安娜的档案称,此前该档案馆发明某种可以或许大年夜范围抓取 Spotify 平台数据的办法,随后该档案馆意识到或许可以经由过程数据建立用于保存音乐的音乐档案馆,接下来就是抓取数据。
最终抓取的数据和概述如下:
安娜的档案成功存档 8600 万首音乐文件,约占总播放量的 99.6%,整体数据大年夜小约为 300TB;
按照 Spotify 平台受迎接程度来肯定歌曲的优先级,用户可以查看排名前 10000 的歌曲榜单;
对于风行程度非零的歌曲几乎都已经抓取,75kbit/s 的 OGG Opus 格局;
添加元数据时没有对音频文件进行从新编码,但供给差别文件存档,包含原始哈希和元数据文件用于重建;
Spotify 作为全球范围最大年夜的流媒体音乐平台今朝拥有 2.56 亿首歌曲,个中 99.9% 的歌曲已经被抓取;
对于风行程度为零的歌曲大年夜约抓取了 50%,音频被从新编码为 75kbit/s 的 OGG Opus 格局,这种音质较低但体积小;
数据截止至 2025 年 7 月,也就是在此之后上架的音乐或更新都不包含鄙人载数据内。
因为数据异常大年夜安娜的档案将以 BT 种子情势宣布数据,也就是说除非所有人都已经放弃这部分数据,不然数据将 BT 情势传播在全部互联网上,任何人想要将其彻底清除都几乎是弗成能的工作。

不过须要解释的是今朝数据还在构建并筹划分阶段宣布,临时宣布的数据只有歌曲的元数据,接下来音乐文件、附加文件元数据、专辑封面以及 zstdpatch 文件等都将分阶段宣布,具体宣布时光未知。

发表评论 取消回复