Pular para o conteúdo

Anna’s Archive diz ter extraído dados em massa do Spotify e alega possuir quase todo o catálogo

Pessoa usando laptop para copiar 86 milhões de arquivos, com disco e pen drive ao lado em mesa branca.

Anna’s Archive afirma ter conseguido reunir uma quantidade gigantesca de dados do Spotify: as metadados de praticamente todo o catálogo e 86 milhões de faixas, o que corresponderia a mais de 99% das reproduções na plataforma.

O Anna’s Archive, um site pirata, diz que sua missão é “preservar o conhecimento e a cultura da humanidade”, mesmo violando de forma intencional “a legislação de direitos autorais na maioria dos países”. Criado em 2022 e até agora concentrado sobretudo em livros, o grupo informou, nesta semana, que vai publicar 300 TB de arquivos roubados em formato torrent, contendo parte do catálogo do Spotify e as metadados de mais de 99% do acervo.

“Há algum tempo, descobrimos uma forma de coletar dados em grande escala no Spotify. Vimos nisso uma oportunidade de criar um arquivo musical voltado principalmente para a preservação”, afirmou o Anna’s Archive em comunicado. A justificativa apresentada é que, embora a música em geral seja bem preservada, esse tipo de preservação costuma se concentrar nos artistas mais populares ou na melhor qualidade possível. Além disso, o site sustenta que, até hoje, não existe uma lista de torrents que tente representar toda a música já produzida.

Segundo o Anna’s Archive, foram extraídas as metadados de 99,9% dos 256 milhões de faixas existentes no Spotify. Isso inclui mais de 15 milhões de artistas e mais de 58 milhões de álbuns. Esse conjunto de metadados soma 200 GB. O grupo também diz ter obtido ilegalmente cerca de 86 milhões de arquivos musicais, que representariam aproximadamente 99,6% das reproduções da plataforma. Esses arquivos ocupam um pouco menos de 300 TB.

Anna’s Archive, Spotify e a ilegalidade da extração de dados

É importante lembrar, ainda que isso pareça óbvio, que a coleta de dados feita pelo Anna’s Archive e a distribuição desse material são ilegais. O Spotify, por sua vez, já se manifestou sobre o caso.

“Uma investigação sobre um acesso não autorizado revelou que um terceiro havia obtido metadados públicos e usado táticas ilícitas para contornar o DRM e acessar alguns arquivos de áudio da plataforma. No momento, estamos conduzindo uma apuração detalhada sobre esse incidente”, informou o serviço de streaming, segundo o Android Authority.

Esse episódio também reacende o debate sobre o limite entre preservação digital e violação de direitos. Arquivos em grande escala podem, de fato, ajudar a documentar obras e metadados que poderiam se perder com o tempo, mas isso não elimina o problema legal nem a necessidade de respeitar os direitos de artistas, selos e distribuidores. Em serviços comerciais, o uso de proteções técnicas, como o DRM, existe justamente para dificultar esse tipo de acesso não autorizado.

Outro ponto relevante é que a simples existência de um grande volume de dados não garante utilidade prática para o público. Sem curadoria, padronização e contexto, conjuntos massivos de metadados podem até registrar nomes, álbuns e faixas, mas nem sempre oferecem uma forma clara de consulta, organização ou preservação sustentável ao longo do tempo.

Comentários

Ainda não há comentários. Seja o primeiro!

Deixar um comentário