Livros antigos comprados aos milhares, digitalizados e depois destruídos: o preocupante “saque literário” das prateleiras esquecidas das livrarias pelas empresas de IA

Para encontrar os meus novos livros, as empresas de inteligência artificial podem recorrer a uma fonte inesperada: livros físicos comprados em grandes quantidades a livrarias de todo o mundo e depois destruídos após serem digitalizados. Uma prática jurídica que preocupa os livreiros.

Em algumas livrarias europeias, a noite não consiste apenas em fechar os biombos de ferro. Tornou-se o horário de pico para o cliente invisível que compra livros a bordo sem dizer olá.

Desde o início de Maio, os livreiros alemães constataram um fenómeno bastante preocupante. Entre 3h e 5h, seus sites de vendas on-line registram pedidos enormes e repetidos, observa o meio de comunicação alemão Dass. Insomnia não corresponde de forma alguma às compras do leitor ou colecionador compulsivo, mas sim a um sistema completo de óleo.

Vinhos e Diários da Guerra Civil

Muito rapidamente, especialistas em livros de Espanha, Estados Unidos, Nova Zelândia e Bulgária partilharam experiências semelhantes, segundo o jornal espanhol Eldiario.

“Posso receber sete encomendas consecutivas do mesmo comprador no espaço de um minuto”, disse o livreiro Marcel Font aos meios de comunicação espanhóis, que suspeitam que um robô esteja na origem destas compras.

Isto porque as encomendas são principalmente criações catalãs que se acumulam no seu armazém há anos, todas as provas quase não vendidas. Por exemplo, um comprador misterioso comprou um livro sobre o mundo dos castellars em Granollers (Barcelona) na década de 1970, manuais técnicos de vinificação, atas de conferências realizadas há 50 anos ou diários da guerra civil em Espanha.

A plataforma canadense Zoom Books será a originadora desses pedidos espalhados pelo mundo. A empresa se autodenomina player na reciclagem e revenda de livros usados, “líder em reciclagem de livros na América do Norte.

Biblioteca Nacional e Universitária) em Estrasburgo, 17 de maio de 2024 © SEBASTIEN BOZON © 2019 AFP

Segundo suas próprias declarações, ele compra obras, revende as reutilizáveis ​​e recicla outras. Mas os volumes envolvidos são intrigantes. Isso porque a empresa compra milhares de livros antigos, a maioria em alemão, espanhol ou búlgaro, sem nenhuma ligação aparente com o mercado norte-americano.

“Nosso foco são obras de não ficção publicadas desde 1970 e com número ISBN”, explica a empresa, garantindo que só está interessada em itens “empoeirados” não vendidos. No entanto, os livreiros descrevem pedidos incomuns, às vezes feitos com aviso prévio, como se um algoritmo fosse substituir um comprador humano.

Outra característica estranha é que fotos tiradas no centro logístico da Zoom Books, publicadas por diversas investigações do diário espanhol El Diario e do jornal alemão Tass, mostram livros empilhados ao acaso em grandes caixas. Um cenário que contrasta fortemente com as práticas habituais do setor…

Rompendo a “parede de dados”.

Por trás deste extraordinário fluxo de livros, alguns especialistas defendem outra hipótese: um ingrediente para a inteligência artificial. O treinamento de modelos de linguagem requer grandes quantidades de dados textuais. No entanto, o conteúdo nem sempre é da mais alta qualidade. Alguns conteúdos online de acesso gratuito foram restringidos, especialmente devido a restrições de direitos de autor.

“Quando o conhecimento de acesso gratuito na Internet se tornou raro, as empresas correram para sites de download ilegal de livros digitais para alimentar seus modelos. O uso desses recursos levou a ações judiciais por violação de direitos autorais no valor de milhões de dólares”, explica o especialista em inteligência artificial Xavier Vinixa, entrevistado pelo elDiario.

Como resultado, as empresas nesta área enfrentam o que alguns pesquisadores chamam de “parede de dados”. Sem textos novos, inéditos e longos para treinar o algoritmo, a IA corre o risco de estagnar. Para ultrapassar este obstáculo, muitas instituições recorreram a uma estratégia alternativa: adquirir livros físicos, digitalizá-los e depois utilizá-los como instituição de formação.

“O princípio é este: você tem que manter fisicamente os livros e destruí-los depois de ‘lê-los’ – você pode insistir para que nenhuma cópia não autorizada esteja em circulação e que seja de uso justo”, resume um livreiro da SRF.

Um armazém da Zoom Books © Zoom Books

Na verdade, a digitalização de textos e a sua publicação online pode levar a processos judiciais por violação de direitos de autor. No entanto, nos Estados Unidos, o conceito de “uso justo” cria uma lacuna na qual as empresas de IA se precipitaram, sublinha a RTS. Pode permitir que modelos de IA sejam treinados a partir de livros adquiridos legalmente, sem permissão expressa, e esta aplicação auxilia a educação pública e estimula a produção intelectual.

Entre o acaso e a desgraça

A investigação responde às revelações do Washington Post. A mídia dos EUA mencionou um projeto de digitalização em massa liderado pela empresa de IA Anthropic em janeiro de 2026. Centenas de milhares de livros são desmontados, digitalizados página por página e reciclados. Neste projeto, o livro físico torna-se um simples meio temporário, um repositório de dados antes que desapareçam.

Por sua vez, a Zoom Books nega categoricamente as acusações de digitalização ou destruição de livros. A empresa destaca seu modelo de reciclagem e revenda. As empresas de IA, por sua vez, não confirmam nem negam a utilização precisa destes dados.

Mas os livreiros estão céticos. As livrarias estão satisfeitas com essas vendas inesperadas no curto prazo. A longo prazo, alguns temem uma mudança mais subtil: o património impresso será disperso, absorvido e depois transformado em dados pessoais. Porque quando os livros chegam à usina de processamento, suas lombadas são cortadas, as páginas são digitalizadas automaticamente e depois os volumes são triturados para transformá-los em celulose.

“Podemos não perceber, mas perderemos para sempre uma parte muito importante do nosso património bibliográfico”, alerta Miguel Ángel Ortega. O titular da Associação Profissional de Livreiros e Colecionadores de Livros Antigos descreve a situação como “perversa”. “É frustrante receber um pedido grande sem saber o que acontecerá com os livros”, acrescenta.

“Estamos testemunhando uma espécie de pirataria literária”, lamenta Marcel Font. “Sentimos o tsunami chegando. Acho que as empresas precisam intervir.”

Nesta nova economia financeira, precisamos de saber se os livros estão a ser lidos… ou simplesmente trocados, antes de terminarem as suas vidas num confete de dados, algures entre os dois códigos.

Fonte