Três autores entraram com uma ação coletiva contra a empresa de inteligência artificial Anthropic por violação de direitos autorais. Os autores alegam que a empresa usou conjuntos de dados contendo versões pirateadas de suas obras para treinar sua família de modelos de linguagem grandes (LLMs), Claude.
Os autores Andrea Bartz, Charles Graeber e Kirk Wallace Johnson são jornalistas e autores de ficção e não-ficção populares. Eles alegam que a Anthropic usou conscientemente conjuntos de dados que “eram compostos por uma coleção de conteúdo protegido por direitos autorais proveniente de sites piratas.”
Violação de direitos autorais foi uma escolha, alega o processo
A Anthropic poderia ter obtido licenças para usar o material que usou, alega o processo, mas em vez disso “tomou a decisão deliberada de economizar e depender de materiais roubados para treinar seus modelos”. A ação afirma:
“Durante toda a sua existência, a Anthropic se revestiu da retórica de ‘segurança em IA’ e ‘responsabilidade’. Suas ações, no entanto, desmoralizaram seus objetivos elevados.”
A ação, movida no Tribunal Distrital do Norte da Califórnia, também tenta enquadrar suas acusações em um contexto maior:
“A Goldman Sachs estima que a IA generativa possa substituir 300 milhões de empregos de tempo integral no futuro próximo. […] Escritores já relatam perda de renda com direitos autorais, jornalismo e escrita de conteúdo online, que são fontes importantes de renda para autores de livros.”
Os autores pedem ao tribunal que decida se a Anthropic infringiu os direitos autorais dos autores, se as ações da empresa constituem uso justo, se os membros da ação coletiva foram prejudicados e têm direito a indenizações, e se a Anthropic agiu de forma intencional em sua alegada infração.
Os autores pedem danos estatutários ou compensatórios e uma ordem permanente contra a empresa para futuras violações de direitos autorais.

Questões relacionadas ao uso de IA estão sendo resolvidas
O processo dos autores faz parte de uma onda de queixas que surgiram junto com a indústria de IA. Eles observaram:
“Nos últimos dois anos, um mercado de licenciamento próspero para dados de treinamento protegidos por direitos autorais se desenvolveu. Várias empresas de IA, incluindo OpenAI, Google e Meta, pagaram centenas de milhões de dólares para obter licenças para reproduzir material protegido por direitos autorais para o treinamento de LLMs.”
A concorrente da Anthropic, OpenAI, enfrenta uma ação coletiva por violação de direitos autorais movida pelo Author’s Guild no Tribunal do Distrito Sul de Nova York em setembro. A comediante Sarah Silverman e os autores Richard Kadrey e Christopher Golden processaram a OpenAI e a Meta no mesmo tribunal da Califórnia em julho de 2023. Essas ações também envolveram o treinamento de LLMs.

Um grupo de editores de música entrou com uma ação contra a Anthropic no mesmo tribunal por usar letras de músicas para treinar o Claude em outubro. Em 15 de agosto, a Anthropic pediu que algumas das alegações nessa ação fossem rejeitadas.
A Anthropic não respondeu imediatamente a um pedido do Cointelegraph para comentar o caso.