Os desenvolvedores de sistemas de inteligência artificial (IA) dependem fortemente da extração ilegal de material protegido por direitos autorais de publicações de notícias e de autores para treinar seus modelos, afirmou um grupo de representação de veículos de mídia.

No dia 30 de outubro, a News Media Alliance (NMA) publicou um estudo de 77 páginas e o enviou ao Escritório de Direitos Autorais dos Estados Unidos, afirmando que os conjuntos de dados que treinam os modelos de IA usam muito mais conteúdo de veículos de notícias do que de outras fontes.

Como resultado, os modelos de IA "copiam e usam o conteúdo dos editores para gerar seus resultados", o que viola a lei de direitos autorais e desfavorece os veículos de notícias na concorrência com os modelos de IA.

"Muitos desenvolvedores de IA generativa optaram por extrair conteúdo de editores sem permissão para usá-lo no treinamento de seus modelos e em tempo real para criar produtos concorrentes", enfatizou a NMA em uma declaração divulgada em 31 de outubro.

Na segunda-feira, a News/Media Alliance publicou um documento e uma análise técnica e os enviou ao @CopyrightOffice alertando sobre o uso de conteúdo de editores para alimentar tecnologias de inteligência artificial generativa (#GAI).

— News/Media Alliance (@newsalliance)

O grupo argumenta que, enquanto os editores de notícias fazem investimentos e assumem riscos para gerar conteúdo de qualidade, os desenvolvedores de IA são os beneficiários "em termos de usuários, dados, criação de marca e receitas de publicidade."

Receitas reduzidas, diminuição das oportunidades de emprego e prejuízo na relação com seus clientes são outros contratempos que os editores enfrentam, observou a NMA no ofício enviado ao Escritório de Direitos Autorais.

Para combater os problemas, a NMA recomendou que o Escritório de Direitos Autorais declarasse que o uso do conteúdo de uma publicação para monetizar sistemas de IA prejudica os editores. O grupo também solicitou a implantação de vários modelos de licenciamento e medidas de transparência para restringir a raspagem de materiais protegidos por direitos autorais.

O NMA também recomenda que o Escritório de Direitos Autorais adote medidas para eliminar o conteúdo protegido de sites de terceiros.

O The Guardian acusou a Microsoft de prejudicar sua reputação jornalística ao publicar uma pesquisa gerada por IA que especulava sobre a causa da morte de uma mulher ao lado de um artigo da publicação.

— News/Media Alliance (@newsalliance)

Ao mesmo tempo, a NMA reconheceu os benefícios da IA generativa e observou que os veículos e os jornalistas podem usar a IA para revisar texto, gerar ideias e otimizar os mecanismos de pesquisa.

O ChatGPT da OpenAI, o Bard do Google e o Claude da Anthropic são três chatbots de IA que registraram um uso crescente nos últimos 12 meses. No entanto, os métodos para treinar esses modelos de IA foram criticados, e todos eles enfrentaram processos por violação de direitos autorais nos tribunais.

A comediante Sarah Silverman processou a OpenAI e a Meta em julho, alegando que as duas empresas usaram obras de sua autoria protegidas por direitos autorais para treinar seus sistemas de IA sem permissão.

A OpenAI e o Google foram alvo de ações coletivas separadas sob a acusação de que teriam extraído informações privadas de usuários da Internet.

O Google disse que assumirá a responsabilidade legal se seus clientes forem acusados de violar direitos autorais ao usar seus produtos de IA generativa no Google Cloud e no Workspace.

"Se você for processado com base em violação de direitos autorais, assumiremos a responsabilidade pelos possíveis riscos envolvidos."

No entanto, a ferramenta de busca do Bard do Google não está incluída no compromisso assumido pela empresa.

A OpenAI e o Google não responderam imediatamente a um pedido de comentários do Cointelegraph.

LEIA MAIS