Empresa dona de enciclopédia processa ChatGPT por roubo de conteúdos

A Encyclopedia Britannica, grupo editorial responsável pela enciclopédia de mesmo nome e dono da marca Merriam-Webster, está processando a OpenAI. A empresa de inteligência artificial (IA) é acusada de infração de direitos autorais.

A ação judicial indica que a companhia dona do ChatGPT teria usado sem autorização ou compensação financeira artigos online e os verbetes da enciclopédia e do dicionário para treinar os modelos de linguagem que rodam em plataformas populares de IA.

Esse processo parte da acusação de que conteúdos gerados pelo ChatGPT são "substancialmente similares" aos materias de propriedade da Encyclopedia Britannica. O GPT-4 teria "memorizado" boa parte do conteúdo da enciclopédia e "respondido com cópias quase idênticas de porções significativas" de texto.

No texto do processo, a editora ainda coloca lado a lado textos da companhia e as respostas da IA sobre determinados conteúdos para indicar que há a cópia desses conteúdos.

Além do caso principal, há ainda uma segunda questão lidada nos documentos do tribunal: a OpenAI ter "canibalizado" o tráfego na web dos próprios sites da enciclopédia ao "substituir ou competir diretamente" com esse serviço, em vez de direcionar os usuários à fonte dos conteúdos.

IA e direitos autorais

Em nota enviada à Reuters, a OpenAI alega que os modelos "empoderam inovação e são treinados em dados publicamente disponíveis e baseados no princípio do uso justo (o chamado fair use)".

Porém, esse não é o primeiro processo que empresas de IA encaram por questões de direitos autorais e o que foi usado no treinamento dessas plataformas. Ao menos dois se destacam nesse meio:

a disputa do jornal The New York Times contra a OpenAI, que foi aberta ainda em 2023 e envolve acusações de treinamento ilegal do ChatGPT;
o processo finalizado em acordo entre a Anthropic e autores de livros, com a dona do Claude compensando financeiramente escritores em um total de US$ 1,5 bilhão (R$ 7,8 bilhões).

Em uma fala no ano passado, um ex-executivo da Meta sugeriu que pedir permissão para usar conteúdos nessa etapa de treinamento “mataria” a indústria, reforçando a importância do uso dessas obras na programação de uma IA.

Qual é o lado perigoso de agentes de IA com muita autonomia para trabalhar? Entenda neste artigo!