Pular para conteúdo

Editoras processam Microsoft e OpenAI por raspagem de conteúdo: 'Bilhões roubados dos criadores'

Manu Ramalho
Manu Ramalho

25 de junho de 2026

Editoras processaram Microsoft e OpenAI por raspagem de artigos sem permissão para treinar modelos de IA.

Carregando áudio…
Editoras processam Microsoft e OpenAI por raspagem de conteúdo: 'Bilhões roubados dos criadores'

Microsoft e OpenAI estão sendo processadas por um grupo de editoras por terem usado milhões de artigos protegidos por direitos autorais para treinar seus modelos de inteligência artificial sem autorização. A ação, aberta nesta semana, alega que as empresas lucraram bilhões de dólares às custas do trabalho de jornalistas e escritores, sem pagar um centavo de compensação. O caso pode estabelecer um precedente crucial para a relação entre IA generativa e propriedade intelectual.

O que a ação contra Microsoft e OpenAI alega sobre raspagem?

Segundo informações do Bloomberg Law, a queixa coletiva foi protocolada em um tribunal federal dos Estados Unidos e envolve editoras que afirmam ter tido seu conteúdo raspado em larga escala para alimentar os modelos de linguagem da OpenAI, como o GPT-4, e os serviços integrados da Microsoft, como o Copilot. A acusação central é que as empresas violaram direitos autorais ao reproduzir, distribuir e exibir publicamente os artigos sem licenciamento. As editoras pedem indenização por danos que podem chegar a US$ 150 mil por obra infringida, além de uma ordem judicial que obrigue a remoção dos conteúdos dos bancos de dados de treinamento.

Por que a raspagem de conteúdo afeta criadores e editores?

A raspagem não autorizada de textos, imagens e áudios para treinar modelos de IA se tornou uma prática comum entre as big techs, mas raramente é questionada judicialmente de forma tão abrangente. Este processo, por envolver empresas do porte da Microsoft e da OpenAI, pode definir regras mais claras sobre o uso de dados públicos para fins comerciais de inteligência artificial. Para jornalistas, autores e editores, a decisão pode significar o reconhecimento de que o trabalho criativo não pode ser explorado gratuitamente — e que os bilhões de dólares movimentados pela IA devem, em parte, retornar a quem produziu o conteúdo original. O caso ecoa discussões recentes sobre regulação de IA, como o alerta feito pela aliança Five Eyes sobre os riscos de ciberataques impulsionados por essas tecnologias — tema que abordamos em outra análise.

Como Microsoft e OpenAI justificam a raspagem de conteúdo?

Até o fechamento desta edição, nem Microsoft nem OpenAI se pronunciaram oficialmente sobre o processo. Em casos anteriores semelhantes, a OpenAI argumentou que o uso de dados públicos se enquadra no conceito de 'fair use' (uso justo) previsto na legislação americana, especialmente quando o material é transformado em novo conhecimento pelo modelo de IA. No entanto, a defesa enfrenta o desafio de provar que a replicação de trechos inteiros de artigos nos resultados do ChatGPT ou do Copilot não configura violação direta. A Microsoft, por sua vez, tem investido pesadamente na parceria com a OpenAI e pode tentar isolar sua responsabilidade, alegando que a raspagem foi conduzida pela desenvolvedora do modelo. O desfecho dependerá de provas técnicas sobre como os dados foram coletados e armazenados.

Perguntas frequentes sobre raspagem de conteúdo

O que as editoras estão pedindo na ação?

As editoras requerem indenização por danos materiais e morais, além de uma liminar que obrigue Microsoft e OpenAI a excluir todo o conteúdo protegido por direitos autorais dos conjuntos de dados de treinamento e a pagar royalties futuros pelo uso.

Quais editoras estão envolvidas no processo?

A ação foi movida por um grupo de editoras de veículos de mídia, incluindo nomes como The Intercept, Raw Story e AlterNet, conforme reportado pela Bloomberg Law. Outras editoras podem aderir posteriormente.

O que isso significa para o futuro da IA generativa?

Se o tribunal decidir contra as empresas, a decisão poderá forçar a indústria a repensar a forma como obtém dados para treinamento, incentivando a criação de licenças pagas e acordos com detentores de direitos autorais, o que pode encarecer o desenvolvimento de novos modelos.

Compartilhar:
Manu Ramalho

Escrito por

Manu Ramalho

Sou Manu Ramalho, publicitária com 15 anos de estrada conectando marcas e pessoas. Como fundadora da EME Marketing Digital, sempre busquei o marketing estratégico para gerar conexões autênticas. Aqui, mergulho na fronteira da inteligência artificial como analista de tendências. Meu foco é traduzir a complexidade de NLP, novos modelos de linguagem e papers acadêmicos para o mundo real, sempre com um olhar atento à regulamentação, ética e aos impactos sociais que essa tecnologia imprime na nossa sociedade.

Artigos relacionados