Editoras processam Microsoft e OpenAI por raspagem de conteúdo: 'Bilhões roubados dos criadores'
25 de junho de 2026
Editoras processaram Microsoft e OpenAI por raspagem de artigos sem permissão para treinar modelos de IA.
Microsoft e OpenAI estão sendo processadas por um grupo de editoras por terem usado milhões de artigos protegidos por direitos autorais para treinar seus modelos de inteligência artificial sem autorização. A ação, aberta nesta semana, alega que as empresas lucraram bilhões de dólares às custas do trabalho de jornalistas e escritores, sem pagar um centavo de compensação. O caso pode estabelecer um precedente crucial para a relação entre IA generativa e propriedade intelectual.
O que a ação contra Microsoft e OpenAI alega sobre raspagem?
Segundo informações do Bloomberg Law, a queixa coletiva foi protocolada em um tribunal federal dos Estados Unidos e envolve editoras que afirmam ter tido seu conteúdo raspado em larga escala para alimentar os modelos de linguagem da OpenAI, como o GPT-4, e os serviços integrados da Microsoft, como o Copilot. A acusação central é que as empresas violaram direitos autorais ao reproduzir, distribuir e exibir publicamente os artigos sem licenciamento. As editoras pedem indenização por danos que podem chegar a US$ 150 mil por obra infringida, além de uma ordem judicial que obrigue a remoção dos conteúdos dos bancos de dados de treinamento.
Por que a raspagem de conteúdo afeta criadores e editores?
A raspagem não autorizada de textos, imagens e áudios para treinar modelos de IA se tornou uma prática comum entre as big techs, mas raramente é questionada judicialmente de forma tão abrangente. Este processo, por envolver empresas do porte da Microsoft e da OpenAI, pode definir regras mais claras sobre o uso de dados públicos para fins comerciais de inteligência artificial. Para jornalistas, autores e editores, a decisão pode significar o reconhecimento de que o trabalho criativo não pode ser explorado gratuitamente — e que os bilhões de dólares movimentados pela IA devem, em parte, retornar a quem produziu o conteúdo original. O caso ecoa discussões recentes sobre regulação de IA, como o alerta feito pela aliança Five Eyes sobre os riscos de ciberataques impulsionados por essas tecnologias — tema que abordamos em outra análise.
Como Microsoft e OpenAI justificam a raspagem de conteúdo?
Até o fechamento desta edição, nem Microsoft nem OpenAI se pronunciaram oficialmente sobre o processo. Em casos anteriores semelhantes, a OpenAI argumentou que o uso de dados públicos se enquadra no conceito de 'fair use' (uso justo) previsto na legislação americana, especialmente quando o material é transformado em novo conhecimento pelo modelo de IA. No entanto, a defesa enfrenta o desafio de provar que a replicação de trechos inteiros de artigos nos resultados do ChatGPT ou do Copilot não configura violação direta. A Microsoft, por sua vez, tem investido pesadamente na parceria com a OpenAI e pode tentar isolar sua responsabilidade, alegando que a raspagem foi conduzida pela desenvolvedora do modelo. O desfecho dependerá de provas técnicas sobre como os dados foram coletados e armazenados.
Perguntas frequentes sobre raspagem de conteúdo
O que as editoras estão pedindo na ação?
As editoras requerem indenização por danos materiais e morais, além de uma liminar que obrigue Microsoft e OpenAI a excluir todo o conteúdo protegido por direitos autorais dos conjuntos de dados de treinamento e a pagar royalties futuros pelo uso.
Quais editoras estão envolvidas no processo?
A ação foi movida por um grupo de editoras de veículos de mídia, incluindo nomes como The Intercept, Raw Story e AlterNet, conforme reportado pela Bloomberg Law. Outras editoras podem aderir posteriormente.
O que isso significa para o futuro da IA generativa?
Se o tribunal decidir contra as empresas, a decisão poderá forçar a indústria a repensar a forma como obtém dados para treinamento, incentivando a criação de licenças pagas e acordos com detentores de direitos autorais, o que pode encarecer o desenvolvimento de novos modelos.
Fonte: news.bloomberglaw.com
Escrito por
Manu RamalhoSou Manu Ramalho, publicitária com 15 anos de estrada conectando marcas e pessoas. Como fundadora da EME Marketing Digital, sempre busquei o marketing estratégico para gerar conexões autênticas. Aqui, mergulho na fronteira da inteligência artificial como analista de tendências. Meu foco é traduzir a complexidade de NLP, novos modelos de linguagem e papers acadêmicos para o mundo real, sempre com um olhar atento à regulamentação, ética e aos impactos sociais que essa tecnologia imprime na nossa sociedade.