Meta, NYT e mais empresas impedem Apple de treinar IA com seus dados

Uma reportagem da Wired revelou que várias empresas conhecidas no ambiente digital decidiram não permitir que a Apple use seus dados para treinar modelos de inteligência artificial. Entre essas empresas estão gigantes como Meta, The New York Times e Condé Nast, que utilizaram uma ferramenta disponibilizada pela Apple para evitar que seus dados sejam utilizados na construção de modelos de IA.

  • Clique e siga o Canaltech no WhatsApp
  • Como treinar uma inteligência artificial?

Bloqueio do Applebot

A Apple, que utiliza o bot Applebot-Extended para coletar dados da web, implementou recentemente um recurso que permite aos proprietários de sites controlarem se suas informações podem ou não ser utilizadas em treinamentos de IA.

O recurso foi disponibilizado há poucos meses e permite que os sites bloqueiem o Applebot-Extended através de um arquivo de configuração conhecido como “robots.txt”. Embora o bloqueio não impeça o bot de acessar o site para outros propósitos, como indexação para buscas, ele garante que os dados não sejam usados em modelos de linguagem e outros projetos de IA da Apple.


Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.

Empresas bloqueiam uso de dados para treinamento de IA da Apple (Imagem: TechIT Brasil)
Empresas bloqueiam uso de dados para treinamento de IA da Apple (Imagem: TechIT Brasil)

Entre as empresas que bloquearam o Applebot-Extended, segundo a Wired, estão a Meta (que controla Facebook e Instagram), The New York Times, e Condé Nast (responsável por marcas como Vogue, The New Yorker e Vanity Fair). Outras plataformas incluem Craigslist e Vox Media, que gerencia sites como The Verge e Eater. Além delas, o Financial Times, The Atlantic e a rede USA Today também optaram por restringir o acesso aos seus dados para os treinamentos de IA da Apple.

Veja também: Como os dados na web são coletados para desenvolver IAs

Dados para treinamento de IA

Essa decisão de bloqueio reflete uma crescente preocupação entre empresas de mídia e plataformas online sobre o uso de seus dados para treinamento de IA, especialmente quando se trata de direitos autorais e a possível utilização comercial desses dados sem compensação adequada.

A disputa sobre a coleta de dados por bots de IA não é exclusiva da Apple. Outras grandes empresas, como OpenAI e Google, também enfrentam resistência semelhante, com muitas organizações bloqueando seus bots por motivos semelhantes.

Um exemplo claro desse cenário é o The New York Times, que além de bloquear o Applebot-Extended, está atualmente em litígio com a OpenAI sobre questões de direitos autorais. O jornal expressou preocupações sobre o uso não autorizado de seu conteúdo e ressaltou que o bloqueio de bots é uma medida necessária para proteger os direitos de seus conteúdos publicados.

Apesar do bloqueio por parte de algumas empresas, a maioria dos sites ainda não adotou o Applebot-Extended. Análises recentes indicam que apenas uma pequena porcentagem de sites de alto tráfego bloquearam o bot da Apple, embora o número esteja crescendo gradualmente.

Leia mais sobre o treinamento de modelos de IA:

  • Big Techs usaram canais do YouTube para treinar IAs sem permissão
  • OpenAI admite que modelos de IA usam materiais protegidos por lei
  • Microsoft AI acha que tudo na web é livre e pode ser usado para treinar IA
  • O que é o colapso dos modelos de IA, sobre o qual alertam pesquisadores

Leia a matéria no Canaltech.

Trending no Canaltech:

  • Supergirl desenvolve um poder tão invasivo que chega a ser indecente
  • Honor provoca Samsung com mensagem minúscula em celular dobrável
  • Batman confirma qual herói ele respeita mais do que Superman e Asa Noturna
  • Galaxy Tab S10 Plus e Ultra vazam em novas certificações
  • 🔥 PARCELADO | Compre Acer Nitro V15 com Intel Core i5 em ótima oferta
  • Meta pode retomar treinamento de IA com dados pessoais no Brasil, decide ANPD
Adicionar aos favoritos o Link permanente.