
Google lança ferramenta para sites optarem por não compartilhar dados com IA
Introdução
O Google anunciou o lançamento do Google-Extended, uma nova ferramenta que permite que os editores de sites optem por não ter seus dados utilizados para treinar os modelos de Inteligência Artificial (IA) da empresa.
Essa iniciativa visa garantir a privacidade dos dados dos sites, ao mesmo tempo em que eles permanecem visíveis nas pesquisas do Google. Entenda melhor como funciona essa nova funcionalidade e suas implicações.
Funcionamento do Google-Extended
Com o Google-Extended, os sites continuarão a ser rastreados e indexados pelos crawlers do Google, como o Googlebot. Porém, seus dados não serão utilizados para aprimorar os modelos de IA atuais e futuros da empresa.
Essa opção dá aos editores maior controle sobre o acesso ao conteúdo de seus sites, permitindo que eles decidam se desejam contribuir para o treinamento dos algoritmos de IA do Google.
Como habilitar o Google-Extended
Essa nova funcionalidade está disponível por meio do arquivo robots.txt, que é responsável por informar aos crawlers quais páginas podem ser acessadas.
O Google ressaltou que, à medida que as aplicações de IA se expandem, eles continuarão a explorar outras abordagens para dar mais escolha e controle aos editores de sites.
Implicações da ferramenta
Essa iniciativa é uma resposta aos recentes bloqueios de crawlers por parte de diversos sites, incluindo gigantes da mídia como The New York Times, CNN, Reuters e Medium, que procuraram evitar que seus dados fossem utilizados para treinar modelos de IA de terceiros.
O desafio é encontrar um equilíbrio entre proteger a privacidade dos dados e permitir que o Google indexe e apresente resultados relevantes em suas pesquisas.
Vantagens
- Maior controle dos editores sobre o uso de seus dados
- Preservação da privacidade
- Sites continuam indexados e visíveis nas buscas
Desvantagens
- Menos dados disponíveis para treinar IA do Google
- Pode afetar qualidade dos resultados das buscas
Conclusão
O Google-Extended é uma ferramenta importante para equilibrar a privacidade dos dados com a qualidade das pesquisas por IA. Ela permite que os editores decidam se querem contribuir para o treinamento de modelos de IA, preservando seus direitos.
Resta saber se essa abordagem será suficiente para acalmar os ânimos em relação ao uso de dados pela gigante da tecnologia ou se novas medidas serão necessárias no futuro.