Diversos sites de grandes empresas, como Amazon, Reuters e The New York Times, bloquearam o GPTBot, robô da OpenAI, lançado no dia 8, que tem função de rastrear textos na internet para alimentar e treinar o ChatGPT.
Até o dia 22 de agosto, ao menos 69 sites bloquearam esse robô, segundo uma análise realizada pela Originality.ai, empresa de verificação de conteúdos gerados por IA e plágio.
Mais de 15% dos 100 sites mais populares teriam bloqueado o GPTBot nas últimas duas semanas. “O GPTBot foi lançado há 14 dias e a porcentagem dos mil principais sites que o bloqueiam tem aumentado constantemente”, afirma a pesquisa. Entre os sites analisados, os maiores que bloqueiam o robô da OpenAI são o Amazon.com, Quora.com, NYTimes.com, Shutterstock.com, Wikihow.com e CNN.com.
Ao bloquear o GPTBot, o site impede o uso do conteúdo protegido por direitos autorais para alimentar e treinar o chatbot de inteligência artificial (IA). “Propriedade intelectual é a força vital dos nossos negócios, e precisamos proteger os direitos autorais do nosso conteúdo”, disse um porta-voz da agência de notícias Reuters ao jornal The Guardian.
A análise foi feita entre os dias 8 e 22 de agosto com os mil sites mais populares da internet. Durante o estudo, foram analisados todos os arquivos robots.txt dos endereços selecionador para verificar se o GPTBot estava bloqueado ou não.
A discussão sobre os direitos autorais dos conteúdos usados por IAs generativas não é de hoje. Em janeiro, por exemplo, o banco de imagens Getty Images processou os criadores da IA Stable Diffusion por treinar o sistema usando imagens protegidas por direitos autorais.
O ChatGPT foi lançado em novembro do ano passado e deu início a uma onda de inteligências artificiais generativas capazes de gerar textos, imagens e até vídeos. Influenciados pela nova tecnologia, grandes empresas como Microsoft e Google também passaram a investir mais nessa área.
*Alice Labate é estagiária sob supervisão do editor Bruno Romani