O novo modelo de inteligência artificial da Anthropic foi concebido para beneficiar usuários e mostrou-se eficaz para corrigir vulnerabilidades em softwares, mas seu lançamento, neste momento, “poderia trazer consequências indesejadas” e “poderia gerar danos”, disse ontem Mike Krieger, cofundador do Instagram e desde 2024 à frente da diretoria de produtos da companhia.
Na terça-feira (7), a gigante da inteligência artificial informou que ainda não levará a mercado seu novo modelo por ser considerado “potente” demais. Ao invés disso, concederá acesso ao projeto a empresas de cibersegurança, para que testem o potencial da ferramenta e seus riscos.
Conforme Krieger, o chamado Projeto Glasswing está ligado ao modelo mais recente de IA da companhia, o Claude Mythos, atualmente em fase de testes.
Durante os preparativos para lançamento do novo modelo, contou Krieger, foi constatado que ele não era apenas muito bom para escrever código e executar tarefas de IA, mas também era extremamente eficaz em encontrar e corrigir vulnerabilidades em softwares.
“O projeto nasceu para ajudar pessoas. Quando começamos a pensar em como levar isso ao mercado, entendemos que simplesmente lançar o modelo poderia ter consequências indesejadas. Ele não serviria apenas para ajudar pessoas a resolver problemas, mas também poderia ser usado para exploração”, “, acrescentou Krieger.
Diante disso, a decisão foi dar um passo atrás e avaliar “qual a melhor forma de preparar o mundo” para esse novo modelo.
“Foi assim que surgiu o Projeto Glasswing. A iniciativa reúne um grupo de empresas líderes em cibersegurança. Em vez de lançar o modelo publicamente, decidimos dar acesso antecipado a essas organizações de defesa cibernética”, contou Krieger. Amazon, Apple, Google, Microsoft, Cisco e CrowdStrike, entre outras organizações, foram engajadas no projeto.
As empresas terão acesso ao Claude Mythos para buscar falhas em seus produtos e compartilhar as descobertas com outras companhias do setor. A Anthropic disse ainda que usará os relatórios do Projeto Glasswing para definir as diretrizes de segurança da tecnologia.
Krieger pondera que iniciativas como essa – o desenvolvimento de modelos de inteligência artificial cada vez mais poderosos – não vão permanecer concentradas por muito tempo e há outros provedores e modelos sendo desenvolvidos, mas a ideia da Anthropic foi dar aos grandes nomes da indústria uma “vantagem inicial”
“Por um lado, o modelo é impressionante. Nós o usamos internamente, e estou animado para, no futuro, disponibilizar sistemas como esse ao público. Mas essa pareceu a forma mais responsável de lidar com esse momento” , explicou.
Ao permitir que empresas de tecnologia acessem seu novo modelo de lA a americana Anthropic abre caminho para que elas se preparem para possíveis ataques cibernéticos que poderiam resultar justamente do uso de seu sistema.
Segundo a agência Bloomberg, o acordo reflete a crescente preocupação entre as empresas de tecnologia de que modelos mais sofisticados sejam usados indevidamente por criminosos e “hackers” patrocinados por governos para buscar falhas no código-fonte e burlar as defesas cibernéticas.
A tecnologia de inteligência artificial já está sendo usada para facilitar ataques cibernéticos, lembra a agência de notícias. Em um dos casos, um “hacker” usou ferramentas de IA para facilitar uma violação que afetou o governo mexicano. A OpenAl, concorrente da Anthropic, também já havia destacado as crescentes capacidades cibernéticas de seus modelos e lançado um programa-piloto com o objetivo de colocar suas ferramentas “primeiramente nas mãos dos defensores”.
