Um projeto chamado AI IQ, lançado em maio, tentou pela primeira vez medir o quociente de inteligência (QI) dos principais modelos de linguagem utilizando uma metodologia que se propõe reproduzível. O resultado colocou as IAs que as pessoas usam todos os dias em um nível que até recentemente seria considerado ficção científica.
Os modelos que ficaram no topo, como o GPT 5.5, o Claude Opus 4.7 e o Gemini 3.1 Pro, passaram da marca de 130 pontos, que historicamente tem servido de fronteira simbólica para o que se costuma considerar uma inteligência muito alta.
O método de avaliação agregou 18 benchmarks em cinco dimensões de raciocínio: abstração fluida, matemática, programação, raciocínio crítico e capacidade agêntica, e calculou o QI como a média dessas áreas, com o cuidado de reduzir o teto dos testes mais suscetíveis à contaminação de dados, para evitar que inflassem a nota.
É importante entender o que esse número de fato significa. O QI é uma escala construída para que a média populacional fique em 100, com um desvio padrão de 15 pontos. Isso significa que cerca de dois terços das pessoas ficam entre 85 e 115, e que ultrapassar 130 coloca alguém no percentil 98, ou seja, acima de 98 a cada 100 indivíduos.
É importante mencionar que há críticas legítimas contra o uso do QI como medida de inteligência. O QI captura uma parcela específica de habilidades, sobretudo raciocínio lógico e abstrato, e ignora dimensões importantes como criatividade, inteligência emocional e a capacidade de agir bem em situações de alta incerteza.
Os testes de QI têm também sido historicamente acusados de viés cultural e socioeconômico, e a noção de que existe um valor geral de inteligência permanece contestada entre psicometristas.
Apesar dessas ressalvas importantes, o QI continua sendo o instrumento mais difundido e comparável que temos quando o assunto é medir inteligência. Ele tem mais de um século de validação psicométrica e está bem correlacionado com o desempenho acadêmico e profissional.
A realidade é que a era da inteligência das máquinas veio para ficar, e as IAs não deixam de ser inteligentes só porque às vezes erram em coisas triviais. As pessoas mais brilhantes que conhecemos frequentemente esquecem o nome de pessoas com quem convivem há anos e se atrapalham para montar uma cadeira.
Kurt Gödel, um dos maiores lógicos da história, morreu de desnutrição por desconfiar de tudo que comia, e Paul Erdős mal sabia fritar um ovo. A inteligência nunca foi uma característica consistente em todos os domínios, nem nas pessoas nem nas máquinas.
A avaliação do QI dos algoritmos não encerra a discussão sobre a inteligência, mas ajuda a demonstrar a velocidade dos avanços. O que ainda não se sabe é se a inteligência dos humanos mais geniais representa o teto das IAs, ou apenas mais uma fronteira que os algoritmos deixarão para trás nos próximos anos.
