Na sala de máquinas que alimenta o serviço de buscas dominante da internet, o Google pôs para funcionar recentemente uma nova e poderosa ferramenta.
Segundo a gigante das buscas, a nova tecnologia, um modelo de inteligência artificial de grande escala conhecido como MUM, poderá tornar as buscas na internet um serviço muito mais sofisticado, atuando como um assistente de pesquisas que filtra a web procurando soluções para questões complexas.
Os críticos da empresa advertem que isso traz um claro risco: o de acelerar uma mudança já em andamento, em que o próprio Google apresenta respostas mais diretas às perguntas dos usuários, entrando na frente de outros sites de forma a “internalizar” o tráfego das buscas e manter as pessoas “amarradas” por mais tempo no universo Google na internet.
O MUM (sigla em inglês para “modelo unificado multitarefa”) é a mais nova de uma série de atualizações da ferramenta de busca que vem sendo feita nos bastidores e que, segundo o Google, tem trazido grandes mudanças na qualidade dos resultados.
Uma delas foi a introdução, há dez anos, de um “gráfico do conhecimento”, que definiu o relacionamento entre diferentes conceitos, trazendo um grau de compreensão semântica das buscas. Mais recentemente, o Google tentou aplicar as tecnologias mais recentes de “aprendizagem profunda” para melhorar a relevância das buscas com uma ferramenta chamada RankBrain.
“Achamos que [agora] estamos no próximo grande marco desse tipo”, disse Pundu Nayak, pesquisador do Google encarregado do MUM.
Em maio, o Google deu uma primeira mostra da nova tecnologia em sua conferência anual de programadores, embora tenha comentado pouco sobre como o sistema pode ser usado. Agora, em entrevista, Nayak disse que o MUM poderá um dia lidar com muitas das “necessidades nebulosas de informações” que as pessoas têm no cotidiano, mas que elas ainda não formularam em questões específicas que pudessem pesquisar.
Como exemplos, ele dá as perguntas que os pais se fazem quando querem encontrar uma escola adequada para os filhos ou as que as pessoas fazem quando sentem necessidade de mudar o nível de suas atividades de condicionamento físico. “Ficam tentando descobrir qual seria uma boa planilha de exercícios – ‘Uma que esteja no meu nível?’”, disse.
Usando as ferramentas atuais, “é preciso converter isso em uma série de perguntas a fazer ao Google para receber a informação que deseja”, disse Nayak. No futuro, sugere ele, essa carga cognitiva ficará com a máquina, que lidará com o que ele chama de “necessidades dos usuários muito mais complexas e talvez mais realistas”.
Em algum momento, acrescentou, as aplicações do MUM provavelmente se estenderão muito além das buscas. “Pensamos nele como uma espécie de plataforma”, disse.
O MUM é o exemplo mais recente de uma ideia que vem varrendo o campo do processamento de linguagem natural via inteligência artificial. Esse campo usa a técnica chamada de “transformador”, que permite à máquina analisar as palavras em contexto e não apenas como objetos isolados a ser interpretados por análises estatísticas em volumes maciços – uma inovação que permitiu um salto na “compreensão” das máquinas.
A técnica foi primeiro desenvolvida pelo Google em 2018, mas sua demonstração mais impressionante veio em 2020 com o GPT-3, um sistema desenvolvido pela OpenAI que chocou muitos no mundo da inteligência artificial por sua capacidade de gerar grandes blocos de textos que pareciam ter coerência.
Jordi Ribas, chefe de engenharia e produtos na ferramenta de buscas Bing, da Microsoft, disse que isso desencadeou uma “corrida entre todas as empresas de alta tecnologia para criar modelos maiores, que representem melhor a linguagem”.
Quando a Microsoft revelou seu modelo de geração de linguagem Turing no início de 2020, reivindicou que era o maior sistema do tipo já construído. Mas o GPT-3, lançado meses depois, era dez vezes maior. O Google não divulgou detalhes técnicos do MUM, mas informa que é “1 mil vezes mais poderoso” que o Bert, seu primeiro modelo experimental a usar transformadores.
Mesmo após esse grande salto tecnológico, o Google se depara com um desafio assombroso. As empresas de buscas na internet sonham em poder responder perguntas complexas há 15 anos, mas descobriram que é um problema muito mais difícil do que imaginavam, segundo Sridhar Ramaswamy, ex-chefe de negócios de propaganda do Google e hoje CEO da startup de buscas na internet Neeva.
“Há muitíssimas variações em toda busca complexa que estamos fazendo,”, disse Ramaswamy. “Tentar fazer um software entender essas variações, e nos guiar, revelou-se incrivelmente difícil na prática.”
As primeiras utilidades do MUM envolvem tarefas de bastidores, como ranquear os resultados, classificar as informações ou extrair respostas de textos.
A dificuldade de mensurar objetivamente a qualidade dos resultados da busca torna difícil julgar o impacto de esforços como esse, de forma que muitos especialistas questionam se outras novas tecnologias de busca estiveram à altura de tanta badalação. Greg Sterling, analista veterano do setor de buscas, disse que muitos usuários de ferramentas de busca não perceberão grande melhora e que, em particular, as buscas de produtos continuam altamente frustrantes.
Por sua vez, as empresas de buscas na internet dizem que testes internos mostram uma preferência dos usuários pelos resultados trazidos pelas tecnologias mais avançadas. A capacidade de extrair respostas de um texto já permitiu ao Bing oferecer respostas diretas a 20% das buscas que recebe, segundo Ribas.
Para a maioria das pessoas, o impacto dos transformadores provavelmente apenas será sentido se a tecnologia resultar em mudanças mais visíveis. Por exemplo, o Google diz que a capacidade do MUM de compreender tanto textos quanto imagens – áudio e vídeo devem ser incluídos posteriormente – pode levar a novas formas de busca nos diferentes tipos de mídia.
Resolver as buscas mais “nebulosas” imaginadas por Nayak exigiria na prática que o Google recolhesse informações de vários locais diferentes na web para, assim, apresentar uma resposta mais precisa a cada busca, altamente particular.
“Isso consolida todas as atividades nas áreas do Google”, disse Sara Watson, analista sênior na empresa de análises de mercado Inside Intelligence. “Tudo o que aparece naquela primeira página [de resultados da busca] pode conter tudo o que você queria.” Tal sistema poderia provocar uma reação contrária de empresas de conteúdo, acrescentou.
O Google, que já sob os holofotes das agências reguladoras ao redor do mundo, nega que planeje usar o MUM para ficar com uma maior parte do tráfego na internet para si. “Ele não se tornará um [sistema] que dará respostas [próprias] às perguntas”, insistiu Nayak. “O conteúdo que está por aí na internet é tão rico que não faria sentido dar respostas curtas.”
Ele também nega que filtrar os resultados de múltiplas buscas e reduzi-los a um resultado único diminuiria o volume de tráfego que o Google remete a outros sites.
“Quanto mais você compreender a intenção dos usuários e mais apresentar informações que eles realmente querem, mais pessoas retornarão para fazer buscas”, disse. O efeito seria de “aumentar o bolo” para todos.
A publicidade nas buscas, força vital dos negócios do Google, pode enfrentar questões similares. Reduzir o número de buscas necessárias para responder a uma pergunta de usuário poderia reduzir o volume de anúncios que o Google pode vender. Por outro lado, disse Watson”, “se a busca pode ser mais complexa e direcionada, o anúncio também”. “Isso dá [aos anúncios] um valor muito maior, e potencialmente, muda o modelo de preços.”