A IA chegou à robótica: o que esperar dos robôs inteligentes?

Apesar de muita gente ainda associar a área de inteligência artificial (IA) a robôs, a verdade é que a robótica foi uma das áreas que mais demorou para incorporar algoritmos de aprendizado.

Até muito recentemente, os robôs se moviam com base em regras fixas e trajetórias rigidamente programadas, em que cada movimento era resultado de cálculos determinísticos pré-definidos por humanos. Era tudo no fundo apenas uma dança coreografada.

Esses sistemas seguiam orientações precisas, mas eram completamente incapazes de adaptar os seus movimentos a situações novas, como no caso de andar em terrenos irregulares ou lidar com objetos incomuns. Era uma robótica precisa, mas intelectualmente cega.

Agora, com a chegada da IA, essa limitação está começando aos poucos a ser superada. Talvez o avanço mais transformador do ano tenha sido o paradigma de auto-melhoria, onde os robôs, após um ajuste fino supervisionado inicial, praticam tarefas com um mínimo de supervisão humana usando recompensas auto-geradas. Isso tem permitindo a adição de competências mais complexas do que a simples escalada de dados de imitação.

As próximas perspectivas de avanço na robótica apontam para uma convergência entre o planejamento e a ação. A integração de modelos multimodais, capazes de processar simultaneamente texto, visão, som e tato, está tornando os robôs mais antenados ao contexto externo e permitindo decisões cada vez mais precisas em tempo real.

Além disso, arquiteturas inspiradas em LLMs estão sendo adaptadas para controle físico, permitindo que robôs entendam instruções em linguagem natural humana e aprendam novas tarefas a partir de descrições textuais.

A próxima grande fronteira será a criação dos foundation models específicos para a robótica, semelhante aos LLMs que revolucionaram o processamento de texto. Esses novos modelos, que estão sendo também chamados de VLA (Vision-Language-Action, ou Visão-Linguagem-Ação), estão sendo treinados em conjuntos de dados enormes que combinam vídeos de ações, comandos em linguagem natural e dados de sensores do próprio robô.

O principal objetivo da robótica no próximo ano deixará de ser treinar robôs para tarefas específicas e passará a ser o desenvolvimento de agentes generalistas, capazes de compreender instruções simples e complexas. As suas aplicações mais promissoras estão na saúde, onde, em hospitais, robôs multimodais já estão auxiliando na entrega de medicamentos e na higienização, interpretando comandos em linguagem natural.

A robótica está finalmente deixando para trás a era da coreografia e entrando na era da improvisação inteligente. O que podemos esperar para os próximos anos são não apenas máquinas que executam tarefas pré-definidas, mas sim colaboradores capazes de se adaptar e interagir com a complexidade e a imprevisibilidade do mundo real.

https://www.estadao.com.br/link/alexandre-chiavegatto-filho/a-ia-esta-finalmente-chegando-a-robotica-o-que-esperar-dos-robos-inteligentes

Deixe um comentário