A equipe de pesquisa do MIT fez um grande avanço recentemente para desenvolver um novo modelo de treinamento de robôs que empresta os métodos de treinamento de grandes modelos de idiomas (LLMS) e não se baseia mais em conjuntos de dados específicos, mas usa informações maciças são usadas para treinamento. Espera -se que essa inovação resolva as limitações encontradas pelos métodos tradicionais de treinamento de robôs para responder a mudanças ambientais e novos desafios, estabelecendo uma base sólida para a pesquisa e desenvolvimento de cérebros robóticos gerais. O significado deste estudo é que ele tem o potencial de mudar o futuro da robótica, permitindo que os robôs se adaptem melhor a ambientes complexos e mutáveis e executem uma ampla gama de tarefas.
O MIT nesta semana apresentou um modelo de treinamento de robôs completamente novo que abandonou os métodos de treinamento anteriores focados em conjuntos de dados específicos e, em vez disso, usavam grandes quantidades de informações usadas ao treinar em grandes modelos de idiomas (LLMS).
Os pesquisadores apontam que o aprendizado de imitação - ou seja, os agentes aprendem imitando indivíduos que realizam tarefas - podem falhar quando confrontados com pequenos desafios. Esses desafios podem incluir diferentes condições de iluminação, diferentes configurações ambientais ou novos obstáculos. Nesses casos, o robô não possui dados suficientes para se adaptar a essas mudanças.

A equipe emprestou modelos como o GPT-4 e adotou um método aproximado de resolução de problemas orientado a dados.
"No campo da linguagem, os dados são frases", disse Lirui Wang, principal autor do artigo. "No campo da robótica, dada a diversidade de dados, se você deseja pré-treinar de maneira semelhante, precisamos de diferentes arquiteturas".
A equipe introduziu uma nova arquitetura chamada Transformador pré-treinado heterogêneo (HPT), que integra informações de diferentes sensores e ambientes diferentes. Os dados são então integrados ao modelo de treinamento usando um transformador. Quanto maior o conversor, melhor o resultado da saída.
O usuário insere o design, a configuração e as tarefas do robô que desejam realizar.
"Nosso sonho é ter um cérebro robótico universal que você pode baixar e usar para o seu robô sem nenhum treinamento", disse David Held, professor associado da Universidade Carnegie Mellon, do estudo. "Embora estejamos apenas começando, continuaremos trabalhando duro, esperando que a expansão possa levar a avanços em estratégias robóticas, como grandes modelos de idiomas".
Este estudo foi financiado em parte pelo Instituto Toyota. No ano passado, no TechCrunch Disrupt, Tri demonstrou uma maneira de treinar um robô durante a noite. Recentemente, alcançou uma parceria divisória que combina sua pesquisa de aprendizado robótico com o hardware da Boston Dynamics.
Esta pesquisa do MIT trouxe novas possibilidades ao campo da robótica, e seu futuro desenvolvimento vale a pena esperar. Ao aproveitar a experiência bem -sucedida de grandes modelos de idiomas, espera -se que o modelo promova avanços mais significativos na tecnologia robótica, realizando o sonho de um cérebro robótico geral, para que os robôs possam servir aos seres humanos com mais flexibilidade e inteligência.