Recentemente, a tecnologia Hangzhou Qunkeng mais uma vez se tornou o foco da comunidade de tecnologia com seu modelo de entendimento espacial de código aberto. Esse modelo inovador foi mencionado especificamente pelo Google em um trabalho de pesquisa, marcando seu grande avanço no treinamento de robôs. A função principal do espacial é que ele pode permitir que os robôs entendam as relações geométricas do mundo físico por meio de vídeos comuns, fornecendo assim novas possibilidades completamente para o treinamento de robôs.
O Spatiallm é único, pois pode converter vídeos capturados por telefones celulares em informações precisas de layout espacial tridimensional. Os usuários precisam apenas gravar a cena em casa com seus telefones celulares, e o Spatiallm pode gerar um modelo 3D detalhado, incluindo a estrutura da sala, a localização dos móveis e a largura do canal. Essa tecnologia não apenas reduz bastante o custo do treinamento de robôs, mas também melhora significativamente a eficiência do treinamento, abrindo caminho para a popularização e aplicação da tecnologia de robôs.

Na conferência GTC2025, a CNK Technology também mostrou sua plataforma de treinamento virtual Spatialverse. Essa plataforma combina os dados gerados pelo SpatialLM, permitindo que os robôs treinem tarefas complexas, como evitar obstáculos e captar em um ambiente simulado, alcançando assim um loop fechado completo da cognição à ação. Através desse sistema, os robôs não apenas "vejam" o layout espacial, mas também entendem como operar em ambientes complexos, o que fornece um poderoso suporte técnico para a aplicação de robôs no mundo real.
O princípio de trabalho do Spatiallm é baseado na tecnologia Masast3R-Slam, que desmonta o vídeo em inúmeros quadros, extrai detalhes de objetos como sofás e tabelas e os transforma em um modelo de nuvem de pontos. O modelo então converte esses dados em um layout 3D estruturado, registrando informações importantes sobre cada objeto, como tamanho e posição. Comparado aos métodos de treinamento tradicionais, o Spatiallm não apenas economiza tempo e recursos, mas também melhora significativamente a capacidade cognitiva espacial do robô, permitindo que ele se adapte melhor a ambientes complexos.
O que é único nessa tecnologia é que ela permite que os robôs compreendam e lidem com mudanças ambientais complexas, como seres humanos. Sejam itens do cotidiano na vida doméstica ou ferramentas no local de trabalho, o SpatialLM ajuda os robôs a se adaptarem rapidamente e a executar tarefas. Essa capacidade é crucial para melhorar o desempenho dos robôs em ambientes reais, especialmente no campo atual da inteligência incorporada, onde muitas tecnologias ainda estão enfrentando dificuldades em implementá -las.
Por meio de espaciallm de código aberto e espacial, o CNK está reformulando o futuro do treinamento de robôs, permitindo que ele responda flexivelmente aos desafios no mundo real. A aplicação generalizada dessa tecnologia não apenas promoverá o desenvolvimento adicional da tecnologia de robótica, mas também trará mais conveniência à vida humana.
Endereço do projeto: https://top.aibase.com/tool/spatiallm