Projeto GR00T da Nvidia: Uma IA multimodal para alimentar humanóides do futuro

Projeto GR00T

Imagine um mundo onde humanóides não apenas existem, mas também interagem conosco de maneira natural e intuitiva. Este cenário, que parece saído diretamente de um filme de ficção científica, está se tornando cada vez mais realidade graças ao Projeto GR00T da Nvidia. Este projeto promete ser um divisor de águas na forma como pensamos sobre inteligência artificial (IA) e robótica. Vamos mergulhar nos detalhes deste projeto fascinante e explorar como ele pode moldar o futuro dos humanóides.

O que é o Projeto GR00T?

O Projeto GR00T, anunciado recentemente pela Nvidia, representa um avanço significativo na criação de modelos de fundação de propósito geral para robôs humanoides. Segundo Jensen Huang, fundador e CEO da Nvidia, construir modelos de fundação para robôs humanoides gerais é um dos problemas mais empolgantes a serem resolvidos na IA hoje.

O que é o Projeto GR00T?

O projeto não apenas visa desenvolver IA capaz de compreender linguagem natural, mas também de emular movimentos humanos através da observação, aprendendo rapidamente coordenação, destreza e outras habilidades necessárias para navegar, adaptar-se e interagir com o mundo real.

 

Jetson Thor: O Cérebro por Trás dos Humanóides

Um componente crucial para o sucesso do Projeto GR00T é o Jetson Thor, um novo computador desenvolvido especificamente para robôs humanoides. Baseado no sistema em chip Thor da Nvidia, o Jetson Thor é projetado para realizar tarefas complexas e interagir de forma segura e natural com pessoas e máquinas. Sua arquitetura modular otimiza desempenho, potência e tamanho, tornando-o uma peça chave na evolução dos robôs humanoides.

 

O que esperar do Projeto GR00T da Nvidia?

Embora o nome possa lembrar o personagem Groot da Marvel, ele na verdade representa a Tecnologia do Robô Generalista 00 (Generalist Robot 00 Technology). Segundo a Nvidia, o projeto foi desenvolvido para entender textos, fala, vídeos e demonstrações ao vivo em linguagem natural, a fim de emular movimentos humanos — como coordenação, destreza e outras habilidades — e produzir ações gerais para navegar, adaptar-se e interagir com o mundo real.

Isso não só aprimorará as capacidades dos robôs humanoides, mas também facilitará muito o desenvolvimento e a implantação deles. Essencialmente, com textos e demonstrações como entradas, os robôs podem ser programados por qualquer pessoa (com acesso relevante).

Em sua palestra no GTC, Huang demonstrou vários robôs humanoides alimentados pelo GR00T realizando uma variedade de tarefas, incluindo aquelas da Agility Robotics, Apptronik, Fourier Intelligence e Unitree Robotics. Deepu Talla, que deu um briefing sobre o GR00T para jornalistas, observou que o projeto aproveita os trabalhos mais recentes e avançados em inteligência artificial generativa e transformadores, sem compartilhar muitos detalhes sobre a amplitude total de suas capacidades.

Notavelmente, a OpenAI, que é um dos nomes mais proeminentes no espaço de IA generativa, também está trabalhando em IA incorporada e apoiou duas startups nesse domínio: 1X Technologies e Figure. Recentemente, a Figure até lançou um vídeo que mostrava um de seus robôs realizando tarefas rotineiras, como pegar lixo com a ajuda de um grande modelo de linguagem de visão (VLM) treinado pelo laboratório de pesquisa liderado por Sam Altman. Ambas as empresas também estão trabalhando com a Nvidia, conforme confirmado pela empresa.

O Projeto GR00T, um modelo de fundação multimodal de propósito geral para humanoides, atua como a mente dos robôs, tornando-os capazes de aprender habilidades para resolver uma variedade de tarefas úteis. Quando contatado pela VentureBeat, Talla disse que a empresa não pode compartilhar detalhes adicionais sobre a arquitetura interna, mas terá mais a compartilhar sobre as capacidades no futuro. Ele também observou que apenas desenvolvedores de humanoides selecionados, incluindo os mencionados acima, têm acesso antecipado ao modelo no momento, mas eles planejam expandir sua disponibilidade para mais humanoides e outras encarnações em breve.

Para garantir que os robôs humanoides possam executar modelos multimodais complexos como o GR00T, a Nvidia também lançou a plataforma de computação Jetson Thor para humanoides. Baseado no SoC Thor da empresa, o computador inclui um cluster de CPU de alto desempenho e uma GPU de próxima geração baseada na arquitetura Nvidia Blackwell com um motor transformador que entrega 800 teraflops de desempenho de IA em ponto flutuante de 8 bits.

Talla disse no briefing que o desempenho da GPU do sistema é 8 vezes melhor do que a versão anterior, Jetson Orin, enquanto o desempenho da CPU é 2,6 vezes melhor.

 

Avanços e Aplicações Futuras

Robôs alimentados pela tecnologia GR00T, que significa Generalist Robot 00 Technology, prometem revolucionar a maneira como interagimos com máquinas. Durante a apresentação de Huang na GTC, vários robôs demonstraram a capacidade de completar uma variedade de tarefas, evidenciando o potencial vasto de aplicações futuras. Além disso, a Nvidia também anunciou atualizações em sua plataforma de robótica Isaac, reforçando seu compromisso com o avanço da IA e robótica.

Em conclusão, o Projeto GR00T da Nvidia está estabelecendo as bases para o futuro dos robôs humanoides. Com a introdução do Jetson Thor e as melhorias na plataforma Isaac, estamos um passo mais perto de um mundo onde humanóides podem aprender, adaptar-se e interagir com o ambiente de maneira eficaz. Este projeto não apenas destaca o progresso impressionante na área de IA e robótica, mas também abre portas para inúmeras possibilidades de interação humano-robô no futuro.

Para mais informações, visite a fonte original.

Sumário

Picture of Janderson de Sales

Janderson de Sales

Sou um Especialista WordPress, com formação em Tecnologia da Informação e Professor de Física pela Universidade Federal de Rondônia. Trabalho com produção de conteúdo para blogs, desenvolvimento e manutenção de sites WordPress, e sou um entusiasta de tecnologias de inteligência artificial. Tenho conhecimento em produção de imagens de alta qualidade em plataformas de IAs generativas de imagens e possuo habilidades em SEO e desenvolvimento web. Estou comprometido em oferecer soluções inovadoras e eficazes para atender às necessidades do mercado digital.