No campo acelerado da inteligência artificial, surpreendemos a nós mesmos com o que a tecnologia tem a capacidade de realizar. A mais recente façanha? Ensinar o GPT-4, o modelo de linguagem poderoso por trás do ChatGPT e de vários outros aplicativos e serviços, a jogar Minecraft – um dos jogos mais populares e versáteis do mundo.
O Projeto Voyager
Liderada por Linxi “Jim” Fan, pesquisador de IA da Nvidia, uma equipe de especialistas, incluindo Anima Anandkumar, diretora de aprendizado de máquina da empresa e professora do Caltech, desenvolveu um bot chamado Voyager. Este bot, ao contrário de um jogador humano, lê o estado do jogo diretamente através de uma API. Utilizando o GPT-4, o Voyager é capaz de gerar objetivos que o ajudam a explorar o jogo e melhorar suas habilidades ao longo do tempo.
O Projeto Voyager é um bot de Minecraft criado pela Nvidia que usa o modelo de linguagem GPT-4 para resolver problemas dentro do jogo. O bot lê o estado do jogo diretamente através de uma API e usa o GPT-4 para sugerir metas que ajudam a explorar o jogo e gerar códigos que melhoram suas habilidades ao longo do tempo. Por exemplo, se o bot vê uma vara de pescar em seu inventário e um rio por perto, pode usar o GPT-4 para sugerir o objetivo de pescar para ganhar experiência. O bot então usará esse objetivo para ter o GPT-4 gerar o código necessário para que o personagem o alcance. Se o código inicialmente sugerido não funcionar perfeitamente, o Voyager tentará refiná-lo usando mensagens de erro, feedback do jogo e uma descrição do código gerado pelo GPT-4.
Voyager é a primeira “agente de aprendizagem ao longo da vida” incorporado, alimentado por um Modelo de Linguagem de Grande Escala (LLM), neste caso, o GPT-4, que explora continuamente o mundo, adquire diversas habilidades e faz novas descobertas sem intervenção humana. O Voyager consiste em três componentes principais:
1. Um currículo automático que maximiza a exploração. O currículo é gerado pelo GPT-4 com base no objetivo global de “descobrir o máximo de coisas diversas possível”.
2. Uma biblioteca de habilidades em constante crescimento de códigos executáveis para armazenar e recuperar comportamentos complexos.
3. Um novo mecanismo de solicitação iterativa que incorpora feedback do ambiente, erros de execução e autoverificação para melhorar o programa.
Voyager tem uma capacidade de aprendizagem ao longo da vida em contexto e mostra proficiência excepcional ao jogar Minecraft. Ele obtém 3,3 vezes mais itens únicos, viaja 2,3 vezes maiores distâncias e desbloqueia marcos-chave da árvore de tecnologia até 15,3 vezes mais rápido do que os métodos anteriores. Além disso, Voyager é capaz de utilizar a biblioteca de habilidades aprendida em um novo mundo de Minecraft para resolver tarefas novas a partir do zero, enquanto outras técnicas têm dificuldade para generalizar.
Tentei encontrar informações sobre desenvolvimentos recentes no uso do GPT-4 em assistentes virtuais, mas infelizmente, encontrei problemas ao acessar alguns sites. Se você tiver mais perguntas ou se eu puder ajudar com outra coisa, por favor me avise.
Aprendizado e Adaptação
Uma das partes mais inovadoras deste projeto é a capacidade do GPT-4 de gerar código para adicionar comportamentos ao Voyager. Quando o código sugerido inicialmente não funciona perfeitamente, Voyager tenta refiná-lo usando mensagens de erro, feedback do jogo e uma descrição do código gerado pelo GPT-4. Com o tempo, o Voyager constrói uma biblioteca de código, permitindo-lhe realizar tarefas cada vez mais complexas e explorar mais o jogo.
O Futuro da IA
Os chatbots, como o ChatGPT, têm impressionado o mundo com sua eloquência e aparente conhecimento. No entanto, Voyager demonstra o imenso potencial dos modelos de linguagem para realizar ações úteis em computadores. Usar modelos de linguagem dessa forma pode até mesmo automatizar muitas tarefas de escritório rotineiras, representando um dos maiores impactos econômicos da tecnologia.
O processo que Voyager usa com o GPT-4 para descobrir como fazer coisas no Minecraft pode ser adaptado para um assistente de software que descobre como automatizar tarefas via sistema operacional em um PC ou telefone. Esta ideia está se tornando uma realidade, com a OpenAI adicionando “plugins” ao bot para permitir que ele interaja com serviços online, e a Microsoft treinando programas de IA para jogar Minecraft. A empresa recentemente anunciou o Windows 11 Copilot, um recurso do sistema operacional que usará aprendizado de máquina e APIs para automatizar certas tarefas.
Com a rápida evolução da inteligência artificial, continuamos a descobrir novas aplicações e potenciais para essa tecnologia. Através do exemplo do Voyager, vemos como a IA pode ser usada não apenas para conversação, mas também para realizar tarefas e aprender de maneira autônoma em ambientes complexos como o Minecraft. À medida que avançamos, podemos esperar ainda mais inovações e aplicações da IA em nossas vidas diárias.