A Google DeepMind, uma das maiores potências na pesquisa de inteligência artificial (IA), está desenvolvendo um novo modelo de IA chamado Gemini. Este projeto ambicioso promete ser uma evolução significativa em relação ao atual modelo de linguagem de grande escala, o ChatGPT.
Combinando as técnicas de aprendizado que alimentaram o AlphaGo, o primeiro sistema a derrotar um jogador humano profissional no jogo de tabuleiro Go, com modelos de linguagem de grande escala (LLMs), o Gemini promete novas funcionalidades, como a capacidade de planejar e resolver problemas.
O CEO da DeepMind, Demis Hassabis, afirmou que o Gemini está sendo projetado para trabalhar com texto e é semelhante ao GPT-4, o modelo que alimenta o ChatGPT. No entanto, a equipe de Hassabis pretende combinar o LLM com o aprendizado por reforço do AlphaGo. O desenvolvimento do Gemini ainda levará meses e custará centenas de milhões de dólares, seguindo o exemplo do GPT-4, cuja criação custou mais de $100 milhões.
Além disso, a Google DeepMind e o Google’s Brain AI Lab estão trabalhando juntos no Gemini. Eles estão usando todos os vídeos, comentários e transcrições do YouTube como uma fonte principal de treinamento de dados. Isso demonstra que a Google está empenhada em aproveitar seus vastos recursos de dados para alimentar o desenvolvimento de sua IA.
O AlphaGo foi baseado em uma técnica que a DeepMind desenvolveu chamada aprendizado por reforço. Nesse processo, o software aprende a lidar com problemas desafiadores que exigem a escolha de ações, como em Go ou videogames, fazendo tentativas repetidas e recebendo feedback sobre seu desempenho. A próxima grande evolução para os modelos de linguagem pode envolver a execução de mais tarefas na internet e em computadores.
A Gemini é uma resposta da Google à ameaça competitiva representada pelo ChatGPT e outras tecnologias de IA gerativas. Desde a estreia do ChatGPT, a Google lançou seu próprio chatbot, Bard, e incorporou a IA gerativa em seu mecanismo de busca e em muitos outros produtos.
Para impulsionar a pesquisa de IA, a empresa combinou a unidade de Hassabis, a DeepMind, com o principal laboratório de IA da Google, Brain, para criar o Google DeepMind. Hassabis acredita que a nova equipe trará duas potências que têm sido fundamentais para o recente progresso da IA.
O treinamento de um grande modelo de linguagem como o GPT-4 da OpenAI envolve a alimentação de grandes quantidades de texto curado de livros, páginas da web e outras fontes em um software de aprendizado de máquina conhecido como transformador.
Este software usa os padrões nos dados de treinamento para se tornar proficiente em prever as letras e palavras que devem seguir um pedaço de texto. A profunda experiência da DeepMind com o aprendizado por reforço pode permitir que seus pesquisadores dêem ao Gemini capacidades inovadoras.
Hassabis e sua equipe também podem tentar aprimorar a tecnologia de modelo de linguagem de grande escala com ideias de outras áreas da IA. Os pesquisadores da DeepMind trabalham em áreas que vão desde a robótica até a neurociência.
Aprender com a experiência física do mundo, como humanos e animais fazem, é amplamente esperado para tornar a IA mais capaz. O fato de os modelos de linguagem aprenderem sobre o mundo indiretamente, através do texto, é visto por alguns especialistas em IA como uma grande limitação.
Hassabis está encarregado de acelerar os esforços de IA da Google, enquanto também gerencia riscos desconhecidos e potencialmente graves. O rápido progresso recente nos modelos de linguagem fez com que muitos especialistas em IA, incluindo alguns que estão construindo os algoritmos, se preocupassem com a possibilidade de a tecnologia ser usada para fins malévolos ou se tornar difícil de controlar.
Hassabis acredita que os benefícios extraordinários potenciais da IA – como para a descoberta científica em áreas como saúde ou clima – tornam imperativo que a humanidade não pare de desenvolver a tecnologia.
No entanto, isso não significa que Hassabis defende que o desenvolvimento da IA prossiga de maneira precipitada. A DeepMind tem explorado os riscos potenciais da IA desde antes do surgimento do ChatGPT, e Shane Legg, um dos cofundadores da empresa, lidera um grupo de “segurança da IA” dentro da empresa há anos. Hassabis se juntou a outras figuras de destaque da IA no mês passado para assinar uma declaração alertando que a IA pode algum dia representar um risco comparável à guerra nuclear ou a uma pandemia.
Um dos maiores desafios agora, segundo Hassabis, é determinar quais são os riscos prováveis de uma IA mais capaz. Para isso, ele diz, a DeepMind pode tornar seus sistemas mais acessíveis a cientistas externos. “Eu adoraria ver a academia ter acesso antecipado a esses modelos de fronteira”, diz ele, uma afirmação que, se seguida, poderia ajudar a abordar as preocupações de que especialistas fora das grandes empresas estão sendo excluídos da mais nova pesquisa em IA.
Fonte: nextbigfuture.com
O que é o Gemini da DeepMind?
Resposta: Gemini é um novo modelo de linguagem de grande escala em desenvolvimento pela DeepMind, uma unidade de IA da Google. O Gemini é semelhante ao GPT-4, que alimenta o ChatGPT, mas a equipe da DeepMind planeja combinar a tecnologia de modelo de linguagem de grande escala com técnicas usadas no AlphaGo, visando dar ao sistema novas capacidades, como planejamento ou a capacidade de resolver problemas.
O que torna o Gemini diferente do GPT-4?
A diferença significativa entre o Gemini e o GPT-4 está na abordagem de aprendizado. A DeepMind planeja usar técnicas de aprendizado por reforço, algo que foi fundamental para o sucesso do AlphaGo. Além disso, a equipe do Gemini pode tentar aprimorar a tecnologia de modelo de linguagem de grande escala com ideias de outras áreas da IA, como robótica e neurociência.
Pergunta: Qual é o objetivo do Gemini?
O Gemini foi desenvolvido para superar as capacidades do ChatGPT e outras tecnologias de IA gerativas. Ele será uma parte importante da resposta do Google à ameaça competitiva representada por tais tecnologias.
Quanto tempo levará para o Gemini ser concluído e qual é o custo estimado?
A conclusão do desenvolvimento do Gemini levará alguns meses e pode custar dezenas ou centenas de milhões de dólares. Para comparação, a criação do GPT-4 custou mais de 100 milhões de dólares.
Quais são as preocupações sobre a IA mais poderosa, como o Gemini?
As rápidas evoluções recentes nos modelos de linguagem levaram muitos especialistas em IA a se preocuparem com o uso malévolo da tecnologia ou com a dificuldade de controle. Além disso, a DeepMind e outras partes interessadas estão explorando os riscos potenciais da IA e chamando atenção para a necessidade de mais pesquisas para avaliar a capacidade e o controle dos novos modelos de IA.