Google Veo: A Nova IA de Texto para Vídeo Revolucionária

Google Veo: A Nova IA de Texto para Vídeo Revolucionária

O Google segue rapidamente os passos do OpenAI e, apenas três meses após o anúncio do Sora, lançou o Google Veo, um modelo avançado de geração de vídeo a partir de texto. Revelado durante o Google I/O, o Veo promete revolucionar a criação de vídeos com resolução de 1080p e uma variedade de estilos cinematográficos. Vamos explorar os principais detalhes dessa importante novidade.

 

Google I/O 2023: Lançamento do Veo

No evento anual da conferência de desenvolvedores Google I/O na terça-feira (14 de maio), o Veo foi revelado. Este é o modelo de geração de vídeo mais recente e avançado do Google, que pode criar vídeos com resolução de 1080p em uma variedade de estilos cinematográficos e visuais.

Google I/O 2023: Lançamento do Veo
Google I/O 2023: Lançamento do Veo. Fonte: Divulgação Google

A gigante da tecnologia afirma “Veo se baseia em anos de nosso trabalho de modelo de vídeo generativo, incluindo Generative Query Network, DVD-GAN, Imagen-Video, Phenaki, WALT, VideoPoet e Lumiere – combinando arquitetura, leis de escala e outras técnicas inovadoras para melhorar a qualidade e resolução de saída.” A capacidade de gerar vídeos é descrita como “um nível sem precedentes de controle criativo”.

De forma semelhante ao Sora da OpenAI, a mais nova estreia do Google ainda não está disponível para o público, pois a equipe está trabalhando apenas com criadores selecionados em uma visualização privada para fins de teste. Alguns dos recursos do Veo chegarão aos curtas do YouTube e outros produtos no futuro.

Veo não é a única ferramenta nova que o Google lançou esta semana, pois o recém-lançado Imagen 3 também foi descoberto. Este é um modelo de texto para imagem que pode produzir imagens fotorrealistas e realistas. O Google afirma: “A Imagem 3 entende melhor a linguagem natural, a intenção por trás de sua solicitação e incorpora pequenos detalhes de solicitações mais longas. A compreensão avançada do modelo ajuda-o a dominar uma variedade de estilos.”

À medida que a empresa volta seu foco para a inteligência artificial, eles divulgaram detalhes sobre práticas de responsabilidade relacionadas aos modelos de vídeo e imagem. “Estamos atentos não apenas ao avanço do estado da arte, mas também a fazê-lo de forma responsável. Por isso, estamos a tomar medidas para enfrentar os desafios levantados pelas tecnologias generativas e ajudar a permitir que pessoas e organizações trabalhem de forma responsável com conteúdos gerados por IA.”

 

Google Veo: Principais Características e Capacidades

Veo: Principais Características e Capacidades

O Veo é o mais recente e avançado modelo de geração de vídeo do Google. Ele é capaz de criar vídeos com resolução de 1080p em uma variedade de estilos cinematográficos e visuais. A tecnologia do Veo se baseia em anos de trabalho da empresa com outros modelos de vídeo generativo, como Generative Query Network, DVD-GAN, Imagen-Video, Phenaki, WALT, VideoPoet e Lumiere. Esses modelos contribuem para uma combinação única de arquitetura, leis de escala e outras técnicas inovadoras que melhoram a qualidade e a resolução dos vídeos gerados.

A capacidade criativa do Veo é um de seus maiores diferenciais, oferecendo um nível sem precedentes de controle criativo aos seus usuários. Isso significa que os criadores podem manipular diversos aspectos dos vídeos gerados, ajustando estilos e visuais para atender às suas necessidades específicas.

No entanto, similar ao Sora da OpenAI, o Veo ainda não está disponível para o público em geral. Atualmente, a ferramenta está sendo testada por criadores selecionados em uma visualização privada. Embora o acesso público não esteja disponível agora, o Google planeja integrar alguns dos recursos do Veo aos curtas do YouTube e outros produtos no futuro.

Este modelo de vídeo foi revelado durante a conferência de desenvolvedores Google I/O 2023, onde também foram apresentadas outras novidades tecnológicas. Apesar de ainda estar em fase de testes, a expectativa é que o Veo faça uma revolução na forma como os vídeos são gerados e utilizados.

 

Comparação entre Google Veo e Sora da OpenAI

A principal diferença entre o Veo e o Sora da OpenAI está na resolução e na qualidade dos vídeos gerados. Enquanto o Veo do Google é capaz de criar vídeos com resolução de 1080p e uma variedade de estilos cinematográficos, o Sora se destaca pelo seu enfoque em criar vídeos de maneira eficiente usando menos recursos.

Comparação entre Google Veo e Sora da OpenAI
Fonte: Divulgação Google

Tanto o Veo quanto o Sora ainda não foram disponibilizados para o público em geral e estão em fase de testes com criadores selecionados. Essa abordagem permite que ambas as empresas ajustem e melhorem suas ferramentas antes do lançamento oficial.

Uma característica que diferencia o Veo é sua base em projetos anteriores do Google, como Generative Query Network, DVD-GAN, Imagen-Video e outros. Isso sugere que o Veo pode ter uma vantagem em termos de desenvolvimento e inovação tecnológica.

Por outro lado, o Sora da OpenAI tem sido elogiado por seu nível “sem precedentes de controle criativo”, indicando que oferece aos usuários uma flexibilidade significativa na geração de vídeos. O Veo também promete essa capacidade, mas o foco na qualidade de saída pode torná-lo mais atraente para criadores que buscam vídeos de alta resolução.

Em termos de aplicação, alguns recursos do Veo serão integrados a produtos do Google, como os curtas do YouTube, o que pode oferecer uma vantagem em termos de acessibilidade e usabilidade.

Ambas as ferramentas são promissoras no campo da geração de vídeo a partir de texto, mas sua eficácia e popularidade dependerão dos feedbacks dos testers e das implementações futuras feitas pelas respectivas empresas.

 

Disponibilidade e Planos Futuros do Google Veo

Disponibilidade e Planos Futuros do Veo

Durante o evento Google I/O 2023, o lançamento do Veo foi um dos principais destaques. Este modelo de geração de vídeo de última geração ainda não está disponível para o público em geral. No momento, a equipe do Google está trabalhando com criadores selecionados em uma visualização privada para fins de teste. Essa abordagem permite que a gigante da tecnologia colete feedback e refinamentos necessários antes de um lançamento mais amplo.

No futuro, alguns dos recursos do Veo serão incorporados aos curtas do YouTube e outros produtos do Google. Isso demonstra o compromisso da empresa em integrar suas tecnologias mais avançadas em suas plataformas populares, proporcionando aos usuários uma experiência mais rica e interativa.

Planos futuros para Veo incluem um lançamento gradual para criadores de conteúdo e profissionais da indústria, permitindo que mais pessoas aproveitem o poder desta tecnologia inovadora. Conforme a equipe do Google continua a desenvolver e aprimorar o modelo, é esperado que mais funcionalidades e melhorias sejam introduzidas, aumentando ainda mais o potencial criativo fornecido pelo Veo.

O Google também está comprometido em garantir que o uso do Veo seja realizado de forma responsável. Isso inclui práticas de responsabilidade para evitar mal-entendidos e mau uso da tecnologia, sempre incentivando o uso ético dos recursos de inteligência artificial gerados pela empresa.

 

Responsabilidade e IA: Compromisso do Google

A postura do Google frente à responsabilidade na criação e implementação de modelos de inteligência artificial é um ponto crucial discutido durante a conferência Google I/O 2023. A empresa reiterou o compromisso de avançar na tecnologia de IA de maneira ética e responsável.

Transparência e Segurança: Durante o evento, o Google destacou a importância de transparência e segurança no desenvolvimento de tecnologias generativas. Eles estão adotando uma abordagem cuidadosa para enfrentar desafios éticos e técnicos, garantindo que as ferramentas não sejam usadas de maneira prejudicial ou irresponsável.

Práticas de Responsabilidade: O Google mencionou práticas específicas para tratamento de dados, incluindo anonimização e controle de acesso, além de colaborar com especialistas em ética e IA para rever e melhorar continuamente seus modelos. Eles ressaltam que o impacto dessas tecnologias deve sempre ser avaliado e gerenciado para minimizar riscos.

Colaboração com a Comunidade: No discurso, foi enfatizado que o Google está trabalhando em estreita colaboração com criadores selecionados para testar e aprimorar o Veo e Imagen 3 de maneira controlada antes de disponibilizá-las amplamente. Essas etapas visam garantir que, quando lançadas, as ferramentas estejam preparadas para um uso responsável e seguro.

O compromisso do Google com a responsabilidade em IA reflete uma clara compreensão dos desafios e oportunidades proporcionadas por essas tecnologias emergentes. Avançar com prudência, salvaguardando princípios éticos, é essencial para a adoção segura e benéfica da inteligência artificial na sociedade.

Sumário

Picture of Janderson de Sales

Janderson de Sales

Sou um Especialista WordPress, com formação em Tecnologia da Informação e Professor de Física pela Universidade Federal de Rondônia. Trabalho com produção de conteúdo para blogs, desenvolvimento e manutenção de sites WordPress, e sou um entusiasta de tecnologias de inteligência artificial. Tenho conhecimento em produção de imagens de alta qualidade em plataformas de IAs generativas de imagens e possuo habilidades em SEO e desenvolvimento web. Estou comprometido em oferecer soluções inovadoras e eficazes para atender às necessidades do mercado digital.