Google lança nova versão de IA que transforma textos em vídeos

Ecrã de um smartphone a mostrar a página da tecnologia Veo, da Google DeepMind. A imagem de fundo exibe uma criatura marinha com manchas (possivelmente uma medusa ou polvo), e o texto em destaque diz “Our most capable generative video model” com um botão azul que convida o utilizador a inscrever-se para testar no VideoFX.

A Google lançou uma nova versão de seu modelo de inteligência artificial (IA), capaz de gerar vídeos a partir de textos. O Veo 2 consegue criar produções visuais em alta resolução – 720p em arquivos MP4 – em apenas oito segundos, a partir de prompts de texto e imagem. A funcionalidade, por enquanto, está disponível apenas para assinantes do Gemini Advanced.

Os usuários também poderão gerar animações com o Whisk Animate, acessível por meio do Google One AI Premium.

No anúncio, a Google afirmou que a ferramenta é capaz de produzir cenas mais realistas e com detalhes mais refinados, por “entender melhor o mundo real e o movimento humano”. A versão anterior do Veo, lançada em maio de 2024, não oferecia a mesma definição de detalhes nem contava com o recurso para animações.

Leia mais: Skymail mira em grandes clientes e quer faturar R$ 140 milhões em 2026

Para garantir a segurança dos usuários, a empresa realizou diversos testes com sua ‘equipe vermelha’ – setor formado por hackers especializados em identificar brechas nos modelos de IA da Google. Além disso, todos os vídeos gerados com o Veo 2 são marcados com SynthID, uma marca d’água digital incorporada em cada quadro, que identifica o conteúdo como gerado por inteligência artificial.

A big tech ressaltou ainda que as respostas do Veo 2 são determinadas principalmente pelos prompts dos usuários e que, “como qualquer ferramenta de IA generativa, pode haver casos em que sejam gerados conteúdos considerados questionáveis”.

Para utilizar a nova ferramenta, o internauta deve selecionar o Veo 2 no menu de modelos de IA do Gemini e inserir o comando em texto. É possível descrever a cena e incluir o gênero, o tipo de lente de câmera que seria usado na gravação e outros efeitos de vídeo.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!