Google veo 3

Tipo de IA

Criação de vídeo

Avaliação Upwego

Descrição

Google veo 3 é um modelo da Google DeepMind que gera vídeos a partir de texto ou imagens. Consegue produzir vídeos curtos com alta qualidade visual, movimento realista e, em alguns casos, áudio sincronizado como diálogos, efeitos sonoros e ambiente. Está integrado no Google AI Studio e no ecossistema Gemini.

Principais funcionalidades

  • Geração de vídeos a partir de texto.
  • Criação de vídeos a partir de imagens de referência.
  • Produção de cenas com movimento relativamente realista e alguma consistência temporal.
  • Suporte a áudio sincronizado, incluindo som ambiente, efeitos e diálogos.
  • Boa capacidade de interpretar prompts complexos e detalhados.
  • Criação de vídeos curtos (com duração limitada) em resolução até HD na maioria dos casos.
  • Integração com ferramentas da Google, como Gemini e Vertex AI.

Prós

Contras

  • Integração nativa de áudio com vídeo, incluindo diálogos, efeitos e som ambiente, permitindo gerar conteúdo já com áudio sincronizado.
  • Boa qualidade visual, com resultados frequentemente realistas e com aspeto próximo de produção cinematográfica, embora ainda não seja consistente em todos os casos.
  • Boa aderência a prompts detalhados, conseguindo seguir instruções de cena, estilo e contexto com relativa precisão.
  • Suporte a resoluções até HD, adequado para a maioria dos usos atuais (resoluções como 4K ainda são limitadas ou não amplamente disponíveis).
  • Controlo criativo através de prompts, permitindo orientar câmara, estilo e estética, embora sem controlo técnico direto como num software de edição tradicional.
  • Requer acesso através de planos pagos ou disponibilidade limitada, o que pode dificultar o uso por utilizadores casuais ou para testes rápidos.
  • Não oferece suporte avançado para transparência (como canal alfa), o que pode limitar a integração direta em workflows de composição e efeitos visuais.
  • Resultados podem ser inconsistentes em alguns casos, especialmente com prompts complexos, levando a variações na fidelidade da cena, do estilo ou da coerência entre elementos.
  • Ainda é uma tecnologia em evolução, podendo apresentar instabilidade, mudanças frequentes e limitações no desempenho.
  • Pode ser necessário dividir a geração de vídeos em várias partes com prompts mais curtos para garantir maior fidelidade ao resultado pretendido.

Leia mais sobre esta ferramenta