Share

Como fazer imagem se mexer e falar online com IA

A capacidade de tornar uma imagem estática em algo dinâmico e interativo tem sido um desejo antigo para muitos criadores de conteúdo e profissionais de marketing. Com o avanço da inteligência artificial (IA), essa possibilidade tornou-se realidade com a tecnologia D-ID.

Neste artigo, você vai aprender como fazer uma imagem mexer e falar online usando a poderosa tecnologia de Inteligência Artificial D-ID.

O que é D-ID?

D-ID é uma tecnologia baseada em IA que permite a animação de imagens com avatar e a sincronização labial, tornando possível dar vida, e fazer imagens falar e mexer de forma realista através de algoritmos avançados de aprendizado de máquina, o D-ID pode analisar e compreender os movimentos humanos, expressões faciais e fala, replicando-os com precisão nas imagens selecionadas.

Publicidade

Essa tecnologia revolucionária abre um mundo de possibilidades criativas e oferece diversas aplicações práticas em diferentes setores.

Como fazer imagem se mexer e falar com Inteligência Artificial (IA)

O processo para fazer um avatar que fala com D-ID é relativamente simples e requer apenas alguns passos. Aqui está um guia básico sobre como fazer uma imagem se mexer e falar usando o D-ID.

  1. Acesse o site d-id.com, e crie uma conta para conseguir criar vídeos animados com suas imagens.
  2. Após acessar a conta criada, no painel do editor clique em “Create Video”, e dê um nome ao projeto para facilitar a identificação.
  3. Escolha a opção “Choose a presenter” e em “+ADD” clique para adicionar um imagem personalizada.
  4. Selecione uma imagem com boa iluminação e qualidade para um melhor resultado, depois clique em abrir.
  5. Nas configurações para fazer a imagem falar você pode digitar um texto em “Type Your Script”, ou enviar um áudio seu em “Upload Voice Audio” que será sincronizado com a imagem escolhida.
  6. Após concluir a etapa acima, escolha o idioma do texto ou do áudio enviado em “Language”.
  7. Caso tenha escolhido “Type Your Script”, escolha a voz que irá ler o texto inserido em “Voices”.
  8. Agora em “Styles” escolha como será a expressão facial do avatar entre as opções triste, alegre, amigável, nervoso e outros. Alguns idiomas possuem mais estilos.
  9. Com as configurações feitas, em “Type Your Script” no campo de texto, clique no “icone de áudio” para que a Inteligência Artificial leia o texto.
  10. Agora basta clicar em “Generate Video”, e esperar que a imagem animada seja criada em formato de vídeo pela IA. Você deve receber um aviso no e-mail quando o vídeo estiver disponível para download.
  11. Para baixar o vídeo contendo a imagem animada que fala e mexe, acesse “Video Library” no painel do editor, sobre o vídeo gerado passe o ponteiro do mouse, clique “ícone de três pontinhos” e em seguida escolha a opção de “Download”.

Qual os requisitos de imagem para usar no D-ID?

Para garantir a melhor qualidade possível dos vídeos gerados por Inteligência Artificial D-ID, e permitir que o avatar se movimente de forma sincronizada com a fala, é fundamental cumprir todos os requisitos que são:

Publicidade
  • Tamanho máximo de 10 MB: Garanta que o tamanho da imagem não exceda 10 MB para que o processamento seja mais eficiente e com animação suave.
  • Iluminação adequada e consistente: Uma iluminação sólida e adequada ajudará com a precisão dos movimentos na animação.
  • Expressão facial neutra e boca fechada: Para facilitar a sincronização labial, é recomendado que a imagem tenha uma expressão facial neutra e a boca fechada. Isso permitirá que a tecnologia D-ID analise melhor os movimentos labiais.
  • Tamanho da cabeça dentro da imagem 200x200px: Para garantir que a animação seja ajustada corretamente e facilitar o alinhamento dos movimentos com a imagem.
  • Rosto completamente visível, sem máscaras ou acessórios: Certifique-se de que o rosto na imagem esteja completamente visível e sem obstruções como máscaras, óculos ou acessórios que possam interferir nos movimentos da animação.
  • Formatos suportados – JPEG, JPG, PNG: O D-ID suporta os formatos de imagem JPEG, JPG e PNG.

Qual o formato de Vídeo no D-ID?

Cada vídeo gerado pelo gerador de vídeo D-ID é convertido para o formato MP4. A qualidade do vídeo gerado é determinada pelo AI Presenter em uso e também pelo plano do D-ID Creative Reality™ Studio.

Por padrão, o AI Presenter oferece uma resolução máxima de saída de 1280 × 1280 pixels. No entanto, a resolução de saída pode variar com base no plano do AI Presenter selecionado. Aqui estão as resoluções de saída para os diferentes planos:

  • Plano Trial: A resolução de saída é de 720p.
  • Plano Lite: O recurso de apresentador premium não é suportado neste plano.
  • Planos Pro, Advanced e Enterprise: A resolução de saída é de 1080p.

Quanto a utilização do D-ID Creative Reality Studio no plano Trial, é importante ter em mente que a duração do vídeo está limitada a 5 minutos. Portanto, é recomendado planejar o conteúdo do vídeo de acordo com essa restrição

Qual formato e durações de áudio suportados pelo D-ID?

O tamanho máximo do arquivo de áudio é de no máximo 15 MB e a duração é limitada a 5 minutos no Plano Trial. Os formatos de áudio suportados incluem MP3, FLAC, M4A, MP4 e WAV.

Lembrando que essas limitações podem sofrer alterações a qualquer momento e mudar para garantir que a ferramenta esteja funcionando para todos e não ultrapasse sua capacidade máxima.

Quais idiomas o D-ID disponibiliza?

A ferramenta atualmente oferece uma ampla seleção de mais de 119 idiomas para você escolher. Além disso, você também tem a liberdade de selecionar o sotaque e o estilo de fala que considera mais adequados ao seu projeto.

Essa flexibilidade proporcionada pela ferramenta permite que você crie uma experiência única, garantindo que suas animações e projetos sejam impactantes e atrativos para seu público-alvo.

Os vídeos gerados possuem marca d’água?

Sim, na versão gratuita do D-ID, é importante ter em mente que os vídeos criados serão marcados com uma marca d’água. Essa marca d’água varia de acordo com o plano escolhido:

  • No plano Free Trial e Lite, uma marca d’água do logotipo D-ID será aplicada nos vídeos.
  • Os usuários do plano Pro terão uma pequena marca d’água genérica de IA.
  • Já os usuários dos planos Advanced e Enterprise têm a opção de personalizar a marca d’água de IA, mas não podem removê-la completamente.

Caso deseje remover a marca d’água por completo, é necessário o uso de um software de edição de vídeos, ou uma ferramenta que muitos usam após gerar vídeos no D-ID que é o “Easy Video Logo Remove”.

Quais Imagens são possíveis fazer mover e falar com D-ID

O D-ID é capaz de animar diversos tipos de imagens, desde retratos de pessoa até objetos animados, paisagens e ilustrações. Seja qual for o tipo de imagem estática que você deseja fazer mexer e falar, o D-ID consegue fazer, e ainda irá transformar imagens em vídeo envolvente para entretenimento de seus espectadores.

Então se você sempre teve vontade de mexer foto antiga, criar canal no Youtube sem aparecer e criar histórias em vídeo com personagens gerados por Inteligência Artificial, a ferramenta D-ID vai te ajudar.

Conclusão

Fazer uma foto se mexer e falar com Inteligência Artificial, e ao mesmo tempo transformar isso em vídeo, nunca foi tão simples graças a tecnologia D-ID que está cada dia mais presente em nosso dia-a-dia. E sem dúvidas, o uso dessa ferramenta vai ajudar em vários setores que carecem de recursos audiovisuais.

Categorias