A capacidade de tornar uma imagem estática em algo dinâmico e interativo tem sido um desejo antigo para muitos criadores de conteúdo e profissionais de marketing. Com o avanço da inteligência artificial (IA), essa possibilidade tornou-se realidade com a tecnologia D-ID.
Neste artigo, você vai aprender como fazer uma imagem mexer e falar online usando a poderosa tecnologia de Inteligência Artificial D-ID.
O que é D-ID?
D-ID é uma tecnologia baseada em IA que permite a animação de imagens com avatar e a sincronização labial, tornando possível dar vida, e fazer imagens falar e mexer de forma realista através de algoritmos avançados de aprendizado de máquina, o D-ID pode analisar e compreender os movimentos humanos, expressões faciais e fala, replicando-os com precisão nas imagens selecionadas.
Essa tecnologia revolucionária abre um mundo de possibilidades criativas e oferece diversas aplicações práticas em diferentes setores.
Como fazer imagem se mexer e falar com Inteligência Artificial (IA)
O processo para fazer um avatar que fala com D-ID é relativamente simples e requer apenas alguns passos. Aqui está um guia básico sobre como fazer uma imagem se mexer e falar usando o D-ID.
- Acesse o site d-id.com, e crie uma conta para conseguir criar vídeos animados com suas imagens.
- Após acessar a conta criada, no painel do editor clique em “Create Video”, e dê um nome ao projeto para facilitar a identificação.
- Escolha a opção “Choose a presenter” e em “+ADD” clique para adicionar um imagem personalizada.
- Selecione uma imagem com boa iluminação e qualidade para um melhor resultado, depois clique em abrir.
- Nas configurações para fazer a imagem falar você pode digitar um texto em “Type Your Script”, ou enviar um áudio seu em “Upload Voice Audio” que será sincronizado com a imagem escolhida.
- Após concluir a etapa acima, escolha o idioma do texto ou do áudio enviado em “Language”.
- Caso tenha escolhido “Type Your Script”, escolha a voz que irá ler o texto inserido em “Voices”.
- Agora em “Styles” escolha como será a expressão facial do avatar entre as opções triste, alegre, amigável, nervoso e outros. Alguns idiomas possuem mais estilos.
- Com as configurações feitas, em “Type Your Script” no campo de texto, clique no “icone de áudio” para que a Inteligência Artificial leia o texto.
- Agora basta clicar em “Generate Video”, e esperar que a imagem animada seja criada em formato de vídeo pela IA. Você deve receber um aviso no e-mail quando o vídeo estiver disponível para download.
- Para baixar o vídeo contendo a imagem animada que fala e mexe, acesse “Video Library” no painel do editor, sobre o vídeo gerado passe o ponteiro do mouse, clique “ícone de três pontinhos” e em seguida escolha a opção de “Download”.
Qual os requisitos de imagem para usar no D-ID?
Para garantir a melhor qualidade possível dos vídeos gerados por Inteligência Artificial D-ID, e permitir que o avatar se movimente de forma sincronizada com a fala, é fundamental cumprir todos os requisitos que são:
- Tamanho máximo de 10 MB: Garanta que o tamanho da imagem não exceda 10 MB para que o processamento seja mais eficiente e com animação suave.
- Iluminação adequada e consistente: Uma iluminação sólida e adequada ajudará com a precisão dos movimentos na animação.
- Expressão facial neutra e boca fechada: Para facilitar a sincronização labial, é recomendado que a imagem tenha uma expressão facial neutra e a boca fechada. Isso permitirá que a tecnologia D-ID analise melhor os movimentos labiais.
- Tamanho da cabeça dentro da imagem 200x200px: Para garantir que a animação seja ajustada corretamente e facilitar o alinhamento dos movimentos com a imagem.
- Rosto completamente visível, sem máscaras ou acessórios: Certifique-se de que o rosto na imagem esteja completamente visível e sem obstruções como máscaras, óculos ou acessórios que possam interferir nos movimentos da animação.
- Formatos suportados – JPEG, JPG, PNG: O D-ID suporta os formatos de imagem JPEG, JPG e PNG.
Qual o formato de Vídeo no D-ID?
Cada vídeo gerado pelo gerador de vídeo D-ID é convertido para o formato MP4. A qualidade do vídeo gerado é determinada pelo AI Presenter em uso e também pelo plano do D-ID Creative Reality™ Studio.
Por padrão, o AI Presenter oferece uma resolução máxima de saída de 1280 × 1280 pixels. No entanto, a resolução de saída pode variar com base no plano do AI Presenter selecionado. Aqui estão as resoluções de saída para os diferentes planos:
- Plano Trial: A resolução de saída é de 720p.
- Plano Lite: O recurso de apresentador premium não é suportado neste plano.
- Planos Pro, Advanced e Enterprise: A resolução de saída é de 1080p.
Quanto a utilização do D-ID Creative Reality Studio no plano Trial, é importante ter em mente que a duração do vídeo está limitada a 5 minutos. Portanto, é recomendado planejar o conteúdo do vídeo de acordo com essa restrição
Qual formato e durações de áudio suportados pelo D-ID?
O tamanho máximo do arquivo de áudio é de no máximo 15 MB e a duração é limitada a 5 minutos no Plano Trial. Os formatos de áudio suportados incluem MP3, FLAC, M4A, MP4 e WAV.
Lembrando que essas limitações podem sofrer alterações a qualquer momento e mudar para garantir que a ferramenta esteja funcionando para todos e não ultrapasse sua capacidade máxima.
Quais idiomas o D-ID disponibiliza?
A ferramenta atualmente oferece uma ampla seleção de mais de 119 idiomas para você escolher. Além disso, você também tem a liberdade de selecionar o sotaque e o estilo de fala que considera mais adequados ao seu projeto.
Essa flexibilidade proporcionada pela ferramenta permite que você crie uma experiência única, garantindo que suas animações e projetos sejam impactantes e atrativos para seu público-alvo.
Os vídeos gerados possuem marca d’água?
Sim, na versão gratuita do D-ID, é importante ter em mente que os vídeos criados serão marcados com uma marca d’água. Essa marca d’água varia de acordo com o plano escolhido:
- No plano Free Trial e Lite, uma marca d’água do logotipo D-ID será aplicada nos vídeos.
- Os usuários do plano Pro terão uma pequena marca d’água genérica de IA.
- Já os usuários dos planos Advanced e Enterprise têm a opção de personalizar a marca d’água de IA, mas não podem removê-la completamente.
Caso deseje remover a marca d’água por completo, é necessário o uso de um software de edição de vídeos, ou uma ferramenta que muitos usam após gerar vídeos no D-ID que é o “Easy Video Logo Remove”.
Quais Imagens são possíveis fazer mover e falar com D-ID
O D-ID é capaz de animar diversos tipos de imagens, desde retratos de pessoa até objetos animados, paisagens e ilustrações. Seja qual for o tipo de imagem estática que você deseja fazer mexer e falar, o D-ID consegue fazer, e ainda irá transformar imagens em vídeo envolvente para entretenimento de seus espectadores.
Então se você sempre teve vontade de mexer foto antiga, criar canal no Youtube sem aparecer e criar histórias em vídeo com personagens gerados por Inteligência Artificial, a ferramenta D-ID vai te ajudar.
Conclusão
Fazer uma foto se mexer e falar com Inteligência Artificial, e ao mesmo tempo transformar isso em vídeo, nunca foi tão simples graças a tecnologia D-ID que está cada dia mais presente em nosso dia-a-dia. E sem dúvidas, o uso dessa ferramenta vai ajudar em vários setores que carecem de recursos audiovisuais.