Com o enorme sucesso de novas tecnologias que incorporam inteligência artificial na criação de imagens alucinantes, como Dall-E e MidJourney, o Google não ficou de fora e acaba de apresentar DreamFusion, seu gerador de texto para imagem 3D de última geração!
Pelas informações DreamFusion é uma evolução do Dream Fields, um gerador de texto para imagem 3D revelado pelo Google em 2021. Como o Dream Fields, o DreamFusion cria suas imagens 3D combinando um Neural Radiance Field (NeRF) — ou uma rede neural que pode crie cenas 3D sintéticas usando conjuntos de dados 2D parciais — com um modelo de prompt de texto para que haja uma interação para solicitar a imagem.
Ao contrário da Dream Fields, que utilizou a tecnologia CLIP da OpenAI como modelo, a DreamFusion agora usa a sua própria: Imagen, concorrente do Google DALL-E 2.
Embora os modelos do DreamFusion não sejam totalmente realistas, eles são bastante impressionantes – como seus criadores explicam o artigo, as formas geradas por IA que são exibidas em seu site são “coerentes, com normais de alta qualidade, geometria de superfície e profundidade , e são confiáveis por utilizar um modelo de sombreamento Lambertiano.”
Em outras palavras, embora a tecnologia do Goolgle não impressione ainda como DALL-E 2 e MidJourney, a gigante de tecnologia mostra que não está ficando para trás adicionando novos elementos para este tipo de tecnologia.
Não está claro quando o DreamFusion ou uma versão com outro nome estará disponível ao público, ainda assim vale acompanhar as novidades nesta área tão promissora.
Comente!