Text2NeRF : une IA qui génère des scènes en 3D

Tout le monde en parle sur les réseaux, voici la dernière folie qui va révolutionner la création graphique !

Text2NeRF, un modèle d’intelligence artificielle pour créer des scènes 3D à partir d’un prompt.

Text2NeRF est un nouveau modèle qui transforme les descriptions de texte en scènes 3D dans une variété de styles artistiques différents. C’est comme si votre ordinateur était un artiste 3D et que vous lui donniez un briefing en quelques mots pour générer une scène comme celle-ci :

Exemple : « A cosy living room »

Champ de rayonnement neuronal

Text2NeRF utilise un champ de rayonnement neuronal (Neural Radiance Field = NeRF) pour représenter « implicitement » la scène 3D. En d’autres termes, il utilise un réseau neuronal pour modéliser la profondeur de chaque point dans l’espace 3D.

Représentation des profondeurs 3D de la scène ci-dessus

Un modèle de diffusion couplé à un modèle de gestion de la profondeur

Un modèle texte-image pré-entraîné (modèle de diffusion latente) génère une version approximative de la scène sur la base de la description du texte. La structure 3D est ensuite déterminée par une méthode d’estimation monoculaire de la profondeur.

Illustration :

Schéma de la pipeline de Text2NeRF
Schéma de la pipeline du modèle de génération

L’inpainting pour générer les parties masquées

Pour s’assurer que le rendu de la scène 3D est correct quel que soit le point de vue, une stratégie d’inpainting génère les parties cachées de l’image lorsqu’on déplace le point d’observation.

Exemple : a cabin in the woods

Des résultats très prometteurs

Les résultats montrent que Text2NeRF surpasse les méthodes existantes en créant des scènes 3D réalistes, multi-vues, cohérentes et diverses à partir d’une variété de descriptions textuelles.

Text2NeRF ne se contente pas des styles photoréalistes mais peut également travailler sur de nombreux styles graphiques (cartoon, fantasy, surréaliste…), de la même manière que Midjourney et Stable Diffusion.

Prompt : Future City in surrealist style

Génération de scènes 3D à 360°

Text2NeRF peut également générer des scènes à 360°… Imaginez ce que ça pourrait donner pour la création de jeux vidéo ou la réalité virtuelle !

Scène 3D à 360 degrés générée par Text2NeRF

Pour en savoir plus sur Text2NeRF

Ces recherches nous viennent de l’Université de Hong Kong et du laboratoire de recherche Tencent AI. Envie d’en savoir plus ?

Le papier de recherche est ici : https://arxiv.org/abs/2305.11588

La page Github du projet : https://eckertzhang.github.io/Text2NeRF.github.io/

Nous serions ravis de connaître votre avis

Laisser un commentaire

Direct Intelligence Artificielle
Logo