dc.contributor.authorMESBOUT, DJamel EDdine-
dc.contributor.authorBABAOUSMAIL, ZAkaria-
dc.descriptionSupervisor : Mr. Belkacem KHALDI Co-Supervisor : Mr. Mohammed BEKKOUCHEen_US
dc.description.abstractThis report introduces a novel two-stage approach for generating accurate 3D building models from textual descriptions, addressing a critical challenge in architectural design and game asset creation. In the first stage, we leverage the power of a finetuned Stable Diffusion model, a leading text-to-image synthesis approach, to generate high-fidelity images from textual prompts detailing specific building features. Subsequently, these generated images are processed by InstantMesh, a state-of-the-art 3D object reconstruction model, to generate detailed 3D representations. To enhance the accuracy and quality of the generated models, we meticulously curated a specialized dataset of building images, employing the advanced annotation and summarization capabilities of LLaVa and LLaMa 3. Our experimental results demonstrate the effectiveness of this dual-stage pipeline in accurately translating textual descriptions into precise 3D models. While the current framework shows promising results, we acknowledge there is room for further refinement and optimization. This work paves the way for streamlining the creation of 3D building models, offering significant benefits to architects in the early stages of conceptual design and providing valuable assets for the gaming industry. *** Ce rapport pr´esente une nouvelle m´ethode en deux ´etapes pour cr´eer des mod`eles 3D r´ealistes de bˆatiments `a partir de donn´ees textuelles, r´esolvant ainsi un d´efi majeur dans les domaines de la conception graphique et de la cr´eation de ressources pour les jeux vid´eo. Dans un premier temps, nous utilisons la puissance du mod`ele Stable Diffusion, une technique de g´en´eration d’images avanc´ee, pour g´en´erer des images fiables `a partir de descriptions textuelles de bˆatiments sp´ecifiques. Ensuite, ces images sont trait´ees avec InstantMesh, une m´ethode de g´en´eration 3D d’´etat de l’art, pour cr´eer des objets 3D d´etaill´es. Pour am´eliorer la pr´ecision et la qualit´e des mod`eles g´en´er´es, nous avons soigneusement constitu´e un ensemble de donn´ees d’images et d’objets 3D en tirant parti des capacit´es avanc´ees d’annotation et de r´esum´e de LLaVa et LLaMa 3. Les r´esultats de la recherche d´emontrent l’efficacit´e de ce r´eseau pour g´en´erer des informations d´etaill´ees sur chaque bˆatiment. Bien que le cadre actuel donne des r´esultats prometteurs, nous reconnaissons qu’il existe des possibilit´es de raffinement et d’optimisation suppl´ementaires. Ce travail fournit un moyen de simplifier la cr´eation de mod`eles 3D de bˆatiments, ce qui b´en´eficiera grandement aux architectes d`es les premi`eres ´etapes de la conception et fournira des outils pr´ecieux pour la production de jeux vid´eo.en_US
dc.subjectComputer Visionen_US
dc.subjectNatural Language Processingen_US
dc.subjectText To Imageen_US
dc.subjectTmage To 3Den_US
dc.subjectText To 3Den_US
dc.titleGenerating 3D Building Models from Textual Descriptionsen_US
