Skip navigation
Please use this identifier to cite or link to this item: https://repository.esi-sba.dz/jspui/handle/123456789/875
Full metadata record
DC FieldValueLanguage
dc.contributor.authorMOUSLIM, SAidi-
dc.date.accessioned2026-06-30T07:28:30Z-
dc.date.available2026-06-30T07:28:30Z-
dc.date.issued2025-
dc.identifier.urihttps://repository.esi-sba.dz/jspui/handle/123456789/875-
dc.descriptionEncadrant : Dr. MALKI Abdelhamiden_US
dc.description.abstractInvoice capture remains a significant bottleneck in business operations, characterized by laborintensive, error-prone manual data entry from diverse and unstructured document formats. This engineering thesis presents the AI Invoice Capture Solution, a robust system designed to automate this critical task. The approach is multidisciplinary, drawing heavily on Machine Learning (ML), Deep Learning (DL), Natural Language Processing (NLP), and advanced Computer Vision techniques. Specifically, the solution integrates traditional Optical Character Recognition (OCR) with the cognitive power of Large Language Models (LLMs) to enhance extraction accuracy and adaptiveness. The implementation leverages modern transformer-based models, including LayoutLMv3 and the OCR-free Donut model, alongside Gemini AI Interaction, after essential image preprocessing steps (e.g., noise removal, table enhancement). The primary objective is to develop a scalable, high-performance system capable of handling diverse invoice layouts, ensuring high data extraction accuracy, and offering seamless integration with existing software management systems via a Flask API. This work demonstrates the practical potential of combining state-of-the-art AI architectures to solve long-standing, real-world document processing challenges, ultimately contributing to greater efficiency and reduced operational costs.*** La capture de factures demeure un goulot d'étranglement important dans les opérations commerciales, caractérisée par une saisie manuelle de données laborieuse et sujette aux erreurs, provenant de formats de documents divers et non structurés. Ce mémoire de fin d'études d'ingénieur présente la Solution de Capture de Factures par IA (AI Invoice Capture Solution), un système robuste conçu pour automatiser cette tâche critique. L'approche est multidisciplinaire, s'appuyant fortement sur l'Apprentissage Automatique (AA), l'Apprentissage Profond (DL), le Traitement du Langage Naturel (TLN) et des techniques avancées de Vision par Ordinateur. Plus précisément, la solution intègre la Reconnaissance Optique de Caractères (OCR) traditionnelle avec la puissance cognitive des Grands Modèles de Langage (LLMs) pour améliorer la précision de l'extraction et l'adaptabilité. L'implémentation utilise des modèles modernes basés sur les transformateurs, notamment LayoutLMv3 et le modèle Donut (sans OCR), ainsi que l'Interaction Gemini AI, après des étapes essentielles de prétraitement d'image (par exemple, suppression du bruit, amélioration des tableaux). L'objectif principal est de développer un système évolutif et performant capable de gérer diverses mises en page de factures, d'assurer une grande précision dans l'extraction des données et d'offrir une intégration transparente avec les systèmes de gestion de logiciels existants via une API Flask. Ce travail démontre le potentiel pratique de la combinaison d'architectures d'IA de pointe pour résoudre des défis de traitement de documents réels, anciens et complexes, contribuant ainsi à une plus grande efficacité et à une réduction des coûts opérationnels.en_US
dc.language.isoenen_US
dc.subjectLarge Language Modelsen_US
dc.subjectDeep Learningen_US
dc.subjectNLPen_US
dc.subjectComputer Visionen_US
dc.subjectOptical Character Recogintion, Pre-trained Modelsen_US
dc.subjectFine-tuningen_US
dc.titleAI INVOICE CAPTURE SOLUTIONen_US
Appears in Collections:Ingenieur

Files in This Item:
File Description SizeFormat 
PFE-1-1.pdf139,84 kBAdobe PDFView/Open
Show simple item record


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.