Skip navigation
Please use this identifier to cite or link to this item: https://repository.esi-sba.dz/jspui/handle/123456789/875
Title: AI INVOICE CAPTURE SOLUTION
Authors: MOUSLIM, SAidi
Keywords: Large Language Models
Deep Learning
NLP
Computer Vision
Optical Character Recogintion, Pre-trained Models
Fine-tuning
Issue Date: 2025
Abstract: Invoice capture remains a significant bottleneck in business operations, characterized by laborintensive, error-prone manual data entry from diverse and unstructured document formats. This engineering thesis presents the AI Invoice Capture Solution, a robust system designed to automate this critical task. The approach is multidisciplinary, drawing heavily on Machine Learning (ML), Deep Learning (DL), Natural Language Processing (NLP), and advanced Computer Vision techniques. Specifically, the solution integrates traditional Optical Character Recognition (OCR) with the cognitive power of Large Language Models (LLMs) to enhance extraction accuracy and adaptiveness. The implementation leverages modern transformer-based models, including LayoutLMv3 and the OCR-free Donut model, alongside Gemini AI Interaction, after essential image preprocessing steps (e.g., noise removal, table enhancement). The primary objective is to develop a scalable, high-performance system capable of handling diverse invoice layouts, ensuring high data extraction accuracy, and offering seamless integration with existing software management systems via a Flask API. This work demonstrates the practical potential of combining state-of-the-art AI architectures to solve long-standing, real-world document processing challenges, ultimately contributing to greater efficiency and reduced operational costs.*** La capture de factures demeure un goulot d'étranglement important dans les opérations commerciales, caractérisée par une saisie manuelle de données laborieuse et sujette aux erreurs, provenant de formats de documents divers et non structurés. Ce mémoire de fin d'études d'ingénieur présente la Solution de Capture de Factures par IA (AI Invoice Capture Solution), un système robuste conçu pour automatiser cette tâche critique. L'approche est multidisciplinaire, s'appuyant fortement sur l'Apprentissage Automatique (AA), l'Apprentissage Profond (DL), le Traitement du Langage Naturel (TLN) et des techniques avancées de Vision par Ordinateur. Plus précisément, la solution intègre la Reconnaissance Optique de Caractères (OCR) traditionnelle avec la puissance cognitive des Grands Modèles de Langage (LLMs) pour améliorer la précision de l'extraction et l'adaptabilité. L'implémentation utilise des modèles modernes basés sur les transformateurs, notamment LayoutLMv3 et le modèle Donut (sans OCR), ainsi que l'Interaction Gemini AI, après des étapes essentielles de prétraitement d'image (par exemple, suppression du bruit, amélioration des tableaux). L'objectif principal est de développer un système évolutif et performant capable de gérer diverses mises en page de factures, d'assurer une grande précision dans l'extraction des données et d'offrir une intégration transparente avec les systèmes de gestion de logiciels existants via une API Flask. Ce travail démontre le potentiel pratique de la combinaison d'architectures d'IA de pointe pour résoudre des défis de traitement de documents réels, anciens et complexes, contribuant ainsi à une plus grande efficacité et à une réduction des coûts opérationnels.
Description: Encadrant : Dr. MALKI Abdelhamid
URI: https://repository.esi-sba.dz/jspui/handle/123456789/875
Appears in Collections:Ingenieur

Files in This Item:
File Description SizeFormat 
PFE-1-1.pdf139,84 kBAdobe PDFView/Open
Show full item record


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.