| DC Field | Value | Language |
| dc.contributor.author | MOUSLIM, SAidi | - |
| dc.date.accessioned | 2026-06-30T07:28:30Z | - |
| dc.date.available | 2026-06-30T07:28:30Z | - |
| dc.date.issued | 2025 | - |
| dc.identifier.uri | https://repository.esi-sba.dz/jspui/handle/123456789/875 | - |
| dc.description | Encadrant : Dr. MALKI Abdelhamid | en_US |
| dc.description.abstract | Invoice capture remains a significant bottleneck in business operations, characterized by laborintensive,
error-prone manual data entry from diverse and unstructured document formats. This
engineering thesis presents the AI Invoice Capture Solution, a robust system designed to automate this
critical task. The approach is multidisciplinary, drawing heavily on Machine Learning (ML), Deep
Learning (DL), Natural Language Processing (NLP), and advanced Computer Vision techniques.
Specifically, the solution integrates traditional Optical Character Recognition (OCR) with the
cognitive power of Large Language Models (LLMs) to enhance extraction accuracy and adaptiveness.
The implementation leverages modern transformer-based models, including LayoutLMv3 and the
OCR-free Donut model, alongside Gemini AI Interaction, after essential image preprocessing steps
(e.g., noise removal, table enhancement).
The primary objective is to develop a scalable, high-performance system capable of handling diverse
invoice layouts, ensuring high data extraction accuracy, and offering seamless integration with existing
software management systems via a Flask API. This work demonstrates the practical potential of
combining state-of-the-art AI architectures to solve long-standing, real-world document processing
challenges, ultimately contributing to greater efficiency and reduced operational costs.***
La capture de factures demeure un goulot d'étranglement important dans les opérations commerciales,
caractérisée par une saisie manuelle de données laborieuse et sujette aux erreurs, provenant de formats
de documents divers et non structurés. Ce mémoire de fin d'études d'ingénieur présente la Solution de
Capture de Factures par IA (AI Invoice Capture Solution), un système robuste conçu pour automatiser
cette tâche critique. L'approche est multidisciplinaire, s'appuyant fortement sur l'Apprentissage
Automatique (AA), l'Apprentissage Profond (DL), le Traitement du Langage Naturel (TLN) et des
techniques avancées de Vision par Ordinateur.
Plus précisément, la solution intègre la Reconnaissance Optique de Caractères (OCR) traditionnelle
avec la puissance cognitive des Grands Modèles de Langage (LLMs) pour améliorer la précision de
l'extraction et l'adaptabilité. L'implémentation utilise des modèles modernes basés sur les
transformateurs, notamment LayoutLMv3 et le modèle Donut (sans OCR), ainsi que l'Interaction
Gemini AI, après des étapes essentielles de prétraitement d'image (par exemple, suppression du bruit,
amélioration des tableaux).
L'objectif principal est de développer un système évolutif et performant capable de gérer diverses
mises en page de factures, d'assurer une grande précision dans l'extraction des données et d'offrir une
intégration transparente avec les systèmes de gestion de logiciels existants via une API Flask. Ce
travail démontre le potentiel pratique de la combinaison d'architectures d'IA de pointe pour résoudre
des défis de traitement de documents réels, anciens et complexes, contribuant ainsi à une plus grande
efficacité et à une réduction des coûts opérationnels. | en_US |
| dc.language.iso | en | en_US |
| dc.subject | Large Language Models | en_US |
| dc.subject | Deep Learning | en_US |
| dc.subject | NLP | en_US |
| dc.subject | Computer Vision | en_US |
| dc.subject | Optical Character Recogintion, Pre-trained Models | en_US |
| dc.subject | Fine-tuning | en_US |
| dc.title | AI INVOICE CAPTURE SOLUTION | en_US |
| Appears in Collections: | Ingenieur
|