| DC Field | Value | Language |
| dc.contributor.author | MOUSLIM, SAidi | - |
| dc.date.accessioned | 2026-06-23T07:27:10Z | - |
| dc.date.available | 2026-06-23T07:27:10Z | - |
| dc.date.issued | 2025 | - |
| dc.identifier.uri | https://repository.esi-sba.dz/jspui/handle/123456789/844 | - |
| dc.description | Encadrant : Dr. MALKI Abdelhamid | en_US |
| dc.description.abstract | The rapid advancement of AI, driven by breakthroughs in machine learning (ML), deep learning (DL),
and natural language processing (NLP), has revolutionized various industries by providing intelligent
automation solutions. This thesis focuses on developing a robust AI-based solution for invoice capture,
a task that remains labor-intensive and prone to errors due to unstructured data and varied formats. In
collaboration with Shabakett Core, an Algerian software company, this work addresses the critical
need for an advanced system that leverages
Optical Character Recognition (OCR) technologies and Large Language Models (LLMs) for accurate
and adaptive data extraction.
The primary objective is to create a scalable and high-performance system that can handle diverse
invoice formats, automate processing, and integrate seamlessly via an API. This research explores the
multidisciplinary principles of ML, DL, NLP, and LLMs to achieve this goal. The study evaluates the
effectiveness of LLMs in enhancing traditional OCR, as LLMs have been shown to outperform
classical methods, especially on tasks involving complex, handwritten, or distorted text. The thesis
aims to demonstrate the potential of this integrated approach to improve accuracy and efficiency in
real-world document processing applications, contributing to a deeper understanding of how modern
AI can solve long-standing business challenges.***
L'évolution rapide de l'IA, alimentée par des percées en apprentissage automatique (ML), en
apprentissage profond (DL) et en traitement du langage naturel (NLP), a révolutionné diverses
industries en offrant des solutions d'automatisation intelligentes. Cette thèse se concentre sur le
développement d'une solution robuste basée sur l'IA pour la capture de factures, une tâche qui reste
laborieuse et sujette aux erreurs en raison de la nature non structurée des données et de la diversité des
formats. En collaboration avec Shabakett Core, une entreprise de logiciels algérienne, ce travail répond
au besoin crucial d'un système avancé qui tire parti des technologies de reconnaissance optique de
caractères (OCR) et des grands modèles de langage (LLM) pour une extraction de données précise et
adaptative.
L'objectif principal est de créer un système évolutif et performant capable de gérer divers formats de
factures, d'automatiser le traitement et de s'intégrer de manière transparente via une API. Cette
recherche explore les principes multidisciplinaires du ML, du DL, du NLP et des LLM pour atteindre
cet objectif. La thèse évalue l'efficacité des LLM à améliorer l'OCR traditionnel, car les LLM se sont
montrés plus performants que les méthodes classiques, en particulier sur les tâches impliquant du texte
complexe, manuscrit ou déformé. L'objectif de la thèse est de démontrer le potentiel de cette approche
intégrée pour améliorer la précision et l'efficacité dans des applications de traitement de documents du
monde réel, contribuant ainsi à une compréhension plus approfondie de la manière dont l'IA moderne
peut résoudre des défis commerciaux de longue date. | en_US |
| dc.language.iso | en | en_US |
| dc.subject | Large Language Models | en_US |
| dc.subject | Deep Learning | en_US |
| dc.subject | NLP | en_US |
| dc.subject | Computer Vision | en_US |
| dc.subject | Optical Character Recogintion | en_US |
| dc.subject | Pre-trained Models | en_US |
| dc.subject | Fine-tuning | en_US |
| dc.title | AI INVOICE CAPTURE SOLUTION | en_US |
| dc.type | Thesis | en_US |
| Appears in Collections: | Master
|