Skip navigation
Please use this identifier to cite or link to this item: https://repository.esi-sba.dz/jspui/handle/123456789/844
Title: AI INVOICE CAPTURE SOLUTION
Authors: MOUSLIM, SAidi
Keywords: Large Language Models
Deep Learning
NLP
Computer Vision
Optical Character Recogintion
Pre-trained Models
Fine-tuning
Issue Date: 2025
Abstract: The rapid advancement of AI, driven by breakthroughs in machine learning (ML), deep learning (DL), and natural language processing (NLP), has revolutionized various industries by providing intelligent automation solutions. This thesis focuses on developing a robust AI-based solution for invoice capture, a task that remains labor-intensive and prone to errors due to unstructured data and varied formats. In collaboration with Shabakett Core, an Algerian software company, this work addresses the critical need for an advanced system that leverages Optical Character Recognition (OCR) technologies and Large Language Models (LLMs) for accurate and adaptive data extraction. The primary objective is to create a scalable and high-performance system that can handle diverse invoice formats, automate processing, and integrate seamlessly via an API. This research explores the multidisciplinary principles of ML, DL, NLP, and LLMs to achieve this goal. The study evaluates the effectiveness of LLMs in enhancing traditional OCR, as LLMs have been shown to outperform classical methods, especially on tasks involving complex, handwritten, or distorted text. The thesis aims to demonstrate the potential of this integrated approach to improve accuracy and efficiency in real-world document processing applications, contributing to a deeper understanding of how modern AI can solve long-standing business challenges.*** L'évolution rapide de l'IA, alimentée par des percées en apprentissage automatique (ML), en apprentissage profond (DL) et en traitement du langage naturel (NLP), a révolutionné diverses industries en offrant des solutions d'automatisation intelligentes. Cette thèse se concentre sur le développement d'une solution robuste basée sur l'IA pour la capture de factures, une tâche qui reste laborieuse et sujette aux erreurs en raison de la nature non structurée des données et de la diversité des formats. En collaboration avec Shabakett Core, une entreprise de logiciels algérienne, ce travail répond au besoin crucial d'un système avancé qui tire parti des technologies de reconnaissance optique de caractères (OCR) et des grands modèles de langage (LLM) pour une extraction de données précise et adaptative. L'objectif principal est de créer un système évolutif et performant capable de gérer divers formats de factures, d'automatiser le traitement et de s'intégrer de manière transparente via une API. Cette recherche explore les principes multidisciplinaires du ML, du DL, du NLP et des LLM pour atteindre cet objectif. La thèse évalue l'efficacité des LLM à améliorer l'OCR traditionnel, car les LLM se sont montrés plus performants que les méthodes classiques, en particulier sur les tâches impliquant du texte complexe, manuscrit ou déformé. L'objectif de la thèse est de démontrer le potentiel de cette approche intégrée pour améliorer la précision et l'efficacité dans des applications de traitement de documents du monde réel, contribuant ainsi à une compréhension plus approfondie de la manière dont l'IA moderne peut résoudre des défis commerciaux de longue date.
Description: Encadrant : Dr. MALKI Abdelhamid
URI: https://repository.esi-sba.dz/jspui/handle/123456789/844
Appears in Collections:Master

Files in This Item:
File Description SizeFormat 
Master-1-1.pdf134,89 kBAdobe PDFView/Open
Show full item record


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.