Skip navigation
Please use this identifier to cite or link to this item: https://repository.esi-sba.dz/jspui/handle/123456789/544
Full metadata record
DC FieldValueLanguage
dc.contributor.authorBENLARIA, AYyoub YAssine-
dc.contributor.authorDAFI, ADel-
dc.date.accessioned2023-10-17T13:23:09Z-
dc.date.available2023-10-17T13:23:09Z-
dc.date.issued2023-
dc.identifier.urihttps://repository.esi-sba.dz/jspui/handle/123456789/544-
dc.descriptionEncadrant : Dr. Mediani Mohammed / Dr. Khaldi Belkacemen_US
dc.description.abstractABSTRACT : This study explores the development of Natural Language Processing (NLP) tools and models for the Tamasheq language, a low-resource and underrepresented language spoken in North Africa. The research focuses on Automatic Speech Recognition (ASR) and translation tasks, utilizing fine-tuning and data augmentation techniques. Additionally, a user-friendly TamaLinguist Platform is introduced, providing easier access and utilization of the developed models. The findings indicate that fine-tuning ASR models with mixed datasets and integrating features from other languages and models can significantly enhance accuracy. Moreover, the research demonstrates progress in Tamasheq text translation, although challenges remain due to limited data and language structural complexities. This work highlights the potential of NLP advancements in revitalizing and preserving endangered languages like Tamasheq. *** Résumé : Cette étude explore le développement d’outils et de modèles de traitement du langage naturel (NLP) pour la langue Tamasheq, une langue à faibles ressources et sousreprésentée parlée en Afrique du Nord. La recherche se concentre sur la reconnaissance automatique de la parole (ASR) et les tâches de traduction, en utilisant des techniques de Fine-Tuning et d’augmentation des données. De plus, une plate-forme TamaLinguist conviviale est introduite, facilitant l’accès et l’utilisation des modèles développés. Les résultats indiquent quun Fine-Tuning des modèles ASR avec des ensembles de données mixtes et lintégration de fonctionnalités dautres langages et modèles peuvent améliorer considérablement la précision. De plus, la recherche démontre des progrès dans la traduction de textes en Tamasheq, même si des défis subsistent en raison du nombre limité de données et de la complexité structurelle de la langue. Ce travail met en évidence le potentiel des progrès de la NLP dans la revitalisation et la préservation de langues en voie de disparition comme le Tamasheq.en_US
dc.language.isoenen_US
dc.subjectNatural Language Processingen_US
dc.subjectAutomatic Speech Recognitionen_US
dc.subjectMachine Translationen_US
dc.subjectlow Resource Languageen_US
dc.subjectDeep Learningen_US
dc.subjectTamasheqen_US
dc.subjectTuaregen_US
dc.subjectWav2Vec2en_US
dc.subjectM2Men_US
dc.titleA Smart NLP System for Tamasheq – Arabic Bilingual Corpus Buildingen_US
dc.typeThesisen_US
Appears in Collections:Ingénieur

Files in This Item:
File Description SizeFormat 
PFE_final-1-1.pdf78,35 kBAdobe PDFView/Open
Show simple item record


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.