Skip navigation
Please use this identifier to cite or link to this item: https://repository.esi-sba.dz/jspui/handle/123456789/73
Title: Classification des textes en arabe basée sur les représentations en graphes
Authors: LACEFAR, INess Chaima
Keywords: La Classification Textuelle
Représentations En Graphes
Embeddings Des Mots
Text Rank
Issue Date: 2020
Abstract: Le traitement automatique du langage naturel est très difficile à maîtriser à cause de la complexité du langage humain et des particularités qu’il contient, ce qui empêche d’appliquer des règles fixes qui couvrent tous les aspects. Les recherches dans le domaine du traitement de la langue arabe n’ont vu le jour que ces dernières années où différentes tentatives ont présenté des performances plus ou moins satisfaisantes. Ces recherches se basent généralement sur des représentations de base qui utilisent des notions simples pour pondérer et classer les termes. Cependant, ces représentations ne sont pas assez précises pour refléter les contenus des documents arabes dans lesquels les dépendances entre les mots sont assez fortes,et aussi du fait de l’ambiguïté, d’agglutination et de divers problèmes de cette langue. Dans ce travail, nous présentons quelques approches qui montrent quelques représentations en graphes et en embedding des mots proposées pour la classification des textes, et nous étudions aussi les connaissances linguistiques et morphologiques de la langue arabe ce qui permet d’améliorer les performances, en exploitant pleinement sa richesse.Nous présentons également une comparaison entre ces travaux et une synthèse pour extraire suffisamment d’informations dans ce domaine de recherche. En se basant sur cette étude bibliographique, une application web est proposée pour la classification des textes arabes en se basant sur une représentation des graphes, en utilisant l’algorithme TextRank et des méthodes d’apprentissage automatique supervisé.*** Automatic natural language processing mastering is complicated due to the complexity of human language and its charasteristic, which avoids the application of fixed rules to the totality of aspects. Research in the field of language processing for the Arabic language only emerged a few years after the first work, various attempts have yielded more or less satisfactory performance. These searches are generally based on traditional representations ; use simple concepts to weight and classify the terms. However, these representations are not precise enough to represent the contents of Arabic documents in which the dependencies between the words are strong, and because of the ambiguity, agglutination, and various problems of this language. In this work, we present some approaches which show some representations in graphs and embedding of the words proposed for the classification of texts, and also we study the linguistic and morphological knowledge of the Arabic language, which allows improving performances, in fully exploiting its wealth. This allows at the end to make a comparison between these works and then a synthesis to obtain enough information in this area of research. Based on this bibliographic study, a web application is proposed for the classification of Arabic texts based on a representation of graphs, using the textbf TextRank algorithm and supervised machine learning methods.
Description: Mme BENNABI Sakina Rim Encadreur
URI: https://repository.esi-sba.dz/jspui/handle/123456789/73
Appears in Collections:Ingénieur

Files in This Item:
File Description SizeFormat 
Memoire Ingénieur VF.pdf199,91 kBAdobe PDFView/Open
Show full item record


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.