DC Field | Value | Language |
dc.contributor.author | LACEFAR, INess Chaima | - |
dc.date.accessioned | 2022-03-31T08:17:13Z | - |
dc.date.available | 2022-03-31T08:17:13Z | - |
dc.date.issued | 2020 | - |
dc.identifier.uri | https://repository.esi-sba.dz/jspui/handle/123456789/73 | - |
dc.description | Mme BENNABI Sakina Rim Encadreur | en_US |
dc.description.abstract | Le traitement automatique du langage naturel est très difficile à maîtriser à cause de la complexité
du langage humain et des particularités qu’il contient, ce qui empêche d’appliquer des règles fixes
qui couvrent tous les aspects. Les recherches dans le domaine du traitement de la langue arabe n’ont
vu le jour que ces dernières années où différentes tentatives ont présenté des performances plus ou
moins satisfaisantes. Ces recherches se basent généralement sur des représentations de base qui
utilisent des notions simples pour pondérer et classer les termes. Cependant, ces représentations
ne sont pas assez précises pour refléter les contenus des documents arabes dans lesquels les
dépendances entre les mots sont assez fortes,et aussi du fait de l’ambiguïté, d’agglutination et de
divers problèmes de cette langue. Dans ce travail, nous présentons quelques approches qui montrent
quelques représentations en graphes et en embedding des mots proposées pour la classification
des textes, et nous étudions aussi les connaissances linguistiques et morphologiques de la langue
arabe ce qui permet d’améliorer les performances, en exploitant pleinement sa richesse.Nous
présentons également une comparaison entre ces travaux et une synthèse pour extraire suffisamment
d’informations dans ce domaine de recherche.
En se basant sur cette étude bibliographique, une application web est proposée pour la classification
des textes arabes en se basant sur une représentation des graphes, en utilisant l’algorithme TextRank
et des méthodes d’apprentissage automatique supervisé.***
Automatic natural language processing mastering is complicated due to the complexity of human
language and its charasteristic, which avoids the application of fixed rules to the totality of aspects.
Research in the field of language processing for the Arabic language only emerged a few years
after the first work, various attempts have yielded more or less satisfactory performance. These
searches are generally based on traditional representations ; use simple concepts to weight and
classify the terms. However, these representations are not precise enough to represent the contents
of Arabic documents in which the dependencies between the words are strong, and because of the
ambiguity, agglutination, and various problems of this language. In this work, we present some
approaches which show some representations in graphs and embedding of the words proposed
for the classification of texts, and also we study the linguistic and morphological knowledge of
the Arabic language, which allows improving performances, in fully exploiting its wealth. This
allows at the end to make a comparison between these works and then a synthesis to obtain enough
information in this area of research.
Based on this bibliographic study, a web application is proposed for the classification of Arabic
texts based on a representation of graphs, using the textbf TextRank algorithm and supervised
machine learning methods. | en_US |
dc.language.iso | fr | en_US |
dc.subject | La Classification Textuelle | en_US |
dc.subject | Représentations En Graphes | en_US |
dc.subject | Embeddings Des Mots | en_US |
dc.subject | Text Rank | en_US |
dc.title | Classification des textes en arabe basée sur les représentations en graphes | en_US |
dc.type | Thesis | en_US |
Appears in Collections: | Ingénieur
|