https://repository.esi-sba.dz/jspui/handle/123456789/255
Title: | Fouille de Web basé sur les méthodes d’apprentissage automatique et apprentissage profond |
Authors: | FELOUH, BRahim BOUSBA, FAdia Nouna |
Keywords: | La Fouille De Données Apprentissage Profond Exploration De Web ANN(Réseau De Neurones Profond) SVM KNN |
Issue Date: | 2019 |
Abstract: | l’apprentissage en profondeur est une technique d’apprentissage automatique qui vise à extraire des représentations de haut niveau à partir de données brutes en utilisant plusieurs couches neuronales. Le succès récent de l’apprentissage en profon-deur a montré qu’il surpassait les systèmes conventionnels en traitement d’image. La fouille du Web utilise les algorithmes de fouille de données pour détecter les modèles à partir de la toile. Il est divisé en trois axes : fouille du contenu du web, fouille de l’usage et fouille de la structure du web. L’usage de l’approche d’apprentissage profond peut o˙rir un potentiel considérable pour améliorer la fouille du Web, et ce en exploitant les grandes masses de données disponibles sur la toile d’une manière eÿcace. L’utilisation des méthodes conventionnelles en fouille de données sur ces grands volumes de données se trouve souvent limitée, n’exploitant pas au mieux ces bases d’information. Ceci nécessite donc un apprentissage en profondeur afin d’extraire de la connais-sance nouvelle et non évidente. SONATRACH est la Société nationale pour la re-cherche, la production, le transport, la transformation et la commercialisation des hydrocarbures. GTP (Grands Travaux Pétroliers) est une filiale du Groupe Sona-trach spécialisée dans l’ingénierie et la construction d’installations industrielles des-tinées à la production, transformation, transport et distribution des hydrocarbures. Dans ce travail, on dresse un état de l’art des travaux existants dans l’usage des algorithmes d’apprentissage automatique et apprentissage profond dans l’explora-tion du Web. Ceci permet de comparer ces travaux et de les synthétiser pour avoir une vision globale sur cet axe de recherche. Dans notre application on va analyser l’usage d’un site Web à partir des fichiers journaux (log files) fournis par le serveur web du groupe GTP dans le but de La détection des failles sécuritaires de sites web de l’entreprise, on se focalise sur l’implémentation de la technique de la fouille de l’usage du web avec les trois méthodes suivantes ANN profond, KNN, et SVM.*** searching the structure of the web. The use of the deep learning approach can o˙er considerable potential for improving Web browsing by leveraging the vast amount of data available on the web in an eÿcient manner. The use of conventional methods in data mining on these large volumes of data is often limited, not making the best use of these databases. This requires deep learning to extract new and unseen know-ledge. SONATRACH is the National Society for Research, Production, Transport, Processing and Marketing of Hydrocarbons. GTP (Grands Travaux Pétroliers) is a subsidiary of the Sonatrach Group specializing in the engineering and construction of industrial facilities for the production, processing, transport and distribution of hydrocarbons. In this work, we draw up a state of the art of existing works in the use of machine learning algorithms and deep learning in the exploration of the Web. This allows to compare these works and to synthesize them to have a global vision on this line of research. In our application we will analyze the use of a website from the log files provided by the web server of the GTP group for the purpose of the detection of security breaches of the company’s websites. focuses on the implementation of the technique of the excavation of the use of the web with the following three methods ANN deep, KNN, and SVM. |
Description: | Bennabi Rim Sakina Encadreur |
URI: | https://repository.esi-sba.dz/jspui/handle/123456789/255 |
Appears in Collections: | Ingénieur |
File | Description | Size | Format | |
---|---|---|---|---|
Mémoire Ingeniorat.pdf | 1,02 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.