https://repository.esi-sba.dz/jspui/handle/123456789/772
Title: | Anomaly Detection Using Logs Data |
Authors: | AID, ABderrahmane |
Keywords: | Anomaly Detection Log Data Machine Learning Deep Learning Log Parsing Transformer Models Cybersecurity System Monitoring |
Issue Date: | 2025 |
Abstract: | System crashes and security compromises from out-of-ordinary behaviors in computing systems can greatly threaten the operations and the cybersecurity of an organization. Anomaly detection in log data is fundamental to system security and greatly depends on the accuracy and real-time detection. But discovering problems from unstructured high-dimensional log data is relatively hard, with most of them depending on the manual approach or incomplete automation to discard false positives, and suffering from harmful imbalance and varying log formats. This thesis investigates the problem of detecting anomalies from log data, and applies machine learning and deep learning approaches to overcome limitations of established methods. These difficulties such as redundant runtime information, absence of labeled anomalies, and heterogeneous log structures, have been addressed from the use of sophisticated preprocessing methods such as log parsing and semantic embedding extraction, and the use of strong model such as transformer based architecture and hybrid autoencoder-recurrent neural network. These approaches improve the detection precision and portability in a wide range of log environments, which can promote the proactive monitoring of systems and cyber security. *** Les pannes système et les compromissions de sécurité dues à des comportements inhabituels dans les systèmes informatiques peuvent gravement menacer les opérations et la cybersécurité d’une organisation. La détection d’anomalies dans les données de journaux est essentielle pour la sécurité des systèmes et repose largement sur la précision et la détection en temps réel. Cependant, identifier les problèmes à partir de données de journaux non structurées et à haute dimension est relativement difficile, la plupart des approches dépendant de méthodes manuelles ou d’une automatisation incomplète pour éliminer les faux positifs, et souffrant de déséquilibres nuisibles et de formats de journaux variés. Cette thèse examine le problème de la détection d’anomalies dans les données de journaux et applique des approches d’apprentissage automatique et d’apprentissage profond pour surmonter les limites des méthodes établies. Ces défis, tels que les informations d’exécution redondantes, l’absence d’anomalies étiquetées et les structures de journaux hétérogènes, ont été abordés grâce à l’utilisation de méthodes de prétraitement sophistiquées telles que l’analyse syntaxique des journaux et l’extraction d’incorporations sémantiques, ainsi que l’utilisation de modèles puissants comme l’architecture basée sur les transformers et un réseau neuronal récurrent-autoencodeur hybride. Ces approches améliorent la précision de la détection et la portabilité dans une large gamme d’environnements de journaux, favorisant ainsi une surveillance proactive des systèmes et la cybersécurité. |
Description: | Supervisor : Dr. Hanae Naoum Co-Supervisor : Pr. Sidi Mohammed BENSLIMANE |
URI: | https://repository.esi-sba.dz/jspui/handle/123456789/772 |
Appears in Collections: | Master |
File | Description | Size | Format | |
---|---|---|---|---|
master_abderrahmane_final-1-1.pdf | 77,03 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.