DC Field | Value | Language |
dc.contributor.author | AID, ABderrahmane | - |
dc.date.accessioned | 2025-07-17T12:38:17Z | - |
dc.date.available | 2025-07-17T12:38:17Z | - |
dc.date.issued | 2025 | - |
dc.identifier.uri | https://repository.esi-sba.dz/jspui/handle/123456789/772 | - |
dc.description | Supervisor : Dr. Hanae Naoum Co-Supervisor : Pr. Sidi Mohammed BENSLIMANE | en_US |
dc.description.abstract | System crashes and security compromises from out-of-ordinary behaviors in computing
systems can greatly threaten the operations and the cybersecurity of an organization.
Anomaly detection in log data is fundamental to system security and greatly depends
on the accuracy and real-time detection. But discovering problems from unstructured
high-dimensional log data is relatively hard, with most of them depending on the manual
approach or incomplete automation to discard false positives, and suffering from harmful
imbalance and varying log formats.
This thesis investigates the problem of detecting anomalies from log data, and applies
machine learning and deep learning approaches to overcome limitations of established
methods. These difficulties such as redundant runtime information, absence of
labeled anomalies, and heterogeneous log structures, have been addressed from the use
of sophisticated preprocessing methods such as log parsing and semantic embedding extraction,
and the use of strong model such as transformer based architecture and hybrid
autoencoder-recurrent neural network. These approaches improve the detection precision
and portability in a wide range of log environments, which can promote the proactive
monitoring of systems and cyber security. ***
Les pannes système et les compromissions de sécurité dues à des comportements inhabituels
dans les systèmes informatiques peuvent gravement menacer les opérations et la
cybersécurité d’une organisation. La détection d’anomalies dans les données de journaux
est essentielle pour la sécurité des systèmes et repose largement sur la précision et
la détection en temps réel. Cependant, identifier les problèmes à partir de données de
journaux non structurées et à haute dimension est relativement difficile, la plupart des
approches dépendant de méthodes manuelles ou d’une automatisation incomplète pour
éliminer les faux positifs, et souffrant de déséquilibres nuisibles et de formats de journaux
variés.
Cette thèse examine le problème de la détection d’anomalies dans les données de journaux
et applique des approches d’apprentissage automatique et d’apprentissage profond
pour surmonter les limites des méthodes établies. Ces défis, tels que les informations
d’exécution redondantes, l’absence d’anomalies étiquetées et les structures de journaux
hétérogènes, ont été abordés grâce à l’utilisation de méthodes de prétraitement sophistiquées
telles que l’analyse syntaxique des journaux et l’extraction d’incorporations sémantiques,
ainsi que l’utilisation de modèles puissants comme l’architecture basée sur
les transformers et un réseau neuronal récurrent-autoencodeur hybride. Ces approches
améliorent la précision de la détection et la portabilité dans une large gamme d’environnements
de journaux, favorisant ainsi une surveillance proactive des systèmes et la
cybersécurité. | en_US |
dc.language.iso | en | en_US |
dc.subject | Anomaly Detection | en_US |
dc.subject | Log Data | en_US |
dc.subject | Machine Learning | en_US |
dc.subject | Deep Learning | en_US |
dc.subject | Log Parsing | en_US |
dc.subject | Transformer Models | en_US |
dc.subject | Cybersecurity | en_US |
dc.subject | System Monitoring | en_US |
dc.title | Anomaly Detection Using Logs Data | en_US |
dc.type | Thesis | en_US |
Appears in Collections: | Master
|