Skip navigation
Please use this identifier to cite or link to this item: https://repository.esi-sba.dz/jspui/handle/123456789/779
Full metadata record
DC FieldValueLanguage
dc.contributor.authorALILAT, ZOhra-
dc.contributor.authorBENDOUBBA, HAna-
dc.date.accessioned2025-10-13T08:05:49Z-
dc.date.available2025-10-13T08:05:49Z-
dc.date.issued2025-
dc.identifier.urihttps://repository.esi-sba.dz/jspui/handle/123456789/779-
dc.descriptionSupervisor : Dr. KHALDI Milouden_US
dc.description.abstractThe rapid expansion of the Internet has made it an integral part of modern life, facilitating communication and data exchange across numerous domains. However, this growth has also led to a surge in cyber threats, particularly those leveraging malicious URLs to deceive users and compromise sensitive data. Traditional detection methods often rely on manual feature extraction, which limits scalability and effectiveness in dynamic threat environments. This study proposes an enhanced approach to malicious URL detection by applying hyperparameter optimization (HPO) to machine learning and deep learning models, using metaheuristic algorithms such as Optuna and Randomized Search. Two benchmark datasets were used for evaluation: the Kaggle "Malicious URLs" dataset, based on raw URL strings, and the ISCX-URL-2016 dataset, which includes engineered features. The results show that optimized models significantly outperform baseline configurations. For instance, the BERT-Optuna model achieved an accuracy of 98.84% and an F1-score of 99.02%, while LightGBM with TF-IDF and Random Search reached 98.46% accuracy. On the ISCX dataset, the CatBoost-RF-Optuna model achieved 98.31% accuracy with a low False Acceptance Rate (FAR) of 0.0069 and an AUC-ROC of 99.93%. By integrating advanced feature representations and automated hyperparameter tuning, the proposed models not only enhance classification performance but also maintain computational efficiency. Additionally, a practical browser extension was developed to enable real-time malicious URL detection, bridging the gap between research and application. *** L’expansion rapide d’Internet en a fait un élément essentiel de la vie moderne, facilitant la communication et l’échange de données dans de nombreux domaines. Cependant, cette croissance s’est accompagnée d’une augmentation des cybermenaces, notamment celles qui exploitent les URL malveillantes pour tromper les utilisateurs et compromettre des informations sensibles. Les méthodes de détection traditionnelles reposent souvent sur une extraction manuelle des caractéristiques, ce qui limite leur évolutivité et leur efficacité face à des environnements de menaces dynamiques. Cette étude propose une approche améliorée pour la détection des URL malveillantes en appliquant l’optimisation des hyperparamètres (HPO) à des modèles d’apprentissage automatique et profond, à l’aide d’algorithmes métaheuristiques tels que Optuna et Randomized Search. Deux jeux de données de référence ont été utilisés pour l’évaluation : le dataset Kaggle ń Malicious URLs ż, basé sur des chaînes d’URL brutes, et le dataset ISCX-URL-2016, contenant des caractéristiques extraites. Les résultats montrent que les modèles optimisés surpassent significativement les configurations de base. Par exemple, le modèle BERT-Optuna a atteint une précision de 98,84% et un score F1 de 99,02%, tandis que LightGBM avec TF-IDF et Random Search a atteint une précision de 98,46%. Sur le jeu de données ISCX, le modèle CatBoost-RF-Optuna a obtenu une précision de 98,31%, un taux de fausses acceptations (FAR) réduit à 0,0069 et un AUC-ROC de 99,93%. En combinant des représentations avancées des caractéristiques avec un réglage automatisé des hyperparamètres, les modèles proposés améliorent non seulement les performances de classification, mais conservent également une efficacité computationnelle. De plus, une extension de navigateur pratique a été développée pour permettre une détection en temps réel des URL malveillantes, comblant ainsi le fossé entre la recherche et l’application réelle.en_US
dc.language.isoenen_US
dc.subjectMalicious URL Detectionen_US
dc.subjectHyperparameter Optimizationen_US
dc.subjectMetaheuristicsen_US
dc.subjectMachine Learningen_US
dc.subjectDeep Learningen_US
dc.subjectBERTen_US
dc.subjectOptunaen_US
dc.subjectLightGBMen_US
dc.subjectRandom Searchen_US
dc.subjectCatBoosten_US
dc.titleA Metaheuristic-Optimized Framework for Robust Malicious URL Detection Using ML and DL with Real-Time Applicationen_US
dc.typeThesisen_US
Appears in Collections:Ingénieur

Files in This Item:
File Description SizeFormat 
MemoirePFEFinalf-1-1.pdf93,77 kBAdobe PDFView/Open
Show simple item record


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.