| DC Field | Value | Language |
| dc.contributor.author | NEDJAA, INes | - |
| dc.date.accessioned | 2025-10-13T09:39:51Z | - |
| dc.date.available | 2025-10-13T09:39:51Z | - |
| dc.date.issued | 2025 | - |
| dc.identifier.uri | https://repository.esi-sba.dz/jspui/handle/123456789/799 | - |
| dc.description | Supervisor : Dr. KHALDI Miloud | en_US |
| dc.description.abstract | The darknet has emerged as a covert environment for illicit activities, enabling adversaries
to distribute malware, conduct illegal trade, and coordinate cyberattacks beyond
the reach of traditional monitoring systems. Its encrypted and obfuscated traffic presents
serious challenges for organizations, creating blind spots that hinder proactive defense
strategies such as cyber threat hunting. Addressing this gap requires intelligent detection
frameworks capable of analyzing network flows in real time and accurately identifying
darknet-related anomalies.
This research introduces an AI-driven darknet traffic detection framework that integrates
machine learning, deep learning, and meta-learning to support cyber threat hunting
operations. The framework is trained and evaluated on the CICDarknet2020 dataset,
which provides a comprehensive collection of darknet and non-darknet traffic. For traffic
type classification, we employ machine learning models including K-Nearest Neighbors,
Decision Tree, Random Forest, XGBoost, and Logistic Regression, alongside deep learning
architectures such as LSTM and CNN. To enhance accuracy and efficiency, feature
selection is performed using Mutual Information, Recursive Feature Elimination, and
Random Forest-based selection, while hyperparameter optimization is conducted with
HalvingRandomSearchCV. For application type classification, the same set of machine
learning and deep learning models, feature selection strategies, and hyperparameter optimization
techniques are applied. In addition, a meta-learning approach is implemented
to dynamically leverage predictions from base learners, ensuring optimal model selection
for each instance.
Experimental results demonstrate that Random Forest achieves the highest accuracy
for traffic type classification, while the meta-learning framework significantly improves
application type detection over individual ML/DL models. Furthermore, real-time evaluation
using live network traffic confirms the system’s practicality and robustness, proving
its effectiveness in operational environments.
This research delivers an efficient, accurate, and real-time darknet detection solution
that combines advanced AI techniques with optimized feature selection to empower cyber
threat hunters, reduce attacker dwell time, and strengthen organizational resilience
against evolving cyber threats. ***
Le darknet s’est imposé comme un environnement clandestin facilitant les activités
illicites, permettant à des acteurs malveillants de distribuer des logiciels malveillants, de
mener des transactions illégales et de coordonner des cyberattaques en dehors de la portée
des systèmes de surveillance traditionnels. Son trafic chiffré et obscurci présente des défis
majeurs pour les organisations, créant des angles morts qui entravent les stratégies de
défense proactive telles que la chasse aux cybermenaces. Combler cette lacune nécessite
des systèmes de détection intelligents capables d’analyser les flux réseau en temps réel et
d’identifier avec précision les anomalies liées au darknet.
Cette recherche propose un système de détection du trafic darknet piloté par l’intelligence
artificielle, qui intègre l’apprentissage automatique, l’apprentissage profond et
le méta-apprentissage pour soutenir les opérations de chasse aux menaces. Le système
est entraîné et évalué sur le jeu de données CICDarknet2020, qui offre une collection
complète de trafic darknet et non-darknet. Pour la classification du type de trafic, nous
utilisons des modèles d’apprentissage automatique (K-Nearest Neighbors, Arbre de Décision,
Random Forest, XGBoost, et Régression Logistique) ainsi que des architectures
d’apprentissage profond (LSTM et CNN). Pour améliorer la précision et l’efficacité, une
sélection des caractéristiques est effectuée à l’aide de l’Information Mutuelle, l’Élimination
Récursive des Caractéristiques (RFE) et une sélection basée sur Random Forest, tandis
que l’optimisation des hyperparamètres est réalisée avec HalvingRandomSearchCV. La
même méthodologie est appliquée pour la classification du type d’application. De plus,
une approche de méta-apprentissage est mise en oeuvre pour exploiter dynamiquement
les prédictions des modèles de base, garantissant une sélection optimale du modèle pour
chaque instance.
Les résultats expérimentaux démontrent que l’algorithme Random Forest obtient la
meilleure précision pour la classification du type de trafic, tandis que le cadre de métaapprentissage
améliore significativement la détection du type d’application par rapport
aux modèles individuels. De plus, une évaluation en temps réel utilisant du trafic réseau
live confirme la praticité et la robustesse du système, prouvant son efficacité en environnement
opérationnel.
Cette recherche offre une solution de détection darknet efficace, précise et fonctionnant
en temps réel. Elle combine des techniques avancées d’IA avec une sélection optimisée
des caractéristiques pour renforcer les capacités des chasseurs de menaces, réduire le
temps d’infiltration des attaquants et améliorer la résilience des organisations face aux
cybermenaces en évolution. | en_US |
| dc.language.iso | en | en_US |
| dc.subject | Cybersecurity | en_US |
| dc.subject | Darknet Detection | en_US |
| dc.subject | Machine Learning | en_US |
| dc.subject | Deep Learning | en_US |
| dc.subject | Meta-Learning | en_US |
| dc.subject | Feature Selection | en_US |
| dc.subject | Hyperparameter Optimization | en_US |
| dc.subject | Threat Hunting | en_US |
| dc.title | AI-Powered Darknet Detection for Cyber Threat Hunting | en_US |
| dc.type | Thesis | en_US |
| Appears in Collections: | Ingénieur
|