Skip navigation
Please use this identifier to cite or link to this item: https://repository.esi-sba.dz/jspui/handle/123456789/788
Title: Etude de l'interférence et son impact sur les performances GPUs NVIDIA
Authors: ROUHA, NEsrine ROumaissa
Keywords: Systèmes Temps Réel
Deep Learning
GPU
CUDA
Déterminisme Temporel
Interférence
Occupation
Mémoire Partagée
Nsight Compute
CNN
MNIST
Issue Date: 2025
Abstract: This thesis is part of the Héritage project, which aims to ensure temporal determinism in heterogeneous real-time systems leveraging GPUs. The rise of Convolutional Neural Networks (CNNs) in critical applications, such as embedded vision and autonomous vehicles, makes it necessary to control execution time variability induced by hardware and software interferences. After presenting the fundamental concepts of GPU architecture and its constraints in real-time environments, a comprehensive scientific review is conducted. This review analyzes several approaches from the literature, ranging from memory transfer optimization and spatial partitioning of computing units, to the management of CPU–GPU memory interference and asynchronous multi-stream execution. The studies are compared according to their efficiency, adaptability, and limitations in a mixed-criticality context. The analysis reveals the absence of integrated solutions that combine isolation, dynamic scheduling, and precise control of interferences. These findings motivate the proposal, in the forthcoming engineering thesis, of an experimental methodology based on reverse engineering of CNN layers in CUDA, systematic profiling with Nsight Compute, and fine-grained evaluation of hardware impacts on temporal stability. The ultimate goal is to design optimization strategies that guarantee predictable execution on embedded GPUs. *** Ce mémoire s’inscrit dans le cadre du projet Héritage, qui vise à garantir le déterminisme temporel dans les systèmes temps réel hétérogènes exploitant des GPU. L’essor des réseaux de neurones convolutifs (CNN) dans les applications critiques, telles que la vision embarquée et les véhicules autonomes, impose de maîtriser les variabilités de temps d’exécution induites par les interférences matérielles et logicielles. Après avoir présenté les notions de base sur l’architecture GPU et ses contraintes en environnement temps réel, une revue scientifique exhaustive est menée. Celle-ci analyse plusieurs approches issues de la littérature, allant de l’optimisation des transferts mémoire et du partitionnement spatial des unités de calcul, à la gestion de l’interférence mémoire CPU–GPU et à l’exécution asynchrone multi-flux. Les travaux sont comparés selon leur efficacité, leur adaptabilité et leurs limites dans un contexte de criticité mixte. L’analyse révèle l’absence de solutions intégrées combinant isolation, ordonnancement dynamique et contrôle précis des interférences. Ces constats motivent la proposition, dans le cadre du mémoire d’ingénieur à venir, d’une méthodologie expérimentale basée sur le reverse engineering de couches CNN en CUDA, le profilage systématique par Nsight Compute et l’évaluation fine des impacts matériels sur la stabilité temporelle, en vue de concevoir des stratégies d’optimisation garantissant une exécution prédictible sur GPU embarqués.
Description: Encadrant : Dr. Houssam-Eddine Zahaf / Pr. BENSLIMANE Sidi Mohamed
URI: https://repository.esi-sba.dz/jspui/handle/123456789/788
Appears in Collections:Master

Files in This Item:
File Description SizeFormat 
memoireMaster_NesrineROUHA-1-1.pdf146,1 kBAdobe PDFView/Open
Show full item record


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.