Skip navigation
Please use this identifier to cite or link to this item: https://repository.esi-sba.dz/jspui/handle/123456789/612
Title: 360° Videos Streaming Optimization and Saliency Prediction
Authors: ABDALLAOUI, WAlid
Keywords: VR
360° Videos
HMD
Saliency
FoV
Streaming
Issue Date: 2024
Abstract: In recent years there has been a signiĄcant interest in Virtual Reality applications, notably 360° videos. A typical 360° video viewing arrangement involves a user interacting with the scene through a Head Mounted Device (HMD) with the Ąeld of view (FoV) which is the region the user sees at any moment. 360° videos provide immersive experiences with potential applications in diverse Ąelds such as education, medicine, and entertainment. However, streaming these videos over a network is bandwidth-intensive, as their Ąle sizes can be up to six times larger than traditional videos. Consequently, this technology faces unique challenges, including high bandwidth requirements and the need for low motion-to-photon latency to prevent userŠs cybersickness. To address these challenges, optimization models are crucial. These models rely on understanding the content of 360° videos, particularly through saliency prediction. Saliency prediction identiĄes the areas within the video that capture usersŠ attention, enabling optimization techniques to prioritize the delivery of these regions. Several optimization techniques are employed in 360° video streaming. Tile-based streaming divides the video into smaller tiles, allowing for adaptive streaming of only the tiles within the viewerŠs Ąeld of view. Field of View (FoV) prediction anticipates the viewerŠs gaze direction, enabling proactive fetching of relevant tiles. In this thesis, we conduct a study of 360° videos streaming technology diving into the streaming framework of this videos at different levels from the content server to the user HMD. We give an overview of the challenges associated with it and the optimization techniques used to overcome them with a focus on the potential visual saliency prediction can offer for such techniques. We conduct an analysis of deep learning based 360° visual saliency prediction models in the literature leading to a better understanding of the problem of human visual attention exploring this immersive content.*** Ces dernières années ont vu un intérêt croissant pour les applications de Réalité Virtuelle, notamment les vidéos à 360°. Une conĄguration typique de visionnage de vidéos à 360° implique un utilisateur interagissant avec la scène via un casque de réalité virtuelle (HMD) avec un champ de vision (FoV) qui est la région que lŠutilisateur voit à chaque instant. Les vidéos à 360° offrent des expériences immersives avec des applications potentielles dans divers domaines tels que lŠéducation, la médecine et le divertissement. Cependant, la diffusion en continu de ces vidéos sur un réseau est gourmande en bande passante, car leurs tailles de Ąchier peuvent être jusquŠà six fois supérieures à celles des vidéos traditionnelles. Par conséquent, cette technologie fait face à des déĄs uniques, notamment des exigences élevées en matière de bande passante et la nécessité dŠune faible latence mouvement-photon pour prévenir le mal des transports chez lŠutilisateur. Pour relever ces déĄs, les modèles dŠoptimisation sont cruciaux. Ces modèles reposent sur la compréhension du contenu des vidéos à 360°, notamment grâce à la prédiction de saillance. La prédiction de saillance identiĄe les zones de la vidéo qui captent lŠattention des utilisateurs, permettant aux techniques dŠoptimisation de prioriser la diffusion de ces régions. Plusieurs techniques dŠoptimisation sont utilisées dans la diffusion de vidéos à 360°. La diffusion en mosaïque divise la vidéo en tuiles plus petites, permettant une diffusion adaptative uniquement des tuiles dans le champ de vision du spectateur. La prédiction du champ de vision (FoV) anticipe la direction du regard du spectateur, permettant une récupération proactive des tuiles pertinentes. Dans cette thèse, nous menons une étude sur la technologie de diffusion de vidéos à 360°, en plongeant dans le cadre de diffusion de ces vidéos à différents niveaux, du serveur de contenu au casque HMD de lŠutilisateur. Nous donnons un aperçu des déĄs associés et des techniques dŠoptimisation utilisées pour les surmonter, en mettant lŠaccent sur le potentiel que la prédiction de saillance visuelle peut offrir pour de telles techniques. Nous effectuons une analyse des modèles de prédiction de saillance visuelle à 360° basés sur lŠapprentissage profond dans la littérature, menant à une meilleure compréhension du problème de lŠattention visuelle humaine explorant ce contenu immersif.
Description: Encadreur : M.CHAIB Souleyman
URI: https://repository.esi-sba.dz/jspui/handle/123456789/612
Appears in Collections:Master

Files in This Item:
File Description SizeFormat 
Master-ABDALLAOUI Walid-1-1.pdf119,95 kBAdobe PDFView/Open
Show full item record


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.