Mise en oeuvre d'un modèle de détection d'objets en temps réel intégrant les connaissances antérieures

OMARI, SOuhil

Please use this identifier to cite or link to this item: https://repository.esi-sba.dz/jspui/handle/123456789/540

Title:	Mise en oeuvre d'un modèle de détection d'objets en temps réel intégrant les connaissances antérieures
Authors:	OMARI, SOuhil
Keywords:	Artificial Intelligence Common Objects In Context Convolution Neural Network Deep Learning Ground Truth Intersection Over Union Mean Average Precision Mean Average Recall Machine Learning Non-Maximum Suppression Region-based Convolutional Network Region-based Fully Convolutional Network Region Of Interest Single Shot Multibox Detection Support Vector Machine You Only Look Once
Issue Date:	2023
Abstract:	Abstract : Le The industrial sector is one of the many areas in which the automation of several tasks is possible thanks to computer vision. However, whatever the task, for example maintenance or handling by mobile robots, an accurate detection system is required. Object detection consists in locating the different objects in an image (via a bounding box) and associating a category to each of these objects. This task can be a classification at the scale of an entire image, and a segmentation at the scale of a pixel. The numerous challenges proposed over the years, consisting in solving one or the other of these tasks on a specific database, have allowed great advances in image processing methods. Among these methods, convolutional neural networks (CNNs) have shown a superior ability to solve these tasks, especially with the continuous improvement of computer computing capabilities and the availability of large-scale databases. These databases, which include images and their associated annotations, allow the analysis of image content with different levels of accuracy. Despite all these advances, object detection in an industrial environment remains a challenging task, especially due to the lack of real images or databases for training, and the real-time constraint required for the algorithm, which is usually embedded in a mobile device. In recent years, several researchers have been interested in proposing lightweight object detectors for mobile devices, such as PP-PicoDet, MobileNet SSD and Yolo. These models have interesting performances that allow them to be used in industrial applications requiring realtime response, but there is still an opportunity to further optimize their operation to make them more lightweight. Indeed, most of these models process the whole image to extract the regions of interest and then determine the detections. However, they do not take into account prior knowledge to optimize and reduce the execution time of the detection model. Actually, the use of this knowledge can allow to process only some parts of the input image, and to rely on the previous detections to reduce the number of regions to be examined. In this work, we propose a method that allows for optimizing a model by incorporating prior knowledge so that the model is lightweight due to the limited computing resources of mobile robots. *** Résumé : Le secteur industriel est l'un des nombreux domaines dans lesquels l'automatisation de plusieurs tâches est possible grâce à la vision par ordinateur. Cependant, quelle que soit la tâche, par exemple la maintenance ou la manipulation par des robots mobiles, un système de détection précis est nécessaire. La détection d'objets consiste à localiser les différents objets dans une image (via une boîte englobante) et à associer une catégorie à chacun de ces objets. Cette tâche peut être une classification à l'échelle d'une image entière, et une segmentation à l'échelle d'un pixel. Les nombreux défis proposés au fil des années, consistant à résoudre l'une ou l'autre de ces tâches sur une base de données spécifique, ont permis de grandes avancées dans les méthodes de traitement d'images. Parmi ces méthodes, les réseaux de neurones convolutifs (CNN) ont montré une capacité supérieure à résoudre ces tâches, notamment avec l'amélioration continue des capacités de calcul des ordinateurs et la disponibilité de bases de données à grande échelle. Ces bases de données, qui comprennent des images et leurs annotations associées, permettent d'analyser le contenu des images avec différents niveaux de précision. Malgré toutes ces avancées, la détection d'objets dans un environnement industriel reste une tâche difficile, notamment en raison du manque d'images réelles ou de bases de données pour l'entraînement, et de la contrainte de temps réel requise pour l'algorithme, qui est généralement embarqué dans un dispositif mobile. Ces dernières années, plusieurs chercheurs se sont intéressés à proposer des détecteurs d'objets légers pour les appareils mobiles, tels que PP-PicoDet, MobileNet SSD et Yolo. Ces modèles ont des performances intéressantes qui leur permettent d'être utilisés dans des applications industrielles nécessitant une réponse en temps réel, mais il est encore possible d'optimiser leur fonctionnement pour les rendre plus légers. En effet, la plupart de ces modèles traitent l'image entière pour extraire les régions d'intérêt et ensuite déterminer les détections. Cependant, ils ne prennent pas en compte les connaissances préalables pour optimiser et réduire le temps d'exécution du modèle de détection. En effet, l'utilisation de ces connaissances peut permettre de ne traiter que certaines parties de l'image d'entrée, et de s'appuyer sur les détections précédentes pour réduire le nombre de régions à examiner. Dans ce travail, nous proposons une méthode qui permet d'optimiser un modèle en intégrant les connaissances préalables afin que le modèle soit léger en raison des ressources de calcul limitées des robots mobiles.
Description:	Encadreur : M Belfedhal Alaa Eddine
URI:	https://repository.esi-sba.dz/jspui/handle/123456789/540
Appears in Collections:	Ingénieur

Files in This Item:

File	Description	Size	Format
rapport finale pfe-1-1.pdf		227,25 kB	Adobe PDF	View/Open

Show full item record