DC Field | Value | Language |
dc.contributor.author | OMARI, SOuhil | - |
dc.date.accessioned | 2023-10-17T13:00:03Z | - |
dc.date.available | 2023-10-17T13:00:03Z | - |
dc.date.issued | 2023 | - |
dc.identifier.uri | https://repository.esi-sba.dz/jspui/handle/123456789/540 | - |
dc.description | Encadreur : M Belfedhal Alaa Eddine | en_US |
dc.description.abstract | Abstract :
Le The industrial sector is one of the many areas in which the automation of several
tasks is possible thanks to computer vision. However, whatever the task, for example
maintenance or handling by mobile robots, an accurate detection system is required. Object
detection consists in locating the different objects in an image (via a bounding box) and
associating a category to each of these objects. This task can be a classification at the scale of
an entire image, and a segmentation at the scale of a pixel. The numerous challenges proposed
over the years, consisting in solving one or the other of these tasks on a specific database,
have allowed great advances in image processing methods. Among these methods,
convolutional neural networks (CNNs) have shown a superior ability to solve these tasks,
especially with the continuous improvement of computer computing capabilities and the
availability of large-scale databases. These databases, which include images and their
associated annotations, allow the analysis of image content with different levels of accuracy.
Despite all these advances, object detection in an industrial environment remains a
challenging task, especially due to the lack of real images or databases for training, and the
real-time constraint required for the algorithm, which is usually embedded in a mobile device.
In recent years, several researchers have been interested in proposing lightweight object
detectors for mobile devices, such as PP-PicoDet, MobileNet SSD and Yolo. These models have
interesting performances that allow them to be used in industrial applications requiring realtime
response, but there is still an opportunity to further optimize their operation to make
them more lightweight. Indeed, most of these models process the whole image to extract the
regions of interest and then determine the detections. However, they do not take into account
prior knowledge to optimize and reduce the execution time of the detection model. Actually,
the use of this knowledge can allow to process only some parts of the input image, and to rely
on the previous detections to reduce the number of regions to be examined.
In this work, we propose a method that allows for optimizing a model by incorporating
prior knowledge so that the model is lightweight due to the limited computing resources of
mobile robots. ***
Résumé :
Le secteur industriel est l'un des nombreux domaines dans lesquels l'automatisation
de plusieurs tâches est possible grâce à la vision par ordinateur. Cependant, quelle que soit la
tâche, par exemple la maintenance ou la manipulation par des robots mobiles, un système de
détection précis est nécessaire. La détection d'objets consiste à localiser les différents objets
dans une image (via une boîte englobante) et à associer une catégorie à chacun de ces objets.
Cette tâche peut être une classification à l'échelle d'une image entière, et une segmentation
à l'échelle d'un pixel. Les nombreux défis proposés au fil des années, consistant à résoudre
l'une ou l'autre de ces tâches sur une base de données spécifique, ont permis de grandes
avancées dans les méthodes de traitement d'images. Parmi ces méthodes, les réseaux de
neurones convolutifs (CNN) ont montré une capacité supérieure à résoudre ces tâches,
notamment avec l'amélioration continue des capacités de calcul des ordinateurs et la
disponibilité de bases de données à grande échelle. Ces bases de données, qui comprennent
des images et leurs annotations associées, permettent d'analyser le contenu des images avec
différents niveaux de précision.
Malgré toutes ces avancées, la détection d'objets dans un environnement industriel
reste une tâche difficile, notamment en raison du manque d'images réelles ou de bases de
données pour l'entraînement, et de la contrainte de temps réel requise pour l'algorithme, qui
est généralement embarqué dans un dispositif mobile. Ces dernières années, plusieurs
chercheurs se sont intéressés à proposer des détecteurs d'objets légers pour les appareils
mobiles, tels que PP-PicoDet, MobileNet SSD et Yolo. Ces modèles ont des performances
intéressantes qui leur permettent d'être utilisés dans des applications industrielles nécessitant
une réponse en temps réel, mais il est encore possible d'optimiser leur fonctionnement pour
les rendre plus légers. En effet, la plupart de ces modèles traitent l'image entière pour extraire
les régions d'intérêt et ensuite déterminer les détections. Cependant, ils ne prennent pas en
compte les connaissances préalables pour optimiser et réduire le temps d'exécution du
modèle de détection. En effet, l'utilisation de ces connaissances peut permettre de ne traiter
que certaines parties de l'image d'entrée, et de s'appuyer sur les détections précédentes pour
réduire le nombre de régions à examiner.
Dans ce travail, nous proposons une méthode qui permet d'optimiser un modèle en
intégrant les connaissances préalables afin que le modèle soit léger en raison des ressources
de calcul limitées des robots mobiles. | en_US |
dc.language.iso | fr | en_US |
dc.subject | Artificial Intelligence | en_US |
dc.subject | Common Objects In Context | en_US |
dc.subject | Convolution Neural Network | en_US |
dc.subject | Deep Learning | en_US |
dc.subject | Ground Truth | en_US |
dc.subject | Intersection Over Union | en_US |
dc.subject | Mean Average Precision | en_US |
dc.subject | Mean Average Recall | en_US |
dc.subject | Machine Learning | en_US |
dc.subject | Non-Maximum Suppression | en_US |
dc.subject | Region-based Convolutional Network | en_US |
dc.subject | Region-based Fully Convolutional Network | en_US |
dc.subject | Region Of Interest | en_US |
dc.subject | Single Shot Multibox Detection | en_US |
dc.subject | Support Vector Machine | en_US |
dc.subject | You Only Look Once | en_US |
dc.title | Mise en oeuvre d'un modèle de détection d'objets en temps réel intégrant les connaissances antérieures | en_US |
dc.type | Thesis | en_US |
Appears in Collections: | Ingénieur
|