In-Database Machine Learning (In-DB ML)

YOUSFI, IKram OUmelkheir

Please use this identifier to cite or link to this item: https://repository.esi-sba.dz/jspui/handle/123456789/714

Title:	In-Database Machine Learning (In-DB ML)
Authors:	YOUSFI, IKram OUmelkheir
Keywords:	In-Database Machine Learning Database Management System DBMS ML
Issue Date:	2024
Abstract:	In-Database Machine Learning (In-DB ML) or Database Machine Learning (DBML) is a young, key area of research that embeds Machine Learning (ML) right into Database Management Systems (DBMS). This approach puts to use the intrinsic strengths of databases—data integrity, security, and concurrency control—while making data processing efficient and performing analytics close to the source. Basically, that would entail a reduction in data movement and other complexities or overhead that occur in traditional machine learning pipelines, where data must be exported to external environments in order to be processed. In-DB ML run machine learning algorithms natively inside the database environment by using stored procedures or User-Defined Functions (UDFs) that can use SQL and other languages native to the database. This not only enhances performance by leveraging optimized database operations but remains within database access control mechanisms for improved security. The practical advantages of In-DB ML include lower latency in insight generation, better data governance, and streamlined architecture for data analytics workflows. More importantly, this integration makes scalable machine learning operations over large datasets common in enterprise systems possible, thus making it relevant for use cases in finance, healthcare, and retail—industries for which data privacy and fast data processing are essential. Research in this field is primarily focused on the development of new algorithms that are friendly to in-database execution, with extensions to database architectures that allow for rich analytic functionality and ease of use for data scientists and database administrators through better tooling and interfaces. As this field continues to grow and evolve, so will the potential significance it may have in the future with respect to a far greater, broader diffusion of machine learning, eventually making it much more accessible and efficient for a myriad of applications. *** L’apprentissage automatique dans les bases de données (In-DB ML) ou apprentissage automatique basé sur les bases de données (DBML) est un domaine de recherche jeune et clé qui intègre l’apprentissage automatique (ML) directement dans les systèmes de gestion de bases de données (SGBD). Cette approche exploite les forces intrinsèques des bases de données—intégrité des données, sécurité et contrôle de la concurrence—tout en rendant le traitement des données plus efficace et en effectuant des analyses près de la source. Concrètement, cela permet de réduire les mouvements de données et les autres complexités ou surcharges qui surviennent dans les pipelines traditionnels d’apprentissage automatique, où les données doivent être exportées vers des environnements externes pour être traitées. L’In-DB ML exécute des algorithmes d’apprentissage automatique de manière native dans l’environnement de la base de données en utilisant des procédures stockées ou des fonctions définies par l’utilisateur (UDF) qui peuvent utiliser le SQL et d’autres langages propres à la base de données. Cela améliore non seulement les performances en exploitant des opérations optimisées de la base de données, mais reste également sous les mécanismes de contrôle d’accès de la base de données pour une sécurité renforcée. Les avantages pratiques de l’In-DB ML incluent une latence réduite dans la génération d’informations, une meilleure gouvernance des données et une architecture simplifiée pour les flux de travail analytiques. Plus important encore, cette intégration rend possibles des opérations d’apprentissage automatique à grande échelle sur de grands ensembles de données, ce qui est fréquent dans les systèmes d’entreprise. Cela en fait une solution pertinente pour des cas d’utilisation dans des secteurs tels que la finance, la santé et la vente au détail, où la confidentialité des données et le traitement rapide des informations sont essentiels. La recherche dans ce domaine se concentre principalement sur le développement de nouveaux algorithmes adaptés à l’exécution au sein des bases de données, avec des extensions des architectures de bases de données permettant des fonctionnalités analytiques riches et une utilisation simplifiée pour les data scientists et les administrateurs de bases de données grâce à de meilleurs outils et interfaces. Alors que ce domaine continue de croître et d’évoluer, son potentiel pourrait devenir de plus en plus significatif à l’avenir, permettant une diffusion beaucoup plus large de l’apprentissage automatique, le rendant ainsi plus accessible et plus efficace pour une multitude d’applications.
Description:	Supervisor : Ms. ELOUALI Nadia Co-Supervisor : Ms. AMER-YAHIA Sihem / Mr. BOUAROUR Nassim
URI:	https://repository.esi-sba.dz/jspui/handle/123456789/714
Appears in Collections:	Master

Files in This Item:

File	Description	Size	Format
master_ikram-1-1.pdf		97,42 kB	Adobe PDF	View/Open

Show full item record