Ronan Tournier

Maître de conférences
Informatique.
Ecole de droit de Toulouse

Responsabilités administratives et scientifiques :

  • Vice président délégué au numérique
  • THESE

    Analyse en ligne (OLAP) de documents, soutenue en 2007 à Toulouse 3 sous la direction de Gilles Zurfluh(zurfluh@irit.fr) et Gilles Zurfluh, membres du jury : Omar Boussaid (Rapporteur), Patrick Marcel (Examinateur), Franck Ravat (Encadrant), Michel Schneider (Rapporteur), Chantal Soulé-Dupuy (Examinatrice), Olivier Teste (Encadrant) et Gilles Zurfluh (Directeur)   

  • Ronan Tournier, Valentin Boulisset, Jean-Luc Attié, Xavier Ceamanos, « Aerosol Optical Depth Measurements from a Simulated Low-Cost Multi-Wavelength Ground-Based Camera: A Clear Case over a Peri-Urban Area », Remote Sensing, MDPI, 2024, n°1, p. 140   

    Ronan Tournier, Gilles Hubert, Yoann Pitarch, Karen Pinel-Sauvagnat, « TournaRank: when retrieval becomes document competition », Information Processing and Management, Elsevier, 2018, n°2   

    Ronan Tournier, Max Chevalier, Mohammed El Malki, Arlind Kopliku, Olivier Teste, « Entrepôts de données orientés documents : cuboïdes étendus - Modèles et cuboïdes NoSQL orientés documents », Document numérique - Revue des sciences et technologies de l'information. Série Document numérique, Lavoisier, 2017, n°1, pp. 9-38    

    Avec l’essor ces dernières années des grandes plateformes Web (par exemple, Google, Facebook, Twitter, Amazon), ont été développées des solutions de gestion des mégadonnées (big data) basées sur des approches décentralisées permettant la gestion et le stockage de gigantesques masses de données. Cette approche décentralisée repose sur le principe de la scalabilité, c’est-à-dire l’ajustement d’une manière progressive et continue du stockage et des traitements au volume des données. Ce type d’architecture distribuée a connu récemment le développement de systèmes de gestion de fichiers massivement distribués et de nouvelles techniques de parallélisation massive des traitements. Adossés à ce contexte de distribution massive, différents systèmes de stockage sont apparus ces dernières années. Ces systèmes, qualifiés de systèmes not-only-SQL (ou NoSQL), relaxent les fondements de l’approche relationnelle pour pouvoir supporter les masses de données distribuées. De ce fait, il est envisageable de construire des entrepôts de données massives reposant sur ce principe de scalabilité de l’espace de stockage. Dans ce papier, nous étudions l’instanciation d’entrepôts de données avec les systèmes orientés documents. Dans un premier temps, nous étudions les enjeux primaires des entrepôts tels que la modélisation, l’interrogation, le chargement des données et les cubes OLAP. Dans un deuxième temps, nous proposons des améliorations qui sont spécifiques aux systèmes orientés documents. En particulier, nous proposons des versions étendues des cubes OLAP qui exploitent l’imbrication. Nous montrons que ces cubes répondent plus rapidement à des charges de travail composées de requêtes OLAP de type “drill-down”.

    Ronan Tournier, Ali Hassan, Franck Ravat, Olivier Teste, « Differentiated Multiple Aggregations in Multidimensional Databases », Transactions on Large-Scale Data- and Knowledge-Centered Systems, Springer Berlin / Heidelberg, 2015, pp. 20-47   

    Ronan Tournier, Ali Hassan, Franck Ravat, Olivier Teste, « Multidimensional database modelling with differentiated multiple aggregations », Journal of Decision Systems, Routledge Taylor & Francis Group, 2014, n°4   

  • Ronan Tournier, Max Chevalier, Arlind Kopliku, Mohammed El Malki, Olivier Teste, MOBIDIK: nosql MOdeling of BIg Data, Information and Knowledge, 2015 

  • Ronan Tournier, Sandro Bimonte, Gianni Bellocchi, Francois Pinet, Guillaume Charrier, « Technological and Research Challenges in Data Engineering for Sustainable Agriculture », SIGMOD/PODS '24: International Conference on Management of Data, Santiago AA Chile, le 09 juin 2024 

    Ronan Tournier, Gilles Hubert, Yoann Pitarch, Karen Pinel-Sauvagnat, « TournaRank : Quand la recherche d'information devient un tournoi entre documents », 15e Conference francophone en Recherche d'Information et Applications (CORIA 2018), Rennes, le 14 mai 2018 

    Ronan Tournier, Max Chevalier, Mohammed El Malki, Olivier Teste, Arlind Kopliku, « Un benchmark enrichi pour l'évaluation des entrepôts de données noSQL volumineuses et variables », Journees Francophones sur les Entrepots de Donnees et l'Analyse en ligne (EDA 2017), Lyon, le 03 mai 2017 

    Ronan Tournier, Max Chevalier, Mohammed El Malki, Arlind Kopliku, Olivier Teste, « Document-oriented data warehouses: models and extended cuboids », 10th International IEEE Conference on Research Challenges in Information Science (RCIS 2016) co-located witht the 34th French Conference INFORSID, Grenoble, le 01 juin 2016 

    Ronan Tournier, Max Chevalier, Mohammed El Malki, Arlind Kopliku, Olivier Teste, « Entrepôts de données multidimensionnelles NoSQL », 11e Journées Francophones sur les Entrepôts de Données et l'Analyse en ligne (EDA 2015), Bruxelles Belgium, le 02 avril 2015  

    Les données des systèmes d'analyse en ligne (OLAP, On-Line Analytical Processing) sont traditionnellement gérées par des bases de données relationnelles. Malheureusement, il devient difficile de gérer des mégadonnées (de gros volumes de données, « Big Data »). Dans un tel contexte, comme alternative, les environnements « Not-Only SQL » (NoSQL) peuvent fournir un passage à l'échelle tout en gardant une certaine flexibilité pour un système OLAP. Nous définissons ainsi des règles pour convertir un schéma en étoile, ainsi que son optimisation, le treillis d'agrégats pré-calculés, en deux modèles logiques NoSQL : orienté-colonnes ou orienté-documents. En utilisant ces règles, nous implémentons et analysons deux systèmes décisionnels, un par modèle, avec MongoDB et HBase. Nous comparons ces derniers sur les phases de chargement des données (générées avec le benchmark TPC-DS), de calcul d'un treillis et d'interrogation.

    Ronan Tournier, Max Chevalier, Mohammed El Malki, Arlind Kopliku, Olivier Teste, « Implementation of multidimensional databases in column-oriented NoSQL systems », 17th International Conference on Enterprise Information Systems (ICEIS 2015) held in conjunction with ENASE 2015 and GISTAM 2015, Barcelone Spain, le 08 septembre 2015  

    Les systèmes NoSQL (Not Only SQL) se développent notamment grâce à leur capacité à gérer facilement de grands volumes de données, et leur flexibilité en terme de type de données. Dans cet article, nous étudions l'implantation d'un entrepôt de données multidimensionnelles avec un système NoSQL orienté documents. Nous proposons des règles de transformation qui permettent de passer d'un modèle conceptuel multidimensionnel vers un modèle logique NoSQL orienté documents. Nous proposons trois types de transformation pour implanter les entrepôts de données multidimensionnelles. Nous expérimentons ces trois approches avec le système MongoDB, et étudions le chargement des données, les processus de transformation d'un type d'implantation à un autre ainsi que le pré-calcul d'agrégats inhérents aux entrepôts de données multidimensionnelles.

    Ronan Tournier, Elsa Negre, Franck Ravat, Olivier Teste, « Problème du démarrage à froid pour les systèmes de recommandation dans les entrepôts de données », 31ème Congrès INFormatique des Organisations et Systemes d'Information et de Decision (INFORSID 2013), Paris, le 01 septembre 2013  

    L’exploration OLAP (On-Line Analytical Processing) de données est un processus incrémental basé sur des requêtes effectuant une recherche d’informations dans un Entrepôt de Données (ED) multidimensionnelles. Afin de faciliter l’exploration d’un décideur, des systèmes de recommandation ont été proposés. Toutefois, lors de l’utilisation d’un nouveau système, ces systèmes de recommandations ne fonctionnent plus (problème de démarrage à froid). Dans cet article, nous proposons des recommandations pour un décideur qui est confronté à un problème de démarrage à froid. Notre processus est composé de quatre étapes : identifier le squelette des requêtes OLAP, prévoir des opérations candidates, calculer des recommandations sur les opérations candidates et classer ces recommandations.

PublicationsENCADREMENT DOCTORAL
  • Mohammed El Malki, Modélisation NoSQL des entrepôts de données multidimensionnelles massives, thèse soutenue en 2016 à Toulouse 2 sous la direction de Olivier Teste et Max Chevalier présidée par Ladjel Bellatreche, membres du jury : Omar Boussaid (Rapp.), François Pinet (Rapp.), Anne Laurent et Gilles Zurfluh      

    Les systèmes d’aide à la décision occupent une place prépondérante au sein des entreprises et des grandes organisations, pour permettre des analyses dédiées à la prise de décisions. Avec l’avènement du big data, le volume des données d’analyses atteint des tailles critiques, défiant les approches classiques d’entreposage de données, dont les solutions actuelles reposent principalement sur des bases de données R-OLAP. Avec l’apparition des grandes plateformes Web telles que Google, Facebook, Twitter, Amazon… des solutions pour gérer les mégadonnées (Big Data) ont été développées et appelées « Not Only SQL ». Ces nouvelles approches constituent une voie intéressante pour la construction des entrepôts de données multidimensionnelles capables de supporter des grandes masses de données. La remise en cause de l’approche R-OLAP nécessite de revisiter les principes de la modélisation des entrepôts de données multidimensionnelles. Dans ce manuscrit, nous avons proposé des processus d’implantation des entrepôts de données multidimensionnelles avec les modèles NoSQL. Nous avons défini quatre processus pour chacun des deux modèles NoSQL orienté colonnes et orienté documents. De plus, le contexte NoSQL rend également plus complexe le calcul efficace de pré-agrégats qui sont habituellement mis en place dans le contexte ROLAP (treillis). Nous avons élargis nos processus d’implantations pour prendre en compte la construction du treillis dans les deux modèles retenus.Comme il est difficile de choisir une seule implantation NoSQL supportant efficacement tous les traitements applicables, nous avons proposé deux processus de traductions, le premier concerne des processus intra-modèles, c’est-à-dire des règles de passage d’une implantation à une autre implantation du même modèle logique NoSQL, tandis que le second processus définit les règles de transformation d’une implantation d’un modèle logique vers une autre implantation d’un autre modèle logique.

    Kamal Boulil, Une approche automatisée basée sur des contraintes d’intégrité définies en UML et OCL pour la vérification de la cohérence logique dans les systèmes SOLAP : applications dans le domaine agri-environnemental, thèse soutenue en 2012 à ClermontFerrand 2 sous la direction de François Pinet présidée par Michel Schneider, membres du jury : Jérôme Gensel (Rapp.), Sandro Bimonte      

    Les systèmes d'Entrepôts de Données et OLAP spatiaux (EDS et SOLAP) sont des technologies d'aide à la décision permettant l'analyse multidimensionnelle de gros volumes de données spatiales. Dans ces systèmes, la qualité de l'analyse dépend de trois facteurs : la qualité des données entreposées, la qualité des agrégations et la qualité de l’exploration des données. La qualité des données entreposées dépend de critères comme la précision, l'exhaustivité et la cohérence logique. La qualité d'agrégation dépend de problèmes structurels (e.g. les hiérarchies non strictes qui peuvent engendrer le comptage en double des mesures) et de problèmes sémantiques (e.g. agréger les valeurs de température par la fonction Sum peut ne pas avoir de sens considérant une application donnée). La qualité d'exploration est essentiellement affectée par des requêtes utilisateur inconsistantes (e.g. quelles ont été les valeurs de température en URSS en 2010 ?). Ces requêtes peuvent engendrer des interprétations erronées des résultats. Cette thèse s'attaque aux problèmes d'incohérence logique qui peuvent affecter les qualités de données, d'agrégation et d'exploration. L'incohérence logique est définie habituellement comme la présence de contradictions dans les données. Elle est typiquement contrôlée au moyen de Contraintes d'Intégrité (CI). Dans cette thèse nous étendons d'abord la notion de CI (dans le contexte des systèmes SOLAP) afin de prendre en compte les incohérences relatives aux agrégations et requêtes utilisateur. Pour pallier les limitations des approches existantes concernant la définition des CI SOLAP, nous proposons un Framework basé sur les langages standards UML et OCL. Ce Framework permet la spécification conceptuelle et indépendante des plates-formes des CI SOLAP et leur implémentation automatisée. Il comporte trois parties : (1) Une classification des CI SOLAP. (2) Un profil UML implémenté dans l'AGL MagicDraw, permettant la représentation conceptuelle des modèles des systèmes SOLAP et de leurs CI. (3) Une implémentation automatique qui est basée sur les générateurs de code Spatial OCL2SQL et UML2MDX qui permet de traduire les spécifications conceptuelles en code au niveau des couches EDS et serveur SOLAP. Enfin, les contributions de cette thèse ont été appliquées dans le cadre de projets nationaux de développement d'applications (S)OLAP pour l'agriculture et l'environnement.