Catalogue en ligne IGN

Détail de l'auteur

Auteur Michel Dhome

Documents disponibles écrits par cet auteur (3)

Ajouter le résultat dans votre panier Affiner la recherche Interroger des sources externes

Apprentissage profond et IA pour l’amélioration de la robustesse des techniques de localisation par vision artificielle / Achref Elouni (2021)

Public

Titre : Apprentissage profond et IA pour l’amélioration de la robustesse des techniques de localisation par vision artificielle
Type de document : Thèse/HDR
Auteurs : Achref Elouni, Auteur ; Michel Dhome, Directeur de thèse
Editeur : Clermont-Ferrand : Université Clermont Auvergne
Année de publication : 2021
Importance : 121 p.
Format : 21 x 30 cm
Note générale : Bibliographie
Thèse pour obtenir le grade de Docteur d’Université, Spécialité Informatique
Langues : Français (fre)
Descripteur : [Vedettes matières IGN] Traitement d'image
[Termes IGN] apprentissage profond
[Termes IGN] estimation de pose
[Termes IGN] état de l'art
[Termes IGN] localisation basée vision
[Termes IGN] méthode robuste
[Termes IGN] points homologues
[Termes IGN] réalité augmentée
[Termes IGN] reconstruction 3D
[Termes IGN] réseau neuronal convolutif
[Termes IGN] segmentation sémantique

Index. décimale : THESE Thèses et HDR
Résumé : (Auteur) Le travail réalisé dans le cadre de ce doctorat se place dans le contexte d’un projet collaboratif ayant pour objectif la mise au point d’un casque de réalité augmenté. Afin de faire fonctionner un tel dispositif il s’avère nécessaire de calculer la position d’une caméra embarquée dans l’environnent d’intervention de l’utilisateur. Récemment, deux technologies dénommées SLAM (pour « Simultaneous Localization And Mapping ») et SfM (pour « Structure From Motion ») ont fait preuve de performances indéniables pour la reconstruction 3D d’un environnement à partir d’une collection d’images. Nous nous sommes intéressés à elles afin de résoudre le problème délicat de l’initialisation de notre dispositif ou de sa ré-initialisation en cas d’échec du suivi temps réel de la position. En effet, malgré les travaux de recherche réalisés ces dernières années, plusieurs limitations empêchent les système de localisation d’estimer une pose parfaite dans toutes les conditions. Ces conditions incluent les changements légers du contexte comme les variations de la luminosité, du point d’observation ou des modifications géométriques telles que l’ajout d’objets. Pour faire face à ces limitations et afin de proposer une solution facile à déployer,nous avons étudié la possibilité d’intégrer dans le processus de localisation des informations invariantes qui pourraient augmenter la probabilité d’avoir une pose précise. Deux types d’information invariante (sémantique et géométrique) ont été exploitées dans cette thèse pour aider le système de localisation à trouver sa position. Les solutions proposées ont été validées sur plusieurs jeux de données internes et externes (Dubrovnik, Rome, Oxford, Musée) grâce auxquels nous avons pu comparer nos résultats avec les travaux décrits dans l’état de l’art. Deux types d’images requêtes ont été étudiées dans cette thèse : celle composée d’une seule image et celle issue d’un dispositif stéréo. L’avantage d’utiliser une paire stéréo est de pouvoir trianguler des points homologues afin d’extraire leur hauteur et d’exploiter cette dernière dans le processus de localisation. L’autre approche envisagée consiste à utiliser comme invariant le label des pixels obtenu par un algorithme de segmentation sémantique basé sur un réseau de neurones convolutionnel. Dans les deux cas, les résultats obtenus montrent une amélioration sensible sur la précision des poses estimées.
Note de contenu : 1. Introduction générale
1.1 Contexte
2. État de l’art
2.1 Le problème de la reconstruction 3D
2.2 Localisation visuelle basée sur l’image
2.3 Conclusion
3. Descripteur géométrique-visuel pour une localisation améliorée ba?sée sur l’image utilisant un a priori sur la verticale
3.1 Introduction
3.2 Méthode proposée
3.3 Étude expérimentale
3.4 Conclusion
4. La segmentation sémantique pour améliorer la localisation visuelle
4.1 Introduction
4.2 Méthode proposée
4.3 Étude expérimentale
4.4 Conclusion
5. La segmentation sémantique pour améliorer la recherche d’image par le contenu
5.1 Introduction
5.2 Méthode proposée
5.3 Étude expérimentale
5.4 Conclusion
6. Conclusion et Perspectives

Numéro de notice : 26763
Affiliation des auteurs : non IGN
Thématique : IMAGERIE/INFORMATIQUE
Nature : Thèse française
Note de thèse : Thèse de Doctorat : Informatique : Clermont Ferrand : 2021
Organisme de stage : Institut Pascal
nature-HAL : Thèse
DOI : sans
Date de publication en ligne : 03/02/2022
En ligne : https://tel.hal.science/tel-03554182/
Format de la ressource électronique : URL
Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=99827

Contributions au RGBD-SLAM / Kathia Melbouci (2017)

Public

Titre : Contributions au RGBD-SLAM
Type de document : Thèse/HDR
Auteurs : Kathia Melbouci, Auteur ; Michel Dhome, Directeur de thèse
Editeur : Clermont-Ferrand : Université Clermont Auvergne
Année de publication : 2017
Importance : 144 p.
Format : 21 x 30 cm
Note générale : bibliographie
Thèse présentée en vue de l’obtention du grade de Docteur d’université, Formation Doctorale Électronique et Système Spécialité : Vision pour la Robotique
Langues : Français (fre)
Descripteur : [Vedettes matières IGN] Traitement d'image
[Termes IGN] compensation par faisceaux
[Termes IGN] compréhension de l'image
[Termes IGN] effet de profondeur cinétique
[Termes IGN] Kinect
[Termes IGN] modélisation 3D
[Termes IGN] primitive
[Termes IGN] reconstruction 3D
[Termes IGN] robot mobile
[Termes IGN] scène

Index. décimale : THESE Thèses et HDR
Résumé : (auteur) Pour assurer la navigation autonome d’un robot mobile, les traitements effectués pour sa localisation doivent être faits en ligne et doivent garantir une précision suffisante pour permettre au robot d’effectuer des tâches de haut niveau pour la navigation et l’évitement d’obstacles. Les auteurs de travaux basés sur le SLAM visuel (Simultaneous Localization And Mapping) tentent depuis quelques années de garantir le meilleur compromis rapidité/précision. La majorité des solutions SLAM visuel existantes sont basées sur une représentation éparse de l’environnement. En suivant des primitives visuelles sur plusieurs images, il est possible d’estimer la position 3D de ces primitives ainsi que les poses de la caméra. La communauté du SLAM visuel a concentré ses efforts sur l’augmentation du nombre de primitives visuelles suivies et sur l’ajustement de la carte 3D, afin d’améliorer l’estimation de la trajectoire de la caméra et les positions 3D des primitives. Cependant, la localisation par SLAM visuel présente souvent des dérives dues au cumul d’erreurs, et dans le cas du SLAM visuel monoculaire, la position de la caméra n’est connue qu’à un facteur d’échelle près. Ce dernier peut être fixé initialement mais dérive au cours du temps. Pour faire face à ces limitations, nous avons centré nos travaux de thèse sur la problématique suivante : intégrer des informations supplémentaires dans un algorithme de SLAM visuel monoculaire afin de mieux contraindre la trajectoire de la caméra et la reconstruction 3D. Ces contraintes ne doivent pas détériorer les performances calculatoires de l’algorithme initial et leur absence ne doit pas mettre l’algorithme en échec. C’est pour cela que nous avons choisi d’intégrer l’information de profondeur fournie par un capteur 3D (e.g. Microsoft Kinect) et des informations géométriques sur la structure de la scène. La première contribution de cette thèse est de modifier l’algorithme SLAM visuel monoculaire proposé par Mouragnon et al.(2006b) pour prendre en compte la mesure de profondeur fournie par un capteur 3D, en proposant particulièrement un ajustement de faisceaux qui combine, d’une manière simple, des informations visuelles et des informations de profondeur. La deuxième contribution est de proposer une nouvelle fonction de coût du même ajustement de faisceaux qui intègre, en plus des contraintes sur les profondeurs des points, des contraintes géométriques d’appartenance aux plans de la scène. Les solutions proposées ont été validées sur des séquences de synthèse et sur des séquences réelles, représentant des environnements variés. Ces solutions ont été comparées aux récentes méthodes de l’état de l’art. Les résultats obtenus montrent que les différentes contraintes développées permettent d’améliorer significativement la précision de la localisation du SLAM. De plus, les solutions proposées sont faciles à déployer et peu couteuses en temps de calcul.
Note de contenu : Introduction
1 - Notions de base
2 - Etat de l’art des méthodes SLAM
3 - RGBD-SLAM : SLAM augmenté par l’information de profondeur
4 - Évaluation expérimentale du RGBD SLAM
5 - GBD-SLAM Contraint : Contrainte d’appartenance aux plans de la scène
6 - Évaluation expérimentale du RGBD-SLAM Contraint
Conclusion
Numéro de notice : 21578
Affiliation des auteurs : non IGN
Thématique : IMAGERIE
Nature : Thèse française
Note de thèse : Thèse de doctorat : Vision pour la Robotique : Clermont Auvergne : 2017
nature-HAL : Thèse
DOI : sans
En ligne : http://www.theses.fr/2017CLFAC006
Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=90584

Contours et reconnaissance des formes pour l'analyse de scènes en robotique / Michel Dhome (1984)

Public

Titre : Contours et reconnaissance des formes pour l'analyse de scènes en robotique
Type de document : Thèse/HDR
Auteurs : Michel Dhome, Auteur
Editeur : Clermont : Université de Clermont 2
Année de publication : 1984
Importance : 154 p.
Format : 21 x 30 cm
Note générale : Bibliographie
Thèse pour obtenir le titre de docteur ingénieur, spécialité électronique systèmes
Langues : Français (fre)
Descripteur : [Vedettes matières IGN] Intelligence artificielle
[Termes IGN] contour
[Termes IGN] polygone
[Termes IGN] reconnaissance de formes
[Termes IGN] robotique
[Termes IGN] scène
[Termes IGN] segmentation d'image

Index. décimale : THESE Thèses et HDR
Numéro de notice : 56270
Affiliation des auteurs : non IGN
Thématique : GEOMATIQUE/INFORMATIQUE
Nature : Thèse française
Note de thèse : Thèse de docteur ingénieur : Electronique systèmes : Clermont 2 : 1984
nature-HAL : Thèse
DOI : sans
Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=45753