Titre : |
Learning to translate land-cover maps: Several multi-dimensional context-wise solutions |
Titre original : |
Apprendre à traduire des cartes d'occupation des sols : Plusieurs solutions exploitant de multiples formes de contexte |
Type de document : |
Thèse/HDR |
Auteurs : |
Luc Baudoux , Auteur ; Clément Mallet , Directeur de thèse ; Jordi Inglada, Directeur de thèse |
Editeur : |
Champs-sur-Marne [France] : Université Gustave Eiffel |
Année de publication : |
2021 |
Projets : | MAESTRIA / Mallet, Clément | Note générale : |
bibliographie
École doctorale n° 532, Mathématiques, Science, et Technologie de l’Information et de la Communication (MSTIC) - Spécialité de doctorat : Signal, Image, et Automatique |
Langues : |
Anglais (eng) |
Descripteur : |
[Vedettes matières IGN] Bases de données localisées [Termes IGN] apprentissage profond [Termes IGN] base de données d'occupation du sol [Termes IGN] indicateur de résolution [Termes IGN] information sémantique [Termes IGN] nomenclature [Termes IGN] prise en compte du contexte
|
Index. décimale : |
THESE Thèses et HDR |
Résumé : |
(auteur) La description de la couverture biophysique des surfaces terrestres, appelée occupation du sol, est d'une importance capitale dans de nombreux domaines, allant de l'urbanisme aux études climatiques en passant par la sécurité alimentaire. Historiquement produites à la main, les cartes d'occupation du sol ont profité de l'essor de l'imagerie satellitaire et des méthodes avancées de vision par ordinateur pour gagner en précision et en fréquence de mise à jour. Elles souffrent toutefois de deux inconvénients limitant leur utilisation. D'une part, la résolution spatiale des cartes produites est fixe. Or une carte d'une résolution de 10 mètres ne conviendra pas à l'analyse de phénomènes à grande échelle, ni à l'étude d'objets de moins de 10 mètres. D'autre part, la nomenclature de la carte est choisie pour répondre à un besoin spécifique qui ne correspond pas nécessairement aux besoins d'un autre utilisateur. Ainsi, une carte peut regrouper sous le terme "bâti" un ensemble d'éléments tels que des "routes" et des "habitations", qui dans d'autres nomenclatures seront classés séparément. Les approches actuelles de traduction de nomenclatures sont principalement fondées sur des méthodes de traduction sémantique (LCCS...) appliquées au niveau de la nomenclature en comparant les définitions de classes (la classe "blé" sera traduite en "herbacée"). Ce faisant, elles négligent le fait que deux objets de la même classe peuvent être traduits différemment en fonction, par exemple, de leur contexte spatial ou de leur évolution temporelle. En outre, la traduction de la résolution spatiale est généralement traitée distinctement de la traduction de nomenclature alors que ces deux notions sont intimement liées (un arbre seul ne peut pas être traduit en "forêt"). Cette thèse aborde ce problème en proposant des méthodes de traduction contextuelle augmentant les possibilités de réutilisation et de génération de nouvelles occupations des sols. Dans un premier temps, nous proposons différentes stratégies, principalement fondées sur des réseaux de neurones à convolution apprenant à traduire une carte source en une carte cible en fonction du contexte. Nous montrons l'importance cruciale du contexte spatial et géographique (une forêt en montagne est probablement constituée de conifères) sur de multiples exemples de traductions. Dans un deuxième temps, partant du constat que les modèles de traduction multi-langues donnent de meilleurs résultats que ceux entraînés à traduire d'une seule langue source vers une seule langue cible, nous proposons un modèle de traduction multi-cartes permettant d'obtenir plusieurs nomenclatures cibles à partir d'une carte source. Nous montrons que ce modèle permet d'obtenir des résultats plus robustes que les modèles entraînés sur une seule traduction, en particulier sur des cartes avec peu d'échantillons d'entraînement. Troisièmement, nous expérimentons différentes configurations de fusion multimodale fusionnant des images satellites (optiques et radar) et des données d'élévation du terrain avec des cartes d'occupation du sol. Enfin, nous définissons la notion et proposons une méthode pour construire un espace de représentation sémantique commun à toutes les occupations du sol. Nous ne représentons alors plus la traduction comme le passage d'un espace de représentation discret à n classes (une nomenclature) vers un autre espace, mais comme un simple changement d'interprétation d'un espace de représentation sémantique continu commun à toutes les nomenclatures. Nous proposons une première application de la notion d'espace de représentation sémantique à la traduction, en nous concentrant sur la traduction de cartes sources non vues pendant l’entraînement du modèle de traduction. Les codes et jeux de données (France entière, six cartes d'occupation du sol, images satellite, vérité terrain) produits au cours de cette thèse sont rendus accessibles pour la reproductibilité et des comparaisons futures. |
Numéro de notice : |
17766 |
Affiliation des auteurs : |
UGE-LASTIG (2020- ) |
Thématique : |
GEOMATIQUE/IMAGERIE/INFORMATIQUE |
Nature : |
Thèse française |
Note de thèse : |
thèse : Signal, Image, et Automatique : Gustave Eiffel : 2021 |
Organisme de stage : |
LASTIG (IGN) |
nature-HAL : |
Thèse |
DOI : |
sans |
Date de publication en ligne : |
07/02/2023 |
En ligne : |
https://hal.science/tel-03977658 |
Format de la ressource électronique : |
URL |
Permalink : |
https://documentation.ensg.eu/index.php?lvl=notice_display&id=103209 |
| |