Détail de l'éditeur
Universidad de Zaragoza
localisé à :
Saragosse
|
Documents disponibles chez cet éditeur (1)
Ajouter le résultat dans votre panier Affiner la recherche Interroger des sources externes
Titre : Automatic reconstruction of itineraries from descriptive texts Type de document : Thèse/HDR Auteurs : Ludovic Moncla , Auteur ; Mauro Gaio, Directeur de thèse ; Javier Nogueras-Iso, Directeur de thèse ; Sébastien Mustière , Encadrant Editeur : Pau : Université de Pau et des pays de l'Adour Année de publication : 2015 Autre Editeur : Saragosse [Espagne] : Universidad de Zaragoza Importance : 212 p. Format : 21 x 30 cm Note générale : bibliographie
thèse pour l’obtention du Doctorat de l’Université de Pau de des Pays de l’Adour (France) (mention Informatique) et Doctor por la Universidad de Zaragoza (Espana) (Programa de Doctorado de Ingenieria de Sistemas e Informatica)Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Géomatique
[Termes IGN] exploration de texte
[Termes IGN] extraction automatique
[Termes IGN] itinéraire
[Termes IGN] reconstruction d'itinéraire ou de trajectoire
[Termes IGN] toponyme
[Termes IGN] traitement du langage naturelIndex. décimale : THESE Thèses et HDR Résumé : (auteur) Cette thèse s’inscrit dans le cadre du projet PERDIDO dont les objectifs sont l’extraction et la reconstruction d’itinéraires à partir de documents textuels. Ces travaux ont été réalisés en collaboration entre le laboratoire LIUPPA de l’université de Pau et des Pays de l’Adour (France), l’équipe Systèmes d’Information Avancés (IAAA) de Universidad de Zaragoza (Espagne) et le laboratoire COGIT de l’IGN (France). Les objectifs de cette thèse sont de concevoir un système automatique permettant d’extraire, dans des récits de voyages ou des descriptions d’itinéraires, des déplacements, puis de les représenter sur une carte. Nous proposons une approche automatique pour la représentation d’un itinéraire décrit en langage naturel. Notre approche est composée de deux tâches principales. La première tâche a pour rôle d’identifier et d’extraire les informations qui décrivent l’itinéraire dans le texte, comme par exemple les entités nommées de lieux et les expressions de déplacement ou de perception. La seconde tâche a pour objectif la reconstruction de l’itinéraire. Notre proposition combine l’utilisation d’informations extraites grâce au traitement automatique du langage ainsi que des données extraites de ressources géographiques externes (comme des gazetiers). L’étape d’annotation d’informations spatiales est réalisée par une approche qui combine l’étiquetage morpho-syntaxique et des patrons lexico-syntaxiques (cascade de transducteurs) afin d’annoter des entités nommées spatiales et des expressions de déplacement ou de perception. Une première contribution au sein de la première tâche est la désambiguïsation des toponymes, qui est un problème encore mal résolu en NER et essentiel en recherche d’information géographique. Nous proposons un algorithme non-supervisé de géoréférencement basé sur une technique de clustering capable de proposer une solution pour désambiguïser les toponymes trouvés dans les ressources géographiques externes, et dans le même temps, de proposer une estimation de la localisation des toponymes non référencés. Nous proposons un modèle de graphe générique pour la reconstruction automatique d’itinéraire, ou chaque nœud représente un lieu et chaque segment représente un chemin reliant deux lieux. L’originalité de notre modèle est qu’en plus de tenir compte des éléments habituels (chemins et points de passage), il permet de représenter les autres éléments impliqués dans la description d’un itinéraire, comme par exemple les points de repères visuels. Un calcul d’arbre de recouvrement minimal à partir d’un graphe pondéré est utilisé pour obtenir automatiquement un itinéraire sous la forme d’un graphe. Chaque segment du graphe initial est pondéré en utilisant une méthode d’analyse multicritère combinant des critères qualitatifs et des critères quantitatifs. La valeur des critères est déterminée à partir d’informations extraites du texte et d’informations provenant de ressources géographiques externes. Par exemple, nous combinons les informations issues du traitement automatique de la langue comme les relations spatiales décrivant une orientation (ex: se diriger vers le sud) avec les coordonnées géographiques des lieux trouvés dans les ressources pour déterminer la valeur du critère “relation spatiale”. De plus, à partir de la définition du concept d’itinéraire et des informations utilisées dans la langue pour décrire un itinéraire, nous avons modélisé un langage d’annotation d’information multicouche. Ce langage s’appuie sur une couche générique basée sur les recommandations du consortium TEI (Text Encoding and Interchange) et peut être adapté en plusieurs couches spécifiques, en ajoutant de la sémantique aux éléments et aux relations annotées. Enfin, nous avons implémenté et évalué les différentes étapes de notre approche sur un corpus multilingue de descriptions de randonnées (Francais, Espagnol et Italien). Note de contenu : 1. Introduction
2. Background and Related Work
3. Reconstruction of Itineraries from Text
4. Text Mining and Toponym Resolution
5. A Multi-Scale Markup Language: A Case Study of Geospatial Language
6. Integration of the Processing Chain on a Web-Based Architecture
7. Evaluation
8. Conclusions and Future WorkNuméro de notice : 17314 Affiliation des auteurs : LASTIG COGIT (2012-2019) Thématique : GEOMATIQUE Nature : Thèse française Note de thèse : thèse de doctorat : Informatique : Pau : 2015 Organisme de stage : COGIT (IGN) ; Laboratoire d’Informatique de l’Université de Pau ; Departamento de Informatica e Ingenierıa de Sistemas Universidad de Zaragoza nature-HAL : Thèse DOI : sans En ligne : https://hal.science/tel-01249999v1 Format de la ressource électronique : URL Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=83184 Exemplaires(1)
Code-barres Cote Support Localisation Section Disponibilité 17314-01 THESE Livre LASTIG Dépôt en unité Exclu du prêt