Descripteur
Termes IGN > sciences humaines et sociales > linguistique > linguistique informatique > traitement du langage naturel
traitement du langage naturelSynonyme(s)traitement automatique du langage naturelVoir aussi |
Documents disponibles dans cette catégorie (56)
Ajouter le résultat dans votre panier
Visionner les documents numériques
Affiner la recherche Interroger des sources externes
Etendre la recherche sur niveau(x) vers le bas
Toponym recognition in custom-made map titles / Catherine Dominguès in International journal of cartography, vol 1 n° 1 (August 2015)
[article]
Titre : Toponym recognition in custom-made map titles Type de document : Article/Communication Auteurs : Catherine Dominguès , Auteur ; Iris Eshkol-Taravella, Auteur Année de publication : 2015 Article en page(s) : pp 109 - 120 Note générale : bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Géomatique
[Termes IGN] carte topographique
[Termes IGN] corpus
[Termes IGN] géobalise
[Termes IGN] prise en compte du contexte
[Termes IGN] répertoire toponymique
[Termes IGN] toponyme
[Termes IGN] traitement du langage naturelMots-clés libres : toponym subjective toponym web corpus natural language processing gazetteer Résumé : (auteur) The titles of customized topographic maps constitute a specific corpus which is characterized by a very significant number of place names and spelling variations. This paper is about identifying toponyms in these titles. The toponym tracking is based on gazetteers as well as light parsing according to patterns. The method used broadens the definition of the toponym to include the nature of the corpus and the data in it. It consists of seven successive stages where both the extralinguistic context – in this case toponym georeferencing – and the linguistic context are taken into account. Mistakes in tagging are analyzed from the corpus characteristics and the results of each step tagging are evaluated (recall, precision, F-measure). Different conclusions can be suggested: (i) toponym recognition in web corpora should take into account spelling changes, (ii) toponym recognition cannot be limited to gazetteer proper nouns, (iii) the notion of subjective toponym is relevant in this specific corpus, and could be considered with reference to the customization of maps. Numéro de notice : A2015-404 Affiliation des auteurs : LASTIG COGIT+Ext (2012-2019) Thématique : GEOMATIQUE/TOPONYMIE Nature : Article nature-HAL : ArtAvecCL-RevueIntern DOI : 10.1080/23729333.2015.1055935 Date de publication en ligne : 07/08/2015 En ligne : https://doi.org/10.1080/23729333.2015.1055935 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=76891
in International journal of cartography > vol 1 n° 1 (August 2015) . - pp 109 - 120[article]
Titre : Confounds and Consequences in Geotagged Twitter Data Type de document : Article/Communication Auteurs : Umashanthi Pavalanathan, Auteur ; Jacob Eisenstein, Auteur Editeur : Ithaca [New York - Etats-Unis] : ArXiv - Université Cornell Année de publication : 7/06/2015 Importance : 10 p. Format : 21 x 30 cm Note générale : bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Géomatique web
[Termes IGN] données issues des réseaux sociaux
[Termes IGN] erreur systématique
[Termes IGN] géobalise
[Termes IGN] traitement du langage naturelRésumé : (auteur) Twitter is often used in quantitative studies that identify geographically-preferred topics, writing styles, and entities. These studies rely on either GPS coordinates attached to individual messages, or on the user-supplied location field in each profile. In this paper, we compare these data acquisition techniques and quantify the biases that they introduce; we also measure their effects on linguistic analysis and text-based geolocation. GPS-tagging and self-reported locations yield measurably different corpora, and these linguistic differences are partially attributable to differences in dataset composition by age and gender. Using a latent variable model to induce age and gender, we show how these demographic variables interact with geography to affect language use. We also show that the accuracy of text-based geolocation varies with population demographics, giving the best results for men above the age of 40. Numéro de notice : P2015-001 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE Nature : Preprint nature-HAL : Préprint DOI : 10.48550/arXiv.1506.02275 En ligne : https://doi.org/10.48550/arXiv.1506.02275 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=79901 Documents numériques
en open access
Confounds and Consequences in Geotagged Twitter DataAdobe Acrobat PDF Metadata topic harmonization and semantic search for linked-data-driven geoportals: A case study using ArcGIS online / Yingjie Hu in Transactions in GIS, vol 19 n° 3 (June 2015)
[article]
Titre : Metadata topic harmonization and semantic search for linked-data-driven geoportals: A case study using ArcGIS online Type de document : Article/Communication Auteurs : Yingjie Hu, Auteur ; Krzysztof Janowicz, Auteur ; Sathya Prasad, Auteur ; Song Gao, Auteur Année de publication : 2015 Article en page(s) : pp 398 - 416 Note générale : bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Géomatique
[Termes IGN] ArcGIS
[Termes IGN] diffusion de données
[Termes IGN] géoportail
[Termes IGN] langage naturel (informatique)
[Termes IGN] métadonnées géographiques
[Termes IGN] partage de données localisées
[Termes IGN] traitement du langage naturel
[Termes IGN] web sémantiqueRésumé : (auteur) Geoportals provide integrated access to geospatial resources, and enable both authorities and the general public to contribute and share data and services. An essential goal of geoportals is to facilitate the discovery of the available resources. Such a process relies heavily on the quality of metadata. While multiple metadata standards have been established, data contributers may adopt different standards when sharing their data via the same geoportal. This is especially the case for user-generated content where various terms and topics can be introduced to describe similar datasets. While this heterogeneity provides a wealth of perspectives, it also complicates resource discovery. With the fast development of the Semantic Web technologies, there is a rise of Linked-Data-driven portals. Although these novel portals open up new ways to organize metadata and retrieve resources, they lack effective semantic search methods. This article addresses the two challenges discussed above, namely the topic heterogeneity brought by multiple metadata standards and the lack of established semantic search in Linked-Data-driven geoportals. To harmonize the metadata topics, we employ a natural language processing method, namely Labeled Latent Dirichlet Allocation (LLDA), and train it using standardized metadata from Data.gov. With respect to semantic search, we construct thematic and geographic matching features from the textual metadata descriptions, and train a regression model via a human participants experiment. We evaluate our methods by examining their performances in addressing the two issues. Finally, we implement a semantics-enabled and Linked-Data-driven prototypical geoportal using a sample dataset from Esri's ArcGIS Online. Numéro de notice : A2015-679 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE Nature : Article nature-HAL : ArtAvecCL-RevueIntern DOI : 10.1111/tgis.12151 En ligne : http://dx.doi.org/10.1111/tgis.12151 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=78307
in Transactions in GIS > vol 19 n° 3 (June 2015) . - pp 398 - 416[article]Mining trajectory data and geotagged data in social media for road map inference: Mining social media for road map inference / Jun Li in Transactions in GIS, vol 19 n° 1 (February 2015)
[article]
Titre : Mining trajectory data and geotagged data in social media for road map inference: Mining social media for road map inference Type de document : Article/Communication Auteurs : Jun Li, Auteur ; Qiming Qin, Auteur ; Jiawei Han, Auteur ; Lu-An Tang, Auteur ; Kin Hou Lei, Auteur Année de publication : 2015 Article en page(s) : pp 1 - 18 Note générale : bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Bases de données localisées
[Termes IGN] base de données routières
[Termes IGN] contenu généré par les utilisateurs
[Termes IGN] données localisées des bénévoles
[Termes IGN] exploration de données géographiques
[Termes IGN] géobalise
[Termes IGN] inférence
[Termes IGN] mise à jour de base de données
[Termes IGN] traitement du langage naturelRésumé : (auteur) As mapping is costly and labor-intensive work, government mapping agencies are less and less willing to absorb these costs. In order to reduce the updating cycle and cost, researchers have started to use user generated content (UGC) for updating road maps; however, the existing methods either rely heavily on manual labor or cannot extract enough information for road maps. In view of the above problems, this article proposes a UGC-based automatic road map inference method. In this method, data mining techniques and natural language processing tools are applied to trajectory data and geotagged data in social media to extract not only spatial information – the location of the road network – but also attribute information – road class and road name – in an effort to create a complete road map. A case study using floating car data, collected by the National Commercial Vehicle Monitoring Platform of China, and geotagged text data from Flickr and Google Maps/Earth, validates the effectiveness of this method in inferring road maps. Numéro de notice : A2015--118 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE Nature : Article DOI : 10.1111/tgis.12072 Date de publication en ligne : 15/01/2014 En ligne : http://doi.wiley.com/10.1111/tgis.12072 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=102453
in Transactions in GIS > vol 19 n° 1 (February 2015) . - pp 1 - 18[article]
Titre : Automatic reconstruction of itineraries from descriptive texts Type de document : Thèse/HDR Auteurs : Ludovic Moncla , Auteur ; Mauro Gaio, Directeur de thèse ; Javier Nogueras-Iso, Directeur de thèse ; Sébastien Mustière , Encadrant Editeur : Pau : Université de Pau et des pays de l'Adour Année de publication : 2015 Autre Editeur : Saragosse [Espagne] : Universidad de Zaragoza Importance : 212 p. Format : 21 x 30 cm Note générale : bibliographie
thèse pour l’obtention du Doctorat de l’Université de Pau de des Pays de l’Adour (France) (mention Informatique) et Doctor por la Universidad de Zaragoza (Espana) (Programa de Doctorado de Ingenieria de Sistemas e Informatica)Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Géomatique
[Termes IGN] exploration de texte
[Termes IGN] extraction automatique
[Termes IGN] itinéraire
[Termes IGN] reconstruction d'itinéraire ou de trajectoire
[Termes IGN] toponyme
[Termes IGN] traitement du langage naturelIndex. décimale : THESE Thèses et HDR Résumé : (auteur) Cette thèse s’inscrit dans le cadre du projet PERDIDO dont les objectifs sont l’extraction et la reconstruction d’itinéraires à partir de documents textuels. Ces travaux ont été réalisés en collaboration entre le laboratoire LIUPPA de l’université de Pau et des Pays de l’Adour (France), l’équipe Systèmes d’Information Avancés (IAAA) de Universidad de Zaragoza (Espagne) et le laboratoire COGIT de l’IGN (France). Les objectifs de cette thèse sont de concevoir un système automatique permettant d’extraire, dans des récits de voyages ou des descriptions d’itinéraires, des déplacements, puis de les représenter sur une carte. Nous proposons une approche automatique pour la représentation d’un itinéraire décrit en langage naturel. Notre approche est composée de deux tâches principales. La première tâche a pour rôle d’identifier et d’extraire les informations qui décrivent l’itinéraire dans le texte, comme par exemple les entités nommées de lieux et les expressions de déplacement ou de perception. La seconde tâche a pour objectif la reconstruction de l’itinéraire. Notre proposition combine l’utilisation d’informations extraites grâce au traitement automatique du langage ainsi que des données extraites de ressources géographiques externes (comme des gazetiers). L’étape d’annotation d’informations spatiales est réalisée par une approche qui combine l’étiquetage morpho-syntaxique et des patrons lexico-syntaxiques (cascade de transducteurs) afin d’annoter des entités nommées spatiales et des expressions de déplacement ou de perception. Une première contribution au sein de la première tâche est la désambiguïsation des toponymes, qui est un problème encore mal résolu en NER et essentiel en recherche d’information géographique. Nous proposons un algorithme non-supervisé de géoréférencement basé sur une technique de clustering capable de proposer une solution pour désambiguïser les toponymes trouvés dans les ressources géographiques externes, et dans le même temps, de proposer une estimation de la localisation des toponymes non référencés. Nous proposons un modèle de graphe générique pour la reconstruction automatique d’itinéraire, ou chaque nœud représente un lieu et chaque segment représente un chemin reliant deux lieux. L’originalité de notre modèle est qu’en plus de tenir compte des éléments habituels (chemins et points de passage), il permet de représenter les autres éléments impliqués dans la description d’un itinéraire, comme par exemple les points de repères visuels. Un calcul d’arbre de recouvrement minimal à partir d’un graphe pondéré est utilisé pour obtenir automatiquement un itinéraire sous la forme d’un graphe. Chaque segment du graphe initial est pondéré en utilisant une méthode d’analyse multicritère combinant des critères qualitatifs et des critères quantitatifs. La valeur des critères est déterminée à partir d’informations extraites du texte et d’informations provenant de ressources géographiques externes. Par exemple, nous combinons les informations issues du traitement automatique de la langue comme les relations spatiales décrivant une orientation (ex: se diriger vers le sud) avec les coordonnées géographiques des lieux trouvés dans les ressources pour déterminer la valeur du critère “relation spatiale”. De plus, à partir de la définition du concept d’itinéraire et des informations utilisées dans la langue pour décrire un itinéraire, nous avons modélisé un langage d’annotation d’information multicouche. Ce langage s’appuie sur une couche générique basée sur les recommandations du consortium TEI (Text Encoding and Interchange) et peut être adapté en plusieurs couches spécifiques, en ajoutant de la sémantique aux éléments et aux relations annotées. Enfin, nous avons implémenté et évalué les différentes étapes de notre approche sur un corpus multilingue de descriptions de randonnées (Francais, Espagnol et Italien). Note de contenu : 1. Introduction
2. Background and Related Work
3. Reconstruction of Itineraries from Text
4. Text Mining and Toponym Resolution
5. A Multi-Scale Markup Language: A Case Study of Geospatial Language
6. Integration of the Processing Chain on a Web-Based Architecture
7. Evaluation
8. Conclusions and Future WorkNuméro de notice : 17314 Affiliation des auteurs : LASTIG COGIT (2012-2019) Thématique : GEOMATIQUE Nature : Thèse française Note de thèse : thèse de doctorat : Informatique : Pau : 2015 Organisme de stage : COGIT (IGN) ; Laboratoire d’Informatique de l’Université de Pau ; Departamento de Informatica e Ingenierıa de Sistemas Universidad de Zaragoza nature-HAL : Thèse DOI : sans En ligne : https://hal.science/tel-01249999v1 Format de la ressource électronique : URL Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=83184 Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité 17314-01 THESE Livre LASTIG Dépôt en unité Exclu du prêt PermalinkPermalinkPermalinkGénérer une emprise de carte à partir des toponymes d’un texte / Geoffrey Brun (2013)PermalinkPermalinkCartes sur mesure pour les randonneurs / Catherine Dominguès in Cartes & Géomatique, n° 209 (septembre 2011)PermalinkAnalyses linguistiques et techniques d’alignement pour créer et enrichir une ontologie topographique / Sébastien Mustière in Revue internationale de géomatique, vol 21 n° 2 (juin - août 2011)PermalinkPermalinkPermalinkKnowledge engineering and management by the masses, 17th international conference, EKAW 2010, Lisbon, Portugal, October 2010 / Philipp Cimiano (2010)Permalink