Descripteur
Termes IGN > sciences humaines et sociales > linguistique > corpus
corpusSynonyme(s)données textuellesVoir aussi |
Documents disponibles dans cette catégorie (33)
Ajouter le résultat dans votre panier
Visionner les documents numériques
Affiner la recherche Interroger des sources externes
Etendre la recherche sur niveau(x) vers le bas
Repérage et identification automatiques de noms de lieux avec variations d'écriture dans des corpus / Mathilde Jouvel-Triollet (2019)
Titre : Repérage et identification automatiques de noms de lieux avec variations d'écriture dans des corpus Type de document : Mémoire Auteurs : Mathilde Jouvel-Triollet, Auteur ; Catherine Dominguès , Encadrant ; Philippe Gambette, Encadrant Editeur : Grenoble [France] : Université Grenoble Alpes Année de publication : 2019 Importance : 84 p. Note générale : bibliographie
Mémoire de master 2 mention Sciences du Langage, Parcours Industries de la LangueLangues : Français (fre) Descripteur : [Vedettes matières IGN] Toponymie
[Termes IGN] corpus
[Termes IGN] mesure de similitude
[Termes IGN] reconnaissance de noms
[Termes IGN] toponyme
[Termes IGN] traitement du langage naturel
[Termes IGN] variationMots-clés libres : traitement automatique des langues (TAL) variation d’écriture néographie corpus hétérogènes reconnaissance d’entité nommée mesure de similarité Natural Language Processing (NLP) toponym placename written variation new written form heterogeneous corpus named entity recognition string metric Résumé : (auteur) Les toponymes sont parfois amenés à subir des variations d’écriture et voient leur graphie s’éloigner de celle que nous trouvons habituellement dans les dictionnaires de noms propres. Ces variations d’écriture peuvent dépendre du type de corpus dont les toponymes sont issus, du registre, du temps ou du langage que couvre le corpus. Nous proposons une méthode pour identifier un toponyme, c’est-à-dire faire le lien entre un toponyme avec variations d’écriture et sa forme normée. Le présent mémoire se divise en trois parties. Dans une première partie, nous présenterons le terrain de stage. Dans un second temps, nous décrirons les missions confiées, puis nous exposerons l’approche envisagée ainsi que les outils utilisés pour répondre aux missions. Enfin, nous proposerons des solutions afin de répondre au mieux au besoin d’identification de toponymes avec variations d’écriture. // Toponyms can sometimes be the target of written variations and experience a different written form from what we usually find in proper names dictionaries. These written variations can depend on the type of the corpus the toponyms come from, the register, the time or the language that the corpus covers. We suggest a method to identify a toponym, which means making the link between a toponym with written variations and its normalised form. This Master’s thesis is divided into three parts. In the first part we will present the context of the internship. Then we will describe the given tasks and we will expound the contemplated approaches and the tools that we used. Finally, we will suggest solutions to meet at best the need of toponyms identification with written variations. Note de contenu : Introduction
Partie 1. Présentation du terrain de stage
1. IGN
2. UPEM
Partie 2. Objectifs (cahier des charges)
3. Étude du besoin
4. Méthodologie pour répondre à la demande
4.1. Identification de noms de lieux
4.2. Repérage des noms de lieux
4.3. Approche envisagée
5. Ressources et outils utilisés
5.1. Les corpus
5.2. Les gazetiers
5.3. Les mesures d’évaluation
Partie 3. Réponse au cahier des charges
6. Identifier des toponymes
6.1. Introduction
6.2. Méthode
6.3. Résultats
6.4. Discussion
6.5. Variante du processus d’identification
7. Repérer des toponymes dans un corpus
7.1. Des mots déclencheurs
7.2. Des mots impossibles
8. Repérage et identification simultanés
8.1. Introduction
8.2. Méthode
8.3. Résultats
8.4. Discussion
ConclusionNuméro de notice : 14517 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE/INFORMATIQUE/MATHEMATIQUE Nature : Mémoire masters divers Organisme de stage : LASTIG (IGN) Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=102273 Documents numériques
peut être téléchargé
rapport-M2IdL_Jouvel - pdf auteurAdobe Acrobat PDF
Titre : Valorisation de récits de vie de Républicains espagnols Type de document : Article/Communication Auteurs : Catherine Dominguès , Auteur ; Laurence Jolivet , Auteur ; Carmen Brando , Auteur Editeur : Saint-Mandé : Institut national de l'information géographique et forestière - IGN (2012-) Année de publication : 2019 Projets : MATRICIEL / Conférence : EGC 2019, Atelier DAHLIA 22/01/2019 22/01/2019 Metz France Open Access Proceedings Importance : pp 82 - 84 Note générale : bibliographie Langues : Français (fre) Descripteur : [Vedettes matières IGN] Analyse spatiale
[Termes IGN] corpus
[Termes IGN] Espagne
[Termes IGN] récit
[Termes IGN] représentation cartographique
[Termes IGN] traitement du langage naturel
[Termes IGN] vingtième siècleRésumé : (auteur) Ce travail vise à analyser des récits de vie de Républicains espagnols sous l’angle des lieux désignés et d’en proposer une représentation cartographique. Cette analyse combinée montre l’interdépendance des questions linguistiques et cartographiques soulevées. Numéro de notice : C2019-041 Affiliation des auteurs : LASTIG COGIT+Ext (2012-2019) Thématique : GEOMATIQUE Nature : Communication nature-HAL : ComAvecCL&ActesPubliésNat DOI : sans Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=95412 Documents numériques
en open access
Valorisation de récits de vie de Républicains espagnols - pdf éditeurAdobe Acrobat PDF Fictive motion extraction and classification / Ekaterina Egorova in International journal of geographical information science IJGIS, vol 32 n° 11-12 (November - December 2018)
[article]
Titre : Fictive motion extraction and classification Type de document : Article/Communication Auteurs : Ekaterina Egorova, Auteur ; Ludovic Moncla , Auteur ; Mauro Gaio, Auteur ; Christophe Claramunt, Auteur ; Ross S. Purves, Auteur Année de publication : 2018 Article en page(s) : pp 2247 - 2271 Note générale : Bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Géomatique
[Termes IGN] Alpes
[Termes IGN] base de règles
[Termes IGN] corpus
[Termes IGN] extraction automatique
[Termes IGN] traitement du langage naturelRésumé : (Auteur) Fictive motion (e.g. ‘The highway runs along the coast’) is a pervasive phenomenon in language that can imply both a static and a moving observer. In a corpus of alpine narratives, it is used in three types of spatial descriptions: conveying the actual motion of the observer, describing a vista and communicating encyclopaedic spatial knowledge. This study takes a knowledge-based approach to develop rules for automated extraction and classification of these types based on an annotated corpus of fictive motion instances. In particular, we identify the differences in the set of concepts involved into the production of the three types of descriptions, followed by their linguistic operationalization. Based on that, we build a set of rules that classify fictive motion with an overall precision of 0.87 and recall of 0.71. The article highlights the importance of examining spatially rich, naturally occurring corpora for the lines of work dealing with the automated interpretation of spatial information in texts, as well as, more broadly, investigation of spatial language involved into various types of spatial discourse. Numéro de notice : A2018-524 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE Nature : Article nature-HAL : ArtAvecCL-RevueIntern DOI : 10.1080/13658816.2018.1498503 Date de publication en ligne : 30/07/2018 En ligne : https://doi.org/10.1080/13658816.2018.1498503 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=91349
in International journal of geographical information science IJGIS > vol 32 n° 11-12 (November - December 2018) . - pp 2247 - 2271[article]Réservation
Réserver ce documentExemplaires(1)
Code-barres Cote Support Localisation Section Disponibilité 079-2018061 RAB Revue Centre de documentation En réserve L003 Disponible Services web pour l’annotation sémantique d’information spatiale à partir de corpus textuels / Ludovic Moncla in Revue internationale de géomatique, vol 28 n° 4 (octobre - décembre 2018)
[article]
Titre : Services web pour l’annotation sémantique d’information spatiale à partir de corpus textuels Type de document : Article/Communication Auteurs : Ludovic Moncla , Auteur ; Mauro Gaio, Auteur Année de publication : 2018 Article en page(s) : pp 439 - 459 Note générale : bibliographie Langues : Français (fre) Descripteur : [Vedettes matières IGN] Linguistique
[Termes IGN] analyse syntaxique
[Termes IGN] corpus
[Termes IGN] données localisées
[Termes IGN] entité géographique
[Termes IGN] reconnaissance de noms
[Termes IGN] segmentation sémantique
[Termes IGN] service web
[Termes IGN] traitement du langage naturel
[Termes IGN] web des donnéesRésumé : (auteur) L’annotation sémantique d’information spatiale a pour objectif de repérer des mots ou des syntagmes décrivant des références géographiques (noms de lieux) ainsi que diverses expressions spatiales associées. L’une des plus importantes difficultés pour concevoir un système automatique d’annotation d’un tel type d’information est due aux ambiguïtés liées aux entités spatiales. Une approche modulaire basée sur des services Web a été choisie. La méthodologie proposée repose sur la combinaison d’une étape de prétraitement (analyse morphosyntaxique), d’une cascade de transducteurs, et d’une étape de classification utilisant des ressources du Web des données. Un avantage de cette approche est la possibilité d’obtenir des traitements partiels ou encore de mettre en concurrence certains modules réalisant la même tâche. Numéro de notice : A2018-565 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE Nature : Article nature-HAL : ArtAvecCL-RevueIntern DOI : 10.3166/rig.2018.00066 Date de publication en ligne : 18/03/2019 En ligne : https://doi.org/10.3166/rig.2018.00066 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=92230
in Revue internationale de géomatique > vol 28 n° 4 (octobre - décembre 2018) . - pp 439 - 459[article]Réservation
Réserver ce documentExemplaires(1)
Code-barres Cote Support Localisation Section Disponibilité 047-2018041 SL Revue Centre de documentation Revues en salle Disponible A framework for annotating OpenStreetMap objects using geo-tagged tweets / Xin Chen in Geoinformatica, vol 22 n° 3 (July 2018)
[article]
Titre : A framework for annotating OpenStreetMap objects using geo-tagged tweets Type de document : Article/Communication Auteurs : Xin Chen, Auteur ; Hoang Vo, Auteur ; Yu Wang, Auteur ; Fusheng Wang, Auteur Année de publication : 2018 Article en page(s) : pp 589 - 613 Note générale : Bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Bases de données localisées
[Termes IGN] corpus
[Termes IGN] données issues des réseaux sociaux
[Termes IGN] données localisées des bénévoles
[Termes IGN] enrichissement sémantique
[Termes IGN] géobalise
[Termes IGN] intégration de données
[Termes IGN] objet géographique
[Termes IGN] OpenStreetMap
[Termes IGN] TwitterRésumé : (Auteur) Recent years have witnessed an explosion of geospatial data, especially in the form of Volunteered Geographic Information (VGI). As a prominent example, OpenStreetMap (OSM) creates a free editable map of the world from a large number of contributors. On the other hand, social media platforms such as Twitter or Instagram supply dynamic social feeds at population level. As much of such data is geo-tagged, there is a high potential on integrating social media with OSM to enrich OSM with semantic annotations, which will complement existing objective description oriented annotations to provide a broader range of annotations. In this paper, we propose a comprehensive framework on integrating social media data and VGI data to derive knowledge about geographical objects, specifically, top relevant annotations from tweets for objects in OSM. We first integrate geo-tagged tweets with OSM data with scalable spatial queries running on MapReduce. We propose a frequency based method for annotating boundary based geographic objects (a polygon), and a probability based method for annotating point based geographic objects (Latitude and Longitude), with consideration of noise. We evaluate our methods using a large geo-tagged tweets corpus and representative geographic objects from OSM, which demonstrates promising results through ground-truth comparison and case studies. We are able to produce up to 80% correct names for geographical objects and discover implicitly relevant information, such as popular exhibitions of a museum, the nicknames or visitors’ impression to a tourism attraction. Numéro de notice : A2018-369 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE Nature : Article nature-HAL : ArtAvecCL-RevueIntern DOI : 10.1007/s10707-018-0323-8 Date de publication en ligne : 20/06/2018 En ligne : https://doi.org/10.1007/s10707-018-0323-8 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=90760
in Geoinformatica > vol 22 n° 3 (July 2018) . - pp 589 - 613[article]The limits of GIS: Towards a GIS of place / Alberto Giordano in Transactions in GIS, vol 22 n° 3 (June 2018)PermalinkDésambiguïsation des entités spatiales par apprentissage actif / Amal Chihaoui in Revue internationale de géomatique, vol 28 n° 2 (avril - juin 2018)PermalinkDifférencier les représentations spatiales selon leurs statuts : Expérimentation en gestion intégrée des zones côtières / Lucille Ritschard in Revue internationale de géomatique, vol 28 n° 1 (janvier - mars 2018)PermalinkPermalinkProjet PEPS MATRICIEL, lieux des migrants à travers des récits de vie : mots, perceptions, émotions, cartes / Catherine Dominguès (2018)PermalinkÉcriture des toponymes en français : variations entre normes et usages / Catherine Dominguès in Cahiers de lexicologie, n° 110 (2017-1)PermalinkLinking spatial named entities to the web of data for geographical analysis of historical texts / Pierre-Henri Paris in Journal of Map & Geography Libraries, vol 13 n° 1 ([01/05/2017])PermalinkSemantic historical gazetteers and related NLP and corpus linguistics applications / Carmen Brando in Journal of Map & Geography Libraries, vol 13 n° 1 ([01/05/2017])PermalinkReconstruction automatique d'itinéraires à partir de textes descriptifs / Ludovic Moncla in Cartes & Géomatique, n° 227 (mars - mai 2016)PermalinkPerception de l’ambiance sonore d’un lieu selon sa représentation visuelle : une analyse de corpus / Laura Ascone in Corela, vol 14 n° 1 (Février 2016)Permalink