Descripteur
Documents disponibles dans cette catégorie (494)
Ajouter le résultat dans votre panier
Visionner les documents numériques
Affiner la recherche Interroger des sources externes
Etendre la recherche sur niveau(x) vers le bas
Repérage et identification automatiques de noms de lieux avec variations d'écriture dans des corpus / Mathilde Jouvel-Triollet (2019)
Titre : Repérage et identification automatiques de noms de lieux avec variations d'écriture dans des corpus Type de document : Mémoire Auteurs : Mathilde Jouvel-Triollet, Auteur ; Catherine Dominguès , Encadrant ; Philippe Gambette, Encadrant Editeur : Grenoble [France] : Université Grenoble Alpes Année de publication : 2019 Importance : 84 p. Note générale : bibliographie
Mémoire de master 2 mention Sciences du Langage, Parcours Industries de la LangueLangues : Français (fre) Descripteur : [Vedettes matières IGN] Toponymie
[Termes IGN] corpus
[Termes IGN] mesure de similitude
[Termes IGN] reconnaissance de noms
[Termes IGN] toponyme
[Termes IGN] traitement du langage naturel
[Termes IGN] variationMots-clés libres : traitement automatique des langues (TAL) variation d’écriture néographie corpus hétérogènes reconnaissance d’entité nommée mesure de similarité Natural Language Processing (NLP) toponym placename written variation new written form heterogeneous corpus named entity recognition string metric Résumé : (auteur) Les toponymes sont parfois amenés à subir des variations d’écriture et voient leur graphie s’éloigner de celle que nous trouvons habituellement dans les dictionnaires de noms propres. Ces variations d’écriture peuvent dépendre du type de corpus dont les toponymes sont issus, du registre, du temps ou du langage que couvre le corpus. Nous proposons une méthode pour identifier un toponyme, c’est-à-dire faire le lien entre un toponyme avec variations d’écriture et sa forme normée. Le présent mémoire se divise en trois parties. Dans une première partie, nous présenterons le terrain de stage. Dans un second temps, nous décrirons les missions confiées, puis nous exposerons l’approche envisagée ainsi que les outils utilisés pour répondre aux missions. Enfin, nous proposerons des solutions afin de répondre au mieux au besoin d’identification de toponymes avec variations d’écriture. // Toponyms can sometimes be the target of written variations and experience a different written form from what we usually find in proper names dictionaries. These written variations can depend on the type of the corpus the toponyms come from, the register, the time or the language that the corpus covers. We suggest a method to identify a toponym, which means making the link between a toponym with written variations and its normalised form. This Master’s thesis is divided into three parts. In the first part we will present the context of the internship. Then we will describe the given tasks and we will expound the contemplated approaches and the tools that we used. Finally, we will suggest solutions to meet at best the need of toponyms identification with written variations. Note de contenu : Introduction
Partie 1. Présentation du terrain de stage
1. IGN
2. UPEM
Partie 2. Objectifs (cahier des charges)
3. Étude du besoin
4. Méthodologie pour répondre à la demande
4.1. Identification de noms de lieux
4.2. Repérage des noms de lieux
4.3. Approche envisagée
5. Ressources et outils utilisés
5.1. Les corpus
5.2. Les gazetiers
5.3. Les mesures d’évaluation
Partie 3. Réponse au cahier des charges
6. Identifier des toponymes
6.1. Introduction
6.2. Méthode
6.3. Résultats
6.4. Discussion
6.5. Variante du processus d’identification
7. Repérer des toponymes dans un corpus
7.1. Des mots déclencheurs
7.2. Des mots impossibles
8. Repérage et identification simultanés
8.1. Introduction
8.2. Méthode
8.3. Résultats
8.4. Discussion
ConclusionNuméro de notice : 14517 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE/INFORMATIQUE/MATHEMATIQUE Nature : Mémoire masters divers Organisme de stage : LASTIG (IGN) Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=102273 Documents numériques
peut être téléchargé
rapport-M2IdL_Jouvel - pdf auteurAdobe Acrobat PDF Diversity and transparency in (volunteered) geoinformation practices / Tilo Felgenhauer in GI Forum, vol 2018 n° 2 ([01/09/2018])
[article]
Titre : Diversity and transparency in (volunteered) geoinformation practices Type de document : Article/Communication Auteurs : Tilo Felgenhauer, Auteur Année de publication : 2018 Article en page(s) : pp 97 - 102 Note générale : bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Bases de données localisées
[Termes IGN] données localisées des bénévoles
[Termes IGN] interface utilisateur
[Termes IGN] langage cartographique
[Termes IGN] toponymeRésumé : (auteur) Geoinformationis represented in increasing numbers of different forms, with heterogeneous social and cultural implications. This paper highlights the merits as well as the ambivalence of the social (especially) and political effects of the widespread expansion and growing importance of (volunteered) geographic information. This general overview of the basic symbolic forms in which geoinformation appears distinguishes between three areas of spatial semantics: while technological systems address space mainly in numerical terms, the user refers to space by ego-centered deixis, while society and culture provide the established everyday language of toponyms. The main argument, based on this categorization, stresses the importance of diversity and transparency in acting and interacting with geoinformation and geomedia in order to promote empowerment, education and reflection. Numéro de notice : A2018-609 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE Nature : Article DOI : 10.1553/giscience2018_02_s97 En ligne : http://dx.doi.org/10.1553/giscience2018_02_s97 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=92835
in GI Forum > vol 2018 n° 2 [01/09/2018] . - pp 97 - 102[article]Are prominent mountains frequently mentioned in text? Exploring the spatial expressiveness of text frequency / Curdin Derungs in International journal of geographical information science IJGIS, vol 32 n° 5-6 (May - June 2018)
[article]
Titre : Are prominent mountains frequently mentioned in text? Exploring the spatial expressiveness of text frequency Type de document : Article/Communication Auteurs : Curdin Derungs, Auteur ; Tanja Samardžić, Auteur Année de publication : 2018 Article en page(s) : pp 856 - 873 Note générale : Bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Toponymie
[Termes IGN] Alpes centrales
[Termes IGN] échelle géographique
[Termes IGN] géomorphologie
[Termes IGN] recherche d'information géographique
[Termes IGN] Suisse
[Termes IGN] toponyme
[Termes IGN] traitement du langage naturelRésumé : (Auteur) Data-driven GIScience shows a growing interest in making spatial information from large text data. In this paper, we quantify and thus evaluate the relation between text frequency and properties of the outer-text, geographic setting by comparing text frequencies of mountain names to the respective geomorphometric characteristics. We focus on some 2000 unique mountain names that appear some 50,000 times in a large compilation of texts on Swiss alpine history. The results on the full data set suggest only a weak relation: only 5–10% of the variation in the text frequency being explained by the respective geomorphometric characteristics. However, an analysis of multiple scales allows us to identify a Simpson’s Paradox. What appears to be ‘noise’ in the analysis of all mountains in the whole of Switzerland shows significant local signals. Small spatial extents, found all over Switzerland, can show considerably strong correlations between text frequency and spatial prominence, with up to 90% of the total variation explained. We argue that our findings have practical implications for data-driven GIScience. Retrieving meaningful spatial information from text might only be possible if the spatial scale of analysis reflects the spatial scale described in the input text documents. Numéro de notice : A2018-194 Affiliation des auteurs : non IGN Thématique : TOPONYMIE Nature : Article nature-HAL : ArtAvecCL-RevueIntern DOI : 10.1080/13658816.2017.1418362 Date de publication en ligne : 26/12/2017 En ligne : https://doi.org/10.1080/13658816.2017.1418362 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=89859
in International journal of geographical information science IJGIS > vol 32 n° 5-6 (May - June 2018) . - pp 856 - 873[article]Réservation
Réserver ce documentExemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité 079-2018031 RAB Revue Centre de documentation En réserve L003 Disponible Context-aware automated interpretation of elaborate natural language descriptions of location through learning from empirical data / Kristin Stock in International journal of geographical information science IJGIS, vol 32 n° 5-6 (May - June 2018)
[article]
Titre : Context-aware automated interpretation of elaborate natural language descriptions of location through learning from empirical data Type de document : Article/Communication Auteurs : Kristin Stock, Auteur ; Javid Yousaf, Auteur Année de publication : 2018 Article en page(s) : pp 1087 - 1116 Note générale : Bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Toponymie
[Termes IGN] mesure de similitude
[Termes IGN] ontologie
[Termes IGN] prise en compte du contexte
[Termes IGN] raisonnement spatial
[Termes IGN] toponyme
[Termes IGN] traitement du langage naturelRésumé : (Auteur) Natural language descriptions of location can be complex, involving many different elements and often describing location by reference to other objects. Descriptions may be vague, and their meaning often depends upon the context within which the description has been expressed. Many previous approaches use mathematical models, focus on prepositions, and have had limited success and application. We present an approach to the interpretation of geospatial natural language expressions that uses a knowledge base of expressions for which human interpretations (in the form of degree of match to one of 50 geometric configurations) are known. Our approach interprets new expressions by finding the most similar knowledge base expression and adopting its meaning. We determine expression similarity using four different methods: element match; linguistic collocation approaches (Cosine); wordnet semantic network distance and a new approach that incorporates the contextual aspects of the expression including scale, geometry type, axial structure, image-schema and liquid/solid. As well as preposition, relatum and locatum, we consider spatial adjectives, adverbs, verb and sub-parts of the relatum and locatum. The method that incorporates context was the most successful of the four tested, selecting the same geometric configuration as human respondents in 69% of cases. Numéro de notice : A2018-200 Affiliation des auteurs : non IGN Thématique : TOPONYMIE Nature : Article nature-HAL : ArtAvecCL-RevueIntern DOI : 10.1080/13658816.2018.1432861 Date de publication en ligne : 07/02/2018 En ligne : https://doi.org/10.1080/13658816.2018.1432861 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=89869
in International journal of geographical information science IJGIS > vol 32 n° 5-6 (May - June 2018) . - pp 1087 - 1116[article]Réservation
Réserver ce documentExemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité 079-2018031 RAB Revue Centre de documentation En réserve L003 Disponible Crowdsourcing the character of a place : Character‐level convolutional networks for multilingual geographic text classification / Benjamin Adams in Transactions in GIS, vol 22 n° 2 (April 2018)
[article]
Titre : Crowdsourcing the character of a place : Character‐level convolutional networks for multilingual geographic text classification Type de document : Article/Communication Auteurs : Benjamin Adams, Auteur ; Grant McKenzie, Auteur Année de publication : 2018 Article en page(s) : pp 394 - 408 Note générale : Bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Toponymie
[Termes IGN] classification
[Termes IGN] contenu généré par les utilisateurs
[Termes IGN] données localisées des bénévoles
[Termes IGN] exploration de texte
[Termes IGN] géocodage
[Termes IGN] méthode robuste
[Termes IGN] réseau neuronal convolutif
[Termes IGN] toponyme
[Termes IGN] traitement du langage naturelRésumé : (Auteur) This article presents a new character‐level convolutional neural network model that can classify multilingual text written using any character set that can be encoded with UTF‐8, a standard and widely used 8‐bit character encoding. For geographic classification of text, we demonstrate that this approach is competitive with state‐of‐the‐art word‐based text classification methods. The model was tested on four crowdsourced data sets made up of Wikipedia articles, online travel blogs, Geonames toponyms, and Twitter posts. Unlike word‐based methods, which require data cleaning and pre‐processing, the proposed model works for any language without modification and with classification accuracy comparable to existing methods. Using a synthetic data set with introduced character‐level errors, we show it is more robust to noise than word‐level classification algorithms. The results indicate that UTF‐8 character‐level convolutional neural networks are a promising technique for georeferencing noisy text, such as found in colloquial social media posts and texts scanned with optical character recognition. However, word‐based methods currently require less computation time to train, so currently are preferable for classifying well‐formatted and cleaned texts in single languages. Numéro de notice : A2018-214 Affiliation des auteurs : non IGN Thématique : TOPONYMIE Nature : Article nature-HAL : ArtAvecCL-RevueIntern DOI : 10.1111/tgis.12317 Date de publication en ligne : 29/01/2018 En ligne : https://doi.org/10.1111/tgis.12317 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=90004
in Transactions in GIS > vol 22 n° 2 (April 2018) . - pp 394 - 408[article]Désambiguïsation des entités spatiales par apprentissage actif / Amal Chihaoui in Revue internationale de géomatique, vol 28 n° 2 (avril - juin 2018)PermalinkInterpreting the fuzzy semantics of natural-language spatial relation terms with the fuzzy random forest algorithm / Xiaonan Wang in ISPRS International journal of geo-information, vol 7 n° 2 (February 2018)PermalinkAppariement automatique de données hétérogènes: textes, traces GPS et ressources géographiques / Amine Medad (2018)PermalinkPermalinkToponym matching through deep neural networks / Rui Santos in International journal of geographical information science IJGIS, vol 32 n° 1-2 (January - February 2018)PermalinkÉcriture des toponymes en français : variations entre normes et usages / Catherine Dominguès in Cahiers de lexicologie, n° 110 (2017-1)PermalinkPermalinkAnalyse et cartographie des sentiments dans des récits de vie de migrants / Catherine Dominguès (2017)PermalinkEuropean handbook of crowdsourced geographic information, ch. 8. Quality analysis of the Parisian OSM toponyms evolution / Vyron Antoniou (2016)PermalinkEvaluation of NER systems for the recognition of place mentions in French thematic corpora / Carmen Brando (2016)Permalink