Détail de l'auteur
Auteur Mathilde Jouvel-Triollet |
Documents disponibles écrits par cet auteur (1)
Ajouter le résultat dans votre panier
Visionner les documents numériques
Affiner la recherche Interroger des sources externes
Repérage et identification automatiques de noms de lieux avec variations d'écriture dans des corpus / Mathilde Jouvel-Triollet (2019)
Titre : Repérage et identification automatiques de noms de lieux avec variations d'écriture dans des corpus Type de document : Mémoire Auteurs : Mathilde Jouvel-Triollet, Auteur ; Catherine Dominguès , Encadrant ; Philippe Gambette, Encadrant Editeur : Grenoble [France] : Université Grenoble Alpes Année de publication : 2019 Importance : 84 p. Note générale : bibliographie
Mémoire de master 2 mention Sciences du Langage, Parcours Industries de la LangueLangues : Français (fre) Descripteur : [Vedettes matières IGN] Toponymie
[Termes IGN] corpus
[Termes IGN] mesure de similitude
[Termes IGN] reconnaissance de noms
[Termes IGN] toponyme
[Termes IGN] traitement du langage naturel
[Termes IGN] variationMots-clés libres : traitement automatique des langues (TAL) variation d’écriture néographie corpus hétérogènes reconnaissance d’entité nommée mesure de similarité Natural Language Processing (NLP) toponym placename written variation new written form heterogeneous corpus named entity recognition string metric Résumé : (auteur) Les toponymes sont parfois amenés à subir des variations d’écriture et voient leur graphie s’éloigner de celle que nous trouvons habituellement dans les dictionnaires de noms propres. Ces variations d’écriture peuvent dépendre du type de corpus dont les toponymes sont issus, du registre, du temps ou du langage que couvre le corpus. Nous proposons une méthode pour identifier un toponyme, c’est-à-dire faire le lien entre un toponyme avec variations d’écriture et sa forme normée. Le présent mémoire se divise en trois parties. Dans une première partie, nous présenterons le terrain de stage. Dans un second temps, nous décrirons les missions confiées, puis nous exposerons l’approche envisagée ainsi que les outils utilisés pour répondre aux missions. Enfin, nous proposerons des solutions afin de répondre au mieux au besoin d’identification de toponymes avec variations d’écriture. // Toponyms can sometimes be the target of written variations and experience a different written form from what we usually find in proper names dictionaries. These written variations can depend on the type of the corpus the toponyms come from, the register, the time or the language that the corpus covers. We suggest a method to identify a toponym, which means making the link between a toponym with written variations and its normalised form. This Master’s thesis is divided into three parts. In the first part we will present the context of the internship. Then we will describe the given tasks and we will expound the contemplated approaches and the tools that we used. Finally, we will suggest solutions to meet at best the need of toponyms identification with written variations. Note de contenu : Introduction
Partie 1. Présentation du terrain de stage
1. IGN
2. UPEM
Partie 2. Objectifs (cahier des charges)
3. Étude du besoin
4. Méthodologie pour répondre à la demande
4.1. Identification de noms de lieux
4.2. Repérage des noms de lieux
4.3. Approche envisagée
5. Ressources et outils utilisés
5.1. Les corpus
5.2. Les gazetiers
5.3. Les mesures d’évaluation
Partie 3. Réponse au cahier des charges
6. Identifier des toponymes
6.1. Introduction
6.2. Méthode
6.3. Résultats
6.4. Discussion
6.5. Variante du processus d’identification
7. Repérer des toponymes dans un corpus
7.1. Des mots déclencheurs
7.2. Des mots impossibles
8. Repérage et identification simultanés
8.1. Introduction
8.2. Méthode
8.3. Résultats
8.4. Discussion
ConclusionNuméro de notice : 14517 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE/INFORMATIQUE/MATHEMATIQUE Nature : Mémoire masters divers Organisme de stage : LASTIG (IGN) Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=102273 Documents numériques
peut être téléchargé
rapport-M2IdL_Jouvel - pdf auteurAdobe Acrobat PDF