Résultat de la recherche
2 recherche sur le mot-clé libre 'Natural Language Processing (NLP)'




Repérage et identification automatiques de noms de lieux avec variations d'écriture dans des corpus / Mathilde Jouvel-Triollet (2019)
![]()
Titre : Repérage et identification automatiques de noms de lieux avec variations d'écriture dans des corpus Type de document : Mémoire Auteurs : Mathilde Jouvel-Triollet, Auteur ; Catherine Dominguès , Encadrant ; Philippe Gambette, Encadrant
Editeur : Grenoble [France] : Université Grenoble Alpes Année de publication : 2019 Importance : 84 p. Note générale : bibliographie
Mémoire de master 2 mention Sciences du Langage, Parcours Industries de la LangueLangues : Français (fre) Descripteur : [Vedettes matières IGN] Toponymie
[Termes IGN] corpus
[Termes IGN] mesure de similitude
[Termes IGN] reconnaissance de noms
[Termes IGN] toponyme
[Termes IGN] traitement du langage naturel
[Termes IGN] variationMots-clés libres : traitement automatique des langues (TAL) variation d’écriture néographie corpus hétérogènes reconnaissance d’entité nommée mesure de similarité Natural Language Processing (NLP) toponym placename written variation new written form heterogeneous corpus named entity recognition string metric Résumé : (auteur) Les toponymes sont parfois amenés à subir des variations d’écriture et voient leur graphie s’éloigner de celle que nous trouvons habituellement dans les dictionnaires de noms propres. Ces variations d’écriture peuvent dépendre du type de corpus dont les toponymes sont issus, du registre, du temps ou du langage que couvre le corpus. Nous proposons une méthode pour identifier un toponyme, c’est-à-dire faire le lien entre un toponyme avec variations d’écriture et sa forme normée. Le présent mémoire se divise en trois parties. Dans une première partie, nous présenterons le terrain de stage. Dans un second temps, nous décrirons les missions confiées, puis nous exposerons l’approche envisagée ainsi que les outils utilisés pour répondre aux missions. Enfin, nous proposerons des solutions afin de répondre au mieux au besoin d’identification de toponymes avec variations d’écriture. // Toponyms can sometimes be the target of written variations and experience a different written form from what we usually find in proper names dictionaries. These written variations can depend on the type of the corpus the toponyms come from, the register, the time or the language that the corpus covers. We suggest a method to identify a toponym, which means making the link between a toponym with written variations and its normalised form. This Master’s thesis is divided into three parts. In the first part we will present the context of the internship. Then we will describe the given tasks and we will expound the contemplated approaches and the tools that we used. Finally, we will suggest solutions to meet at best the need of toponyms identification with written variations. Note de contenu : Introduction
Partie 1. Présentation du terrain de stage
1. IGN
2. UPEM
Partie 2. Objectifs (cahier des charges)
3. Étude du besoin
4. Méthodologie pour répondre à la demande
4.1. Identification de noms de lieux
4.2. Repérage des noms de lieux
4.3. Approche envisagée
5. Ressources et outils utilisés
5.1. Les corpus
5.2. Les gazetiers
5.3. Les mesures d’évaluation
Partie 3. Réponse au cahier des charges
6. Identifier des toponymes
6.1. Introduction
6.2. Méthode
6.3. Résultats
6.4. Discussion
6.5. Variante du processus d’identification
7. Repérer des toponymes dans un corpus
7.1. Des mots déclencheurs
7.2. Des mots impossibles
8. Repérage et identification simultanés
8.1. Introduction
8.2. Méthode
8.3. Résultats
8.4. Discussion
ConclusionNuméro de notice : 14517 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE/INFORMATIQUE/MATHEMATIQUE Nature : Mémoire masters divers Organisme de stage : LASTIG (IGN) Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=102273 Documents numériques
peut être téléchargé
rapport-M2IdL_Jouvel - pdf auteurAdobe Acrobat PDFAnalyse contrastive de la perception de la ville entre fictions climatiques et débats publics / Alexandra Li–Combeau-Longuet (2022)
![]()
Titre : Analyse contrastive de la perception de la ville entre fictions climatiques et débats publics Type de document : Mémoire Auteurs : Alexandra Li–Combeau-Longuet, Auteur ; Catherine Dominguès , Encadrant ; Sabine Ploux, Encadrant
Editeur : Paris : Institut National des Langues et Civilisations Orientales Année de publication : 2022 Projets : PARVIS / Importance : 80 p. Note générale : bibliographie
Master traitement automatique des langues, Parcours Ingénierie MultilingueLangues : Français (fre) Descripteur : [Vedettes matières IGN] Linguistique
[Termes IGN] analyse de données
[Termes IGN] analyse de groupement
[Termes IGN] corpus
[Termes IGN] linguistique informatique
[Termes IGN] villeMots-clés libres : analyse statistique de données textuelles TXM clustering romans de science-fiction Grand Débat National Natural Language Processing (NLP) city statistical analysis of textual data science fiction Résumé : (auteur) Ce travail, s'inscrivant dans le projet PARVIS (PARoles de VIlleS), porte sur l'analyse contrastive de la perception de la ville entre un corpus de débats publics et un corpus de romans de science-fiction (dont des fictions climatiques). Ces corpus ne parlant pas uniquement de la ville, nous utilisons une approche "par lexique" pour définir la ville. Cette approche pose la question de la désambigüisation lexicale, mais aussi de la segmentation en la seule unité comparable entre les deux corpus : la phrase. Nous avons donc commencé par une exploration "gros grain" des corpus afin de formuler des hypothèses sur la perception de la ville, dans laquelle la désambigüisation lexicale et la segmentation en phrase seront abordées. Enfin, une exploration "grain fin" des vecteurs contextuels des mots de la ville a été réalisée dans le but de répondre à ces hypothèses. Note de contenu : Introduction : contexte de travail
Problématiques et objectifs
Partie 1- État de l’art, rappel sur les méthodes utiles
1 Analyse de données textuelles (ADT) ou Textométrie
2 Apprentissage automatique
Partie 2- Exploration du corpus "gros grain" : formulation d’hypothèses sur la perception de la ville
3 Pré-traitements : désambiguïsation
4 Méthode : exploration "gros grains"
5 Résultats de l’exploration "gros grain"
6 Formulation des hypothèses
Partie 3- Exploration "grain fin" du corpus : les contextes d’emploi
7 Méthode : clustering sur les vecteurs contextuels de CamemBERT
8 Analyses des clusters
9 Discussion
Conclusion généraleNuméro de notice : 13867 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE/INFORMATIQUE/MATHEMATIQUE Nature : Mémoire masters divers Organisme de stage : LASTIG (IGN) Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=102272 Documents numériques
peut être téléchargé
rapport_Li-Combeau-Longuet - pdf auteurAdobe Acrobat PDF