Détail de l'auteur
Auteur Philippe Gambette |
Documents disponibles écrits par cet auteur (2)
Ajouter le résultat dans votre panier
Visionner les documents numériques
Affiner la recherche Interroger des sources externes
Extracting event-related information from a corpus regarding soil industrial pollution / Chuanming Dong (2021)
Titre : Extracting event-related information from a corpus regarding soil industrial pollution Type de document : Article/Communication Auteurs : Chuanming Dong , Auteur ; Philippe Gambette, Auteur ; Catherine Dominguès , Auteur Editeur : Setúbal [Portugal] : Science and Technology Publications - Scitepress Année de publication : 2021 Projets : 1-Pas de projet / Conférence : KDIR 2021, 13th International Conference on Knowledge Discovery and Information Retrieval 25/10/2021 27/10/2021 Setubal Portugal OA Proceedings Importance : pp 217 - 224 Note générale : bibliographie
In Proceedings of the 13th International Joint Conference on Knowledge Discovery, Knowledge Engineering and Knowledge Management - KDIR, ISBN 978-989-758-533-3Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Bases de données localisées
[Termes IGN] apprentissage profond
[Termes IGN] corpus
[Termes IGN] découverte de connaissances
[Termes IGN] données étiquetées d'entrainement
[Termes IGN] pollution des sols
[Termes IGN] site pollué
[Termes IGN] traitement du langage naturelRésumé : (auteur) We study the extraction and reorganization of event-related information in texts regarding industrial pollution. The object is to build a memory of polluted sites that gathers the information about industrial events from various databases and corpora. An industrial event is described through several features as the event trigger, the industrial activity, the institution, the pollutant, etc. In order to efficiently collect information from a large corpus, it is necessary to automatize the information extraction process. To this end, we manually annotated a part of a corpus about soil industrial pollution, then we used it to train information extraction models with deep learning methods. The models we trained achieve 0.76 F-score on event feature extraction. We intend to improve the models and then use them on other text resources to enrich the polluted sites memory with extracted information about industrial events. Numéro de notice : C2021-068 Affiliation des auteurs : UGE-LASTIG+Ext (2020- ) Thématique : GEOMATIQUE/INFORMATIQUE Nature : Communication nature-HAL : ComAvecCL&ActesPubliésIntl DOI : 10.5220/0010656700003064 En ligne : https://dx.doi.org/10.5220/0010656700003064 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=99540 Repérage et identification automatiques de noms de lieux avec variations d'écriture dans des corpus / Mathilde Jouvel-Triollet (2019)
Titre : Repérage et identification automatiques de noms de lieux avec variations d'écriture dans des corpus Type de document : Mémoire Auteurs : Mathilde Jouvel-Triollet, Auteur ; Catherine Dominguès , Encadrant ; Philippe Gambette, Encadrant Editeur : Grenoble [France] : Université Grenoble Alpes Année de publication : 2019 Importance : 84 p. Note générale : bibliographie
Mémoire de master 2 mention Sciences du Langage, Parcours Industries de la LangueLangues : Français (fre) Descripteur : [Vedettes matières IGN] Toponymie
[Termes IGN] corpus
[Termes IGN] mesure de similitude
[Termes IGN] reconnaissance de noms
[Termes IGN] toponyme
[Termes IGN] traitement du langage naturel
[Termes IGN] variationMots-clés libres : traitement automatique des langues (TAL) variation d’écriture néographie corpus hétérogènes reconnaissance d’entité nommée mesure de similarité Natural Language Processing (NLP) toponym placename written variation new written form heterogeneous corpus named entity recognition string metric Résumé : (auteur) Les toponymes sont parfois amenés à subir des variations d’écriture et voient leur graphie s’éloigner de celle que nous trouvons habituellement dans les dictionnaires de noms propres. Ces variations d’écriture peuvent dépendre du type de corpus dont les toponymes sont issus, du registre, du temps ou du langage que couvre le corpus. Nous proposons une méthode pour identifier un toponyme, c’est-à-dire faire le lien entre un toponyme avec variations d’écriture et sa forme normée. Le présent mémoire se divise en trois parties. Dans une première partie, nous présenterons le terrain de stage. Dans un second temps, nous décrirons les missions confiées, puis nous exposerons l’approche envisagée ainsi que les outils utilisés pour répondre aux missions. Enfin, nous proposerons des solutions afin de répondre au mieux au besoin d’identification de toponymes avec variations d’écriture. // Toponyms can sometimes be the target of written variations and experience a different written form from what we usually find in proper names dictionaries. These written variations can depend on the type of the corpus the toponyms come from, the register, the time or the language that the corpus covers. We suggest a method to identify a toponym, which means making the link between a toponym with written variations and its normalised form. This Master’s thesis is divided into three parts. In the first part we will present the context of the internship. Then we will describe the given tasks and we will expound the contemplated approaches and the tools that we used. Finally, we will suggest solutions to meet at best the need of toponyms identification with written variations. Note de contenu : Introduction
Partie 1. Présentation du terrain de stage
1. IGN
2. UPEM
Partie 2. Objectifs (cahier des charges)
3. Étude du besoin
4. Méthodologie pour répondre à la demande
4.1. Identification de noms de lieux
4.2. Repérage des noms de lieux
4.3. Approche envisagée
5. Ressources et outils utilisés
5.1. Les corpus
5.2. Les gazetiers
5.3. Les mesures d’évaluation
Partie 3. Réponse au cahier des charges
6. Identifier des toponymes
6.1. Introduction
6.2. Méthode
6.3. Résultats
6.4. Discussion
6.5. Variante du processus d’identification
7. Repérer des toponymes dans un corpus
7.1. Des mots déclencheurs
7.2. Des mots impossibles
8. Repérage et identification simultanés
8.1. Introduction
8.2. Méthode
8.3. Résultats
8.4. Discussion
ConclusionNuméro de notice : 14517 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE/INFORMATIQUE/MATHEMATIQUE Nature : Mémoire masters divers Organisme de stage : LASTIG (IGN) Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=102273 Documents numériques
peut être téléchargé
rapport-M2IdL_Jouvel - pdf auteurAdobe Acrobat PDF