Détail de l'auteur
Documents disponibles écrits par cet auteur (5)
Ajouter le résultat dans votre panier
Visionner les documents numériques
Affiner la recherche Interroger des sources externes
Caractérisation de la ville du futur dans des corpus de science-fiction et de fiction climatique / Sami Guembour (2022)
Titre : Caractérisation de la ville du futur dans des corpus de science-fiction et de fiction climatique Type de document : Mémoire Auteurs : Sami Guembour, Auteur ; Catherine Dominguès , Encadrant ; Chuanming Dong , Encadrant Editeur : Paris : Université Paris Cité Année de publication : 2022 Projets : PARVIS / Importance : 53 p. Note générale : bibliographie
Rapport de stage Master 2 informatique, parcours Apprentissage Machine pour la Science des DonnéesLangues : Français (fre) Descripteur : [Vedettes matières IGN] Linguistique
[Termes IGN] apprentissage automatique
[Termes IGN] modèle de langue
[Termes IGN] traitement du langage naturelMots-clés libres : plongement lexical CamemBERT science-fiction embedding Résumé : (auteur) La ville future est souvent décrite dans les romans de science-fiction de fiction climatique de façons innovantes et inventives par les écrivains, et avec la variété des imaginations des auteurs et la multiplicité des romans, la caractérisation de la ville de demain devient compliquée. Le traitement automatique des langues (TAL) est un domaine qui permet de traiter le langage humain automatiquement. Dans ce stage, nous avons eu recours aux techniques et méthodes des sciences des données et du TAL et aux modèles de langue fondés sur les transformers pour classifier les romans de la ville et identifier les différents caractères de la ville du futur et les lieux (en tant que zones socialement reconnues et distinguées) publics et privés et les usages associés. Ce travail a permis de contribuer à la caractérisation de la ville future et les résultats seront valorisés par le projet PARVIS, il a également permis de créer des modèles pour le traitement de la polysémie des mots qui désignent la ville, et sur le plan personnel, il m'a permis d'enrichir mes connaissances en TAL et en science des données et de mieux maîtriser les modèles de langues pour la réalisation des différentes tâches. // The future city is often depicted in climate fiction science fiction novels in innovative and inventive ways by writers, and with the variety of authors’ imaginations and the multiplicity of novels, characterizing the city of tomorrow becomes complicated. Natural language processing (NLP) is a field that allows human language to be processed automatically. In this internship we have used the techniques and methods of data science and NLP and language models based on transformers to classify the novels of the city and identify the different characteristics of the city of the future and the different places (as socially recognized and distinguished areas) public and private and associated uses. This work allowed the characterization of the future city and the results were valued by the PARVIS project, it also made it possible to create models for the treatment of the polysemy of the words which designate the city, and on a personal level it allowed to enrich my knowledge in NLP and data science, and to better master the language models for the realization of the different tasks. Note de contenu : Introduction Générale
1 Contexte du stage
1.1 Présentation de l’organisme d’accueil
1.2 Objectif et étapes du stage
2 Etat de l’art
2.1 Introduction
2.2 Généralités sur le traitement Automatique des Langues
2.3 Domaines d’application
2.4 Différentes étapes du TAL
2.5 Les modèles de langues
2.6 Apprentissage automatique
2.7 Apprentissage profond
2.8 Co-clustering
2.9 Analyse factorielle
2.10 Conclusion
3 Travail réalisé
3.1 Introduction
3.2 Construction du corpus de la ville
3.3 Identification des fonctions associées aux lieux de la ville
3.4 Identification et analyse en sentiments des lieux inventés de la ville
3.5 Conclusion
ConclusionNuméro de notice : 14196 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE Nature : Mémoire masters divers Organisme de stage : LASTIG (IGN) Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=102271 Documents numériques
peut être téléchargé
Rapport de stage de Sami GUEMBOUR - pdf auteurAdobe Acrobat PDF Construction d’une mémoire des sites pollués : Fusion de bases de données et extraction d’événements / Chuanming Dong (2021)
Titre : Construction d’une mémoire des sites pollués : Fusion de bases de données et extraction d’événements Type de document : Article/Communication Auteurs : Chuanming Dong , Auteur Editeur : Saint-Mandé : Institut national de l'information géographique et forestière - IGN (2012-) Année de publication : 2021 Projets : Archival City / Conférence : Séminaire 2021 Archives et Histoire des pollutions urbaines 27/05/2021 en ligne France Langues : Français (fre) Numéro de notice : C2021-084 Affiliation des auteurs : UGE-LASTIG (2020- ) Nature : Communication nature-HAL : ComSansActesPubliés-Unpublished DOI : sans En ligne : https://hal.science/hal-03258315v1 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=100364 Extracting event-related information from a corpus regarding soil industrial pollution / Chuanming Dong (2021)
Titre : Extracting event-related information from a corpus regarding soil industrial pollution Type de document : Article/Communication Auteurs : Chuanming Dong , Auteur ; Philippe Gambette, Auteur ; Catherine Dominguès , Auteur Editeur : Setúbal [Portugal] : Science and Technology Publications - Scitepress Année de publication : 2021 Projets : 1-Pas de projet / Conférence : KDIR 2021, 13th International Conference on Knowledge Discovery and Information Retrieval 25/10/2021 27/10/2021 Setubal Portugal OA Proceedings Importance : pp 217 - 224 Note générale : bibliographie
In Proceedings of the 13th International Joint Conference on Knowledge Discovery, Knowledge Engineering and Knowledge Management - KDIR, ISBN 978-989-758-533-3Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Bases de données localisées
[Termes IGN] apprentissage profond
[Termes IGN] corpus
[Termes IGN] découverte de connaissances
[Termes IGN] données étiquetées d'entrainement
[Termes IGN] pollution des sols
[Termes IGN] site pollué
[Termes IGN] traitement du langage naturelRésumé : (auteur) We study the extraction and reorganization of event-related information in texts regarding industrial pollution. The object is to build a memory of polluted sites that gathers the information about industrial events from various databases and corpora. An industrial event is described through several features as the event trigger, the industrial activity, the institution, the pollutant, etc. In order to efficiently collect information from a large corpus, it is necessary to automatize the information extraction process. To this end, we manually annotated a part of a corpus about soil industrial pollution, then we used it to train information extraction models with deep learning methods. The models we trained achieve 0.76 F-score on event feature extraction. We intend to improve the models and then use them on other text resources to enrich the polluted sites memory with extracted information about industrial events. Numéro de notice : C2021-068 Affiliation des auteurs : UGE-LASTIG+Ext (2020- ) Thématique : GEOMATIQUE/INFORMATIQUE Nature : Communication nature-HAL : ComAvecCL&ActesPubliésIntl DOI : 10.5220/0010656700003064 En ligne : https://dx.doi.org/10.5220/0010656700003064 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=99540 Alignement de bases de données pour l'extraction d'informations concernant les sols pollués / Chuanming Dong (2020)
Titre : Alignement de bases de données pour l'extraction d'informations concernant les sols pollués Type de document : Article/Communication Auteurs : Chuanming Dong , Auteur Editeur : Saint-Mandé : Institut national de l'information géographique et forestière - IGN (2012-) Année de publication : 2020 Conférence : Journée d'étude 2020 DOING@MADICS 08/07/2020 27/10/2021 Paris France OA Proceedings Langues : Anglais (eng) Numéro de notice : C2020-032 Affiliation des auteurs : UGE-LASTIG (2020- ) Nature : Communication nature-HAL : ComSansActesPubliés-Unpublished DOI : sans En ligne : https://hal.science/hal-03271421/document Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=98086 Fusion entre bases de données hétérogènes concernant la pollution des sols [diaporama] / Chuanming Dong (2020)
Titre : Fusion entre bases de données hétérogènes concernant la pollution des sols [diaporama] Type de document : Article/Communication Auteurs : Chuanming Dong , Auteur Editeur : GdR MaDICS Année de publication : 2020 Conférence : Atelier 2020 AGEE du second symposium GdR CNRS MaDICS 06/07/2020 06/07/2020 en ligne France programme Langues : Français (fre) Descripteur : [Vedettes matières IGN] Bases de données localisées
[Termes IGN] acteur
[Termes IGN] appariement de données localisées
[Termes IGN] base de données localisées
[Termes IGN] base de données thématiques
[Termes IGN] données spatiotemporelles
[Termes IGN] intégration de données
[Termes IGN] polluant
[Termes IGN] pollution des solsNuméro de notice : C2020-026 Affiliation des auteurs : UGE-LASTIG (2020- ) Autre URL associée : vers HAL Thématique : GEOMATIQUE Nature : Communication nature-HAL : ComSansActesPubliés-Unpublished DOI : sans En ligne : https://hal.archives-ouvertes.fr/hal-03198895/file/AGEE - Fusion entre bases de [...] Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=97635