Détail de l'autorité
PARVIS /
Autorités liées :
Nom :
PARVIS
titre complet :
PARoles de VIlleS
URL du projet :
|
Documents disponibles (2)
Ajouter le résultat dans votre panier
Visionner les documents numériques
Affiner la recherche Interroger des sources externes
Analyse contrastive de la perception de la ville entre fictions climatiques et débats publics / Alexandra Li–Combeau-Longuet (2022)
Titre : Analyse contrastive de la perception de la ville entre fictions climatiques et débats publics Type de document : Mémoire Auteurs : Alexandra Li–Combeau-Longuet, Auteur ; Catherine Dominguès , Encadrant ; Sabine Ploux, Encadrant Editeur : Paris : Institut National des Langues et Civilisations Orientales Année de publication : 2022 Projets : PARVIS / Importance : 80 p. Note générale : bibliographie
Master traitement automatique des langues, Parcours Ingénierie MultilingueLangues : Français (fre) Descripteur : [Vedettes matières IGN] Linguistique
[Termes IGN] analyse de données
[Termes IGN] analyse de groupement
[Termes IGN] corpus
[Termes IGN] linguistique informatique
[Termes IGN] villeMots-clés libres : analyse statistique de données textuelles TXM clustering romans de science-fiction Grand Débat National Natural Language Processing (NLP) city statistical analysis of textual data science fiction Résumé : (auteur) Ce travail, s'inscrivant dans le projet PARVIS (PARoles de VIlleS), porte sur l'analyse contrastive de la perception de la ville entre un corpus de débats publics et un corpus de romans de science-fiction (dont des fictions climatiques). Ces corpus ne parlant pas uniquement de la ville, nous utilisons une approche "par lexique" pour définir la ville. Cette approche pose la question de la désambigüisation lexicale, mais aussi de la segmentation en la seule unité comparable entre les deux corpus : la phrase. Nous avons donc commencé par une exploration "gros grain" des corpus afin de formuler des hypothèses sur la perception de la ville, dans laquelle la désambigüisation lexicale et la segmentation en phrase seront abordées. Enfin, une exploration "grain fin" des vecteurs contextuels des mots de la ville a été réalisée dans le but de répondre à ces hypothèses. Note de contenu : Introduction : contexte de travail
Problématiques et objectifs
Partie 1- État de l’art, rappel sur les méthodes utiles
1 Analyse de données textuelles (ADT) ou Textométrie
2 Apprentissage automatique
Partie 2- Exploration du corpus "gros grain" : formulation d’hypothèses sur la perception de la ville
3 Pré-traitements : désambiguïsation
4 Méthode : exploration "gros grains"
5 Résultats de l’exploration "gros grain"
6 Formulation des hypothèses
Partie 3- Exploration "grain fin" du corpus : les contextes d’emploi
7 Méthode : clustering sur les vecteurs contextuels de CamemBERT
8 Analyses des clusters
9 Discussion
Conclusion généraleNuméro de notice : 13867 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE/INFORMATIQUE/MATHEMATIQUE Nature : Mémoire masters divers Organisme de stage : LASTIG (IGN) Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=102272 Documents numériques
peut être téléchargé
rapport_Li-Combeau-Longuet - pdf auteurAdobe Acrobat PDF Caractérisation de la ville du futur dans des corpus de science-fiction et de fiction climatique / Sami Guembour (2022)
Titre : Caractérisation de la ville du futur dans des corpus de science-fiction et de fiction climatique Type de document : Mémoire Auteurs : Sami Guembour, Auteur ; Catherine Dominguès , Encadrant ; Chuanming Dong , Encadrant Editeur : Paris : Université Paris Cité Année de publication : 2022 Projets : PARVIS / Importance : 53 p. Note générale : bibliographie
Rapport de stage Master 2 informatique, parcours Apprentissage Machine pour la Science des DonnéesLangues : Français (fre) Descripteur : [Vedettes matières IGN] Linguistique
[Termes IGN] apprentissage automatique
[Termes IGN] modèle de langue
[Termes IGN] traitement du langage naturelMots-clés libres : plongement lexical CamemBERT science-fiction embedding Résumé : (auteur) La ville future est souvent décrite dans les romans de science-fiction de fiction climatique de façons innovantes et inventives par les écrivains, et avec la variété des imaginations des auteurs et la multiplicité des romans, la caractérisation de la ville de demain devient compliquée. Le traitement automatique des langues (TAL) est un domaine qui permet de traiter le langage humain automatiquement. Dans ce stage, nous avons eu recours aux techniques et méthodes des sciences des données et du TAL et aux modèles de langue fondés sur les transformers pour classifier les romans de la ville et identifier les différents caractères de la ville du futur et les lieux (en tant que zones socialement reconnues et distinguées) publics et privés et les usages associés. Ce travail a permis de contribuer à la caractérisation de la ville future et les résultats seront valorisés par le projet PARVIS, il a également permis de créer des modèles pour le traitement de la polysémie des mots qui désignent la ville, et sur le plan personnel, il m'a permis d'enrichir mes connaissances en TAL et en science des données et de mieux maîtriser les modèles de langues pour la réalisation des différentes tâches. // The future city is often depicted in climate fiction science fiction novels in innovative and inventive ways by writers, and with the variety of authors’ imaginations and the multiplicity of novels, characterizing the city of tomorrow becomes complicated. Natural language processing (NLP) is a field that allows human language to be processed automatically. In this internship we have used the techniques and methods of data science and NLP and language models based on transformers to classify the novels of the city and identify the different characteristics of the city of the future and the different places (as socially recognized and distinguished areas) public and private and associated uses. This work allowed the characterization of the future city and the results were valued by the PARVIS project, it also made it possible to create models for the treatment of the polysemy of the words which designate the city, and on a personal level it allowed to enrich my knowledge in NLP and data science, and to better master the language models for the realization of the different tasks. Note de contenu : Introduction Générale
1 Contexte du stage
1.1 Présentation de l’organisme d’accueil
1.2 Objectif et étapes du stage
2 Etat de l’art
2.1 Introduction
2.2 Généralités sur le traitement Automatique des Langues
2.3 Domaines d’application
2.4 Différentes étapes du TAL
2.5 Les modèles de langues
2.6 Apprentissage automatique
2.7 Apprentissage profond
2.8 Co-clustering
2.9 Analyse factorielle
2.10 Conclusion
3 Travail réalisé
3.1 Introduction
3.2 Construction du corpus de la ville
3.3 Identification des fonctions associées aux lieux de la ville
3.4 Identification et analyse en sentiments des lieux inventés de la ville
3.5 Conclusion
ConclusionNuméro de notice : 14196 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE Nature : Mémoire masters divers Organisme de stage : LASTIG (IGN) Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=102271 Documents numériques
peut être téléchargé
Rapport de stage de Sami GUEMBOUR - pdf auteurAdobe Acrobat PDF