Descripteur
Documents disponibles dans cette catégorie (112)
Ajouter le résultat dans votre panier
Visionner les documents numériques
Affiner la recherche Interroger des sources externes
Etendre la recherche sur niveau(x) vers le bas
Analyse contrastive de la perception de la ville entre fictions climatiques et débats publics / Alexandra Li–Combeau-Longuet (2022)
Titre : Analyse contrastive de la perception de la ville entre fictions climatiques et débats publics Type de document : Mémoire Auteurs : Alexandra Li–Combeau-Longuet, Auteur ; Catherine Dominguès , Encadrant ; Sabine Ploux, Encadrant Editeur : Paris : Institut National des Langues et Civilisations Orientales Année de publication : 2022 Projets : PARVIS / Importance : 80 p. Note générale : bibliographie
Master traitement automatique des langues, Parcours Ingénierie MultilingueLangues : Français (fre) Descripteur : [Vedettes matières IGN] Linguistique
[Termes IGN] analyse de données
[Termes IGN] analyse de groupement
[Termes IGN] corpus
[Termes IGN] linguistique informatique
[Termes IGN] villeMots-clés libres : analyse statistique de données textuelles TXM clustering romans de science-fiction Grand Débat National Natural Language Processing (NLP) city statistical analysis of textual data science fiction Résumé : (auteur) Ce travail, s'inscrivant dans le projet PARVIS (PARoles de VIlleS), porte sur l'analyse contrastive de la perception de la ville entre un corpus de débats publics et un corpus de romans de science-fiction (dont des fictions climatiques). Ces corpus ne parlant pas uniquement de la ville, nous utilisons une approche "par lexique" pour définir la ville. Cette approche pose la question de la désambigüisation lexicale, mais aussi de la segmentation en la seule unité comparable entre les deux corpus : la phrase. Nous avons donc commencé par une exploration "gros grain" des corpus afin de formuler des hypothèses sur la perception de la ville, dans laquelle la désambigüisation lexicale et la segmentation en phrase seront abordées. Enfin, une exploration "grain fin" des vecteurs contextuels des mots de la ville a été réalisée dans le but de répondre à ces hypothèses. Note de contenu : Introduction : contexte de travail
Problématiques et objectifs
Partie 1- État de l’art, rappel sur les méthodes utiles
1 Analyse de données textuelles (ADT) ou Textométrie
2 Apprentissage automatique
Partie 2- Exploration du corpus "gros grain" : formulation d’hypothèses sur la perception de la ville
3 Pré-traitements : désambiguïsation
4 Méthode : exploration "gros grains"
5 Résultats de l’exploration "gros grain"
6 Formulation des hypothèses
Partie 3- Exploration "grain fin" du corpus : les contextes d’emploi
7 Méthode : clustering sur les vecteurs contextuels de CamemBERT
8 Analyses des clusters
9 Discussion
Conclusion généraleNuméro de notice : 13867 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE/INFORMATIQUE/MATHEMATIQUE Nature : Mémoire masters divers Organisme de stage : LASTIG (IGN) Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=102272 Documents numériques
peut être téléchargé
rapport_Li-Combeau-Longuet - pdf auteurAdobe Acrobat PDF Caractérisation de la ville du futur dans des corpus de science-fiction et de fiction climatique / Sami Guembour (2022)
Titre : Caractérisation de la ville du futur dans des corpus de science-fiction et de fiction climatique Type de document : Mémoire Auteurs : Sami Guembour, Auteur ; Catherine Dominguès , Encadrant ; Chuanming Dong , Encadrant Editeur : Paris : Université Paris Cité Année de publication : 2022 Projets : PARVIS / Importance : 53 p. Note générale : bibliographie
Rapport de stage Master 2 informatique, parcours Apprentissage Machine pour la Science des DonnéesLangues : Français (fre) Descripteur : [Vedettes matières IGN] Linguistique
[Termes IGN] apprentissage automatique
[Termes IGN] modèle de langue
[Termes IGN] traitement du langage naturelMots-clés libres : plongement lexical CamemBERT science-fiction embedding Résumé : (auteur) La ville future est souvent décrite dans les romans de science-fiction de fiction climatique de façons innovantes et inventives par les écrivains, et avec la variété des imaginations des auteurs et la multiplicité des romans, la caractérisation de la ville de demain devient compliquée. Le traitement automatique des langues (TAL) est un domaine qui permet de traiter le langage humain automatiquement. Dans ce stage, nous avons eu recours aux techniques et méthodes des sciences des données et du TAL et aux modèles de langue fondés sur les transformers pour classifier les romans de la ville et identifier les différents caractères de la ville du futur et les lieux (en tant que zones socialement reconnues et distinguées) publics et privés et les usages associés. Ce travail a permis de contribuer à la caractérisation de la ville future et les résultats seront valorisés par le projet PARVIS, il a également permis de créer des modèles pour le traitement de la polysémie des mots qui désignent la ville, et sur le plan personnel, il m'a permis d'enrichir mes connaissances en TAL et en science des données et de mieux maîtriser les modèles de langues pour la réalisation des différentes tâches. // The future city is often depicted in climate fiction science fiction novels in innovative and inventive ways by writers, and with the variety of authors’ imaginations and the multiplicity of novels, characterizing the city of tomorrow becomes complicated. Natural language processing (NLP) is a field that allows human language to be processed automatically. In this internship we have used the techniques and methods of data science and NLP and language models based on transformers to classify the novels of the city and identify the different characteristics of the city of the future and the different places (as socially recognized and distinguished areas) public and private and associated uses. This work allowed the characterization of the future city and the results were valued by the PARVIS project, it also made it possible to create models for the treatment of the polysemy of the words which designate the city, and on a personal level it allowed to enrich my knowledge in NLP and data science, and to better master the language models for the realization of the different tasks. Note de contenu : Introduction Générale
1 Contexte du stage
1.1 Présentation de l’organisme d’accueil
1.2 Objectif et étapes du stage
2 Etat de l’art
2.1 Introduction
2.2 Généralités sur le traitement Automatique des Langues
2.3 Domaines d’application
2.4 Différentes étapes du TAL
2.5 Les modèles de langues
2.6 Apprentissage automatique
2.7 Apprentissage profond
2.8 Co-clustering
2.9 Analyse factorielle
2.10 Conclusion
3 Travail réalisé
3.1 Introduction
3.2 Construction du corpus de la ville
3.3 Identification des fonctions associées aux lieux de la ville
3.4 Identification et analyse en sentiments des lieux inventés de la ville
3.5 Conclusion
ConclusionNuméro de notice : 14196 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE Nature : Mémoire masters divers Organisme de stage : LASTIG (IGN) Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=102271 Documents numériques
peut être téléchargé
Rapport de stage de Sami GUEMBOUR - pdf auteurAdobe Acrobat PDF Mapping experience: Age and indigeneity as mediating factors in users’ experiences with the Algonquian linguistic atlas / Adam Stone in Cartographica, vol 53 n° 4 (Winter 2018)
[article]
Titre : Mapping experience: Age and indigeneity as mediating factors in users’ experiences with the Algonquian linguistic atlas Type de document : Article/Communication Auteurs : Adam Stone, Auteur Année de publication : 2018 Article en page(s) : pp 229 - 240 Note générale : bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Linguistique
[Termes IGN] atlas numérique
[Termes IGN] atlas régional
[Termes IGN] cadre conceptuel
[Termes IGN] Canada
[Termes IGN] cartographie par internet
[Termes IGN] enquête sociologique
[Termes IGN] langue amérindienne
[Termes IGN] langue locale
[Termes IGN] participation du public
[Termes IGN] utilisateur civilRésumé : (auteur) Pour comprendre avec quelle efficacité les cartes numériques des langues autochtones rejoignent divers publics, l’auteur mène, auprès d’utilisateurs, une étude faisant appel à une méthodologie mixte portant sur les expériences de navigation en ligne de 23 usagers autochtones et non autochtones, âgés de moins de 30 ans et de plus de 30 ans, recrutés dans une université canadienne et appelés à s’acquitter d’une série de tâches dans le cadre de la consultation d’un atlas de langues autochtones canadiennes. Un élément d’évaluation permet de jauger l’efficacité avec laquelle l’étude elle-même permet de mesurer ces expériences. Les participants autochtones ont jugé l’atlas plus pertinent et utile et se sont concentrés davantage sur son contenu linguistique, alors que les participants non autochtones se sont plus particulièrement intéressés au modèle et à la structure du cadre conceptuel de l’atlas. Les atlas linguistiques numériques permettent de mieux cerner les populations autochtones canadiennes en insistant sur les représentations multimodales du contenu linguistique et en proposant des liens facilement accessibles vers des ressources supplémentaires provenant des communautés représentées. Bien que l’étude circonscrive bel et bien les multiples dimensions des expériences des utilisateurs, la faible participation autochtone réduit l’efficacité des analyses statistiques comparatives. Il serait opportun, dans des recherches ultérieures, d’améliorer la représentation autochtone en mettant en œuvre des méthodes de recrutement persuasives, adaptées aux populations autochtones. Numéro de notice : A2018-607 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE Nature : Article nature-HAL : ArtAvecCL-RevueIntern DOI : 10.3138/cart.53.4.2017-0024 Date de publication en ligne : 20/02/2019 En ligne : https://doi.org/10.3138/cart.53.4.2017-0024 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=92651
in Cartographica > vol 53 n° 4 (Winter 2018) . - pp 229 - 240[article]Exemplaires(1)
Code-barres Cote Support Localisation Section Disponibilité 031-2018041 SL Revue Centre de documentation Revues en salle Disponible Services web pour l’annotation sémantique d’information spatiale à partir de corpus textuels / Ludovic Moncla in Revue internationale de géomatique, vol 28 n° 4 (octobre - décembre 2018)
[article]
Titre : Services web pour l’annotation sémantique d’information spatiale à partir de corpus textuels Type de document : Article/Communication Auteurs : Ludovic Moncla , Auteur ; Mauro Gaio, Auteur Année de publication : 2018 Article en page(s) : pp 439 - 459 Note générale : bibliographie Langues : Français (fre) Descripteur : [Vedettes matières IGN] Linguistique
[Termes IGN] analyse syntaxique
[Termes IGN] corpus
[Termes IGN] données localisées
[Termes IGN] entité géographique
[Termes IGN] reconnaissance de noms
[Termes IGN] segmentation sémantique
[Termes IGN] service web
[Termes IGN] traitement du langage naturel
[Termes IGN] web des donnéesRésumé : (auteur) L’annotation sémantique d’information spatiale a pour objectif de repérer des mots ou des syntagmes décrivant des références géographiques (noms de lieux) ainsi que diverses expressions spatiales associées. L’une des plus importantes difficultés pour concevoir un système automatique d’annotation d’un tel type d’information est due aux ambiguïtés liées aux entités spatiales. Une approche modulaire basée sur des services Web a été choisie. La méthodologie proposée repose sur la combinaison d’une étape de prétraitement (analyse morphosyntaxique), d’une cascade de transducteurs, et d’une étape de classification utilisant des ressources du Web des données. Un avantage de cette approche est la possibilité d’obtenir des traitements partiels ou encore de mettre en concurrence certains modules réalisant la même tâche. Numéro de notice : A2018-565 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE Nature : Article nature-HAL : ArtAvecCL-RevueIntern DOI : 10.3166/rig.2018.00066 Date de publication en ligne : 18/03/2019 En ligne : https://doi.org/10.3166/rig.2018.00066 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=92230
in Revue internationale de géomatique > vol 28 n° 4 (octobre - décembre 2018) . - pp 439 - 459[article]Exemplaires(1)
Code-barres Cote Support Localisation Section Disponibilité 047-2018041 SL Revue Centre de documentation Revues en salle Disponible Spatialities, social Media and sentiment analysis: Exploring the potential of the detection tool SentiStrength / Christina Reithmeier in GI Forum, vol 2018 n° 2 ([01/09/2018])
[article]
Titre : Spatialities, social Media and sentiment analysis: Exploring the potential of the detection tool SentiStrength Type de document : Article/Communication Auteurs : Christina Reithmeier, Auteur ; Karoline Buschbaum, Auteur ; Detlef Kanwischer, Auteur Année de publication : 2018 Article en page(s) : pp 85 - 96 Note générale : bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Linguistique
[Termes IGN] données issues des réseaux sociaux
[Termes IGN] espace urbain
[Termes IGN] sentiment
[Termes IGN] TwitterRésumé : (auteur) Social media such as Twitter or Facebook not only create new spaces of interaction and communication, they also influence the way we perceive things and lead to changes in our self-perception and our own worldview. Online data occur in various forms and can contain opinions or expressions of feeling. In this article, we explore the potential of SentiStrength, a tool for sentiment analysis in geographic research. We analyse posts on Twitter containing hashtags for possible constructions of spaces in Ostend, a neighbourhood in Frankfurt, Germany. We collected tweets via the Twitter API and used the SentiStrength online application to conduct our sentiment analysis. In order to evaluate the results, we also classified our data manually for comparison. Through its lexicon-based classification, the tool was able to identify positive and negative associations of Ostend. However, we were also able to demonstrate the limitations of the tool compared to manual analysis. Although it provides a quick and comprehensive overview of sentiments, SentiStrength reaches its limits when other media such as images are involved. Overall, the tool offers a good low-threshold approach for scientists to work with digital data. Numéro de notice : A2018-608 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE Nature : Article DOI : 10.1553/giscience2018_02_s85 En ligne : http://dx.doi.org/10.1553/giscience2018_02_s85 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=92834
in GI Forum > vol 2018 n° 2 [01/09/2018] . - pp 85 - 96[article]TAGGS : grouping tweets to improve global geoparsing for disaster response / Jens A. de Bruijn in Journal of Geovisualization and Spatial Analysis, vol 2 n° 1 (June 2018)PermalinkActes de la conférence TALN 2018, Volume 1. Articles longs, articles courts de TALN / Pascale Sébillot (2018)PermalinkActes de la conférence TALN 2018, Volume 2. Démonstrations, articles des Rencontres Jeunes Chercheurs, ateliers DeFT / Pascale Sébillot (2018)PermalinkPermalinkInfluence de l’émotion dans la description d’un lieu / Aglaée Philippi (2016)PermalinkMots voyageurs / Frank Tétart in Carto, le monde en cartes, n° 21 (janvier - février 2014)PermalinkHistoire sociale des langues de France / Georg Kremnitz (2013)PermalinkExtractions de règles concernant les bâtiments d'un corpus de plans locaux d'urbanisme / Leidiana Da Silva Martins (2012)PermalinkNos géographies de France / Daniel Picouly (2012)PermalinkDona Isabel ou la véridique et très mystérieuse histoire d'une créole perdue dans la forêt des Amazones / C. Mouchard (2011)Permalink