Descripteur
Termes IGN > sciences humaines et sociales > linguistique > corpus
corpusSynonyme(s)données textuellesVoir aussi |
Documents disponibles dans cette catégorie (48)
Ajouter le résultat dans votre panier
Visionner les documents numériques
Affiner la recherche Interroger des sources externes
Etendre la recherche sur niveau(x) vers le bas
Exploring scientific literature by textual and image content using DRIFT / Ximena Pocco in Computers and graphics, vol 103 (April 2022)
[article]
Titre : Exploring scientific literature by textual and image content using DRIFT Type de document : Article/Communication Auteurs : Ximena Pocco, Auteur ; Tiago da Silva, Auteur ; Jorge Poco, Auteur ; et al., Auteur Année de publication : 2022 Article en page(s) : pp 140 - 152 Note générale : bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Traitement d'image
[Termes IGN] analyse visuelle
[Termes IGN] bibliothèque numérique
[Termes IGN] classification par réseau neuronal convolutif
[Termes IGN] corpus
[Termes IGN] exploration de données
[Termes IGN] extraction de traits caractéristiques
[Termes IGN] recherche d'image basée sur le contenu
[Termes IGN] recherche scientifique
[Termes IGN] similitude sémantiqueRésumé : (auteur) Digital libraries represent the most valuable resource for storing, querying, and retrieving scientific literature. Traditionally, the reader/analyst aims to compose a set of articles based on keywords, according to his/her preferences, and manually inspect the resulting list of documents. Except for the articles which share citations or common keywords, the results retrieved will be limited to those which fulfill a syntactic match. Besides, if instead of having an article as a reference, the user has an image, the process of finding and exploring articles with similar content becomes infeasible. This paper proposes a visual analytic methodology for exploring and analyzing scientific document collections that consider both textual and image content. The proposed technique relies on combining multiple Content-Based Image Retrieval (CBIR) components and multidimensional projection to map the documents to a visual space based on their similarity, thus enabling an interactive exploration. Moreover, we extend its analytical capabilities with visual resources to display complementary information on selected documents that uncover hidden patterns and semantic relations. We evidence the effectiveness of our methodology through three case studies and a user evaluation, which attest to its usefulness during the process of scientific collections exploration. Numéro de notice : A2022-289 Affiliation des auteurs : non IGN Thématique : IMAGERIE Nature : Article DOI : 10.1016/j.cag.2022.02.005 Date de publication en ligne : 11/02/2022 En ligne : https://doi.org/10.1016/j.cag.2022.02.005 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=100332
in Computers and graphics > vol 103 (April 2022) . - pp 140 - 152[article]Les noms de lieux mentionnés dans des récits de vie de républicains espagnols : distribution géographique et perceptions associées / Laurence Jolivet in Cartes & Géomatique, n° 247-248 (mars-juin 2022)
[article]
Titre : Les noms de lieux mentionnés dans des récits de vie de républicains espagnols : distribution géographique et perceptions associées Type de document : Article/Communication Auteurs : Laurence Jolivet , Auteur ; Carmen Brando , Auteur Année de publication : 2022 Conférence : ICC 2021, 30th ICA international cartographic conference 14/12/2021 18/12/2021 Florence Italie Article en page(s) : pp 135 - 147 Note générale : Bibliographie Langues : Français (fre) Descripteur : [Vedettes matières IGN] Analyse spatiale
[Termes IGN] corpus
[Termes IGN] distribution spatiale
[Termes IGN] Espagne
[Termes IGN] guerre
[Termes IGN] perception
[Termes IGN] récit
[Termes IGN] représentation cartographique
[Termes IGN] toponymeRésumé : (Auteur) Les lieux peuvent être définis par différentes caractéristiques telles que les coordonnées géographiques, les éléments du paysage, mais également des informations subjectives relatives à la perception. Le corpus constitué par le Réseau des acteurs de l'histoire et la mémoire de l'immigration (RAHMI) concerne des entretiens oraux décrivant des parcours de Républicains espagnols pendant la guerre civile d'Espagne et la Seconde Guerre mondiale. Ces récits de vie contiennent des noms de lieux, mentionnés par les personnes, correspondant à des noms propres (Npr) ou des noms communs (Nc). Ces noms de lieux peuvent être enrichis par des informations perceptives. Des méthodes linguistiques et statistiques ont été déployées afin d'extraire automatiquement et de caractériser certaines informations dans le texte par le biais d'annotations. L'objectif du travail présenté est d'analyser les distributions géographiques des lieux et des caractéristiques associées, ainsi que de proposer des cartographies illustrant les récits de vie et accompagnant les analyses. Premièrement, la distribution des Npr de lieux a été étudiée, permettant de cibler des échelles spatiales pertinentes et de cartographier une partie ou la totalité du corpus sous l'angle de ces lieux. Deuxièmement, les caractéristiques des Npr de lieux ont été synthétisées : leur type (administratif, topographique), leur étendue spatiale à partir de leur combinaison avec des Nc. Enfin des perceptions, résumées en polarité positive ou négative, ont été identifiées et dans certains cas associées aux Npr de lieux. Les motifs spatiaux de chaque polarité, en plus des Npr sans polarité et donc neutres, ont été cartographiés. La synthèse des annotations, les résultats d'analyse et les cartes proposées constituent des points d'entrée dans le corpus par des lieux mentionnés. Ces témoignages individuels, ainsi que leur valorisation, contribuent à la connaissance de cette période de l'histoire et aux travaux de recherche dédiés. Numéro de notice : A2022-801 Affiliation des auteurs : UGE-LASTIG+Ext (2020- ) Thématique : GEOMATIQUE Nature : Article nature-HAL : ArtAvecCL-RevueNat DOI : sans Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=101914
in Cartes & Géomatique > n° 247-248 (mars-juin 2022) . - pp 135 - 147[article]Exemplaires(1)
Code-barres Cote Support Localisation Section Disponibilité 021-2022011 SL Revue Centre de documentation Revues en salle Disponible The re-invention of the Goori cultural landscape: Telling the country: Mapping two pockets / Paul Memmott in Cartographica, Vol 57 n° 1 (Spring 2022)
[article]
Titre : The re-invention of the Goori cultural landscape: Telling the country: Mapping two pockets Type de document : Article/Communication Auteurs : Paul Memmott, Auteur ; Ray Kerkhove, Auteur ; Alex Bond, Auteur ; et al., Auteur Année de publication : 2022 Article en page(s) : pp 65-79 Note générale : bibliographie Langues : Anglais (eng) Descripteur : [Termes IGN] Brisbane (Australie)
[Termes IGN] communication cartographique
[Termes IGN] corpus
[Termes IGN] culture
[Termes IGN] droit foncier
[Termes IGN] ethnologie
[Termes IGN] ontologie
[Termes IGN] patrimoine culturel
[Termes IGN] période coloniale
[Termes IGN] Queensland (Australie)
[Vedettes matières IGN] CartologieRésumé : (auteur) This article analyzes the authors’ map of the Aboriginal geography of St Lucia and Long Pocket, two riverine suburbs of Brisbane, upstream of the central business district, and containing two of the University of Queensland’s campuses. The map is a prism into the wider “Goori” Aboriginal society of the early 1800s. The map was generated by two Aboriginal scholars and an anthropologist using a practice-based ontological approach and by historians using early textual sources. The map juxtaposes a geopolitical edge against contemporary metropolitan mapping, providing a foundation of First Nations geography to underlie and undermine the power of colonial and postcolonial cartography. Numéro de notice : A2022-246 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE Nature : Article DOI : 10.3138/cart-2021-0022 Date de publication en ligne : 15/03/2022 En ligne : https://doi.org/10.3138/cart-2021-0022 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=100189
in Cartographica > Vol 57 n° 1 (Spring 2022) . - pp 65-79[article]Exemplaires(1)
Code-barres Cote Support Localisation Section Disponibilité 031-2022011 RAB Revue Centre de documentation En réserve L003 Disponible Analyse contrastive de la perception de la ville entre fictions climatiques et débats publics / Alexandra Li–Combeau-Longuet (2022)
Titre : Analyse contrastive de la perception de la ville entre fictions climatiques et débats publics Type de document : Mémoire Auteurs : Alexandra Li–Combeau-Longuet, Auteur ; Catherine Dominguès , Encadrant ; Sabine Ploux, Encadrant Editeur : Paris : Institut National des Langues et Civilisations Orientales Année de publication : 2022 Projets : PARVIS / Importance : 80 p. Note générale : bibliographie
Master traitement automatique des langues, Parcours Ingénierie MultilingueLangues : Français (fre) Descripteur : [Vedettes matières IGN] Linguistique
[Termes IGN] analyse de données
[Termes IGN] analyse de groupement
[Termes IGN] corpus
[Termes IGN] linguistique informatique
[Termes IGN] villeMots-clés libres : analyse statistique de données textuelles TXM clustering romans de science-fiction Grand Débat National Natural Language Processing (NLP) city statistical analysis of textual data science fiction Résumé : (auteur) Ce travail, s'inscrivant dans le projet PARVIS (PARoles de VIlleS), porte sur l'analyse contrastive de la perception de la ville entre un corpus de débats publics et un corpus de romans de science-fiction (dont des fictions climatiques). Ces corpus ne parlant pas uniquement de la ville, nous utilisons une approche "par lexique" pour définir la ville. Cette approche pose la question de la désambigüisation lexicale, mais aussi de la segmentation en la seule unité comparable entre les deux corpus : la phrase. Nous avons donc commencé par une exploration "gros grain" des corpus afin de formuler des hypothèses sur la perception de la ville, dans laquelle la désambigüisation lexicale et la segmentation en phrase seront abordées. Enfin, une exploration "grain fin" des vecteurs contextuels des mots de la ville a été réalisée dans le but de répondre à ces hypothèses. Note de contenu : Introduction : contexte de travail
Problématiques et objectifs
Partie 1- État de l’art, rappel sur les méthodes utiles
1 Analyse de données textuelles (ADT) ou Textométrie
2 Apprentissage automatique
Partie 2- Exploration du corpus "gros grain" : formulation d’hypothèses sur la perception de la ville
3 Pré-traitements : désambiguïsation
4 Méthode : exploration "gros grains"
5 Résultats de l’exploration "gros grain"
6 Formulation des hypothèses
Partie 3- Exploration "grain fin" du corpus : les contextes d’emploi
7 Méthode : clustering sur les vecteurs contextuels de CamemBERT
8 Analyses des clusters
9 Discussion
Conclusion généraleNuméro de notice : 13867 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE/INFORMATIQUE/MATHEMATIQUE Nature : Mémoire masters divers Organisme de stage : LASTIG (IGN) Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=102272 Documents numériques
peut être téléchargé
rapport_Li-Combeau-Longuet - pdf auteurAdobe Acrobat PDF Anonymisation des contributions des Cahiers citoyens : identifier et traiter les informations sensibles. / Arnaud Le Guilcher (2022)
Titre : Anonymisation des contributions des Cahiers citoyens : identifier et traiter les informations sensibles. Type de document : Article/Communication Auteurs : Arnaud Le Guilcher , Auteur Editeur : Saint-Mandé : Institut national de l'information géographique et forestière - IGN (2012-) Année de publication : 2022 Conférence : Journée d'étude CAMS 2022, Les Cahiers citoyens (2019) – Approches croisées 11/02/2022 18/12/2021 Paris France OA programme Langues : Français (fre) Descripteur : [Termes IGN] anonymisation
[Termes IGN] corpus
[Termes IGN] protection de la vie privéeRésumé : (auteur) L’exploitation des contributions des Cahiers Citoyens pour l’analyse scientifique posent le problème du respect de la vie privée des contributeurs. En effet, les Cahiers Citoyens ont été conçus comme un moyen d’expression anonyme, dans lesquels des contributeurs pourraient s’exprimer librement. Cette liberté est menacée s’il est possible de ré-identifier les auteurs de certaines contributions. Or, certains éléments contenus dans le texte des contributions, combinés à des éléments de contexte (comme le nom de la commune) créent un tel risque de ré-identification. La démarche pour anonymiser les contributions est d’abord d’identifier les éléments des contributions susceptibles de permettre une ré-identification. Ces éléments peuvent être des informations sur l’identité du contributeur, ou des informations de localisation. Une fois des éléments identifiés, il faut les supprimer ou les généraliser pour obtenir un corpus ne présentant plus de risque, tout en conservant des informations utiles. Numéro de notice : C2022-002 Affiliation des auteurs : UGE-LASTIG (2020- ) Thématique : GEOMATIQUE Nature : Communication nature-HAL : ComSansActesPubliés-Unpublished DOI : sans Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=100005 ATONTE: towards a new methodology for seed ontology development from texts and experts / Helen Mair Rawsthorne (2022)PermalinkUsing textual volunteered geographic information to model nature-based activities: A case study from Aotearoa New Zealand / Ekaterina Egorova in Journal of Spatial Information Science, JoSIS, n° 23 (2021)PermalinkDisaster Image Classification by Fusing Multimodal Social Media Data / Zhiqiang Zou in ISPRS International journal of geo-information, vol 10 n° 10 (October 2021)PermalinkCréation de bases de connaissances topographiques à partir de sources hétérogènes / Helen Mair Rawsthorne (2021)PermalinkExtracting event-related information from a corpus regarding soil industrial pollution / Chuanming Dong (2021)PermalinkIntégration et analyse de données massives et hétérogènes pour une observation intelligente du territoire / Rodrigue Kafando (2021)PermalinkPlace names in Spanish republican life stories: spatial patterns in locations and perceptions / Laurence Jolivet (2021)PermalinkInteractions between hierarchical learning and visual system modeling : image classification on small datasets / Thalita Firmo Drumond (2020)PermalinkGeoTxt: A scalable geoparsing system for unstructured text geolocation / Morteza Karimzadeh in Transactions in GIS, vol 23 n° 1 (February 2019)PermalinkCarSenToGram: geovisual text analytics for exploring spatiotemporal variation in public discourse on Twitter / Caglar Koylu in Cartography and Geographic Information Science, Vol 46 n° 1 (January 2019)Permalink