Descripteur
Termes IGN > informatique > intelligence artificielle > ingénierie des connaissances > découverte de connaissances > exploration de données > exploration de texte
exploration de texteVoir aussi |
Documents disponibles dans cette catégorie (21)
Ajouter le résultat dans votre panier
Visionner les documents numériques
Affiner la recherche Interroger des sources externes
Etendre la recherche sur niveau(x) vers le bas
contenu dans Proceedings of the 9th Workshop on Geographic Information Retrieval, GIR'2015 / Ross S. Purves (2015)
Titre : A multi-layer markup language for geospatial semantic annotations Type de document : Article/Communication Auteurs : Ludovic Moncla , Auteur ; Mauro Gaio, Auteur Editeur : New York [Etats-Unis] : Association for computing machinery ACM Année de publication : 2015 Conférence : GIR 2015, 9th Workshop on Geographic Information Retrieval 26/11/2015 27/11/2015 Paris France Proceedings ACM Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Géomatique
[Termes IGN] enrichissement sémantique
[Termes IGN] exploration de texte
[Termes IGN] itinéraire
[Termes IGN] langage de balisage
[Termes IGN] réseau neuronal artificiel
[Termes IGN] traitement du langage naturel
[Termes IGN] XMLRésumé : (auteur) In this paper, we describe a markup language for semantically annotating raw texts. We define a formal representation of text documents written in natural language that can be applied for the task of Named Entities Recognition and Spatial Role Labeling. The proposal relies on a multi-layer annotation process based on a core generic layer, which can be freely adapted into more specific layers depending on the intended goal. Our markup language is based on the TEI Guidelines to propose a generic and extensible markup language. This language is particularly dedicated for the text mining task and ready to use to be layered with more semantic relationships between elements of the text. We show the feasibility of this proposal from a generic annotation of texts describing itineraries toward a geospatial semantic annotation. Note de contenu : Paris France. Numéro de notice : C2015-014 Affiliation des auteurs : LASTIG COGIT+Ext (2012-2019) Thématique : GEOMATIQUE Nature : Communication nature-HAL : ComAvecCL&ActesPubliésIntl DOI : 10.1145/2837689.2837700 En ligne : http://dx.doi.org/10.1145/2837689.2837700 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=83166
contenu dans Proceedings of the 9th Workshop on Geographic Information Retrieval, GIR'2015 / Ross S. Purves (2015)
Titre : TEXTOMAP : determining geographical window for texts Type de document : Article/Communication Auteurs : Geoffrey Brun , Auteur ; Catherine Dominguès , Auteur ; Marie-Dominique Van Damme , Auteur Editeur : New York [Etats-Unis] : Association for computing machinery ACM Année de publication : 2015 Conférence : GIR 2015, 9th Workshop on Geographic Information Retrieval 26/11/2015 27/11/2015 Paris France Proceedings ACM Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Géomatique
[Termes IGN] exploration de texte
[Termes IGN] toponyme
[Termes IGN] traitement du langage naturelRésumé : (auteur) In newspapers or scholar manuals, numerous texts are accompanied by maps. In these map/text couples, maps give a spatial portrayal of the text issues, thus they make the spatial issues easier to understand. TEXTOMAP aims to design the geographical window of the text, based on the notion of important toponyms according to text issues. The important toponym selection is based on indicators which may be spatial, linguistic or semantic. Examples of geographical window calculation are shown and compared with the corresponding CLAVIN geographical focus. The work is in progress and perspectives are offered. Note de contenu : Paris France.. Numéro de notice : C2015-013 Affiliation des auteurs : LASTIG COGIT (2012-2019) Thématique : GEOMATIQUE Nature : Communication nature-HAL : ComAvecCL&ActesPubliésIntl DOI : 10.1145/2837689.2837703 Date de publication en ligne : 26/11/2015 En ligne : http://dx.doi.org/10.1145/2837689.2837703 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=83289
Titre : How to visualize the geography of Swiss history Type de document : Article/Communication Auteurs : André Bruggmann, Auteur ; Sara Irina Fabrikant, Auteur Editeur : Association of Geographic Information Laboratories in Europe AGILE Année de publication : 2014 Conférence : AGILE 2014, 17th International Conference on Geographic Information Science, Connecting a digital Europe through location and place 03/06/2014 06/06/2014 Castellon Espagne Open access proceedings Importance : 6 p. Format : 21 x 30 cm Note générale : bibliographie Langues : Anglais (eng) Descripteur : [Termes IGN] exploration de texte
[Termes IGN] histoire
[Termes IGN] recherche d'information géographique
[Termes IGN] Suisse
[Termes IGN] toponyme
[Vedettes matières IGN] GéovisualisationRésumé : (auteur) Efficient and effective access to and knowledge construction from massively growing spatial and non-spatial databases available online today have become major bottlenecks for the rapidly evolving information society at large. We present a geovisual analytics framework to deal with spatio-temporal knowledge extraction from rapidly growing, and increasingly massive, digital text databases largely untapped for spatio-temporal analyses. Our interdisciplinary, theory-driven approach combines text data mining methods, currently employed in GIScience and geovisual analytics, to re-organize and visualize a semi-structured online dictionary about Swiss history, made available to the general public. We automatically extract spatial, temporal, and thematic information from the text archive, and make it visually available to an information seeker interested in Swiss history, through empirically validated spatialization display techniques (e.g., network visualizations and self-organizing maps). In this case study, we specifically illustrate how spatial relationships between Swiss toponyms can be extracted, analyzed, and visualized using our proposed approach. With this interdisciplinary geovisual analytics approach situated at the nexus of digital humanities, information science, and GIScience we hope to provide new transdisciplinary solutions to facilitate information extraction of and knowledge generation from information buried in vast unstructured text archives. Numéro de notice : C2014-020 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE Nature : Communication DOI : sans Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=81043 Documents numériques
en open access
How to visualizeAdobe Acrobat PDF
Titre : Appliquer les méthodes de la statistique textuelle Type de document : Guide/Manuel Auteurs : Bénédicte Garnier, Auteur ; France Guérin-Pace, Auteur Editeur : Paris : CEPED Année de publication : 2010 Collection : Les Clefs pour Importance : 82 p. Format : 16 x 24 cm ISBN/ISSN/EAN : 978-2-87762-182-3 Note générale : Bibliographie Langues : Français (fre) Descripteur : [Vedettes matières IGN] Statistiques
[Termes IGN] analyse du discours
[Termes IGN] analyse factorielle
[Termes IGN] classification
[Termes IGN] corpus
[Termes IGN] exploration de texte
[Termes IGN] logiciel d'analyse de données
[Termes IGN] terminologie
[Termes IGN] traitement du langage naturelIndex. décimale : 23.60 Statistiques et probabilités Résumé : (éditeur) Analyser les réponses à une question ouverte, un corpus d'entretiens ou de textes est une pratique courante en sciences sociales. Cette exploration peut être facilitée par des logiciels d'aide à la lecture ou à la codification. Si l'on veut enrichir l'exploitation afin de saisir le sens d'un corpus et en quantifier le contenu, il est nécessaire de recourir à des outils spécifiques. Les méthodes de la statistique textuelle décrites dans ce manuel permettent de traiter les textes comme des variables particulières au moyen des outils classiques de l'analyse des données. Nées dans les années 1980 de la rencontre entre plusieurs disciplines (linguistique, statistique informatique, traitement des enquêtes, etc.), la statistique textuelle trouve aujourd'hui di applications dans des domaines de recherche extrêmement variés (linguistique, histoire sociologie, géographie, démographie, marketing, etc.) et de plus en plus étendus. Elle fait l'objet des Journées d'Analyse statistique des Données Textuelles (JADT) qui se tiennent tous les deux ans et présentent les avancées dans ce domaine. Ce manuel s'adresse à tous ceux qui sont amenés à traiter des données recueillies sous forme de textes, quel que soit leur niveau de connaissances en statistique. II présente de manière didactique les éléments clefs de la statistique textuelle. Sa mise en œuvre à partir de logiciel qui font référence dans ce domaine (Spad, Alceste, Lexico) est illustrée par des exemples. Note de contenu : Introduction
1 - Les étapes de traitement d'un corpus
2 - Les outils
3 - La mise en oeuvre
ConclusionNuméro de notice : 21541 Affiliation des auteurs : non IGN Thématique : INFORMATIQUE/MATHEMATIQUE Nature : Manuel Accessibilité hors numérique : Accessible via le SUDOC (sur demande au cdos) En ligne : http://www.ceped.org/IMG/pdf/appliquer_les_methodes_de_la_statistique_textuelle- [...] Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=90480 Etude contrastive de deux sous-corpus de cartographie / Laure Bouttier (2009)
Titre : Etude contrastive de deux sous-corpus de cartographie : Comparer les règles de représentation des informations géographiques en réalisant une étude contrastive: Cartographie thématique vs Cartographie topographique Type de document : Mémoire Auteurs : Laure Bouttier, Auteur Editeur : Orléans : Université d'Orléans Année de publication : 2009 Importance : 49 p. Format : 21 x 30 cm Note générale : bibliographie
Master 2 LAASTICLangues : Français (fre) Descripteur : [Vedettes matières IGN] Cartographie
[Termes IGN] cartographie thématique
[Termes IGN] cartographie topographique
[Termes IGN] exploration de texte
[Termes IGN] sémiologie graphique
[Termes IGN] traitement du langage naturelIndex. décimale : DESS Divers DESS et masters actuels professionnels ou spécialisés Résumé : (auteur) Comment extraire les principes de représentation cartographique ? Pour extraire les aspects essentiels des documents et les mettre en relation avec la demande des utilisateurs, il est indispensable de combiner diverses techniques provenant de domaines comme l’analyse de données, la linguistique, l’intelligence artificielle. La méthodologie présentée ici permet d’extraire des marqueurs linguistiques, lors d’une étude contrastive de deux sous-corpus. Ces sous corpus étant des cours dispensés dans trois licences de cartographie et dans une école d’ingénieurs en sciences géographiques. Cette étude contrastive est réalisée grâce à une analyse lexicale et une analyse lexicométrique qui permettront de construire une classification conceptuelle du domaine cartographique. Cette classification permettra alors d’extraire les concepts importants de réalisation d’une carte topographique et thématique. Note de contenu : INTRODUCTION
1. PRESENTATION DE L’ENTREPRISE ET DE SA DEMANDE
1.1 L’IGN
1.2 Le COGIT
2. ETAT DE L'ART DU TRAITEMENT D'UN CORPUS
2.1 Analyse lexicale
2.2 Analyse quantitative
2.3 L'extraction d'information
3. METHODOLOGIE
3.1 Planning
3.2 Acquisition et présentation du corpus
3.3 Prétraitement du corpus
3.4 Analyse lexicale
3.5 Analyse quantitative
3.6 Construction de la classification conceptuelle du domaine
4. EXTRACTION D'INFORMATION
4.1 Les définitions
4.2 Les variables visuelles
4.3 Les notions abordées et ordre de ces notions dans le corpus
4.4 Les règles de construction
CONCLUSIONNuméro de notice : 17479 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE Nature : Mémoire masters divers Organisme de stage : COGIT (IGN) Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=89732 E-11 - Extraction et gestion des connaissances EGC'2008 (2 volumes) (Bulletin de Revue des Nouvelles Technologies de l'Information, E-11 [01/04/2008]) / Fabrice GuilletPermalink