Descripteur
Termes IGN > informatique > intelligence artificielle > ingénierie des connaissances > découverte de connaissances > exploration de données > exploration de texte
exploration de texteVoir aussi |
Documents disponibles dans cette catégorie (21)



Etendre la recherche sur niveau(x) vers le bas
A benchmark of named entity recognition approaches in historical documents : application to 19th century French directories / Nathalie Abadie (2022)
![]()
Titre : A benchmark of named entity recognition approaches in historical documents : application to 19th century French directories Type de document : Article/Communication Auteurs : Nathalie Abadie , Auteur ; Edwin Carlinet, Auteur ; Joseph Chazalon, Auteur ; Bertrand Duménieu
, Auteur
Editeur : Berlin, Heidelberg, Vienne, New York, ... : Springer Année de publication : 2022 Collection : Lecture notes in Computer Science, ISSN 0302-9743 num. 13237 Projets : SODUCO / Perret, Julien Conférence : DAS 2022, 5th IAPR International Workshop on Document Analysis Systems 22/05/2022 25/05/2022 La Rochelle France Proceedings Springer Importance : pp 445 - 460 Note générale : bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Géomatique
[Termes IGN] classification par réseau neuronal convolutif
[Termes IGN] dix-neuvième siècle
[Termes IGN] données d'entrainement (apprentissage automatique)
[Termes IGN] exploration de texte
[Termes IGN] objet géohistorique
[Termes IGN] reconnaissance de noms
[Termes IGN] traitement du langage naturelRésumé : (auteur) Named entity recognition (NER) is a necessary step in many pipelines targeting historical documents. Indeed, such natural language processing techniques identify which class each text token belongs to, e.g. “person name”, “location”, “number”. Introducing a new public dataset built from 19th century French directories, we first assess how noisy modern, off-the-shelf OCR are. Then, we compare modern CNN- and Transformer-based NER techniques which can be reasonably used in the context of historical document analysis. We measure their requirements in terms of training data, the effects of OCR noise on their performance, and show how Transformer-based NER can benefit from unsupervised pre-training and supervised fine-tuning on noisy data. Results can be reproduced using resources available at https://github.com/soduco/paper-ner-bench-das22 and https://zenodo.org/record/6394464. Numéro de notice : C2022-030 Affiliation des auteurs : UGE-LASTIG+Ext (2020- ) Autre URL associée : vers HAL Thématique : GEOMATIQUE/INFORMATIQUE Nature : Communication nature-HAL : ComAvecCL&ActesPubliésIntl DOI : 10.1007/978-3-031-06555-2_30 En ligne : http://dx.doi.org/10.1007/978-3-031-06555-2_30 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=101088
Titre : Schematizing crossroads from abstract textual descriptions Type de document : Article/Communication Auteurs : Jean-Marie Favreau, Auteur ; Guillaume Touya , Auteur ; Jérémy Kalsron, Auteur
Editeur : Bonn : Université de Bonn Année de publication : 2022 Projets : ACTIVmap / Favreau, Jean-Marie Conférence : CompCarto 2022, 1st workshop on Computational Cartography 19/05/2022 20/05/2022 Bonn Allemagne programme Importance : 3 p. Note générale : Bibliographie Langues : Anglais (eng) Descripteur : [Termes IGN] carrefour
[Termes IGN] carte tactile
[Termes IGN] cartogramme
[Termes IGN] exploration de texte
[Vedettes matières IGN] CartologieRésumé : (auteur) [début] The use of cartographic representations among people with visual impairments (PVI) is often limited by the lack of available materials. However, two uses have been identified: diagrams made with sticks magnetised to a metal plate (Figure 1) are used by Orientation and Mobility instructors as a discussion aid around complex areas (typically intersections), and more accurate maps made by transcribing adapters are sometimes produced for regular use. While classical variations of the generalisation and stylisation approaches allow for the production of fairly accurate maps [JLCJ21], for example from OpenStreetMap data (figure 2), there are currently no known approaches to producing a more schematic representation, in the manner of the locomotion instructors’ magnets. Numéro de notice : C2022-013 Affiliation des auteurs : UGE-LASTIG+Ext (2020- ) Thématique : GEOMATIQUE Nature : Communication nature-HAL : ComSansActesPubliés-Unpublished DOI : sans Date de publication en ligne : 24/05/2022 En ligne : https://hal.science/hal-03677334/ Format de la ressource électronique : URL Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=100747 Investigating the quality of reverse geocoding services using text similarity techniques and logistic regression analysis / Batuhan Kilic in Cartography and Geographic Information Science, Vol 47 n° 4 (July 2020)
![]()
[article]
Titre : Investigating the quality of reverse geocoding services using text similarity techniques and logistic regression analysis Type de document : Article/Communication Auteurs : Batuhan Kilic, Auteur ; Fatih Gülgen, Auteur Année de publication : 2020 Article en page(s) : pp 336 - 349 Note générale : bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Géomatique web
[Termes IGN] exploration de texte
[Termes IGN] géocodage inverse
[Termes IGN] géocodage par adresse postale
[Termes IGN] logique binaire
[Termes IGN] qualité des données
[Termes IGN] régression
[Termes IGN] similitude sémantiqueRésumé : (auteur) Location, usually defined by postal address information or geographic coordinate values, is one of the leading themes in geography. Famous global mapping services such as ArcGIS Online, Bing Maps, Google Maps, or Yandex Maps can provide users with address information of any geographic coordinates using reverse geocoding. The accuracy of retrieved addresses is quite essential for a service user. Several researchers have evaluated the accuracy of the process based on the positional errors between the retrieved and actual addresses. This article proposes a different assessment based on text similarity algorithms. In this study, the authors examine the outcomes of 15 different text similarity algorithms by comparing them with the reference data. They benefit from the binary logistic regression to evaluate the results. At the end of the case study, they conclude that the soft-term frequency/inverse document frequency algorithm is the most appropriate to measure the quality of postal addresses of all tested services. The Jaccard algorithm also produces successful results only for Google and Bing Maps services. Moreover, the study allows the reader to assess the results of reverse geocoding derived from the global map platforms that serve in the test region. Numéro de notice : A2020-339 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE Nature : Article nature-HAL : ArtAvecCL-RevueIntern DOI : 10.1080/15230406.2020.1746198 Date de publication en ligne : 20/04/2020 En ligne : https://doi.org/10.1080/15230406.2020.1746198 Format de la ressource électronique : url article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=95214
in Cartography and Geographic Information Science > Vol 47 n° 4 (July 2020) . - pp 336 - 349[article]Réservation
Réserver ce documentExemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité 032-2020041 RAB Revue Centre de documentation En réserve L003 Disponible
Titre : Calcul d’une emprise de carte à partir du texte d’un article de presse Type de document : Mémoire Auteurs : Clément Beauvallet, Auteur ; Catherine Dominguès , Encadrant ; Laurence Jolivet
, Encadrant
Editeur : Saint-Mandé : Institut national de l'information géographique et forestière - IGN (2012-) Année de publication : 2020 Importance : 25 p. Note générale : bibliographie
rapport de Programmation / SIG dans le cadre du cycle ingénieur 3e annéeLangues : Français (fre) Descripteur : [Vedettes matières IGN] Géomatique
[Termes IGN] emprise de carte
[Termes IGN] entité géographique
[Termes IGN] exploration de texte
[Termes IGN] Java (langage de programmation)
[Termes IGN] toponymeIndex. décimale : TDE Travaux dirigés des étudiants, rapports de projets, rapports de stage hors fin d'études Résumé : pas de résumé Note de contenu : Introduction contextuelle
1- Contexte du stage et travaux antérieurs
1-1 Contexte de l’étude et objectifs du stage
1-2 TEXTOMAP et objectifs du stage
1-3 Support de travail de base : thèse de Geoffrey Brun
1-4 Objectifs du stage
2-Emprise de référence, stratégies de sélection d’entités et emprise calculée
2-1 Définition et extraction des emprises de référence
2-2 Explication des stratégies et du calcul d’emprise
3-Résultats et possibles améliorations
3-1 Résultats obtenus et analyses
3-2 Bilan du stage
ConclusionNuméro de notice : 17692 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE Nature : TD/TP étudiant DOI : sans Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=99158 Extraction de connaissances pour la description de l'environnement maritime côtier à partir de textes d'aide à la navigation / Léa Lamotte in Revue des Nouvelles Technologies de l'Information, E.36 (2020)
[article]
Titre : Extraction de connaissances pour la description de l'environnement maritime côtier à partir de textes d'aide à la navigation Type de document : Article/Communication Auteurs : Léa Lamotte, Auteur ; Nathalie Abadie , Auteur ; Eric Saux, Auteur ; Eric Kergosien, Auteur
Année de publication : 2020 Projets : 2-Pas d'info accessible - article non ouvert / Favreau, Jean-Marie Conférence : EGC 2020, 20e conférence internationale francophone Extraction et Gestion des Connaissances 27/01/2020 31/01/2020 Bruxelles Belgique programme Article en page(s) : pp 341 - 348 Note générale : bibliographie Langues : Français (fre) Descripteur : [Vedettes matières IGN] Géomatique
[Termes IGN] découverte de connaissances
[Termes IGN] exploration de texte
[Termes IGN] information géographique
[Termes IGN] littoral
[Termes IGN] traitement du langage naturelRésumé : (auteur) Les référentiels de données géoréférencées sont de plus en plus utilisés pour permettre l'annotation spatiale de documents textuels et ainsi faciliter l'accès à leur contenu, voire son analyse spatiale. En revanche, peu de travaux se sont intéressés à l'extraction d'information géographique à partir de textes pour alimenter de tels référentiels. Le travail présenté dans cet article explore les potentialités de l'extraction d'information spatiale indirecte (noms de lieux, relations spatiales, etc.) dans les textes des Instructions Nautiques produites par le Service Hydrographique et Océanographique de la Marine (SHOM). La méthode proposée combine une approche lexicale et une approche à base de patrons linguistiques, puis est comparée aux principales approches d'extraction d'information géographique en français. Numéro de notice : A2020-571 Affiliation des auteurs : LASTIG COGIT+Ext (2012-2019) Thématique : GEOMATIQUE/INFORMATIQUE Nature : Article nature-HAL : ArtAvecCL-RevueIntern DOI : sans Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=96012
in Revue des Nouvelles Technologies de l'Information > E.36 (2020) . - pp 341 - 348[article]PermalinkAdvancing New Testament interpretation through spatio‐temporal analysis: Demonstrated by case studies / Vincent Van Altena in Transactions in GIS, vol 22 n° 3 (June 2018)
PermalinkCrowdsourcing the character of a place : Character‐level convolutional networks for multilingual geographic text classification / Benjamin Adams in Transactions in GIS, vol 22 n° 2 (April 2018)
PermalinkA cloud-enabled automatic disaster analysis system of multi-sourced data streams: An example synthesizing social media, remote sensing and Wikipedia data / Qunying Huang in Computers, Environment and Urban Systems, vol 66 (November 2017)
PermalinkLinking spatial named entities to the web of data for geographical analysis of historical texts / Pierre-Henri Paris in Journal of Map & Geography Libraries, vol 13 n° 1 ([01/05/2017])
PermalinkTowards a knowledge base to support geoprocessing workflow development / Barbara Hofer in International journal of geographical information science IJGIS, vol 31 n° 3-4 (March-April 2017)
PermalinkLe travail de la science et le numérique : Données, publications, plateformes / Direction de l'information scientifique et technique - CNRS (20/02/2017)
PermalinkPermalinkLe Grand Paris écologique, endroit très beau : reconnaissance des noms de lieu dans des corpus thématiques français, présenté lors de l'atelier EXtraction de Connaissances à partir de donnEes Spatialisées de SAGEO 2016 / Carmen Brando (2016)
PermalinkPermalink