Détail de l'auteur
Auteur Nathalie Abadie
Commentaire :
Senior researcher in LaSTIG, STRUDEL team
Autorités liées :
idHAL :
nathalie-abadie
idRef :
ORCID :
Scopus :
G. Scholar :
DBLP URL :
|
Documents disponibles écrits par cet auteur (62)
Ajouter le résultat dans votre panier
Visionner les documents numériques
Affiner la recherche Interroger des sources externes
A benchmark of nested named entity recognition approaches in historical structured documents / Solenn Tual (2023)
Titre : A benchmark of nested named entity recognition approaches in historical structured documents Type de document : Article/Communication Auteurs : Solenn Tual , Auteur ; Nathalie Abadie , Auteur ; Joseph Chazalon, Auteur ; Bertrand Duménieu , Auteur ; Edwin Carlinet, Auteur Editeur : Champs-sur-Marne [France] : Université Gustave Eiffel Année de publication : 2023 Projets : SODUCO / Perret, Julien Importance : 18 p. Format : 21 x 30 cm Note générale : Bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Géomatique
[Termes IGN] langage naturel (informatique)
[Termes IGN] reconnaissance de noms
[Termes IGN] traitement du langage naturelRésumé : (Auteur) Named Entity Recognition (NER) is a key step in the creation of structured data from digitised historical documents. Traditional NER approaches deal with flat named entities, whereas entities often are nested. For example, a postal address might contain a street name and a number. This work compares three nested NER approaches, including two state-of-the-art approaches using Transformer-based architectures. We introduce a new Transformer-based approach based on joint labelling and semantic weighting of errors, evaluated on a collection of 19 th-century Paris trade directories. We evaluate approaches regarding the impact of supervised fine-tuning, unsupervised pre-training with noisy texts, and variation of IOB tagging formats. Our results show that while nested NER approaches enable extracting structured data directly, they do not benefit from the extra knowledge provided during training and reach a performance similar to the base approach on flat entities. Even though all 3 approaches perform well in terms of F1 scores, joint labelling is most suitable for hierarchically structured data. Finally, our experiments reveal the superiority of the IO tagging format on such data. Numéro de notice : P2023-001 Affiliation des auteurs : UGE-LASTIG+Ext (2020- ) Thématique : GEOMATIQUE/TOPONYMIE Nature : Preprint nature-HAL : Préprint DOI : sans Date de publication en ligne : 20/02/2023 En ligne : https://hal.science/hal-03994759v1/document Format de la ressource électronique : URL Article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=102602 Création d’un graphe de connaissances géohistorique à partir d’annuaires du commerce parisien du 19ème siècle : application aux métiers de la photographie / Solenn Tual (2023)
Titre : Création d’un graphe de connaissances géohistorique à partir d’annuaires du commerce parisien du 19ème siècle : application aux métiers de la photographie Type de document : Article/Communication Auteurs : Solenn Tual , Auteur ; Nathalie Abadie , Auteur ; Bertrand Duménieu , Auteur ; Joseph Chazalon, Auteur ; Edwin Carlinet, Auteur Editeur : Saint-Mandé : Institut national de l'information géographique et forestière - IGN (2012-) Année de publication : 2023 Projets : SODUCO / Perret, Julien Conférence : IC 2023, 34es journées francophones d'Ingénierie des connaissances 03/07/2023 05/07/2023 Strasbourg France Note générale : bibliographie Langues : Français (fre) Descripteur : [Vedettes matières IGN] Analyse spatiale
[Termes IGN] analyse spatio-temporelle
[Termes IGN] bruit (théorie du signal)
[Termes IGN] entité géographique
[Termes IGN] réseau sémantique
[Termes IGN] visualisation 4DIndex. décimale : 37.20 Analyse spatiale et ses outils Résumé : (auteur) Les annuaires professionnels anciens, édités à un rythme soutenu dans de nombreuses villes européennes tout au long des XIXe et XXe siècles, forment un corpus de sources unique par son volume et la possibilité qu'ils donnent de suivre les transformations urbaines à travers le prisme des activités professionnelles des habitants, de l'échelle individuelle jusqu'à celle de la ville entière. L'analyse spatiotemporelle d'un type de commerces au travers des entrées d'annuaires demande cependant un travail considérable de recensement, de transcription et de recoupement manuels. Pour pallier cette difficulté, cet article propose une approche automatique pour construire et visualiser un graphe de connaissances géohistorique des commerces figurant dans des annuaires anciens. L'approche est testée sur des annuaires du commerce parisien du XIXe siècle allant de 1799 à 1908, sur le cas des métiers de la photographie. Numéro de notice : C2023-012 Affiliation des auteurs : UGE-LASTIG+Ext (2020- ) Thématique : GEOMATIQUE Nature : Communication nature-HAL : ComAvecCL&ActesPubliésIntl DOI : sans En ligne : https://hal.science/hal-04121643 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=103319 Entry separation using a mixed visual and textual language model: Application to 19th century French trade directories / Bertrand Duménieu (2023)
Titre : Entry separation using a mixed visual and textual language model: Application to 19th century French trade directories Type de document : Article/Communication Auteurs : Bertrand Duménieu , Auteur ; Edwin Carlinet, Auteur ; Nathalie Abadie , Auteur ; Joseph Chazalon, Auteur Editeur : Champs-sur-Marne [France] : Université Gustave Eiffel Année de publication : 2023 Projets : SODUCO / Perret, Julien Importance : 20 p. Format : 21 x 30 cm Note générale : Bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Géomatique
[Termes IGN] annuaire
[Termes IGN] dix-neuvième siècle
[Termes IGN] modèle de langue
[Termes IGN] reconnaissance de nomsRésumé : (Auteur) When extracting structured data from repetitively organized documents, such as dictionaries, directories, or even newspapers, a key challenge is to correctly segment what constitutes the basic text regions for the target database. Traditionally, such a problem was tackled as part of the layout analysis and was mostly based on visual clues for dividing (top-down) approaches. Some agglomerating (bottom-up) approaches started to consider textual information to link similar contents, but they required a proper over-segmentation of ne-grained units. In this work, we propose a new pragmatic approach whose eciency is demonstrated on 19 th century French Trade Directories. We propose to consider two sub-problems: coarse layout detection (text columns and reading order), which is assumed to be eective and not detailed here, and a ne-grained entry separation stage for which we propose to adapt a state-of-the-art Named Entity Recognition (NER) approach. By injecting special visual tokens, coding, for instance, indentation or breaks, into the token stream of the language model used for NER purpose, we can leverage both textual and visual knowledge simultaneously. Code, data, results and models are available at https://github.com/soduco/ paper-entryseg-icdar23-code, https://huggingface.co/HueyNemud/ (icdar23-entrydetector* variants). Numéro de notice : P2023-002 Affiliation des auteurs : UGE-LASTIG+Ext (2020- ) Thématique : GEOMATIQUE/INFORMATIQUE/TOPONYMIE Nature : Preprint nature-HAL : Préprint DOI : sans Date de publication en ligne : 17/02/2023 En ligne : https://hal.science/hal-03994702v1/ Format de la ressource électronique : URL Article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=102609 Modèles et outils pour la publication de métadonnées d'archives géographiques et de leurs données dérivées / Melvin Hersent (2023)
Titre : Modèles et outils pour la publication de métadonnées d'archives géographiques et de leurs données dérivées Type de document : Article/Communication Auteurs : Melvin Hersent, Auteur ; Nathalie Abadie , Auteur ; Bertrand Duménieu , Auteur ; Julien Perret , Auteur Editeur : Paris : HAL Année de publication : 2023 Projets : SODUCO / Perret, Julien Conférence : Humanistica 2023, 4e conférence de l'association francophone des humanités numériques 26/06/2023 28/06/2023 Genève Suisse OA Proceedings Importance : 7 p. Format : 21 x 30 cm Note générale : bibliographie Langues : Français (fre) Descripteur : [Vedettes matières IGN] Géomatique web
[Termes IGN] échange dynamique de données
[Termes IGN] interopérabilité sémantique
[Termes IGN] métadonnées
[Termes IGN] métadonnées géographiques
[Termes IGN] norme ISO
[Termes IGN] terminologieIndex. décimale : 37.50 Géomatique web Résumé : (auteur) L'interopérabilité des données dans un projet pluridisciplinaire est primordiale. Prenant l'exemple d'un projet de recherche en histoire spatiale, nous comparerons dans un premier temps les standards et vocabulaires à notre disposition pour décrire des données géographiques et des documents d'archives. Nous proposons ensuite un alignement entre les standards retenus : l'ISO 19115 et RiC-O. Enfin, nous proposons une architecture de microservices pour la saisie, le stockage, la publication sur le Web et l'interrogation unifiée des métadonnées de nos sources. Numéro de notice : C2023-005 Affiliation des auteurs : UGE-LASTIG+Ext (2020- ) Thématique : GEOMATIQUE Nature : Communication nature-HAL : ComAvecCL&ActesPubliésIntl DOI : sans En ligne : https://hal.science/hal-04110787 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=103274 GisGCN: a visual graph-based framework to match geographical areas through time / Margarita Khokhlova in ISPRS International journal of geo-information, vol 11 n° 2 (February 2022)
[article]
Titre : GisGCN: a visual graph-based framework to match geographical areas through time Type de document : Article/Communication Auteurs : Margarita Khokhlova , Auteur ; Nathalie Abadie , Auteur ; Valérie Gouet-Brunet , Auteur ; Liming Chen, Auteur Année de publication : 2022 Projets : Alegoria / Gouet-Brunet, Valérie Article en page(s) : n° 97 Note générale : bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Traitement d'image optique
[Termes IGN] attribut géomètrique
[Termes IGN] attribut sémantique
[Termes IGN] classification par réseau neuronal convolutif
[Termes IGN] données étiquetées d'entrainement
[Termes IGN] entité géographique
[Termes IGN] image aérienne
[Termes IGN] réseau sémantiqueRésumé : (auteur) Historical visual sources are particularly useful for reconstructing the successive states of the territory in the past and for analysing its evolution. However, finding visual sources covering a given area within a large mass of archives can be very difficult if they are poorly documented. In the case of aerial photographs, most of the time, this task is carried out by solely relying on the visual content of the images. Convolutional Neural Networks are capable to capture the visual cues of the images and match them to each other given a sufficient amount of training data. However, over time and across seasons, the natural and man-made landscapes may evolve, making historical image-based retrieval a challenging task. We want to approach this cross-time aerial indexing and retrieval problem from a different novel point of view: by using geometrical and topological properties of geographic entities of the researched zone encoded as graph representations which are more robust to appearance changes than the pure image-based ones. Geographic entities in the vertical aerial images are thought of as nodes in a graph, linked to each other by edges representing their spatial relationships. To build such graphs, we propose to use instances from topographic vector databases and state-of-the-art spatial analysis methods. We demonstrate how these geospatial graphs can be successfully matched across time by means of the learned graph embedding. Numéro de notice : A2022-156 Affiliation des auteurs : UGE-LASTIG+Ext (2020- ) Thématique : IMAGERIE Nature : Article nature-HAL : ArtAvecCL-RevueIntern DOI : 10.3390/ijgi11020097 Date de publication en ligne : 29/01/2022 En ligne : https://doi.org/10.3390/ijgi11020097 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=100316
in ISPRS International journal of geo-information > vol 11 n° 2 (February 2022) . - n° 97[article]Annotation sémantique pour la géolocalisation d'entités spatiales dans des tweets / Gaëtan Caillaut (2022)PermalinkPermalinkATONTE: towards a new methodology for seed ontology development from texts and experts / Helen Mair Rawsthorne (2022)PermalinkAutomated construction of a French Entity Linking dataset to geolocate social network posts in the context of natural disasters / Gaëtan Caillaut (2022)PermalinkA benchmark of named entity recognition approaches in historical documents : application to 19th century French directories / Nathalie Abadie (2022)PermalinkEnjeux et méthodes d’un liage de référentiels géographiques : l’exemple du projet de recherche ALEGORIA / Clara Lelièvre (2021)PermalinkLearning embeddings for cross-time geographic areas represented as graphs / Margarita Khokhlova (2021)PermalinkPermalinkExtraction de connaissances pour la description de l'environnement maritime côtier à partir de textes d'aide à la navigation / Léa Lamotte in Revue des Nouvelles Technologies de l'Information, E.36 (2020)PermalinkRecherche multimodale d'images aériennes multi-date à l'aide d'un réseau siamois / Margarita Khokhlova (2020)Permalink