Descripteur
Termes IGN > sciences humaines et sociales > linguistique > corpus
corpusSynonyme(s)données textuellesVoir aussi |
Documents disponibles dans cette catégorie (33)
Ajouter le résultat dans votre panier
Visionner les documents numériques
Affiner la recherche Interroger des sources externes
Etendre la recherche sur niveau(x) vers le bas
Evaluation of NER systems for the recognition of place mentions in French thematic corpora / Carmen Brando (2016)
Titre : Evaluation of NER systems for the recognition of place mentions in French thematic corpora Type de document : Article/Communication Auteurs : Carmen Brando , Auteur ; Catherine Dominguès , Auteur ; Magali Capeyron, Auteur Editeur : New York [Etats-Unis] : Association for computing machinery ACM Année de publication : 2016 Projets : 2-Pas d'info accessible - article non ouvert / Conférence : GIR 2016, 10th Workshop on Geographic Information Retrieval 31/10/2016 31/10/2016 San Francisco Californie - Etats-Unis Proceedings ACM Note générale : bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Géomatique
[Termes IGN] analyse comparative
[Termes IGN] analyse du discours
[Termes IGN] corpus
[Termes IGN] état de l'art
[Termes IGN] toponyme
[Termes IGN] traitement du langage naturelMots-clés libres : Named-entity recognition NER Reconnaissance d'entités nommées Résumé : (auteur) Ongoing initiatives promoted by cultural institutions and public administrations engage in the development of textual corpora issued from the general public. In this work, we deal with a spoken corpus of life stories and a crowd-sourced Web corpus of people's contributions related to urban planning issues in their city. Located information constitutes an essential component in these corpora. Toponyms refer to official names (e.g. Congo) which are listed in gazetteers but often to generic locations such as un endroit très beau (a beautiful place). Because of the nature of the corpora, these generic locations are inherently subjective, vague and descriptive. For enabling automated exploitation of these texts, it is crucial to properly detect such kinds of place mentions. In this sense, the present work provides a comparative study of state-of-art NER systems, most importantly of supervised tools such as Stanford NER, for the identification of generic locations in thematic corpora. Numéro de notice : C2016-021 Affiliation des auteurs : LASTIG COGIT+Ext (2012-2019) Thématique : GEOMATIQUE Nature : Communication nature-HAL : ComAvecCL&ActesPubliésIntl DOI : 10.1145/3003464.3003471 Date de publication en ligne : 31/10/2016 En ligne : http://dx.doi.org/10.1145/3003464.3003471 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=84620 Le Grand Paris écologique, endroit très beau : reconnaissance des noms de lieu dans des corpus thématiques français, présenté lors de l'atelier EXtraction de Connaissances à partir de donnEes Spatialisées de SAGEO 2016 / Carmen Brando (2016)
Titre : Influence de l'émotion dans la description d'un lieu Type de document : Mémoire Auteurs : Aglaée Philippi, Auteur ; Catherine Dominguès , Encadrant ; Anne Lacheret-Dujour, Encadrant Editeur : Toulouse : Université de Toulouse 2 Jean Jaurès Année de publication : 2016 Importance : 64 p. Note générale : bibliographie
Rapport de Stage en vue de l’obtention du titre de Master 2 professionnel Ergonomie Cognitive et Ingénierie Linguistique de l’Université Toulouse Jean-JaurèsLangues : Français (fre) Descripteur : [Vedettes matières IGN] Linguistique
[Termes IGN] analyse de données
[Termes IGN] corpus
[Termes IGN] transcriptionMots-clés libres : Analyse lexicale Analyse prosodique Résumé : (auteur) Ce stage a pour but de vérifier s’il existe une corrélation entre l’état émotionnel d’une personne et la description qu’elle fait de sa localisation dans un contexte particulier d’appel aux secours en montagne. Il s’agit d’une étude exploratoire sur des données naturelles orales. Nos hypothèses selon lesquelles, il existe des indices, lexicaux, syntaxiques et prosodiques pour repérer des émotions et que la formulation d’une information de localisation varie sous le coup d’une émotion, nous amènent vers une exploration des données selon deux points de vue :
- La prosodie afin de décrire des émotions suivant les contours prosodiques du signal de parole ;
- Et le lexique afin de repérer les expressions de localisation.
Notre travail comporte 3 parties essentielles : la transcription des données orales, l’annotation lexicale des expressions de lieux et expressions spatio-temporelles et également des marqueurs lexicaux d’émotions et enfin à l’annotation de certains contours prosodiques. // This internship aims at verifying if there is a correlation between the emotional state of a person and the description they make of their localisation in a particular context of a call to the mountain rescue services. It is an exploratory study on oral natural data. Our hypotheses, which state that there are lexical, syntactic and prosodic indications to spot feelings and that the formulation of location information varies under the blow of an emotion, bring us towards an exploration of the data according two points of view:
− The prosody, in order to describe feelings following the prosodic outlines of the signal of speech ;
− And the lexicon to spot the expressions of localisation.
Our work contains 3 essential parts: the transcription of the oral data, the lexical annotation of the expressions of places and the spatiotemporal expressions and also the lexical markers of feelings and finally has the annotation of certain prosodic outlines.Note de contenu : Introduction
1. Le contexte et les acteurs de terrain
1.1 L’IGN
1.2 Les appels au secours (en montagne)
1.3 Les acteurs du secours en montagne : les PGHM
1.4 L’échange lors de l’appel au secours (pour les PGHM)
1.5 Les sources d’informations à disposition des secouristes du PGHM
2. Reformulation de la demande
3. Démarche mise en place
4. Présentation des données
5. Préparation de la ressource
5.1 La transcription orthographique – Transcriber
5.2 Conversion vers Praat
5.3 Utilisation de l’extension EasyAlign de Praat
5.4 Annotation prosodique automatique sur ANALOR
5.5 Mise en place d’un balisage XML et stylisation XSLT d’un tableau
6. Analyse de la ressource
6.1 Analyse lexicale
6.2 Analyse prosodique
ConclusionNuméro de notice : 10995 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE Nature : Mémoire masters divers Organisme de stage : COGIT (IGN) Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=102276 Documents numériques
peut être téléchargé
Rapport Stage_Philippi - pdf auteurAdobe Acrobat PDF
Titre : Linked data quality for domain-specific named-entity linking Type de document : Article/Communication Auteurs : Carmen Brando , Auteur ; Nathalie Abadie , Auteur ; Francesca Frontini, Auteur Editeur : Association internationale francophone Extraction et Gestion des Connaissances Année de publication : 2016 Conférence : EGC 2016, 16e conférence internationale francophone Extraction et Gestion des Connaissances 18/01/2016 22/01/2016 Reims France programme sans actes, EGC 2016, Atelier QLOD Qualité des Données du Web 19/01/2016 19/01/2016 Reims France programme sans actes Importance : pp 13 - 24 Note générale : bibliographie
présenté lors de l'atelier "Qualité des Données du Web" (QLOD)Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Géomatique web
[Termes IGN] base de connaissances
[Termes IGN] corpus
[Termes IGN] prise en compte du contexte
[Termes IGN] traitement du langage naturel
[Termes IGN] Uniform Resource Identifier
[Termes IGN] web des donnéesRésumé : (auteur) We present outgoing research whose goal is to assess quality of Linked Data for its usage in domain-specific Named-entity Linking (NEL). NEL is the task of assigning appropriate referents, typically an Uniform Resource Identifier (URI), to mentions of entities (e.g. persons or places) identified in textual documents. Nowadays, many of these approaches strongly rely on Linked Data as knowledge base. However, the scope of the chosen data sets can have an important influence on the performances of NEL as texts often concern specific domains of knowledge. In this paper, we describe LD quality aspects which should be considered for improving NEL in domain-specific contexts, then propose quality metrics and compute them for both French DBpedia and the French National Library (BnF) data sets thereby to discuss the opportunity of using these data sets for the linking of authors in old French Literary digital editions. Our ultimate goal is to improve a Natural Language Processing (NLP) pipeline for the automatic annotation of these texts. Numéro de notice : C2016-022 Affiliation des auteurs : LASTIG COGIT+Ext (2012-2019) Thématique : GEOMATIQUE Nature : Communication nature-HAL : ComAvecCL&ActesPubliésNat DOI : sans Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=84621 Documents numériques
en open access
Linked Data QualityAdobe Acrobat PDF Localisation d’une victime dans un contexte de secours en montagne, présenté à l'Atelier Traitement automatique de la parole non standard (TALPA) / Aglaée Philippi (2016)
Titre : Localisation d’une victime dans un contexte de secours en montagne, présenté à l'Atelier Traitement automatique de la parole non standard (TALPA) Type de document : Article/Communication Auteurs : Aglaée Philippi, Auteur ; Charlotte Kouklia, Auteur ; Catherine Dominguès , Auteur ; Anne Lacheret-Dujour, Auteur Editeur : Paris : Association pour le traitement automatique des langues, Atala Année de publication : 2016 Conférence : TALN 2016, 23e Conférence Traitement Automatique des Langues Naturelles 04/07/2016 08/07/2016 Paris France OA Proceedings Importance : pp 4 - 6 Format : 21 x 30 cm Note générale : bibliographie Langues : Français (fre) Descripteur : [Termes IGN] corpus
[Termes IGN] géolocalisation
[Termes IGN] montagne
[Termes IGN] reconnaissance de la parole
[Termes IGN] secours d'urgence
[Termes IGN] traitement du langage naturelRésumé : (auteur) Plus de 15 000 demandes de secours en montagne sont recensées annuellement en France, en particulier auprès des Pelotons de Gendarmerie de Haute Montagne (PGHM) qui en sont les principaux acteurs. La localisation rapide de la victime constitue une étape cruciale. En effet, la victime peut être en danger, les fenêtres météorologiques favorables à une intervention aérienne sont parfois courtes, d’autres demandes de secours peuvent être en attente. D’autre part, les moyens engagés pour les interventions sont coûteux. Ainsi, l’enjeu est d’améliorer le temps de traitement d’une alerte pour une prise en charge des victimes plus rapide et efficace. Numéro de notice : C2016-059 Affiliation des auteurs : LASTIG COGIT+Ext (2012-2019) Thématique : GEOMATIQUE Nature : Communication nature-HAL : ComAvecCL&ActesPubliésNat DOI : sans En ligne : https://jep-taln2016.limsi.fr/actes/index.php?lang=fr Format de la ressource électronique : URL sommaire Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=91915 Documents numériques
en open access
Localisation d’une victime... - pdf auteurAdobe Acrobat PDF Toponym recognition in custom-made map titles / Catherine Dominguès in International journal of cartography, vol 1 n° 1 (August 2015)PermalinkAccuracy and privacy aspects in free online reverse geocoding services / Ourania Kounadi in Cartography and Geographic Information Science, vol 40 n° 2 (March 2013)PermalinkExtractions de règles concernant les bâtiments d'un corpus de plans locaux d'urbanisme / Leidiana Da Silva Martins (2012)PermalinkUne fiche descriptive pour l'analyse des relations sémantiques entre textes et cartes / Geoffrey Brun (2012)PermalinkExploiting geographic references of documents in a geographical information retrieval system using an ontology-based index / N. Brisaboa in Geoinformatica, vol 14 n° 3 (July 2010)PermalinkPermalinkAccès aux services et aux données / Bénédicte Bucher in Bulletin d'information scientifique et technique de l'IGN, n° 76 (décembre 2008)PermalinkFonctions d'agrégation pour l'analyse en ligne (OLAP) de données textuelles / Guy Pujolle in Ingénierie des systèmes d'information, ISI : Revue des sciences et technologies de l'information, RSTI, vol 13 n° 6 (novembre - décembre 2008)PermalinkTraitements sémantiques pour l'information géographique, textes et cartes / P. Enjalbert in Revue internationale de géomatique, vol 16 n° 2 (juin – août 2006)PermalinkSdC 2006, Semaine de la connaissance, 26 - 30 juin 2006, Nantes, France, Volume 1. IC 2006, 17es Journées francophones d'ingénierie des connaissances / Mounira Harzallah (2006)Permalink