Détail de l'auteur
Auteur Morteza Karimzadeh |
Documents disponibles écrits par cet auteur (1)
Ajouter le résultat dans votre panier Affiner la recherche Interroger des sources externes
GeoTxt: A scalable geoparsing system for unstructured text geolocation / Morteza Karimzadeh in Transactions in GIS, vol 23 n° 1 (February 2019)
[article]
Titre : GeoTxt: A scalable geoparsing system for unstructured text geolocation Type de document : Article/Communication Auteurs : Morteza Karimzadeh, Auteur ; Scott Pezanowski, Auteur ; Alan M. MacEachren, Auteur ; Jan Oliver Wallgrün, Auteur Année de publication : 2019 Article en page(s) : pp 118 - 136 Note générale : bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Informatique
[Termes IGN] analyse syntaxique
[Termes IGN] appariement de données localisées
[Termes IGN] corpus
[Termes IGN] données issues des réseaux sociaux
[Termes IGN] interface de programmation
[Termes IGN] méthode heuristique
[Termes IGN] reconnaissance de noms
[Termes IGN] répertoire toponymique
[Termes IGN] réseau sémantique
[Termes IGN] segmentation sémantique
[Termes IGN] toponyme
[Termes IGN] traitement du langage naturelRésumé : (auteur) In this article, we present GeoTxt, a scalable geoparsing system for the recognition and geolocation of place names in unstructured text. GeoTxt offers six named entity recognition (NER) algorithms for place name recognition, and utilizes an enterprise search engine for the indexing, ranking, and retrieval of toponyms, enabling scalable geoparsing for streaming text. GeoTxt offers a flexible application programming interface (API), allowing for customized attribute and/or spatial ranking of retrieved toponyms. We evaluate the system on a corpus of manually geo‐annotated tweets. First, we benchmark the performance of the six NERs that GeoTxt provides access to. Second, we assess GeoTxt toponym resolution accuracy incrementally, demonstrating improvements in toponym resolution achieved (or not achieved) by adding specific heuristics and disambiguation methods. Compared to using the GeoNames web service, GeoTxt's toponym resolution demonstrates a 20% accuracy gain. Our results show that places mentioned in the same tweet do not tend to be geographically proximate. Numéro de notice : A2019-091 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE Nature : Article nature-HAL : ArtAvecCL-RevueIntern DOI : 10.1111/tgis.12510 Date de publication en ligne : 16/01/2019 En ligne : https://doi.org/10.1111/tgis.12510 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=92238
in Transactions in GIS > vol 23 n° 1 (February 2019) . - pp 118 - 136[article]