Détail de l'auteur
Auteur Umashanthi Pavalanathan |
Documents disponibles écrits par cet auteur (1)
Ajouter le résultat dans votre panier
Visionner les documents numériques
Affiner la recherche Interroger des sources externes
Titre : Confounds and Consequences in Geotagged Twitter Data Type de document : Article/Communication Auteurs : Umashanthi Pavalanathan, Auteur ; Jacob Eisenstein, Auteur Editeur : Ithaca [New York - Etats-Unis] : ArXiv - Université Cornell Année de publication : 7/06/2015 Importance : 10 p. Format : 21 x 30 cm Note générale : bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Géomatique web
[Termes IGN] données issues des réseaux sociaux
[Termes IGN] erreur systématique
[Termes IGN] géobalise
[Termes IGN] traitement du langage naturelRésumé : (auteur) Twitter is often used in quantitative studies that identify geographically-preferred topics, writing styles, and entities. These studies rely on either GPS coordinates attached to individual messages, or on the user-supplied location field in each profile. In this paper, we compare these data acquisition techniques and quantify the biases that they introduce; we also measure their effects on linguistic analysis and text-based geolocation. GPS-tagging and self-reported locations yield measurably different corpora, and these linguistic differences are partially attributable to differences in dataset composition by age and gender. Using a latent variable model to induce age and gender, we show how these demographic variables interact with geography to affect language use. We also show that the accuracy of text-based geolocation varies with population demographics, giving the best results for men above the age of 40. Numéro de notice : P2015-001 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE Nature : Preprint nature-HAL : Préprint DOI : 10.48550/arXiv.1506.02275 En ligne : https://doi.org/10.48550/arXiv.1506.02275 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=79901 Documents numériques
en open access
Confounds and Consequences in Geotagged Twitter DataAdobe Acrobat PDF