Descripteur
Termes descripteurs IGN > informatique > base de données > base de données relationnelles > jointure
jointureVoir aussi |



Etendre la recherche sur niveau(x) vers le bas
Combined geo-social search : computing top-k join queries over incomplete information / Yaron Kanza in Geoinformatica [en ligne], vol 22 n° 3 (July 2018)
![]()
[article]
Titre : Combined geo-social search : computing top-k join queries over incomplete information Type de document : Article/Communication Auteurs : Yaron Kanza, Auteur ; Mirit Shalem, Auteur Année de publication : 2018 Article en page(s) : pp 615 - 660 Note générale : Bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Bases de données localisées
[Termes descripteurs IGN] approximation
[Termes descripteurs IGN] données localisées
[Termes descripteurs IGN] jointure
[Termes descripteurs IGN] requête spatiale
[Termes descripteurs IGN] réseau socialRésumé : (Auteur) Geo-social data sets, which fuse the social and the geospatial facets of data, are vibrant data sources that associate people and activities with locations. In a combined geo-social search, several search queries are posed over geospatial and social data sources, or over data sources with both geospatial and social facets; and the search results, provided as ranked lists of items, are integrated by associating matching items, yielding combinations. Each combination has a score which is a function of the scores of the items it comprises, and the goal is to compute the k combinations with the highest score, that is, the top-k combinations. However, since geo-social data sources are heterogeneous, data items may not have matching items in all the ranked lists. Such items cannot be included in complete combinations. Hence, we study the approach where combinations are padded by nulls for missing items, as in outer-join. A combination is maximal if it cannot be extended by replacing a null by an item. We show that if some of the top-k maximal combinations contain null values, the computation requires reading entire lists, and hence, traditional top-k algorithms and optimization techniques are not as effective as in the case of an ordinary top-k join. Thus, we present two novel algorithms for computing the top-k maximal combinations. One novel algorithm is instance optimal over the class of algorithms that compute a ??approximation to the answer. The second algorithm is more efficient than the modification of two common top-k algorithms to compute maximal combinations. We show this analytically, and experimentally over real and synthetic data. Numéro de notice : A2018-370 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE Nature : Article nature-HAL : ArtAvecCL-RevueIntern DOI : 10.1007/s10707-017-0297-y date de publication en ligne : 25/03/2017 En ligne : https://doi.org/10.1007/s10707-017-0297-y Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=90762
in Geoinformatica [en ligne] > vol 22 n° 3 (July 2018) . - pp 615 - 660[article]
Titre : Fouille de données spatiales : un problème de fouille de données multi-tables Type de document : Thèse/HDR Auteurs : Nadjim Chelghoum, Auteur ; Karine Zeitouni, Directeur de thèse Editeur : Versailles : Université de Versailles Saint-Quentin-en-Yvelines Année de publication : 2004 Importance : 143 p. Format : 21 x 30 cm Note générale : bibliographie Langues : Français (fre) Descripteur : [Vedettes matières IGN] Bases de données localisées
[Termes descripteurs IGN] arbre de décision
[Termes descripteurs IGN] base de données localisées
[Termes descripteurs IGN] état de l'art
[Termes descripteurs IGN] exploration de données géographiques
[Termes descripteurs IGN] jointure
[Termes descripteurs IGN] relation spatialeIndex. décimale : THESE Thèses et HDR Résumé : (auteur) La fouille de données spatiales nécessite l'analyse des interactions dans l'espace. Ces interactions peuvent être matérialisées dans des tables de distances, ramenant ainsi la fouille de données spatiales à l'analyse multi-tables. Or, les méthodes de fouilles de données traditionnelles considèrent une seule table en entrée où chaque tuple est une observation à analyser. De simples jointures entre ces tables ne résout pas le problème et fausse les résultats en raison du comptage multiple des observations. Nous proposons quatre alternatives de fouille de données multi-tables dans le cadre de la fouille des données spatiales. La première consiste à interroger à la volée les différentes tables et modifie en dur les algorithmes existants. La seconde est une optimisation de la première qui pré-calcule les jointures et adapte les algorithmes existants. La troisième réorganise les données dans une table unique en utilisant l'opérateur proposé CROISEMENT et applique ensuite un algorithme standard sans modification. L'idée ici est de compléter - et non de joindre- la table d'analyse par les données présentes dans les autres tables,. La quatrième alternative transforme les données en prédicats exprimés en logique de premier ordre et applique un algorithme de la programmation logique inductive. Cette thèse présente ces quatre alternatives. Elle décrit leur implémentation pour la classification supervisée et compare leur performance. Numéro de notice : 17220 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE/INFORMATIQUE Nature : Thèse française Note de thèse : thèse : Informatique : Versailles : 2004 Organisme de stage : Laboratoire Prism DOI : sans Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=81613 Réservation
Réserver ce documentExemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité 17220-01 THESE Livre Centre de documentation Thèses Disponible