Détail de l'auteur
Auteur Virginie Picard |
Documents disponibles écrits par cet auteur (1)
Ajouter le résultat dans votre panier
Visionner les documents numériques
Affiner la recherche Interroger des sources externes
Instanciation automatique des liens entre ontologies et schémas des bases de données géographiques à partir des spécifications en langage naturel / Virginie Picard (2007)
Titre : Instanciation automatique des liens entre ontologies et schémas des bases de données géographiques à partir des spécifications en langage naturel Type de document : Mémoire Auteurs : Virginie Picard, Auteur Editeur : Nanterre : Université de Paris 10 Nanterre Année de publication : 2007 Importance : 75 p. Format : 21 x 30 cm Note générale : Rapport de stage de fin d’études, Master 2 DEFI – Documents Electroniques et Flux d’Information Langues : Français (fre) Descripteur : [Vedettes matières IGN] Bases de données localisées
[Termes IGN] appariement de modèles conceptuels de données
[Termes IGN] ontologie
[Termes IGN] spécification de contenu
[Termes IGN] traitement du langage naturelRésumé : (auteur) L’Institut Géographique National produit, pour une même zone géographique, des bases de données dotées de niveaux de détails différents, et destinées à des applications différentes. Or, l’indépendance de ces bases de données géographiques pose différents problèmes: - répétition des opérations de mise à jour, - manque de cohérence entre les différentes BDG, - impossibilité de faire des analyses multi-niveaux. Ces différents inconvénients de l’indépendance des bases de données géographiques montrent l’utilité d’intégrer ces bases afin de constituer un ensemble de données structuré et cohérent. Les différents travaux de recherche effectués sur ce thème, ont permis de mettre en évidence le rôle fondamental des spécifications de saisie des bases de données géographiques, ainsi que celui des ontologies, dans le processus d’intégration de ces bases. En effet, les spécifications décrivent la sémantique du contenu de la base à travers le processus d'acquisition des données. Elles constituent donc une source de connaissances indispensable pour l'intégration des bases de données géographiques. Dans sa thèse, Nils Gesbert propose un langage formel pour la représentation des spécifications. Il vise à permettre l'appariement des schémas des différentes bases, à l'aide des spécifications ainsi représentées. L'ensemble des règles de sélection, de découpage, d'agrégation et d'instanciation d'un type d’entité géographique donné, au sein des bases de données géographiques, énoncées dans ce langage formel, est appelé "procédure de représentation".
L’objectif de ce stage est de créer une application permettant l’automatisation de la rédaction de ces procédures de représentation à partir des spécifications de la base de données topographique BDTopo® produite par l’IGN et à partir d’une ontologie du domaine obtenue par l’application créée lors du stage de Laurens Frédéric. Dans un premier temps, nous avons extrait tous les concepts géographiques présents dans l’ontologie du domaine, puis nous avons recherché leurs occurrences dans le texte des spécifications de la BDTopo® et extrait les noms des classes qui les représentaient. Lors de la recherche de leur occurrence, quatre grands traitements ont été mis en place : la tokénisation des spécifications de la BDTopo® en tokens (unités simples), la lemmatisation de ceux de ces tokens qui étaient au pluriel afin de les obtenir au singulier, l’analyse syntaxique des mots entourant l’occurrence du concept recherché pour vérifier s’il s’agit bien d’un nom, et enfin la recherche de termes indiquant l’exclusion du concept géographique de la classe où son occurrence est présente (c’est l’exclusion d’appartenance à la classe). Dans un deuxième temps, dès lors que de nombreux concepts frères issus de l’ontologie du domaine apparaissent dans la fiche descriptive d’une même classe, nous avons créé, pour leur plus petit généralisant commun, une procédure de représentation décrivant les règles de sélection, d’agrégation, de découpage et d’instanciation de ce concept et de ses concepts fils au sein de la base. Ces procédures de représentation sont des fichiers xml qui contiennent des données extraites des spécifications de la BDTopo® selon le langage formel de Gesbert Nils et dont leur syntaxe est inspirée de la grammaire BNF (Backus-Naur Form). L’extraction de ces données pertinentes pour ces procédures est obtenue à l’aide de patrons génériques composés d’expressions régulières.Note de contenu : Introduction
Ch 1 - Présentation du lieu du stage
1-1 L’Institut Géographique National (IGN)
1-2 Le laboratoire Cogit
1-3 L’action de recherche BDMUL
Ch 2 - Contexte du stage
2-1 Notions de base du domaine de l’information géographique
2-2 Travaux antérieurs
2-3 Définition du sujet et objectif du stage
Ch 3 - Les réalisations
3-1 Conversion du fichier html contenant les spécifications de la BDTopo® en fichier structuré xml
3-2 Recherche des concepts géographiques dans le texte des spécifications de la BDTopo® et extraction des classes de la base correspondantes
3-3 Automatisation des procédures de représentation
ConclusionNuméro de notice : 17485 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE Nature : Mémoire masters divers Organisme de stage : COGIT (IGN) Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=89737