Descripteur
Termes IGN > mathématiques > statistique mathématique > analyse de données > classification > classification par réseau neuronal
classification par réseau neuronalVoir aussi |
Documents disponibles dans cette catégorie (434)
Ajouter le résultat dans votre panier
Visionner les documents numériques
Affiner la recherche Interroger des sources externes
Etendre la recherche sur niveau(x) vers le bas
Correcting rural building annotations in OpenStreetMap using convolutional neural networks / John E. Vargas-Muñoz in ISPRS Journal of photogrammetry and remote sensing, vol 147 (January 2019)
[article]
Titre : Correcting rural building annotations in OpenStreetMap using convolutional neural networks Type de document : Article/Communication Auteurs : John E. Vargas-Muñoz, Auteur ; Sylvain Lobry, Auteur ; Alexandre X. Falcão, Auteur ; Devis Tuia, Auteur Année de publication : 2019 Article en page(s) : pp 283 - 293 Note générale : bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Géomatique web
[Termes IGN] bati
[Termes IGN] champ aléatoire de Markov
[Termes IGN] classification par réseau neuronal convolutif
[Termes IGN] correction géométrique
[Termes IGN] données localisées des bénévoles
[Termes IGN] habitat rural
[Termes IGN] mise à jour de base de données
[Termes IGN] OpenStreetMap
[Termes IGN] réseau neuronal convolutif
[Termes IGN] segmentation sémantique
[Termes IGN] Tanzanie
[Termes IGN] Zimbabwe
[Termes IGN] zone ruraleRésumé : (auteur) Rural building mapping is paramount to support demographic studies and plan actions in response to crisis that affect those areas. Rural building annotations exist in OpenStreetMap (OSM), but their quality and quantity are not sufficient for training models that can create accurate rural building maps. The problems with these annotations essentially fall into three categories: (i) most commonly, many annotations are geometrically misaligned with the updated imagery; (ii) some annotations do not correspond to buildings in the images (they are misannotations or the buildings have been destroyed); and (iii) some annotations are missing for buildings in the images (the buildings were never annotated or were built between subsequent image acquisitions). First, we propose a method based on Markov Random Field (MRF) to align the buildings with their annotations. The method maximizes the correlation between annotations and a building probability map while enforcing that nearby buildings have similar alignment vectors. Second, the annotations with no evidence in the building probability map are removed. Third, we present a method to detect non-annotated buildings with predefined shapes and add their annotation. The proposed methodology shows considerable improvement in accuracy of the OSM annotations for two regions of Tanzania and Zimbabwe, being more accurate than state-of-the-art baselines. Numéro de notice : A2019-038 Affiliation des auteurs : non IGN Thématique : GEOMATIQUE Nature : Article nature-HAL : ArtAvecCL-RevueIntern DOI : 10.1016/j.isprsjprs.2018.11.010 Date de publication en ligne : 06/12/2019 En ligne : https://doi.org/10.1016/j.isprsjprs.2018.11.010 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=91975
in ISPRS Journal of photogrammetry and remote sensing > vol 147 (January 2019) . - pp 283 - 293[article]Réservation
Réserver ce documentExemplaires(3)
Code-barres Cote Support Localisation Section Disponibilité 081-2019011 RAB Revue Centre de documentation En réserve L003 Disponible 081-2019013 DEP-EXM Revue LASTIG Dépôt en unité Exclu du prêt 081-2019012 DEP-EAF Revue Nancy Dépôt en unité Exclu du prêt Détection et localisation d'objets 3D par apprentissage profond en topologie capteur / Pierre Biasutti (2019)
Titre : Détection et localisation d'objets 3D par apprentissage profond en topologie capteur Type de document : Article/Communication Auteurs : Pierre Biasutti , Auteur ; Aurélie Bugeau, Auteur ; Jean-François Aujol, Auteur ; Mathieu Brédif , Auteur Editeur : Saint-Martin-d'Hères : Groupe de Recherche et d'Etude du Traitement du Signal et des Images GRETSI Année de publication : 2019 Projets : 1-Pas de projet / Conférence : GRETSI 2019, colloque du Groupe de Recherche et d'Etude du Traitement du Signal et des Images 26/08/2019 29/08/2019 Lille France OA proceedings Importance : 4 p. Format : 21 x 30 cm Note générale : Bibliographie
Ce travail a bénéficié d’une aide du programme de Recherche et Innovation European Union’s Horizon 2020 au titre de la bourse Marie Skłodowska-Curie (No 777826).Langues : Français (fre) Descripteur : [Vedettes matières IGN] Applications photogrammétriques
[Termes IGN] chaîne de traitement
[Termes IGN] classification par réseau neuronal convolutif
[Termes IGN] compréhension de l'image
[Termes IGN] détection d'objet
[Termes IGN] données lidar
[Termes IGN] données localisées 3D
[Termes IGN] fusion de données
[Termes IGN] image optique
[Termes IGN] scène 3D
[Termes IGN] semis de pointsRésumé : (Auteur) Ce travail présente une nouvelle méthode pour la détection et la localisation d'objets dans des scènes 3D LiDAR acquises par des systèmes de cartographie mobile. Ce problème est généralement traité en discrétisant l'espace 3D en une fine grille de voxels. Nous introduisons une approche alternative ne nécessitant pas de discrétisation. Elle est basée sur la représentation en 2D du nuage de points en topologie capteur (TC). Cette image sert d'entrée à un réseau de neurones convolutionnels qui en extrait les informations 3D des objets. La réprésentation en topologie capteur présentant des ambiguïtés dans le fond de la scène, nous améliorerons les résultats de détection en couplant ce modèle avec un réseau de détection 2D d'objets sur une image optique. Les prédictions des deux réseaux sont finalement fusionnées pour obtenir les détections finales. Numéro de notice : C2019-014 Affiliation des auteurs : LASTIG MATIS+Ext (2012-2019) Thématique : IMAGERIE Nature : Poster nature-HAL : Poster-avec-CL DOI : sans En ligne : https://hal.science/hal-02100719v1 Format de la ressource électronique : URL Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=93269 Documents numériques
en open access
Détection et localisation d'objets 3D... - pdf auteurAdobe Acrobat PDF Enhancing the predictability of least-squares collocation through the integration with least-squares-support vector machine / Hossam Talaat Elshambaky in Journal of applied geodesy, vol 13 n° 1 (January 2019)
[article]
Titre : Enhancing the predictability of least-squares collocation through the integration with least-squares-support vector machine Type de document : Article/Communication Auteurs : Hossam Talaat Elshambaky, Auteur Année de publication : 2019 Article en page(s) : pp 1 - 15 Note générale : Bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Statistiques
[Termes IGN] classification par réseau neuronal
[Termes IGN] classification par séparateurs à vaste marge
[Termes IGN] collocation par moindres carrés
[Termes IGN] covariance
[Termes IGN] Egypte
[Termes IGN] fonction de base radiale
[Termes IGN] géoïde localRésumé : (Auteur) Least-squares collocation (LSC) is a crucial mathematical tool for solving many geodetic problems. It has the capability to adjust, filter, and predict unknown quantities that affect many geodetic applications. Hence, this study aims to enhance the predictability property of LSC through applying soft computing techniques in the stage of describing the covariance function. Soft computing techniques include the support vector machine (SVM), least-squares-support vector machine (LS-SVM), and artificial neural network (ANN). A real geodetic case study is used to predict a national geoid from the EGM2008 global geoid model in Egypt. A comparison study between parametric and soft computing techniques was performed to assess the LSC predictability accuracy. We found that the predictability accuracy increased when using soft computing techniques in the range of 10.2 %–27.7 % and 8.2 %–29.8 % based on the mean square error and the mean error terms, respectively, compared with the parametric models. The LS-SVM achieved the highest accuracy among the soft computing techniques. In addition, we found that the integration between the LS-SVM with LSC exhibits an accuracy of 20 % and 25 % higher than using LS-SVM independently as a predicting tool, based on the mean square error and mean error terms, respectively. Consequently, the LS-SVM integrated with LSC is recommended for enhanced predictability in geodetic applications. Numéro de notice : A2019-132 Affiliation des auteurs : non IGN Thématique : MATHEMATIQUE/POSITIONNEMENT Nature : Article nature-HAL : ArtAvecCL-RevueIntern DOI : 10.1515/jag-2018-0017 Date de publication en ligne : 25/08/2018 En ligne : https://doi.org/10.1515/jag-2018-0017 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=92462
in Journal of applied geodesy > vol 13 n° 1 (January 2019) . - pp 1 - 15[article]
Titre : Ensemble methods for pedestrian detection in dense crowds Type de document : Thèse/HDR Auteurs : Jennifer Vandoni, Auteur ; Sylvie Le Hégarat-Mascle, Directeur de thèse Editeur : Paris-Orsay : Université de Paris 11 Paris-Sud Centre d'Orsay Année de publication : 2019 Importance : 182 p. Format : 21 x 30 cm Note générale : bibliographie
Thèse de Doctorat de l'Université Paris-Saclay, Sciences et technologies de l’information et de la communication (STIC), Spécialité : Traitement du Signal et des ImagesLangues : Anglais (eng) Descripteur : [Vedettes matières IGN] Traitement d'image optique
[Termes IGN] algorithme d'apprentissage
[Termes IGN] apprentissage dirigé
[Termes IGN] apprentissage profond
[Termes IGN] classification par réseau neuronal convolutif
[Termes IGN] classification par séparateurs à vaste marge
[Termes IGN] comportement
[Termes IGN] densité de population
[Termes IGN] détection de piéton
[Termes IGN] données multicapteurs
[Termes IGN] étalonnage
[Termes IGN] fusion de données
[Termes IGN] taxinomie
[Termes IGN] théorie de Dempster-ShaferIndex. décimale : THESE Thèses et HDR Résumé : (auteur) The interest surrounding the study of crowd phenomena spanned during the last decade across multiple fields, including computer vision, physics, sociology, simulation and visualization. There are different levels of granularity at which crowd studies can be performed, namely a finer microanalysis, aimed to detect and then track each pedestrian individually; and a coarser macro-analysis, aimed to model the crowd as a whole.
One of the most difficult challenges when working with human crowds is that usual pedestrian detection methodologies do not scale well to the case where only heads are visible, for a number of reasons such as absence of background, high visual homogeneity, small size of the objects, and heavy occlusions. For this reason, most micro-analysis studies by means of pedestrian detection and tracking methodologies are performed in low to medium-density crowds, whereas macro-analysis through density estimation and people counting is more suited in presence of high-density crowds, where the exact position of each individual is not necessary. Nevertheless, in order to analyze specific events involving high-density crowds for monitoring the flow and preventing disasters such as stampedes, a complete understanding of the scene must be reached. This study deals with pedestrian detection in high-density crowds from a monocamera system, striving to obtain localized detections of all the individuals which are part of an extremely dense crowd. The detections can be then used both to obtain robust density estimation, and to initialize a tracking algorithm. In presence of difficult problems such as our application, supervised learning techniques are well suited. However, two different questions arise, namely which classifier is the most adapted for the considered environment, and which data to use to learn from. We cast the detection problem as a Multiple Classifier System (MCS), composed by two different ensembles of classifiers, the first one based on SVM (SVM-ensemble) and the second one based on CNN (CNN-ensemble), combined relying on the Belief Function Theory (BFT) designing a fusion method which is able to exploit their strengths for pixel-wise classification. SVM-ensemble is composed by several SVM detectors based on different gradient, texture and orientation descriptors, able to tackle the problem from different perspectives. BFT allows us to take into account the imprecision in addition to the uncertainty value provided by each classifier, which we consider coming from possible errors in the calibration procedure and from pixel neighbor’s heterogeneity in the image space due to the close resolution of the target (head) and
descriptor respectively. However, scarcity of labeled data for specific dense crowd contexts reflects in the impossibility to easily obtain robust training and validation sets. By exploiting belief functions directly derived
from the classifiers’ combination, we therefore propose an evidential Query-by-Committee (QBC) active learning algorithm to automatically select the most informative training samples. On the other side, we explore deep learning techniques by casting the problem as a segmentation task in presence of soft labels, with a fully convolutional network architecture designed to recover small objects (heads) thanks to a tailored use of dilated convolutions. In order to obtain a pixel-wise measure of reliability about the network’s predictions, we create a CNN-ensemble by means of dropout at inference time, and we combine the different obtained realizations in the
context of BFT. To conclude, we show that the dense output map given by the MCS can be employed not only
for pedestrian detection at microscopic level, but also to perform macroscopic analysis, bridging the gap between the two levels of granularity. We therefore finally focus our attention to people counting, proposing an evaluation method that can be applied at every scale, resulting to be more precise in the error and uncertainty evaluation (disregarding possible compensations) as well as more useful for the modeling community that could use it to improve and validate local density estimation.Note de contenu : 1- Crowd understanding
2- Supervised learning and classifier combination
3- SVM descriptors for pedestrian detection in high-density crowds
4- Taking into account imprecision with Belief Function Framework
5- Evidential QBC Active Learning
6- CNNs for pedestrian detection in high-density crowds
7- CNN-ensemble and evidential Multiple Classifier System
8- Density Estimation
ConclusionNuméro de notice : 25704 Affiliation des auteurs : non IGN Thématique : IMAGERIE Nature : Thèse française Note de thèse : Thèse de Doctorat : Traitement du Signal et des Images : Paris 11 : 2019 Organisme de stage : Systèmes et applications des technologies de l'information et de l'énergie (Paris) nature-HAL : Thèse DOI : sans En ligne : https://theses.hal.science/tel-02318892/document Format de la ressource électronique : URL Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=94838 Estimation de profondeur à partir d'images monoculaires par apprentissage profond / Michel Moukari (2019)
Titre : Estimation de profondeur à partir d'images monoculaires par apprentissage profond Type de document : Thèse/HDR Auteurs : Michel Moukari, Auteur ; Frédéric Jurie, Directeur de thèse Editeur : Caen [France] : Université de Caen Normandie Année de publication : 2019 Importance : 182 p. Format : 21 x 30 cm Note générale : bibliographie
Thèse pour obtenir le diplôme de Doctorat, Spécialité Informatique, préparée au sein de l'Université Caen NormandieLangues : Français (fre) Descripteur : [Vedettes matières IGN] Intelligence artificielle
[Termes IGN] acuité stéréoscopique
[Termes IGN] analyse multiéchelle
[Termes IGN] apprentissage automatique
[Termes IGN] apprentissage profond
[Termes IGN] carte de profondeur
[Termes IGN] classification par réseau neuronal convolutif
[Termes IGN] compréhension de l'image
[Termes IGN] données lidar
[Termes IGN] image 3D
[Termes IGN] image RVB
[Termes IGN] incertitude des données
[Termes IGN] traitement d'image
[Termes IGN] vision monoculaire
[Termes IGN] vision par ordinateurIndex. décimale : THESE Thèses et HDR Résumé : (auteur) La vision par ordinateur est une branche de l'intelligence artificielle dont le but est de permettre à une machine d'analyser, de traiter et de comprendre le contenu d'images numériques. La compréhension de scène en particulier est un enjeu majeur en vision par ordinateur. Elle passe par une caractérisation à la fois sémantique et structurelle de l'image, permettant d'une part d'en décrire le contenu et, d'autre part, d'en comprendre la géométrie. Cependant tandis que l'espace réel est de nature tridimensionnelle, l'image qui le représente, elle, est bidimensionnelle. Une partie de l'information 3D est donc perdue lors du processus de formation de l'image et il est d'autant plus complexe de décrire la géométrie d'une scène à partir d'images 2D de celle-ci.Il existe plusieurs manières de retrouver l'information de profondeur perdue lors de la formation de l'image. Dans cette thèse nous nous intéressons à l’estimation d'une carte de profondeur étant donné une seule image de la scène. Dans ce cas, l'information de profondeur correspond, pour chaque pixel, à la distance entre la caméra et l'objet représenté en ce pixel. L'estimation automatique d'une carte de distances de la scène à partir d'une image est en effet une brique algorithmique critique dans de très nombreux domaines, en particulier celui des véhicules autonomes (détection d’obstacles, aide à la navigation).Bien que le problème de l'estimation de profondeur à partir d'une seule image soit un problème difficile et intrinsèquement mal posé, nous savons que l'Homme peut apprécier les distances avec un seul œil. Cette capacité n'est pas innée mais acquise et elle est possible en grande partie grâce à l'identification d'indices reflétant la connaissance a priori des objets qui nous entourent. Par ailleurs, nous savons que des algorithmes d'apprentissage peuvent extraire ces indices directement depuis des images. Nous nous intéressons en particulier aux méthodes d’apprentissage statistique basées sur des réseaux de neurones profond qui ont récemment permis des percées majeures dans de nombreux domaines et nous étudions le cas de l'estimation de profondeur monoculaire. Note de contenu : 1- Introduction
2- État de l’art
3- Influence des hyperparamètres
4- Analyse multi-échelle
5- Évaluation de l’incertitude prédictive
6- Complétion de profondeur et estimation de confiance
7- Conclusions et perspectivesNuméro de notice : 25834 Affiliation des auteurs : non IGN Thématique : IMAGERIE/INFORMATIQUE Nature : Thèse française Note de thèse : Thèse de Doctorat : Informatique : Caen-Normandie : 2019 nature-HAL : Thèse DOI : sans En ligne : https://theses.hal.science/tel-02426260/document Format de la ressource électronique : URL Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=95172 PermalinkJoint analysis of SAR and optical satellite images time series for grassland event detection / Anatol Garioud (2019)PermalinkPermalinkTime-space tradeoff in deep learning models for crop classification on satellite multi-spectral image time series / Vivien Sainte Fare Garnot (2019)PermalinkTowards visual urban scene understanding for autonomous vehicle path tracking using GPS positioning data / Citlalli Gamez Serna (2019)PermalinkVision-based localization with discriminative features from heterogeneous visual data / Nathan Piasco (2019)PermalinkRemote sensing scene classification using multilayer stacked covariance pooling / Nanjun He in IEEE Transactions on geoscience and remote sensing, vol 56 n° 12 (December 2018)PermalinkScene classification based on multiscale convolutional neural network / Yanfei Liu in IEEE Transactions on geoscience and remote sensing, vol 56 n° 12 (December 2018)PermalinkA new deep convolutional neural network for fast hyperspectral image classification / Mercedes Eugenia Paoletti in ISPRS Journal of photogrammetry and remote sensing, vol 145 - part A (November 2018)PermalinkPan-sharpening via deep metric learning / Yinghui Xing in ISPRS Journal of photogrammetry and remote sensing, vol 145 - part A (November 2018)Permalink