Descripteur
Documents disponibles dans cette catégorie (18)
Ajouter le résultat dans votre panier
Visionner les documents numériques
Affiner la recherche Interroger des sources externes
Etendre la recherche sur niveau(x) vers le bas
Titre : Cross-year multi-modal image retrieval using siamese networks Type de document : Article/Communication Auteurs : Margarita Khokhlova , Auteur ; Valérie Gouet-Brunet , Auteur ; Nathalie Abadie , Auteur ; Liming Chen, Auteur Editeur : New York : Institute of Electrical and Electronics Engineers IEEE Année de publication : 2020 Projets : Alegoria / Gouet-Brunet, Valérie Conférence : ICIP 2020, 27th IEEE International Conference on Image Processing 25/10/2020 28/10/2020 Abou Dhabi Emirats Arabes Unis Proceedings IEEE Importance : pp 2361 - 2365 Format : 21 x 30 cm Note générale : bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Traitement d'image optique
[Termes IGN] apprentissage profond
[Termes IGN] classification par réseau neuronal convolutif
[Termes IGN] descripteur
[Termes IGN] recherche d'image basée sur le contenu
[Termes IGN] réseau neuronal siamois
[Termes IGN] segmentation sémantiqueRésumé : (auteur) This paper introduces a multi-modal network that learns to retrieve by content vertical aerial images of French urban and rural territories taken about 15 years apart. This means it should be invariant against a big range of changes as the (nat-ural) landscape evolves over time. It leverages the original images and semantically segmented and labeled regions. The core of the method is a Siamese network that learns to extract features from corresponding image pairs across time. These descriptors are discriminative enough, such that a simple kNN classifier on top, suffices as final geo-matching criteria. The method outperformed SOTA "off-the-shelf" image descrip-tors GEM and ResNet50 on the new aerial images dataset. Numéro de notice : C2020-015 Affiliation des auteurs : UGE-LASTIG+Ext (2020- ) Autre URL associée : vers HAL Thématique : IMAGERIE/INFORMATIQUE Nature : Communication nature-HAL : ComAvecCL&ActesPubliésIntl DOI : 10.1109/ICIP40778.2020.9190662 Date de publication en ligne : 01/10/2020 En ligne : https://doi.org/10.1109/ICIP40778.2020.9190662 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=95684 Recherche multimodale d'images aériennes multi-date à l'aide d'un réseau siamois / Margarita Khokhlova (2020)
Titre : Recherche multimodale d'images aériennes multi-date à l'aide d'un réseau siamois Type de document : Article/Communication Auteurs : Margarita Khokhlova , Auteur ; Valérie Gouet-Brunet , Auteur ; Nathalie Abadie , Auteur ; Liming Chen, Auteur Editeur : Vannes : Université de Bretagne Sud Année de publication : 2020 Projets : Alegoria / Gouet-Brunet, Valérie Conférence : RFIAP 2020, Reconnaissance des Formes, Image, Apprentissage et Perception 23/06/2020 26/06/2020 Vannes France Open Access Proceedings Importance : 11 p. Format : 21 x 30 cm Note générale : bibliographie Langues : Français (fre) Descripteur : [Vedettes matières IGN] Traitement d'image optique
[Termes IGN] analyse du paysage
[Termes IGN] appariement d'images
[Termes IGN] architecture de réseau
[Termes IGN] BD ortho
[Termes IGN] BD Topo
[Termes IGN] classification barycentrique
[Termes IGN] classification par réseau neuronal convolutif
[Termes IGN] détection de changement
[Termes IGN] données multitemporelles
[Termes IGN] géolocalisation
[Termes IGN] image aérienne
[Termes IGN] image multitemporelle
[Termes IGN] recherche d'image basée sur le contenu
[Termes IGN] réseau neuronal siamois
[Termes IGN] segmentation sémantiqueRésumé : (auteur) Cet article présente un réseau multimodal qui met en correspondance des images aériennes de territoires urbains et ruraux français prises à environ 15 ans d'intervalle. Il devrait être invariant à un large éventail de changements, tels que l'évolution du paysage au fil des années. Il exploite les images originales et les régions sémantiquement segmentées et étiquetées. Le coeur de la méthode est un réseau siamois qui apprend à extraire des caractéristiques des paires d'images correspondantes dans le temps et des paires non correspondantes. Ces descripteurs sont suffisamment discriminants pour qu'un simple classifieur k-NN suffise comme critère de géo-correspondance final. Dans cet article, nous dé-montrons que notre descripteur siamois surpasse les autres descripteurs d'images en termes de recherche d'images par contenu à travers le temps. Numéro de notice : C2020-003 Affiliation des auteurs : UGE-LASTIG+Ext (2020- ) Thématique : IMAGERIE Nature : Communication nature-HAL : ComAvecCL&ActesPubliésNat DOI : sans En ligne : https://cap-rfiap2020.sciencesconf.org/data/RFIAP_2020_paper_21.pdf Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=95446 Voir aussiDocuments numériques
en open access
rfiap2020_21_cameraready.pdfAdobe Acrobat PDF
Titre : Visual object tracking with deep neural networks Type de document : Monographie Auteurs : Pier Luigi Mazzeo, Éditeur scientifique ; Srinivasan Ramakrishnan, Éditeur scientifique ; Paolo Spagnolo, Éditeur scientifique Editeur : London [UK] : IntechOpen Année de publication : 2019 Importance : 206 p. Format : 16 x 24 cm ISBN/ISSN/EAN : 978-1-78985-142-7 Note générale : bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Applications de télédétection
[Termes IGN] apprentissage automatique
[Termes IGN] apprentissage profond
[Termes IGN] détection d'objet
[Termes IGN] image captée par drone
[Termes IGN] poursuite de cible
[Termes IGN] réseau neuronal artificiel
[Termes IGN] réseau neuronal siamois
[Termes IGN] segmentation sémantique
[Termes IGN] SIFT (algorithme)Résumé : (éditeur) Visual object tracking (VOT) and face recognition (FR) are essential tasks in computer vision with various real-world applications including human-computer interaction, autonomous vehicles, robotics, motion-based recognition, video indexing, surveillance and security. This book presents the state-of-the-art and new algorithms, methods, and systems of these research fields by using deep learning. It is organized into nine chapters across three sections. Section I discusses object detection and tracking ideas and algorithms; Section II examines applications based on re-identification challenges; and Section III presents applications based on FR research. Note de contenu : 1- Deep siamese networks toward robust visual tracking
2- Multi-person tracking based on faster R-CNN and deep appearance features
3- Detecting and counting small animal species using drone imagery by applying deep learning
4- Deep-facial feature-based person reidentification for authentication in surveillance applications
5- Object re-identification based on deep learning
6- Spatial domain representation for face recognition
7- Extended binary gradient pattern (eBGP): A micro-and macrostructure-based binary gradient pattern for face recognition in video surveillance area
8- Matrix factorization on complex domain for face recognition
9- Granular approach for recognizing surgically altered face Images using keypoint descriptors and artificial neural networkNuméro de notice : 28579 Affiliation des auteurs : non IGN Thématique : IMAGERIE/INFORMATIQUE Nature : Recueil / ouvrage collectif DOI : 10.5772/intechopen.80142 En ligne : https://doi.org/10.5772/intechopen.80142 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=97854
Titre : Robust hand pose recognition from stereoscopic capture Type de document : Thèse/HDR Auteurs : Rilwan Remilekun Basaru, Auteur Editeur : Londres : University of London Press Année de publication : 2018 Importance : 200 p. Format : 21 x 30 cm Note générale : bibliographie
A thesis submitted in fulfillment of the requirements for the degree of Doctor of Philosophy, Department of Computer Science, City, University of LondonLangues : Anglais (eng) Descripteur : [Vedettes matières IGN] Traitement d'image
[Termes IGN] classification par forêts d'arbres décisionnels
[Termes IGN] estimation de pose
[Termes IGN] image RVB
[Termes IGN] méthode de Monte-Carlo par chaînes de Markov
[Termes IGN] régression
[Termes IGN] réseau neuronal convolutif
[Termes IGN] réseau neuronal siamoisRésumé : (auteur) Hand pose is emerging as an important interface for human-computer interaction. The problem of hand pose estimation from passive stereo inputs has received less attention in the literature compared to active depth sensors. This thesis seeks to address this gap by presenting a data-driven method to estimate a hand pose from a stereoscopic camera input, with experimental results comparable to more expensive active depth sensors. The frameworks presented in this thesis are based on a two camera stereo rig capture as it yields a simpler and cheaper set-up and calibration. Three frameworks are presented, describing the sequential steps taken to solve the problem of depth and pose estimation of hands.
The first is a data-driven method to estimate a high quality depth map of a hand from a stereoscopic camera input by introducing a novel regression framework. The method first computes disparity using a robust stereo matching technique. Then, it applies a machine learning technique based on Random Forest to learn the mapping between the estimated disparity and depth given ground truth data. We introduce Eigen Leaf Node Features (ELNFs) that perform feature selection at the leaf nodes in each tree to identify features that are most discriminative for depth regression. The system provides a robust method for generating a depth image with an inexpensive stereo camera.
The second framework improves on the task of hand depth estimation from stereo capture by introducing a novel superpixel-based regression framework that takes advantage of the smoothness of the depth surface of the hand. To this end, it introduces Conditional Regressive Random Forest (CRRF), a method that combines a Conditional Random Field (CRF) and a Regressive Random Forest (RRF) to model the mapping from a stereo RGB image pair to a depth image. The RRF provides a unary term that adaptively selects different stereo-matching measures as it implicitly determines matching pixels in a coarse-to-fine manner. While the RRF makes depth prediction for each super-pixel independently, the CRF unifies the prediction of depth by modeling pair-wise interactions between adjacent superpixels.
The final framework introduces a stochastic approach to propose potential depth solutions to the observed stereo capture and evaluate these proposals using two convolutional neural networks (CNNs). The first CNN, configured in a Siamese network architecture, evaluates how consistent the proposed depth solution is to the observed stereo capture. The second CNN estimates a hand pose given the proposed depth. Unlike sequential approaches that reconstruct pose from a known depth, this method jointly optimizes the hand pose and depth estimation through Markov-chain Monte Carlo (MCMC) sampling. This way, pose estimation can correct for errors in depth estimation, and vice versa.
Experimental results using an inexpensive stereo camera show that the proposed system measures pose more accurately than competing methods. More importantly, it presents the possibility of pose recovery from stereo capture that is on par with depth based pose recovery.Numéro de notice : 17505 Affiliation des auteurs : non IGN Thématique : IMAGERIE Nature : Thèse étrangère En ligne : https://openaccess.city.ac.uk/19938/ Format de la ressource électronique : URL Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=90396