Descripteur
Termes IGN > sciences naturelles > physique > traitement d'image > reconnaissance de formes
reconnaissance de formesSynonyme(s)reconnaissance des formes |
Documents disponibles dans cette catégorie (219)
Ajouter le résultat dans votre panier
Visionner les documents numériques
Affiner la recherche Interroger des sources externes
Etendre la recherche sur niveau(x) vers le bas
Réseaux de neurones convolutionnels profonds pour la détection de petits véhicules en imagerie aérienne / Jean Ogier du Terrail (2018)
Titre : Réseaux de neurones convolutionnels profonds pour la détection de petits véhicules en imagerie aérienne Type de document : Thèse/HDR Auteurs : Jean Ogier du Terrail, Auteur ; Frédéric Jurie, Directeur de thèse Editeur : Caen [France] : Université de Caen Normandie Année de publication : 2018 Importance : 217 p. Format : 21 x 30 cm Note générale : bibliographie
thèse pour obtenir le diplôme de Doctorat, Spécialité Informatique préparée au sein de l'Université de Caen NormandieLangues : Français (fre) Descripteur : [Vedettes matières IGN] Intelligence artificielle
[Termes IGN] apprentissage automatique
[Termes IGN] apprentissage profond
[Termes IGN] base de données d'images
[Termes IGN] classification par séparateurs à vaste marge
[Termes IGN] détection d'objet
[Termes IGN] image aérienne à axe vertical
[Termes IGN] reconnaissance de formes
[Termes IGN] régression
[Termes IGN] vision par ordinateurIndex. décimale : THESE Thèses et HDR Résumé : (auteur) Cette thèse présente une tentative d'approche du problème de la détection et discrimination des petits véhicules dans des images aériennes en vue verticale par l'utilisation de techniques issues de l'apprentissage profond ou "deep-learning". Le caractère spécifique du problème permet d'utiliser des techniques originales mettant à profit les invariances des automobiles et autres avions vus du ciel.Nous commencerons par une étude systématique des détecteurs dits "single-shot", pour ensuite analyser l'apport des systèmes à plusieurs étages de décision sur les performances de détection. Enfin nous essayerons de résoudre le problème de l'adaptation de domaine à travers la génération de données synthétiques toujours plus réalistes, et son utilisation dans l'apprentissage de ces détecteurs. Note de contenu : 1- Introduction à la détection d’objets dans des images aériennes
2- Détecteurs à un étage pour l’imagerie aérienne
3- Premier détecteur en cascade utilisant un mécanisme d’inférence de l’orientation des véhicules
4- Second détecteur en cascade utilisant des ancres tournantes
5- Données synthétiques et modèles génératifs pour l’entraînement des détecteurs
6- Conclusions et perspectivesNuméro de notice : 25788 Affiliation des auteurs : non IGN Thématique : INFORMATIQUE Nature : Thèse française Note de thèse : Thèse de Doctorat : Informatique : Caen : 2018 nature-HAL : Thèse DOI : sans En ligne : https://tel.archives-ouvertes.fr/tel-02113872 Format de la ressource électronique : URL Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=94999 SDE: A novel selective, discriminative and equalizing feature representation for visual recognition / Guo-Sen Xie in International journal of computer vision, vol 124 n° 2 (1 September 2017)
[article]
Titre : SDE: A novel selective, discriminative and equalizing feature representation for visual recognition Type de document : Article/Communication Auteurs : Guo-Sen Xie, Auteur ; Xu-Yao Zhang, Auteur ; Shuicheng Yan, Auteur ; Cheng-Lin Liu, Auteur Année de publication : 2017 Article en page(s) : pp pp 145 – 168 Note générale : bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Traitement d'image optique
[Termes IGN] apprentissage automatique
[Termes IGN] classification par réseau neuronal
[Termes IGN] optimisation (mathématiques)
[Termes IGN] reconnaissance d'objets
[Termes IGN] réseau neuronal convolutifRésumé : (auteur) Bag of Words (BoW) model and Convolutional Neural Network (CNN) are two milestones in visual recognition. Both BoW and CNN require a feature pooling operation for constructing the frameworks. Particularly, the max-pooling has been validated as an efficient and effective pooling method compared with other methods such as average pooling and stochastic pooling. In this paper, we first evaluate different pooling methods, and then propose a new feature pooling method termed as selective, discriminative and equalizing pooling (SDE). The SDE representation is a feature learning mechanism by jointly optimizing the pooled representations with the target of learning more selective, discriminative and equalizing features. We use bilevel optimization to solve the joint optimization problem. Experiments on seven benchmark datasets (including both single-label and multi-label ones) well validate the effectiveness of our framework. Particularly, we achieve the state-of-the-art fused results (mAP) of 93.21 and 93.97% on the PASCAL VOC2007 and VOC2012 datasets, respectively. Numéro de notice : A2017-482 Affiliation des auteurs : non IGN Thématique : IMAGERIE Nature : Article DOI : 10.1007%2Fs11263-017-1007-9 En ligne : https://doi.org/10.1007/s11263-017-1007-9 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=86421
in International journal of computer vision > vol 124 n° 2 (1 September 2017) . - pp pp 145 – 168[article]The analysis and measurement of building patterns using texton co-occurrence matrices / Wenhao Yu in International journal of geographical information science IJGIS, vol 31 n° 5-6 (May-June 2017)
[article]
Titre : The analysis and measurement of building patterns using texton co-occurrence matrices Type de document : Article/Communication Auteurs : Wenhao Yu, Auteur ; Tinghua Ai, Auteur ; Pengcheng Liu, Auteur ; Xiaoqiang Cheng, Auteur Année de publication : 2017 Note générale : bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Photogrammétrie numérique
[Termes IGN] données vectorielles
[Termes IGN] matrice de co-occurrence
[Termes IGN] métrique
[Termes IGN] modèle géométrique du bâti
[Termes IGN] reconnaissance de formes
[Termes IGN] reconstruction 2D du bâti
[Termes IGN] tessellation
[Termes IGN] triangulation de Delaunay
[Termes IGN] voisinage (relation topologique)Résumé : (auteur) The representation and analysis of building patterns are critical for characterizing urban scenes and making decisions in urban planning. The evaluation of building patterns is a difficult spatial analysis problem that exhibits properties of symbolization, homogeneity and regularity. Open issues in this field include the development of approaches for representing building patterns and vector-based methods for computing various pattern metrics. In the image analysis domain, there are many methods for pattern recognition (e.g., texture analysis), but there are few corresponding solutions for vector data. The aim of this research is to develop several building pattern metrics and offer a texton co-occurrence matrix (TCM)-based method to quantitatively evaluate the features of building patterns. The procedure first constructs a spatial field based on a Delaunay triangulation skeleton to partition a set of buildings into a set of tessellation cells. The tessellations of building clusters have a similar structure as image representations, in that each cell corresponds to an image pixel. We then use the texton analysis to establish a matrix to describe the tessellation structure, including the neighboring relationships and individual attribute information. Finally, a set of feature descriptors is obtained from the TCM to capture the texture-related information of building groups. Through experiments on building pattern analysis and spatial queries, we show that the results of TCM-based evaluation of building patterns are consistent with those of human cognition. Numéro de notice : A2017-242 Affiliation des auteurs : non IGN Thématique : IMAGERIE Nature : Article nature-HAL : ArtAvecCL-RevueIntern DOI : 10.1080/13658816.2016.1265121 En ligne : http://dx.doi.org/10.1080/13658816.2016.1265121 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=85178
in International journal of geographical information science IJGIS > vol 31 n° 5-6 (May-June 2017)[article]Réservation
Réserver ce documentExemplaires(1)
Code-barres Cote Support Localisation Section Disponibilité 079-2017031 RAB Revue Centre de documentation En réserve L003 Disponible
Titre : Recherche multi-descripteurs dans les fonds photographiques numérisés Titre original : Multi-descriptor retrieval in digitalized photographs collections Type de document : Thèse/HDR Auteurs : Neelanjan Bhowmik , Auteur ; Valérie Gouet-Brunet , Directeur de thèse Editeur : Champs/Marne : Université Paris-Est Année de publication : 2017 Importance : 266 p. Format : 21 x 30 cm Note générale : bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Traitement d'image
[Termes IGN] base de données d'images
[Termes IGN] collection
[Termes IGN] descripteur
[Termes IGN] détection d'objet
[Termes IGN] estimation de pose
[Termes IGN] exploration de données
[Termes IGN] extraction de traits caractéristiques
[Termes IGN] index
[Termes IGN] localisation basée image
[Termes IGN] modèle de simulation
[Termes IGN] patrimoine culturel
[Termes IGN] point d'intérêt
[Termes IGN] recherche d'image basée sur le contenu
[Termes IGN] reconnaissance d'objets
[Termes IGN] régression linéaireIndex. décimale : THESE Thèses et HDR Résumé : (auteur) La recherche d’images par contenu (CBIR) est une discipline de l’informatique qui vise à structurer automatiquement les collections d’images selon des critères visuels. Les fonctionnalités proposées couvrent notamment l’accès efficace aux images dans une grande base de données d’images ou l’identification de leur contenu par des outils de détection et de reconnaissance d’objets. Ils ont un impact sur une large gamme de domaines qui manipulent ce genre de données, telles que le multimedia, la culture, la sécurité, la santé, la recherche scientifique, etc. Indexer une image à partir de son contenu visuel nécessite d’abord de produire un résumé visuel de ce contenu pour un usage donné, qui sera l’index de cette image dans la collection. En matière de descripteurs d’images, la littérature est désormais très riche : plusieurs familles de descripteurs existent, et dans chaque famille, de nombreuses approches cohabitent. Bon nombre de descripteurs ne décrivant pas la même information et n’ayant pas les mêmes propriétés d’invariance, il peut être pertinent de les combiner de manière à mieux décrire le contenu de l’image. Cette combinaison peut être mise en oeuvre de différentes manières, selon les descripteurs considérés et le but recherché. Dans cette thèse, nous nous concentrons sur la famille des descripteurs locaux, avec pour application la recherche d’images ou d’objets par l’exemple dans une collection d’images. Leurs bonnes propriétés les rendent très populaires pour la recherche, la reconnaissance et la catégorisation d'objets et de scènes. Deux directions de recherche sont étudiées : Combinaison de caractéristiques pour la recherche d’images par l’exemple : Le coeur de la thèse repose sur la proposition d’un modèle pour combiner des descripteurs de bas niveau et génériques afin d’obtenir un descripteur plus riche et adapté à un cas d’utilisation donné tout en conservant la généricité afin d’indexer différents types de contenus visuels. L’application considérée étant la recherche par l’exemple, une autre difficulté majeure est la complexité de la proposition, qui doit correspondre à des temps de récupération réduits, même avec de grands ensembles de données. Pour atteindre ces objectifs, nous proposons une approche basée sur la fusion d'index inversés, ce qui permet de mieux représenter le contenu tout en étant associé à une méthode d’accès efficace. Complémentarité des descripteurs : Nous nous concentrons sur l’évaluation de la complémentarité des descripteurs locaux existant en proposant des critères statistiques d’analyse de leur répartition spatiale dans l'image. Ce travail permet de mettre en évidence une synergie entre certaines de ces techniques lorsqu’elles sont jugées suffisamment complémentaires. Les critères spatiaux sont exploités dans un modèle de prédiction à base de régression linéaire, qui a l'avantage de permettre la sélection de combinaisons de descripteurs optimale pour la base considérée mais surtout pour chaque image de cette base. L'approche est évaluée avec le moteur de recherche multi-index, où il montre sa pertinence et met aussi en lumière le fait que la combinaison optimale de descripteurs peut varier d'une image à l'autre. En outre, nous exploitons les deux propositions précédentes pour traiter le problème de la recherche d'images inter-domaines, correspondant notamment à des vues multi-source et multi-date. Deux applications sont explorées dans cette thèse. La recherche d’images inter-domaines est appliquée aux collections photographiques culturelles numérisées d’un musée, où elle démontre son efficacité pour l’exploration et la valorisation de ces contenus à différents niveaux, depuis leur archivage jusqu’à leur exposition ou ex situ. Ensuite, nous explorons l’application de la localisation basée image entre domaines, où la pose d’une image est estimée à partir d’images géoréférencées, en retrouvant des images géolocalisées visuellement similaires à la requête. Numéro de notice : 17573 Affiliation des auteurs : LASTIG MATIS (2012-2019) Thématique : IMAGERIE/INFORMATIQUE Nature : Thèse française Organisme de stage : MATIS (IGN) ; Nicéphore Cité nature-HAL : Thèse DOI : sans En ligne : https://tel.hal.science/tel-01759559 Format de la ressource électronique : URL Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=91963 Single Image Super-Resolution based on Neural Networks for text and face recognition / Clément Peyrard (2017)
Titre : Single Image Super-Resolution based on Neural Networks for text and face recognition Type de document : Thèse/HDR Auteurs : Clément Peyrard, Auteur ; Christophe Garcia, Auteur Editeur : Université de Lyon Année de publication : 2017 Autre Editeur : Lyon : Institut National des Sciences Appliquées INSA Lyon Importance : 187 p. Format : 21 x 30 cm Note générale : bibliographie
Thèse de Doctorat de l'Université de Lyon opérée au sein de INSA de Lyon, discipline : InformatiqueLangues : Anglais (eng) Descripteur : [Vedettes matières IGN] Traitement d'image optique
[Termes IGN] apprentissage automatique
[Termes IGN] apprentissage profond
[Termes IGN] artefact
[Termes IGN] classification par réseau neuronal convolutif
[Termes IGN] détection de visage
[Termes IGN] image à basse résolution
[Termes IGN] image à haute résolution
[Termes IGN] méthode fondée sur le noyau
[Termes IGN] reconnaissance automatique
[Termes IGN] reconnaissance de caractères
[Termes IGN] reconnaissance de formesIndex. décimale : THESE Thèses et HDR Résumé : (auteur) This thesis is focussed on super-resolution (SR) methods for improving automatic recognition system (Optical Character Recognition, face recognition) in realistic contexts. SR methods allow to generate high resolution images from low resolution ones. Unlike upsampling methods such as interpolation, they restore spatial high frequencies and compensate artefacts such as blur or jaggy edges. In particular, example-based approaches learn and model the relationship between low and high resolution spaces via pairs of low and high resolution images. Artificial Neural Networks are among the most efficient systems to address this problem. This work demonstrate the interest of SR methods based on neural networks for improved automatic recognition systems. By adapting the data, it is possible to train such Machine Learning algorithms to produce high-resolution images. Convolutional Neural Networks are especially efficient as they are trained to simultaneously extract relevant non-linear features while learning the mapping between low and high resolution spaces. On document text images, the proposed method improves OCR accuracy by +7.85 points compared with simple interpolation. The creation of an annotated image dataset and the organisation of an international competition (ICDAR2015) highlighted the interest and the relevance of such approaches. Moreover, if a priori knowledge is available, it can be used by a suitable network architecture. For facial images, face features are critical for automatic recognition. A two step method is proposed in which image resolution is first improved, followed by specialised models that focus on the essential features. An off-the-shelf face verification system has its performance improved from +6.91 up to +8.15 points. Finally, to address the variability of real-world low-resolution images, deep neural networks allow to absorb the diversity of the blurring kernels that characterise the low-resolution images. With a single model, high-resolution images are produced with natural image statistics, without any knowledge of the actual observation model of the low-resolution image. Note de contenu : 1- Introduction
2- Definitions and application domains
3- Literature review
4- Text single image super-resolution
5- Face single image super-resolution
6- Blind and robust super-resolution
7- ConclusionNuméro de notice : 25863 Affiliation des auteurs : non IGN Thématique : IMAGERIE Nature : Thèse française Note de thèse : Thèse de Doctorat : Discipline : Informatique : Lyon 2017 Organisme de stage : LIRIS nature-HAL : Thèse DOI : sans En ligne : http://www.theses.fr/2017LYSEI083 Format de la ressource électronique : URL Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=95506 Sparsity, redundancy and robustness in artificial neural networks for learning and memory / Philippe Tigréat (2017)PermalinkTélédétection pour l'observation des surfaces continentales, ch. 6. Méthodes de traitement de données lidar / Clément Mallet (2017)PermalinkUrban objects classification by spectral library: Feasibility and applications / Walid Ouerghemmi (2017)PermalinkSparse output coding for scalable visual recognition / Bin Zhao in International journal of computer vision, vol 119 n° 1 (August 2016)PermalinkA novel computer-aided tree species identification method based on burst wind segmentation of 3D bark textures / Alice Ahlem Othmani in Machine Vision and Applications, vol 27 n° 5 (July 2016)PermalinkGrid pattern recognition in road networks using the C4.5 algorithm / Jing Tian in Cartography and Geographic Information Science, Vol 43 n° 3 (June 2016)PermalinkAutomatic keyline recognition and 3D reconstruction for quasi-planar façades in close-range images / Chang Li in Photogrammetric record, vol 31 n° 153 (March - May 2016)PermalinkImproved salient feature-based approach for automatically separating photosynthetic and nonphotosynthetic components within terrestrial Lidar point cloud data of forest canopies / Lixia Ma in IEEE Transactions on geoscience and remote sensing, vol 54 n° 2 (February 2016)PermalinkObject classification and recognition from mobile laser scanning point clouds in a road environment / Matti Lehtomäki in IEEE Transactions on geoscience and remote sensing, vol 54 n° 2 (February 2016)PermalinkA joint Gaussian process model for active visual recognition with expertise estimation in crowdsourcing / Chengjiang Long in International journal of computer vision, vol 116 n° 2 (15th January 2016)Permalink