Descripteur
Documents disponibles dans cette catégorie (1401)
![](./images/expand_all.gif)
![](./images/collapse_all.gif)
Etendre la recherche sur niveau(x) vers le bas
Réseaux de neurones convolutifs pour la segmentation sémantique et l'apprentissage d'invariants de couleur / Damien Fourure (2017)
![]()
Titre : Réseaux de neurones convolutifs pour la segmentation sémantique et l'apprentissage d'invariants de couleur Type de document : Thèse/HDR Auteurs : Damien Fourure, Auteur ; Alain Trémeau, Directeur de thèse ; Christian Wolf, Directeur de thèse Editeur : Université de Lyon Année de publication : 2017 Autre Editeur : Saint-Etienne : Université Jean-Monnet-Saint-Etienne Importance : 178 p. Format : 21 x 30 cm Note générale : bibliographie
Thèse de Doctorat de l'Université de Lyon opérée au sein de l’Université Jean Monnet de Saint-Étienne, Spécialité de doctorat : InformatiqueLangues : Français (fre) Descripteur : [Vedettes matières IGN] Traitement d'image optique
[Termes IGN] apprentissage profond
[Termes IGN] architecture de réseau
[Termes IGN] chromatopsie
[Termes IGN] classification par réseau neuronal convolutif
[Termes IGN] estimation de pose
[Termes IGN] intelligence artificielle
[Termes IGN] Perceptron multicouche
[Termes IGN] segmentation sémantique
[Termes IGN] vision par ordinateurIndex. décimale : THESE Thèses et HDR Résumé : (auteur) La vision par ordinateur est un domaine interdisciplinaire étudiant la manière dont les ordinateurs peuvent acquérir une compréhension de haut niveau à partir d’images ou de vidéos numériques. En intelligence artificielle, et plus précisément en apprentissage automatique, domaine dans lequel se positionne cette thèse, la vision par ordinateur passe par l’extraction de caractéristiques présentes dans les images puis par la généralisation de concepts liés à ces caractéristiques. Ce domaine de recherche est devenu très populaire ces dernières années, notamment grâce aux résultats des réseaux de neurones convolutifs à la base des méthodes dites d’apprentissage profond. Aujourd’hui les réseaux de neurones permettent, entre autres, de reconnaître les différents objets présents dans une image, de générer des images très réalistes ou même de battre les champions au jeu de Go. Leurs performances ne s’arrêtent d’ailleurs pas au domaine de l’image puisqu’ils sont aussi utilisés dans d’autres domaines tels que le traitement du langage naturel (par exemple en traduction automatique) ou la reconnaissance de son. Dans cette thèse, nous étudions les réseaux de neurones convolutifs afin de développer des architectures et des fonctions de coûts spécialisées à des tâches aussi bien de bas niveau (la constance chromatique) que de haut niveau (la segmentation sémantique d’image). Une première contribution s’intéresse à la tâche de constance chromatique. En vision par ordinateur, l’approche principale consiste à estimer la couleur de l’illuminant puis à supprimer son impact sur la couleur perçue des objets. Les expériences que nous avons menées montrent que notre méthode permet d’obtenir des performances compétitives avec l’état de l’art. Néanmoins, notre architecture requiert une grande quantité de données d’entraînement. Afin de corriger en parti ce problème et d’améliorer l’entraînement des réseaux de neurones, nous présentons plusieurs techniques d’augmentation artificielle de données. Nous apportons également deux contributions sur une problématique de haut niveau : la segmentation sémantique d’image. Cette tâche, qui consiste à attribuer une classe sémantique à chacun des pixels d’une image, constitue un défi en vision par ordinateur de par sa complexité. D’une part, elle requiert de nombreux exemples d’entraînement dont les vérités terrains sont coûteuses à obtenir. D’autre part, elle nécessite l’adaptation des réseaux de neurones convolutifs traditionnels afin d’obtenir une prédiction dite dense, c’est-à-dire, une prédiction pour chacun pixel présent dans l’image d’entrée. Pour résoudre la difficulté liée à l’acquisition de données d’entrainements, nous proposons une approche qui exploite simultanément plusieurs bases de données annotées avec différentes étiquettes. Pour cela, nous définissons une fonction de coût sélective. Nous développons aussi une approche dites d’auto-contexte capturant d’avantage les corrélations existantes entre les étiquettes des différentes bases de données. Finalement, nous présentons notre troisième contribution : une nouvelle architecture de réseau de neurones convolutifs appelée GridNet spécialisée pour la segmentation sémantique d’image. Contrairement aux réseaux traditionnels, notre architecture est implémentée sous forme de grille 2D permettant à plusieurs flux interconnectés de fonctionner à différentes résolutions. Afin d’exploiter la totalité des chemins de la grille, nous proposons une technique d’entraînement inspirée du dropout. En outre, nous montrons empiriquement que notre architecture généralise de nombreux réseaux bien connus de l’état de l’art. Nous terminons par une analyse des résultats empiriques obtenus avec notre architecture qui, bien qu’entraînée avec une initialisation aléatoire des poids, révèle de très bonnes performances, dépassant les approches populaires souvent pré-entraînés. Note de contenu : 1- Introduction
2- Les réseaux de neurones convolutifs pour la vision par ordinateur
3- Sous-échantillonnage mixte appliqué à la constance chromatique
4- Segmentation sémantique d’images
5- Une fonction de coût sélective
6- GridNet, une architecture spécialisée pour la segmentation sémantique
7- Conclusion et PerspectivesNuméro de notice : 25838 Affiliation des auteurs : non IGN Thématique : IMAGERIE/INFORMATIQUE Nature : Thèse française Note de thèse : Thèse de Doctorat : Spécialité : Informatique : Lyon : 2017 Organisme de stage : Université Jean Monnet de Saint-Étienne + LIRIS nature-HAL : Thèse DOI : sans En ligne : https://tel.archives-ouvertes.fr/tel-02111472/document Format de la ressource électronique : URL Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=95192 Single Image Super-Resolution based on Neural Networks for text and face recognition / Clément Peyrard (2017)
![]()
Titre : Single Image Super-Resolution based on Neural Networks for text and face recognition Type de document : Thèse/HDR Auteurs : Clément Peyrard, Auteur ; Christophe Garcia, Auteur Editeur : Université de Lyon Année de publication : 2017 Autre Editeur : Lyon : Institut National des Sciences Appliquées INSA Lyon Importance : 187 p. Format : 21 x 30 cm Note générale : bibliographie
Thèse de Doctorat de l'Université de Lyon opérée au sein de INSA de Lyon, discipline : InformatiqueLangues : Anglais (eng) Descripteur : [Vedettes matières IGN] Traitement d'image optique
[Termes IGN] apprentissage automatique
[Termes IGN] apprentissage profond
[Termes IGN] artefact
[Termes IGN] classification par réseau neuronal convolutif
[Termes IGN] détection de visage
[Termes IGN] image à basse résolution
[Termes IGN] image à haute résolution
[Termes IGN] méthode fondée sur le noyau
[Termes IGN] reconnaissance automatique
[Termes IGN] reconnaissance de caractères
[Termes IGN] reconnaissance de formesIndex. décimale : THESE Thèses et HDR Résumé : (auteur) This thesis is focussed on super-resolution (SR) methods for improving automatic recognition system (Optical Character Recognition, face recognition) in realistic contexts. SR methods allow to generate high resolution images from low resolution ones. Unlike upsampling methods such as interpolation, they restore spatial high frequencies and compensate artefacts such as blur or jaggy edges. In particular, example-based approaches learn and model the relationship between low and high resolution spaces via pairs of low and high resolution images. Artificial Neural Networks are among the most efficient systems to address this problem. This work demonstrate the interest of SR methods based on neural networks for improved automatic recognition systems. By adapting the data, it is possible to train such Machine Learning algorithms to produce high-resolution images. Convolutional Neural Networks are especially efficient as they are trained to simultaneously extract relevant non-linear features while learning the mapping between low and high resolution spaces. On document text images, the proposed method improves OCR accuracy by +7.85 points compared with simple interpolation. The creation of an annotated image dataset and the organisation of an international competition (ICDAR2015) highlighted the interest and the relevance of such approaches. Moreover, if a priori knowledge is available, it can be used by a suitable network architecture. For facial images, face features are critical for automatic recognition. A two step method is proposed in which image resolution is first improved, followed by specialised models that focus on the essential features. An off-the-shelf face verification system has its performance improved from +6.91 up to +8.15 points. Finally, to address the variability of real-world low-resolution images, deep neural networks allow to absorb the diversity of the blurring kernels that characterise the low-resolution images. With a single model, high-resolution images are produced with natural image statistics, without any knowledge of the actual observation model of the low-resolution image. Note de contenu : 1- Introduction
2- Definitions and application domains
3- Literature review
4- Text single image super-resolution
5- Face single image super-resolution
6- Blind and robust super-resolution
7- ConclusionNuméro de notice : 25863 Affiliation des auteurs : non IGN Thématique : IMAGERIE Nature : Thèse française Note de thèse : Thèse de Doctorat : Discipline : Informatique : Lyon 2017 Organisme de stage : LIRIS nature-HAL : Thèse DOI : sans En ligne : http://www.theses.fr/2017LYSEI083 Format de la ressource électronique : URL Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=95506 Sparsity, redundancy and robustness in artificial neural networks for learning and memory / Philippe Tigréat (2017)
![]()
Titre : Sparsity, redundancy and robustness in artificial neural networks for learning and memory Type de document : Thèse/HDR Auteurs : Philippe Tigréat, Auteur ; Claude Berrou, Directeur de thèse Editeur : Institut Mines-Télécom Atlantique IMT Atlantique Année de publication : 2017 Autre Editeur : Université Bretagne Loire Importance : 150 P. Format : 21 x 30 cm Note générale : bibliographie
Thèse IMT Atlantique sous le sceau de l’Université Bretagne Loire pour obtenir le grade de Docteur, Signal, Image, VisionLangues : Anglais (eng) Descripteur : [Vedettes matières IGN] Intelligence artificielle
[Termes IGN] apprentissage (cognition)
[Termes IGN] apprentissage automatique
[Termes IGN] apprentissage profond
[Termes IGN] classification par réseau neuronal convolutif
[Termes IGN] codage
[Termes IGN] cognition
[Termes IGN] mémoire
[Termes IGN] reconnaissance de formes
[Termes IGN] stockage de donnéesIndex. décimale : THESE Thèses et HDR Résumé : (auteur) The objective of research in Artificial Intelligence (AI) is to reproduce human cognitive abilities by means of modern computers. The results of the last few years seem to announce a technological revolution that could profoundly change society. We focus our interest on two fundamental cognitive aspects, learning and memory. Associative memories offer the possibility to store information elements and to retrieve them using a sub-part of their content, thus mimicking human memory. Deep Learning allows to transition from an analog perception of the outside world to a sparse and more compact representation.In Chapter 2, we present a neural associative memory model inspired by Willshaw networks, with constrained connectivity. This brings an performance improvement in message retrieval and a more efficient storage of information.In Chapter 3, a convolutional architecture was applied on a task of reading partially displayed words under similar conditions as in a former psychology study on human subjects. This experiment put inevidence the similarities in behavior of the network with the human subjects regarding various properties of the display of words.Chapter 4 introduces a new method for representing categories usingneuron assemblies in deep networks. For problems with a large number of classes, this allows to reduce significantly the dimensions of a network.Chapter 5 describes a method for interfacing deep unsupervised networks with clique-based associative memories. Note de contenu : 1- Introduction
2- Sparse Neural Associative Memories
3- Robustness of Deep Neural Networks to Erasures in a Reading Task
4- Assembly Output Codes for Learning Neural Networks
5- Combination of Unsupervised Learning and Associative Memory
6- Conclusion and OpeningsNuméro de notice : 25836 Affiliation des auteurs : non IGN Thématique : INFORMATIQUE/MATHEMATIQUE Nature : Thèse française Note de thèse : Thèse de Doctorat : Signal, Image, Vision : Mines-Télécom Atlantique : 2017 Organisme de stage : Laboratoire Labsticc nature-HAL : Thèse DOI : sans En ligne : https://tel.archives-ouvertes.fr/tel-01812053 Format de la ressource électronique : URL Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=95178 SVM et réseaux neuronaux convolutifs pour la classification de scènes urbaines / Amaury Zarzelli (2017)
![]()
Titre : SVM et réseaux neuronaux convolutifs pour la classification de scènes urbaines Type de document : Mémoire Auteurs : Amaury Zarzelli, Auteur Editeur : Champs-sur-Marne : Ecole nationale des sciences géographiques ENSG Année de publication : 2017 Importance : 42 p. Format : 21 x 30 cm Note générale : Bibliographie
Rapport de projet pluridisciplinaire, cycle Ingénieur 2e annéeLangues : Français (fre) Descripteur : [Vedettes matières IGN] Traitement d'image optique
[Termes IGN] carte thématique
[Termes IGN] classification par réseau neuronal
[Termes IGN] classification par séparateurs à vaste marge
[Termes IGN] image Streetview
[Termes IGN] Ottawa
[Termes IGN] régression
[Termes IGN] réseau neuronal convolutif
[Termes IGN] scène urbaineIndex. décimale : PROJET Mémoires : Rapports de projet - stage des ingénieurs de 2e année Résumé : (Auteur) L’accès de plus en plus répandu à des banques de données d’imagerie urbaine telles que StreetView de Google en corrélation avec le progrès des technologies en apprentissage machine facilite le développement de techniques permettant le traitement automatique des caractéristiques physiques du bâti sur de grandes zones urbaines. L’une des applications de ce traitement peut être l’étude sociologique, et notamment la mesure de la gentrification, processus par lequel des classes aisées s’installent dans des quartiers historiquement moins favorisés. En effet, ce phénomène se caractérise souvent par une modification de l’aspect des habitations, qui peut être détectée par un modèle de classification. Ce projet consiste à traiter toutes les étapes de cette classification, du téléchargement de l’imagerie urbaine jusqu’à la cartographie du phénomène étudié et peut être adapté à la qualification de n’importe quel phénomène urbain (accessibilité pour les piétons, structure des bâtiments…). Je me suis en particulier attaché à l’étape de la conception du modèle, en explorant notamment des techniques innovantes basées sur des réseaux de neurones convolutifs et dont les résultats sont prometteurs. Le travail a été effectué sur l’unité urbaine de la ville d’Ottawa au Canada. L’ensemble des travaux réalisés au cours du projet sont accessibles sur le dépôt GitHub suivant : https://github.com/azarz/gentriNet. Note de contenu : INTRODUCTION
1. Gestion de projet
2. Étapes de la classification
3. Résultats obtenus
CONCLUSIONNuméro de notice : 22806 Affiliation des auteurs : IGN (2012-2019) Thématique : IMAGERIE/INFORMATIQUE/MATHEMATIQUE/URBANISME Nature : Mémoire de projet pluridisciplinaire Organisme de stage : Université d’Ottawa Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=88412 Réservation
Réserver ce documentExemplaires(1)
Code-barres Cote Support Localisation Section Disponibilité 22806-01 PROJET Livre Centre de documentation Travaux d'élèves Disponible Documents numériques
peut être téléchargé
SVM et réseaux neuronaux convolutifsAdobe Acrobat PDFThe use of logistic model tree (LMT) for pixel- and object-based classifications using high-resolution WorldView-2 imagery / Ismail Colkesen in Geocarto international, vol 32 n° 1 (January 2017)
![]()
[article]
Titre : The use of logistic model tree (LMT) for pixel- and object-based classifications using high-resolution WorldView-2 imagery Type de document : Article/Communication Auteurs : Ismail Colkesen, Auteur ; Taskin Kavzoglu, Auteur Année de publication : 2017 Article en page(s) : pp 71 - 86 Note générale : bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Traitement d'image optique
[Termes IGN] algorithme d'apprentissage
[Termes IGN] arbre de décision
[Termes IGN] classification orientée objet
[Termes IGN] classification par arbre de décision
[Termes IGN] classification pixellaire
[Termes IGN] image Worldview
[Termes IGN] régression logistiqueRésumé : (auteur) Logistic model tree (LMT), a new method integrating standard decision tree (DT) induction and linear logistic regression algorithm in a single tree, have been recently proposed as an alternative to DT-based learning algorithms. In this study, the LMT was applied in the context of pixel- and object-based classifications using high-resolution WorldView-2 imagery, and its performance was compared with C4.5, random forest and Adaboost. Results of the study showed that the LMT generally produced more accurate classification results than the other methods for both pixel- and object-based classifications. The improvement in classification accuracy reached to 3% in pixel-based and 5% in object-based classifications. It was also estimated that the LMT algorithm produced the most accurate results considering the allocation and overall disagreement errors. Based on the Wilcoxon’s Signed-Ranks tests, the performance differences between the LMT and the other methods were statistically significant for both pixel- and object-based image classifications. Numéro de notice : A2017-085 Affiliation des auteurs : non IGN Thématique : IMAGERIE Nature : Article nature-HAL : ArtAvecCL-RevueIntern DOI : 10.1080/10106049.2015.1128486 Date de publication en ligne : 12/01/2016 En ligne : http://dx.doi.org/10.1080/10106049.2015.1128486 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=84410
in Geocarto international > vol 32 n° 1 (January 2017) . - pp 71 - 86[article]Réservation
Réserver ce documentExemplaires(1)
Code-barres Cote Support Localisation Section Disponibilité 059-2017011 RAB Revue Centre de documentation En réserve L003 Disponible PermalinkClass-specific sparse multiple kernel learning for spectral–spatial hyperspectral image classification / Tianzhu Liu in IEEE Transactions on geoscience and remote sensing, vol 54 n° 12 (December 2016)
PermalinkDictionary learning for promoting structured sparsity in hyperspectral compressive sensing / Lei Zhang in IEEE Transactions on geoscience and remote sensing, vol 54 n° 12 (December 2016)
PermalinkDiscriminative-dictionary-learning-based multilevel point-cluster features for ALS point-cloud classification / Zhenxin Zhang in IEEE Transactions on geoscience and remote sensing, vol 54 n° 12 (December 2016)
PermalinkUltra short-term prediction of pole coordinates via combination of empirical mode decomposition and neural networks / Yu Lei in Artificial satellites, vol 51 n° 4 (December 2016)
PermalinkFast three-dimensional empirical mode decomposition of hyperspectral images for class-oriented multitask learning / Zhi He in IEEE Transactions on geoscience and remote sensing, vol 54 n° 11 (November 2016)
PermalinkHow many samples are needed? An investigation of binary logistic regression for selective omission in a road network / Qi Zhou in Cartography and Geographic Information Science, vol 43 n° 5 (November 2016)
PermalinkMultiple kernel learning based on discriminative kernel clustering for hyperspectral band selection / Jie Feng in IEEE Transactions on geoscience and remote sensing, vol 54 n° 11 (November 2016)
PermalinkRobust multitask learning with three-dimensional empirical mode decomposition-based features for hyperspectral classification / Zhi He in ISPRS Journal of photogrammetry and remote sensing, vol 121 (November 2016)
PermalinkSemi-supervised hyperspectral classification from a small number of training samples using a co-training approach / Michał Romaszewski in ISPRS Journal of photogrammetry and remote sensing, vol 121 (November 2016)
PermalinkDeep feature extraction and classification of hyperspectral images based on convolutional neural networks / Yushi Chen in IEEE Transactions on geoscience and remote sensing, vol 54 n° 10 (October 2016)
PermalinkA new ZTD model based on permanent ground-based GNSS-ZTD data / M. Ding in Survey review, vol 48 n° 351 (October 2016)
PermalinkSAR image change detection based on correlation kernel and multistage extreme learning machine / Lu Jia in IEEE Transactions on geoscience and remote sensing, vol 54 n° 10 (October 2016)
PermalinkSemisupervised classification for hyperspectral image based on multi-decision labeling and deep feature learning / Xiaorui Ma in ISPRS Journal of photogrammetry and remote sensing, vol 120 (october 2016)
PermalinkNoise removal from hyperspectral image with joint spectral–spatial distributed sparse representation / Jie Li in IEEE Transactions on geoscience and remote sensing, vol 54 n° 9 (September 2016)
PermalinkAirborne lidar estimation of aboveground forest biomass in the absence of field inventory / António Ferraz in Remote sensing, vol 8 n° 8 (August 2016)
![]()
PermalinkAn immune genetic algorithm to buildings displacement in cartographic generalization / Yageng Sun in Transactions in GIS, vol 20 n° 4 (August 2016)
PermalinkDirichlet process based active learning and discovery of unknown classes for hyperspectral image classification / Hao Wu in IEEE Transactions on geoscience and remote sensing, vol 54 n° 8 (August 2016)
PermalinkDisaggregation of remotely sensed soil moisture in heterogeneous landscapes using holistic structure-based models / Subit Chakrabarti in IEEE Transactions on geoscience and remote sensing, vol 54 n° 8 (August 2016)
PermalinkSea ice concentration estimation during melt from dual-pol SAR scenes using deep convolutional neural networks: a case study / Lei Wang in IEEE Transactions on geoscience and remote sensing, vol 54 n° 8 (August 2016)
Permalink