Catalogue en ligne IGN

Descripteur

Termes IGN > informatique > intelligence artificielle > apprentissage automatique

algorithme d'apprentissage	algorithme génétique	apprentissage dirigé
apprentissage non-dirigé	apprentissage par explications	apprentissage par renforcement
apprentissage par transformation	apprentissage profond	apprentissage semi-dirigé
données d'entrainement (apprentissage automatique)	fonction de perte	méthode fondée sur le noyau
régularisation

apprentissage automatique

Synonyme(s)

apprentissage machine

Voir aussi

Documents disponibles dans cette catégorie (1401)

Ajouter le résultat dans votre panier Visionner les documents numériques Affiner la recherche Interroger des sources externes

Etendre la recherche sur niveau(x) vers le bas

Réseaux de neurones convolutifs pour la segmentation sémantique et l'apprentissage d'invariants de couleur / Damien Fourure (2017)

Public

Titre : Réseaux de neurones convolutifs pour la segmentation sémantique et l'apprentissage d'invariants de couleur
Type de document : Thèse/HDR
Auteurs : Damien Fourure, Auteur ; Alain Trémeau, Directeur de thèse ; Christian Wolf, Directeur de thèse
Editeur : Université de Lyon
Année de publication : 2017
Autre Editeur : Saint-Etienne : Université Jean-Monnet-Saint-Etienne
Importance : 178 p.
Format : 21 x 30 cm
Note générale : bibliographie
Thèse de Doctorat de l'Université de Lyon opérée au sein de l’Université Jean Monnet de Saint-Étienne, Spécialité de doctorat : Informatique
Langues : Français (fre)
Descripteur : [Vedettes matières IGN] Traitement d'image optique
[Termes IGN] apprentissage profond
[Termes IGN] architecture de réseau
[Termes IGN] chromatopsie
[Termes IGN] classification par réseau neuronal convolutif
[Termes IGN] estimation de pose
[Termes IGN] intelligence artificielle
[Termes IGN] Perceptron multicouche
[Termes IGN] segmentation sémantique
[Termes IGN] vision par ordinateur

Index. décimale : THESE Thèses et HDR
Résumé : (auteur) La vision par ordinateur est un domaine interdisciplinaire étudiant la manière dont les ordinateurs peuvent acquérir une compréhension de haut niveau à partir d’images ou de vidéos numériques. En intelligence artificielle, et plus précisément en apprentissage automatique, domaine dans lequel se positionne cette thèse, la vision par ordinateur passe par l’extraction de caractéristiques présentes dans les images puis par la généralisation de concepts liés à ces caractéristiques. Ce domaine de recherche est devenu très populaire ces dernières années, notamment grâce aux résultats des réseaux de neurones convolutifs à la base des méthodes dites d’apprentissage profond. Aujourd’hui les réseaux de neurones permettent, entre autres, de reconnaître les différents objets présents dans une image, de générer des images très réalistes ou même de battre les champions au jeu de Go. Leurs performances ne s’arrêtent d’ailleurs pas au domaine de l’image puisqu’ils sont aussi utilisés dans d’autres domaines tels que le traitement du langage naturel (par exemple en traduction automatique) ou la reconnaissance de son. Dans cette thèse, nous étudions les réseaux de neurones convolutifs afin de développer des architectures et des fonctions de coûts spécialisées à des tâches aussi bien de bas niveau (la constance chromatique) que de haut niveau (la segmentation sémantique d’image). Une première contribution s’intéresse à la tâche de constance chromatique. En vision par ordinateur, l’approche principale consiste à estimer la couleur de l’illuminant puis à supprimer son impact sur la couleur perçue des objets. Les expériences que nous avons menées montrent que notre méthode permet d’obtenir des performances compétitives avec l’état de l’art. Néanmoins, notre architecture requiert une grande quantité de données d’entraînement. Afin de corriger en parti ce problème et d’améliorer l’entraînement des réseaux de neurones, nous présentons plusieurs techniques d’augmentation artificielle de données. Nous apportons également deux contributions sur une problématique de haut niveau : la segmentation sémantique d’image. Cette tâche, qui consiste à attribuer une classe sémantique à chacun des pixels d’une image, constitue un défi en vision par ordinateur de par sa complexité. D’une part, elle requiert de nombreux exemples d’entraînement dont les vérités terrains sont coûteuses à obtenir. D’autre part, elle nécessite l’adaptation des réseaux de neurones convolutifs traditionnels afin d’obtenir une prédiction dite dense, c’est-à-dire, une prédiction pour chacun pixel présent dans l’image d’entrée. Pour résoudre la difficulté liée à l’acquisition de données d’entrainements, nous proposons une approche qui exploite simultanément plusieurs bases de données annotées avec différentes étiquettes. Pour cela, nous définissons une fonction de coût sélective. Nous développons aussi une approche dites d’auto-contexte capturant d’avantage les corrélations existantes entre les étiquettes des différentes bases de données. Finalement, nous présentons notre troisième contribution : une nouvelle architecture de réseau de neurones convolutifs appelée GridNet spécialisée pour la segmentation sémantique d’image. Contrairement aux réseaux traditionnels, notre architecture est implémentée sous forme de grille 2D permettant à plusieurs flux interconnectés de fonctionner à différentes résolutions. Afin d’exploiter la totalité des chemins de la grille, nous proposons une technique d’entraînement inspirée du dropout. En outre, nous montrons empiriquement que notre architecture généralise de nombreux réseaux bien connus de l’état de l’art. Nous terminons par une analyse des résultats empiriques obtenus avec notre architecture qui, bien qu’entraînée avec une initialisation aléatoire des poids, révèle de très bonnes performances, dépassant les approches populaires souvent pré-entraînés.
Note de contenu : 1- Introduction
2- Les réseaux de neurones convolutifs pour la vision par ordinateur
3- Sous-échantillonnage mixte appliqué à la constance chromatique
4- Segmentation sémantique d’images
5- Une fonction de coût sélective
6- GridNet, une architecture spécialisée pour la segmentation sémantique
7- Conclusion et Perspectives
Numéro de notice : 25838
Affiliation des auteurs : non IGN
Thématique : IMAGERIE/INFORMATIQUE
Nature : Thèse française
Note de thèse : Thèse de Doctorat : Spécialité : Informatique : Lyon : 2017
Organisme de stage : Université Jean Monnet de Saint-Étienne + LIRIS
nature-HAL : Thèse
DOI : sans
En ligne : https://tel.archives-ouvertes.fr/tel-02111472/document
Format de la ressource électronique : URL
Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=95192

Single Image Super-Resolution based on Neural Networks for text and face recognition / Clément Peyrard (2017)

Public

Titre : Single Image Super-Resolution based on Neural Networks for text and face recognition
Type de document : Thèse/HDR
Auteurs : Clément Peyrard, Auteur ; Christophe Garcia, Auteur
Editeur : Université de Lyon
Année de publication : 2017
Autre Editeur : Lyon : Institut National des Sciences Appliquées INSA Lyon
Importance : 187 p.
Format : 21 x 30 cm
Note générale : bibliographie
Thèse de Doctorat de l'Université de Lyon opérée au sein de INSA de Lyon, discipline : Informatique

Langues : Anglais (eng)
Descripteur : [Vedettes matières IGN] Traitement d'image optique
[Termes IGN] apprentissage automatique
[Termes IGN] apprentissage profond
[Termes IGN] artefact
[Termes IGN] classification par réseau neuronal convolutif
[Termes IGN] détection de visage
[Termes IGN] image à basse résolution
[Termes IGN] image à haute résolution
[Termes IGN] méthode fondée sur le noyau
[Termes IGN] reconnaissance automatique
[Termes IGN] reconnaissance de caractères
[Termes IGN] reconnaissance de formes

Index. décimale : THESE Thèses et HDR
Résumé : (auteur) This thesis is focussed on super-resolution (SR) methods for improving automatic recognition system (Optical Character Recognition, face recognition) in realistic contexts. SR methods allow to generate high resolution images from low resolution ones. Unlike upsampling methods such as interpolation, they restore spatial high frequencies and compensate artefacts such as blur or jaggy edges. In particular, example-based approaches learn and model the relationship between low and high resolution spaces via pairs of low and high resolution images. Artificial Neural Networks are among the most efficient systems to address this problem. This work demonstrate the interest of SR methods based on neural networks for improved automatic recognition systems. By adapting the data, it is possible to train such Machine Learning algorithms to produce high-resolution images. Convolutional Neural Networks are especially efficient as they are trained to simultaneously extract relevant non-linear features while learning the mapping between low and high resolution spaces. On document text images, the proposed method improves OCR accuracy by +7.85 points compared with simple interpolation. The creation of an annotated image dataset and the organisation of an international competition (ICDAR2015) highlighted the interest and the relevance of such approaches. Moreover, if a priori knowledge is available, it can be used by a suitable network architecture. For facial images, face features are critical for automatic recognition. A two step method is proposed in which image resolution is first improved, followed by specialised models that focus on the essential features. An off-the-shelf face verification system has its performance improved from +6.91 up to +8.15 points. Finally, to address the variability of real-world low-resolution images, deep neural networks allow to absorb the diversity of the blurring kernels that characterise the low-resolution images. With a single model, high-resolution images are produced with natural image statistics, without any knowledge of the actual observation model of the low-resolution image.
Note de contenu : 1- Introduction
2- Definitions and application domains
3- Literature review
4- Text single image super-resolution
5- Face single image super-resolution
6- Blind and robust super-resolution
7- Conclusion
Numéro de notice : 25863
Affiliation des auteurs : non IGN
Thématique : IMAGERIE
Nature : Thèse française
Note de thèse : Thèse de Doctorat : Discipline : Informatique : Lyon 2017
Organisme de stage : LIRIS
nature-HAL : Thèse
DOI : sans
En ligne : http://www.theses.fr/2017LYSEI083
Format de la ressource électronique : URL
Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=95506

Sparsity, redundancy and robustness in artificial neural networks for learning and memory / Philippe Tigréat (2017)

Public

Titre : Sparsity, redundancy and robustness in artificial neural networks for learning and memory
Type de document : Thèse/HDR
Auteurs : Philippe Tigréat, Auteur ; Claude Berrou, Directeur de thèse
Editeur : Institut Mines-Télécom Atlantique IMT Atlantique
Année de publication : 2017
Autre Editeur : Université Bretagne Loire
Importance : 150 P.
Format : 21 x 30 cm
Note générale : bibliographie
Thèse IMT Atlantique sous le sceau de l’Université Bretagne Loire pour obtenir le grade de Docteur, Signal, Image, Vision
Langues : Anglais (eng)
Descripteur : [Vedettes matières IGN] Intelligence artificielle
[Termes IGN] apprentissage (cognition)
[Termes IGN] apprentissage automatique
[Termes IGN] apprentissage profond
[Termes IGN] classification par réseau neuronal convolutif
[Termes IGN] codage
[Termes IGN] cognition
[Termes IGN] mémoire
[Termes IGN] reconnaissance de formes
[Termes IGN] stockage de données

Index. décimale : THESE Thèses et HDR
Résumé : (auteur) The objective of research in Artificial Intelligence (AI) is to reproduce human cognitive abilities by means of modern computers. The results of the last few years seem to announce a technological revolution that could profoundly change society. We focus our interest on two fundamental cognitive aspects, learning and memory. Associative memories offer the possibility to store information elements and to retrieve them using a sub-part of their content, thus mimicking human memory. Deep Learning allows to transition from an analog perception of the outside world to a sparse and more compact representation.In Chapter 2, we present a neural associative memory model inspired by Willshaw networks, with constrained connectivity. This brings an performance improvement in message retrieval and a more efficient storage of information.In Chapter 3, a convolutional architecture was applied on a task of reading partially displayed words under similar conditions as in a former psychology study on human subjects. This experiment put inevidence the similarities in behavior of the network with the human subjects regarding various properties of the display of words.Chapter 4 introduces a new method for representing categories usingneuron assemblies in deep networks. For problems with a large number of classes, this allows to reduce significantly the dimensions of a network.Chapter 5 describes a method for interfacing deep unsupervised networks with clique-based associative memories.
Note de contenu : 1- Introduction
2- Sparse Neural Associative Memories
3- Robustness of Deep Neural Networks to Erasures in a Reading Task
4- Assembly Output Codes for Learning Neural Networks
5- Combination of Unsupervised Learning and Associative Memory
6- Conclusion and Openings
Numéro de notice : 25836
Affiliation des auteurs : non IGN
Thématique : INFORMATIQUE/MATHEMATIQUE
Nature : Thèse française
Note de thèse : Thèse de Doctorat : Signal, Image, Vision : Mines-Télécom Atlantique : 2017
Organisme de stage : Laboratoire Labsticc
nature-HAL : Thèse
DOI : sans
En ligne : https://tel.archives-ouvertes.fr/tel-01812053
Format de la ressource électronique : URL
Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=95178

SVM et réseaux neuronaux convolutifs pour la classification de scènes urbaines / Amaury Zarzelli (2017)

Public

Titre : SVM et réseaux neuronaux convolutifs pour la classification de scènes urbaines
Type de document : Mémoire
Auteurs : Amaury Zarzelli, Auteur
Editeur : Champs-sur-Marne : Ecole nationale des sciences géographiques ENSG
Année de publication : 2017
Importance : 42 p.
Format : 21 x 30 cm
Note générale : Bibliographie
Rapport de projet pluridisciplinaire, cycle Ingénieur 2e année
Langues : Français (fre)
Descripteur : [Vedettes matières IGN] Traitement d'image optique
[Termes IGN] carte thématique
[Termes IGN] classification par réseau neuronal
[Termes IGN] classification par séparateurs à vaste marge
[Termes IGN] image Streetview
[Termes IGN] Ottawa
[Termes IGN] régression
[Termes IGN] réseau neuronal convolutif
[Termes IGN] scène urbaine

Index. décimale : PROJET Mémoires : Rapports de projet - stage des ingénieurs de 2e année
Résumé : (Auteur) L’accès de plus en plus répandu à des banques de données d’imagerie urbaine telles que StreetView de Google en corrélation avec le progrès des technologies en apprentissage machine facilite le développement de techniques permettant le traitement automatique des caractéristiques physiques du bâti sur de grandes zones urbaines. L’une des applications de ce traitement peut être l’étude sociologique, et notamment la mesure de la gentrification, processus par lequel des classes aisées s’installent dans des quartiers historiquement moins favorisés. En effet, ce phénomène se caractérise souvent par une modification de l’aspect des habitations, qui peut être détectée par un modèle de classification. Ce projet consiste à traiter toutes les étapes de cette classification, du téléchargement de l’imagerie urbaine jusqu’à la cartographie du phénomène étudié et peut être adapté à la qualification de n’importe quel phénomène urbain (accessibilité pour les piétons, structure des bâtiments…). Je me suis en particulier attaché à l’étape de la conception du modèle, en explorant notamment des techniques innovantes basées sur des réseaux de neurones convolutifs et dont les résultats sont prometteurs. Le travail a été effectué sur l’unité urbaine de la ville d’Ottawa au Canada. L’ensemble des travaux réalisés au cours du projet sont accessibles sur le dépôt GitHub suivant : https://github.com/azarz/gentriNet.
Note de contenu : INTRODUCTION
1. Gestion de projet
2. Étapes de la classification
3. Résultats obtenus
CONCLUSION
Numéro de notice : 22806
Affiliation des auteurs : IGN (2012-2019)
Thématique : IMAGERIE/INFORMATIQUE/MATHEMATIQUE/URBANISME
Nature : Mémoire de projet pluridisciplinaire
Organisme de stage : Université d’Ottawa
Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=88412

Réservation
Réserver ce document
Exemplaires(1)

Code-barres Cote Support Localisation Section Disponibilité
22806-01 PROJET Livre Centre de documentation Travaux d'élèves Disponible
Documents numériques

peut être téléchargé

SVM et réseaux neuronaux convolutifs
Adobe Acrobat PDF

The use of logistic model tree (LMT) for pixel- and object-based classifications using high-resolution WorldView-2 imagery / Ismail Colkesen in Geocarto international, vol 32 n° 1 (January 2017)

Public

[article]
inGeocarto international > vol 32 n° 1 (January 2017) . - pp 71 - 86
Titre : The use of logistic model tree (LMT) for pixel- and object-based classifications using high-resolution WorldView-2 imagery
Type de document : Article/Communication
Auteurs : Ismail Colkesen, Auteur ; Taskin Kavzoglu, Auteur
Année de publication : 2017
Article en page(s) : pp 71 - 86
Note générale : bibliographie
Langues : Anglais (eng)
Descripteur : [Vedettes matières IGN] Traitement d'image optique
[Termes IGN] algorithme d'apprentissage
[Termes IGN] arbre de décision
[Termes IGN] classification orientée objet
[Termes IGN] classification par arbre de décision
[Termes IGN] classification pixellaire
[Termes IGN] image Worldview
[Termes IGN] régression logistique

Résumé : (auteur) Logistic model tree (LMT), a new method integrating standard decision tree (DT) induction and linear logistic regression algorithm in a single tree, have been recently proposed as an alternative to DT-based learning algorithms. In this study, the LMT was applied in the context of pixel- and object-based classifications using high-resolution WorldView-2 imagery, and its performance was compared with C4.5, random forest and Adaboost. Results of the study showed that the LMT generally produced more accurate classification results than the other methods for both pixel- and object-based classifications. The improvement in classification accuracy reached to 3% in pixel-based and 5% in object-based classifications. It was also estimated that the LMT algorithm produced the most accurate results considering the allocation and overall disagreement errors. Based on the Wilcoxon’s Signed-Ranks tests, the performance differences between the LMT and the other methods were statistically significant for both pixel- and object-based image classifications.
Numéro de notice : A2017-085
Affiliation des auteurs : non IGN
Thématique : IMAGERIE
Nature : Article
nature-HAL : ArtAvecCL-RevueIntern
DOI : 10.1080/10106049.2015.1128486
Date de publication en ligne : 12/01/2016
En ligne : http://dx.doi.org/10.1080/10106049.2015.1128486
Format de la ressource électronique : URL article
Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=84410

[article]

Réservation
Réserver ce document
Exemplaires(1)

Code-barres Cote Support Localisation Section Disponibilité
059-2017011 RAB Revue Centre de documentation En réserve L003 Disponible

Vision-based detection of aircrafts and UAVs / Artem Rozantsev (2017)

Permalink
Class-specific sparse multiple kernel learning for spectral–spatial hyperspectral image classification / Tianzhu Liu in IEEE Transactions on geoscience and remote sensing, vol 54 n° 12 (December 2016)

Permalink
Dictionary learning for promoting structured sparsity in hyperspectral compressive sensing / Lei Zhang in IEEE Transactions on geoscience and remote sensing, vol 54 n° 12 (December 2016)

Permalink
Discriminative-dictionary-learning-based multilevel point-cluster features for ALS point-cloud classification / Zhenxin Zhang in IEEE Transactions on geoscience and remote sensing, vol 54 n° 12 (December 2016)

Permalink
Ultra short-term prediction of pole coordinates via combination of empirical mode decomposition and neural networks / Yu Lei in Artificial satellites, vol 51 n° 4 (December 2016)

Permalink
Fast three-dimensional empirical mode decomposition of hyperspectral images for class-oriented multitask learning / Zhi He in IEEE Transactions on geoscience and remote sensing, vol 54 n° 11 (November 2016)

Permalink
How many samples are needed? An investigation of binary logistic regression for selective omission in a road network / Qi Zhou in Cartography and Geographic Information Science, vol 43 n° 5 (November 2016)

Permalink
Multiple kernel learning based on discriminative kernel clustering for hyperspectral band selection / Jie Feng in IEEE Transactions on geoscience and remote sensing, vol 54 n° 11 (November 2016)

Permalink
Robust multitask learning with three-dimensional empirical mode decomposition-based features for hyperspectral classification / Zhi He in ISPRS Journal of photogrammetry and remote sensing, vol 121 (November 2016)

Permalink
Semi-supervised hyperspectral classification from a small number of training samples using a co-training approach / Michał Romaszewski in ISPRS Journal of photogrammetry and remote sensing, vol 121 (November 2016)

Permalink
Deep feature extraction and classification of hyperspectral images based on convolutional neural networks / Yushi Chen in IEEE Transactions on geoscience and remote sensing, vol 54 n° 10 (October 2016)

Permalink
A new ZTD model based on permanent ground-based GNSS-ZTD data / M. Ding in Survey review, vol 48 n° 351 (October 2016)

Permalink
SAR image change detection based on correlation kernel and multistage extreme learning machine / Lu Jia in IEEE Transactions on geoscience and remote sensing, vol 54 n° 10 (October 2016)

Permalink
Semisupervised classification for hyperspectral image based on multi-decision labeling and deep feature learning / Xiaorui Ma in ISPRS Journal of photogrammetry and remote sensing, vol 120 (october 2016)

Permalink
Noise removal from hyperspectral image with joint spectral–spatial distributed sparse representation / Jie Li in IEEE Transactions on geoscience and remote sensing, vol 54 n° 9 (September 2016)

Permalink
Airborne lidar estimation of aboveground forest biomass in the absence of field inventory / António Ferraz in Remote sensing, vol 8 n° 8 (August 2016)

Permalink
An immune genetic algorithm to buildings displacement in cartographic generalization / Yageng Sun in Transactions in GIS, vol 20 n° 4 (August 2016)

Permalink
Dirichlet process based active learning and discovery of unknown classes for hyperspectral image classification / Hao Wu in IEEE Transactions on geoscience and remote sensing, vol 54 n° 8 (August 2016)

Permalink
Disaggregation of remotely sensed soil moisture in heterogeneous landscapes using holistic structure-based models / Subit Chakrabarti in IEEE Transactions on geoscience and remote sensing, vol 54 n° 8 (August 2016)

Permalink
Sea ice concentration estimation during melt from dual-pol SAR scenes using deep convolutional neural networks: a case study / Lei Wang in IEEE Transactions on geoscience and remote sensing, vol 54 n° 8 (August 2016)

Permalink