Descripteur
Documents disponibles dans cette catégorie (1588)
Ajouter le résultat dans votre panier
Visionner les documents numériques
Affiner la recherche Interroger des sources externes
Etendre la recherche sur niveau(x) vers le bas
Object recognition algorithm based on optimized nonlinear activation function-global convolutional neural network / Feng-Ping An in The Visual Computer, vol 38 n° 2 (February 2022)
[article]
Titre : Object recognition algorithm based on optimized nonlinear activation function-global convolutional neural network Type de document : Article/Communication Auteurs : Feng-Ping An, Auteur ; Jun-e Liu, Auteur ; Lei Bai, Auteur Année de publication : 2022 Article en page(s) : pp 541 - 553 Note générale : bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Traitement d'image
[Termes IGN] détection d'objet
[Termes IGN] programmation non linéaire
[Termes IGN] réseau neuronal convolutifRésumé : (auteur) Traditional object recognition algorithms cannot meet the requirements of object recognition accuracy in the actual warehousing and logistics field. In recent years, the rapid development of the deep learning theory has provided a technical approach for solving the above problems, and a number of object recognition algorithms has been proposed based on deep learning, which have been promoted and applied. However, deep learning has the following problems in the application process of object recognition: First, the nonlinear modeling ability of the activation function in the deep learning model is poor; second, the deep learning model has a large number of repeated pooling operations during which information is lost. In view of these shortcomings, this paper proposes multiple-parameter exponential linear units with uniform and learnable parameter forms and introduces two learned parameters in the exponential linear unit (ELU), enabling it to represent piecewise linear and exponential nonlinear functions. Therefore, the ELU has good nonlinear modeling capabilities. At the same time, to improve the problem of losing information in the large number of repeated pooling operations, this paper proposes a new global convolutional neural network structure. This network structure makes full use of the local and global information of different layer feature maps in the network. It can reduce the problem of losing feature information in the large number of pooling operations. Based on the above ideas, this paper suggests an object recognition algorithm based on the optimized nonlinear activation function-global convolutional neural network. Experiments were carried out on the CIFAR100 dataset and the ImageNet dataset using the object recognition algorithm proposed in this paper. The results show that the object recognition method suggested in this paper not only has a better recognition accuracy than traditional machine learning and other deep learning models but also has a good stability and robustness. Numéro de notice : A2022-147 Affiliation des auteurs : non IGN Thématique : IMAGERIE/INFORMATIQUE Nature : Article DOI : 10.1007/s00371-020-02033-x Date de publication en ligne : 03/01/2022 En ligne : https://doi.org/10.1007/s00371-020-02033-x Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=100041
in The Visual Computer > vol 38 n° 2 (February 2022) . - pp 541 - 553[article]A robust nonrigid point set registration framework based on global and intrinsic topological constraints / Guiqiang Yang in The Visual Computer, vol 38 n° 2 (February 2022)
[article]
Titre : A robust nonrigid point set registration framework based on global and intrinsic topological constraints Type de document : Article/Communication Auteurs : Guiqiang Yang, Auteur ; Rui Li, Auteur ; Yujun Liu, Auteur ; Ji Wang, Auteur Année de publication : 2022 Article en page(s) : pp 603 - 623 Note générale : bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Traitement d'image
[Termes IGN] algorithme espérance-maximisation
[Termes IGN] contrainte géométrique
[Termes IGN] contrainte topologique
[Termes IGN] descripteur local
[Termes IGN] méthode fondée sur le noyau
[Termes IGN] méthode robuste
[Termes IGN] processus gaussien
[Termes IGN] semis de points
[Termes IGN] superposition de donnéesRésumé : (auteur) The problem of registering nonrigid point sets, with the aim of estimating the correspondences and learning the transformation between two given sets of points, often arises in computer vision tasks. This paper proposes a novel method for performing nonrigid point set registration on data with various types of degradation, in which the registration problem is formulated as a Gaussian mixture model (GMM)-based density estimation problem. Specifically, two complementary constraints are jointly considered for optimization in a GMM probabilistic framework. The first is a thin-plate spline-based regularization constraint that maintains global spatial motion consistency, and the second is a spectral graph-based regularization constraint that preserves the intrinsic structure of a point set. Moreover, the correspondences and the transformation are alternately optimized using the expectation maximization algorithm to obtain a closed-form solution. We first utilize local descriptors to construct the initial correspondences and then estimate the underlying transformation under the GMM-based framework. Experimental results on contour images and real images show the effectiveness and robustness of the proposed method. Numéro de notice : A2022-146 Affiliation des auteurs : non IGN Thématique : IMAGERIE/INFORMATIQUE Nature : Article DOI : 10.1007/s00371-020-02037-7 Date de publication en ligne : 21/02/2022 En ligne : https://doi.org/10.1007/s00371-020-02037-7 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=100040
in The Visual Computer > vol 38 n° 2 (February 2022) . - pp 603 - 623[article]Siamese Adversarial Network for image classification of heavy mineral grains / Huizhen Hao in Computers & geosciences, vol 159 (February 2022)
[article]
Titre : Siamese Adversarial Network for image classification of heavy mineral grains Type de document : Article/Communication Auteurs : Huizhen Hao, Auteur ; Zhiwei Jiang, Auteur ; Shiping Ge, Auteur ; et al., Auteur Année de publication : 2022 Article en page(s) : n° 105016 Note générale : bibliographie Langues : Anglais (eng) Descripteur : [Vedettes matières IGN] Traitement d'image
[Termes IGN] apprentissage profond
[Termes IGN] classification barycentrique
[Termes IGN] classification et arbre de régression
[Termes IGN] classification par forêts d'arbres décisionnels
[Termes IGN] extraction de traits caractéristiques
[Termes IGN] microscope électronique
[Termes IGN] minéral
[Termes IGN] polarisation croisée
[Termes IGN] réseau antagoniste génératif
[Termes IGN] réseau neuronal siamois
[Termes IGN] séparateur à vaste margeRésumé : (auteur) The identification of heavy mineral grains based on microscopic images can significantly reduce the time and economic cost of the identification. There are several deep learning models to realize end-to-end identification of mineral image recently. However, due to the variety and complexity of mineral images, the existing models are difficult to accurately recognize heavy mineral grains in microscopic images. Here we propose the Siamese Adversarial Network (SAN) for image classification of the heavy mineral grains, which is the first time to focus on addressing the domain difference of heavy mineral images from different basins. In more details, we design a Siamese feature encoder to extract features of both the plane-polarized and cross-polarized images as internal representation of heavy mineral grains. The features are reconstructed to discard domain-related information by adversarial training the heavy mineral classifier and domain discriminator. The identification performance of the models under the three mixed domain experiments is consistently higher than the performance under the same domain settings respectively which shows that the model we proposed achieves a great generalization ability on unseen domains. Numéro de notice : A2022-174 Affiliation des auteurs : non IGN Thématique : IMAGERIE Nature : Article DOI : 10.1016/j.cageo.2021.105016 Date de publication en ligne : 03/12/2021 En ligne : https://doi.org/10.1016/j.cageo.2021.105016 Format de la ressource électronique : URL article Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=99810
in Computers & geosciences > vol 159 (February 2022) . - n° 105016[article]
Titre : Deep learning architectures for onboard satellite image analysis Type de document : Thèse/HDR Auteurs : Gaétan Bahl, Auteur ; Florent Lafarge, Directeur de thèse Editeur : Nice : Université Côte d'Azur Année de publication : 2022 Importance : 120 p. Format : 21 x 30 cm Note générale : Bibliographie
Thèse de Doctorat de l'Université Côte d’Azur, Spécialité InformatiqueLangues : Anglais (eng) Descripteur : [Vedettes matières IGN] Traitement d'image
[Termes IGN] analyse d'image orientée objet
[Termes IGN] apprentissage profond
[Termes IGN] contour
[Termes IGN] détection d'objet
[Termes IGN] extraction du réseau routier
[Termes IGN] forêt
[Termes IGN] image satellite
[Termes IGN] nuage
[Termes IGN] régression
[Termes IGN] réseau neuronal convolutif
[Termes IGN] réseau neuronal de graphes
[Termes IGN] réseau neuronal récurrent
[Termes IGN] segmentation sémantiqueIndex. décimale : THESE Thèses et HDR Résumé : (Auteur) Les progrès des satellites d'observation de la Terre à haute résolution et la réduction des temps de revisite introduite par la création de constellations de satellites ont conduit à la création quotidienne de grandes quantités d'images (des centaines de Teraoctets par jour). Simultanément, la popularisation des techniques de Deep Learning a permis le développement d'architectures capables d'extraire le contenu sémantique des images. Bien que ces algorithmes nécessitent généralement l'utilisation de matériel puissant, des accélérateurs d'inférence IA de faible puissance ont récemment été développés et ont le potentiel d'être utilisés dans les prochaines générations de satellites, ouvrant ainsi la possibilité d'une analyse embarquée des images satellite. En extrayant les informations intéressantes des images satellite directement à bord, il est possible de réduire considérablement l'utilisation de la bande passante, du stockage et de la mémoire. Les applications actuelles et futures, telles que la réponse aux catastrophes, l'agriculture de précision et la surveillance du climat, bénéficieraient d'une latence de traitement plus faible, voire d'alertes en temps réel. Dans cette thèse, notre objectif est double : D'une part, nous concevons des architectures de Deep Learning efficaces, capables de fonctionner sur des périphériques de faible puissance, tels que des satellites ou des drones, tout en conservant une précision suffisante. D'autre part, nous concevons nos algorithmes en gardant à l'esprit l'importance d'avoir une sortie compacte qui peut être efficacement calculée, stockée, transmise au sol ou à d'autres satellites dans une constellation. Tout d'abord, en utilisant des convolutions séparables en profondeur et des réseaux neuronaux récurrents convolutionnels, nous concevons des réseaux neuronaux de segmentation sémantique efficaces avec un faible nombre de paramètres et une faible utilisation de la mémoire. Nous appliquons ces architectures à la segmentation des nuages et des forêts dans les images satellites. Nous concevons également une architecture spécifique pour la segmentation des nuages sur le FPGA d'OPS-SAT, un satellite lancé par l'ESA en 2019, et réalisons des expériences à bord à distance. Deuxièmement, nous développons une architecture de segmentation d'instance pour la régression de contours lisses basée sur une représentation à coefficients de Fourier, qui permet de stocker et de transmettre efficacement les formes des objets détectés. Nous évaluons la performance de notre méthode sur une variété de dispositifs informatiques à faible puissance. Enfin, nous proposons une architecture d'extraction de graphes routiers basée sur une combinaison de Fully Convolutional Networks et de Graph Neural Networks. Nous montrons que notre méthode est nettement plus rapide que les méthodes concurrentes, tout en conservant une bonne précision. Note de contenu : 1. Introduction
1.1 Context and motivation
1.2 Methods and Challenges
1.3 Contributions and outline
2. On-board image segmentation with compact networks
2.1 Introduction
2.2 Related works
2.3 Proposed architectures
2.4 Experiments on cloud segmentation
2.5 Experiments on forest segmentation
2.6 Conclusion
3. Recurrent convolutional networks for semantic segmentation
3.1 Introduction
3.2 Method
3.3 Experiments
3.4 Conclusion and future works
4. Regression of compact object contours
4.1 Introduction
4.2 Related Work
4.3 Method
4.4 Experiments
4.5 Conclusion
5. Road graph extraction
5.1 Introduction
5.2 Related Works
5.3 Method
5.4 Experiments
5.5 Limitations
5.6 Other uses of our method
5.7 Conclusion
6. Conclusion and Perspectives
6.1 Summary
6.2 Limitations and perspectives
6.3 Publications
6.4 Carbon Impact StatementNuméro de notice : 26912 Affiliation des auteurs : non IGN Thématique : IMAGERIE Nature : Thèse française Note de thèse : Thèse de Doctorat : Informatique : Côte d'Azur : 2022 Organisme de stage : Inria Sophia-Antipolis Méditerranée nature-HAL : Thèse DOI : sans Date de publication en ligne : 27/09/2022 En ligne : https://tel.hal.science/tel-03789667v2 Format de la ressource électronique : URL Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=101955
Titre : Deep learning-based point cloud compression Titre original : Compression de nuages de points par apprentissage profond Type de document : Thèse/HDR Auteurs : Maurice Quach, Auteur ; Frédéric Dufaux, Directeur de thèse ; Giuseppe Valenzise, Directeur de thèse Editeur : Bures-sur-Yvette : Université Paris-Saclay Année de publication : 2022 Importance : 165 p. Format : 21 x 30 cm Note générale : Bibliographie
Thèse de Doctorat de l'Université de Saclay, spécialité Traitement du signal et des imagesLangues : Anglais (eng) Descripteur : [Vedettes matières IGN] Traitement d'image
[Termes IGN] apprentissage profond
[Termes IGN] attribut
[Termes IGN] compression d'image
[Termes IGN] compression de données
[Termes IGN] géométrie
[Termes IGN] semis de points
[Termes IGN] stockage de donnéesIndex. décimale : THESE Thèses et HDR Résumé : (auteur) Point clouds are becoming essential in key applications with advances in capture technologies leading to large volumes of data.Compression is thus essential for storage and transmission.Point Cloud Compression can be divided into two parts: geometry and attribute compression.In addition, point cloud quality assessment is necessary in order to evaluate point cloud compression methods.Geometry compression, attribute compression and quality assessment form the three main parts of this dissertation.The common challenge across these three problems is the sparsity and irregularity of point clouds.Indeed, while other modalities such as images lie on a regular grid, point cloud geometry can be considered as a sparse binary signal over 3D space and attributes are defined on the geometry which can be both sparse and irregular.First, the state of the art for geometry and attribute compression methods with a focus on deep learning based approaches is reviewed.The challenges faced when compressing geometry and attributes are considered, with an analysis of the current approaches to address them, their limitations and the relations between deep learning and traditional ones.We present our work on geometry compression: a convolutional lossy geometry compression approach with a study on the key performance factors of such methods and a generative model for lossless geometry compression with a multiscale variant addressing its complexity issues.Then, we present a folding-based approach for attribute compression that learns a mapping from the point cloud to a 2D grid in order to reduce point cloud attribute compression to an image compression problem.Furthermore, we propose a differentiable deep perceptual quality metric that can be used to train lossy point cloud geometry compression networks while being well correlated with perceived visual quality and a convolutional neural network for point cloud quality assessment based on a patch extraction approach.Finally, we conclude the dissertation and discuss open questions in point cloud compression, existing solutions and perspectives. We highlight the link between existing point cloud compression research and research problems to relevant areas of adjacent fields, such as rendering in computer graphics, mesh compression and point cloud quality assessment. Note de contenu : 1- Introduction
2- State of the Art on point cloud compression
3- Convolutional neural networks for lossy PCGC
4- Deep generative model for lossless PCGC
5- Deep multiscale lossless PCGC
6- Folding-based PCAC
7- Deep perceptual point cloud quality metric
8- Convolutional Neural Network for PCQANuméro de notice : 24081 Affiliation des auteurs : non IGN Thématique : IMAGERIE/INFORMATIQUE Nature : Thèse française Note de thèse : Thèse de doctorat : Traitement du signal et des images : Paris-Saclay : 2022 Organisme de stage : Laboratoire des signaux et systèmes DOI : sans En ligne : https://theses.hal.science/tel-03894261 Format de la ressource électronique : URL Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=102331 PermalinkFast estimation for robust supervised classification with mixture models / Erwan Giry Fouquet in Pattern recognition letters, vol 152 (December 2021)PermalinkConnecting images through sources: Exploring low-data, heterogeneous instance retrieval / Dimitri Gominski in Remote sensing, vol 13 n° 16 (August-2 2021)PermalinkDeep learning in denoising of micro-computed tomography images of rock samples / Mikhail Sidorenko in Computers & geosciences, vol 151 (June 2021)PermalinkDirect analysis in real-time (DART) time-of-flight mass spectrometry (TOFMS) of wood reveals distinct chemical signatures of two species of Afzelia / Peter Kitin in Annals of Forest Science, vol 78 n° 2 (June 2021)PermalinkMultiple convolutional features in Siamese networks for object tracking / Zhenxi Li in Machine Vision and Applications, vol 32 n° 3 (May 2021)PermalinkA stacked dense denoising–segmentation network for undersampled tomograms and knowledge transfer using synthetic tomograms / Dimitrios Bellos in Machine Vision and Applications, vol 32 n° 3 (May 2021)PermalinkParsing of urban facades from 3D point clouds based on a novel multi-view domain / Wei Wang in Photogrammetric Engineering & Remote Sensing, PERS, vol 87 n° 4 (April 2021)PermalinkDigital surface model refinement based on projected images / Jiali Wang in Photogrammetric Engineering & Remote Sensing, PERS, vol 87 n° 3 (March 2021)PermalinkDetection of pictorial map objects with convolutional neural networks / Raimund Schnürer in Cartographic journal (the), vol 58 n° 1 (February 2021)Permalink