Catalogue en ligne IGN

Mot-clé : le dernier

trié(s) par selon titre (Titre croissant(e)) Ajouter le résultat dans votre panier Affiner la recherche

Deep learning architectures for onboard satellite image analysis / Gaétan Bahl (2022)

Public

Titre : Deep learning architectures for onboard satellite image analysis
Type de document : Thèse/HDR
Auteurs : Gaétan Bahl, Auteur ; Florent Lafarge, Directeur de thèse
Editeur : Nice : Université Côte d'Azur
Année de publication : 2022
Importance : 120 p.
Format : 21 x 30 cm
Note générale : Bibliographie
Thèse de Doctorat de l'Université Côte d’Azur, Spécialité Informatique
Langues : Anglais (eng)
Descripteur : [Vedettes matières IGN] Traitement d'image
[Termes IGN] analyse d'image orientée objet
[Termes IGN] apprentissage profond
[Termes IGN] contour
[Termes IGN] détection d'objet
[Termes IGN] extraction du réseau routier
[Termes IGN] forêt
[Termes IGN] image satellite
[Termes IGN] nuage
[Termes IGN] régression
[Termes IGN] réseau neuronal convolutif
[Termes IGN] réseau neuronal de graphes
[Termes IGN] réseau neuronal récurrent
[Termes IGN] segmentation sémantique

Index. décimale : THESE Thèses et HDR
Résumé : (Auteur) Les progrès des satellites d'observation de la Terre à haute résolution et la réduction des temps de revisite introduite par la création de constellations de satellites ont conduit à la création quotidienne de grandes quantités d'images (des centaines de Teraoctets par jour). Simultanément, la popularisation des techniques de Deep Learning a permis le développement d'architectures capables d'extraire le contenu sémantique des images. Bien que ces algorithmes nécessitent généralement l'utilisation de matériel puissant, des accélérateurs d'inférence IA de faible puissance ont récemment été développés et ont le potentiel d'être utilisés dans les prochaines générations de satellites, ouvrant ainsi la possibilité d'une analyse embarquée des images satellite. En extrayant les informations intéressantes des images satellite directement à bord, il est possible de réduire considérablement l'utilisation de la bande passante, du stockage et de la mémoire. Les applications actuelles et futures, telles que la réponse aux catastrophes, l'agriculture de précision et la surveillance du climat, bénéficieraient d'une latence de traitement plus faible, voire d'alertes en temps réel. Dans cette thèse, notre objectif est double : D'une part, nous concevons des architectures de Deep Learning efficaces, capables de fonctionner sur des périphériques de faible puissance, tels que des satellites ou des drones, tout en conservant une précision suffisante. D'autre part, nous concevons nos algorithmes en gardant à l'esprit l'importance d'avoir une sortie compacte qui peut être efficacement calculée, stockée, transmise au sol ou à d'autres satellites dans une constellation. Tout d'abord, en utilisant des convolutions séparables en profondeur et des réseaux neuronaux récurrents convolutionnels, nous concevons des réseaux neuronaux de segmentation sémantique efficaces avec un faible nombre de paramètres et une faible utilisation de la mémoire. Nous appliquons ces architectures à la segmentation des nuages et des forêts dans les images satellites. Nous concevons également une architecture spécifique pour la segmentation des nuages sur le FPGA d'OPS-SAT, un satellite lancé par l'ESA en 2019, et réalisons des expériences à bord à distance. Deuxièmement, nous développons une architecture de segmentation d'instance pour la régression de contours lisses basée sur une représentation à coefficients de Fourier, qui permet de stocker et de transmettre efficacement les formes des objets détectés. Nous évaluons la performance de notre méthode sur une variété de dispositifs informatiques à faible puissance. Enfin, nous proposons une architecture d'extraction de graphes routiers basée sur une combinaison de Fully Convolutional Networks et de Graph Neural Networks. Nous montrons que notre méthode est nettement plus rapide que les méthodes concurrentes, tout en conservant une bonne précision.
Note de contenu : 1. Introduction
1.1 Context and motivation
1.2 Methods and Challenges
1.3 Contributions and outline
2. On-board image segmentation with compact networks
2.1 Introduction
2.2 Related works
2.3 Proposed architectures
2.4 Experiments on cloud segmentation
2.5 Experiments on forest segmentation
2.6 Conclusion
3. Recurrent convolutional networks for semantic segmentation
3.1 Introduction
3.2 Method
3.3 Experiments
3.4 Conclusion and future works
4. Regression of compact object contours
4.1 Introduction
4.2 Related Work
4.3 Method
4.4 Experiments
4.5 Conclusion
5. Road graph extraction
5.1 Introduction
5.2 Related Works
5.3 Method
5.4 Experiments
5.5 Limitations
5.6 Other uses of our method
5.7 Conclusion
6. Conclusion and Perspectives
6.1 Summary
6.2 Limitations and perspectives
6.3 Publications
6.4 Carbon Impact Statement

Numéro de notice : 26912
Affiliation des auteurs : non IGN
Thématique : IMAGERIE
Nature : Thèse française
Note de thèse : Thèse de Doctorat : Informatique : Côte d'Azur : 2022
Organisme de stage : Inria Sophia-Antipolis Méditerranée
nature-HAL : Thèse
DOI : sans
Date de publication en ligne : 27/09/2022
En ligne : https://tel.hal.science/tel-03789667v2
Format de la ressource électronique : URL
Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=101955

Deep learning based 2D and 3D object detection and tracking on monocular video in the context of autonomous vehicles / Zhujun Xu (2022)

Public

Titre : Deep learning based 2D and 3D object detection and tracking on monocular video in the context of autonomous vehicles
Type de document : Thèse/HDR
Auteurs : Zhujun Xu, Auteur ; Eric Chaumette, Directeur de thèse ; Damien Vivet, Directeur de thèse
Editeur : Toulouse : Université de Toulouse
Année de publication : 2022
Importance : 136 p.
Format : 21 x 30 cm
Note générale : bibliographie
Thèse en vue de l'obtention du Doctorat de l'Université de Toulouse, spécialité Informatique et Télécommunications
Langues : Anglais (eng)
Descripteur : [Vedettes matières IGN] Traitement d'image optique
[Termes IGN] apprentissage profond
[Termes IGN] apprentissage semi-dirigé
[Termes IGN] architecture de réseau
[Termes IGN] détection d'objet
[Termes IGN] échantillonnage de données
[Termes IGN] objet 3D
[Termes IGN] segmentation d'image
[Termes IGN] véhicule automobile
[Termes IGN] vidéo
[Termes IGN] vision par ordinateur

Index. décimale : THESE Thèses et HDR
Résumé : (auteur) The objective of this thesis is to develop deep learning based 2D and 3D object detection and tracking methods on monocular video and apply them to the context of autonomous vehicles. Actually, when directly using still image detectors to process a video stream, the accuracy suffers from sampled image quality problems. Moreover, generating 3D annotations is time-consuming and expensive due to the data fusion and large numbers of frames. We therefore take advantage of the temporal information in videos such as the object consistency, to improve the performance. The methods should not introduce too much extra computational burden, since the autonomous vehicle demands a real-time performance.Multiple methods can be involved in different steps, for example, data preparation, network architecture and post-processing. First, we propose a post-processing method called heatmap propagation based on a one-stage detector CenterNet for video object detection. Our method propagates the previous reliable long-term detection in the form of heatmap to the upcoming frame. Then, to distinguish different objects of the same class, we propose a frame-to-frame network architecture for video instance segmentation by using the instance sequence queries. The tracking of instances is achieved without extra post-processing for data association. Finally, we propose a semi-supervised learning method to generate 3D annotations for 2D video object tracking dataset. This helps to enrich the training process for 3D object detection. Each of the three methods can be individually applied to leverage image detectors to video applications. We also propose two complete network structures to solve 2D and 3D object detection and tracking on monocular video.
Note de contenu : 1- Introduction
2- Video object detection avec la heatmap propagation (propagation de carte de chaleur)
3- Video instance segmentation with instance sequence queries
4- Semi-supervised learning of monocular 3D object detection with 2D video tracking annotations
5- Conclusions and perspectives
Numéro de notice : 24072
Affiliation des auteurs : non IGN
Thématique : IMAGERIE
Nature : Thèse française
Note de thèse : Thèse de Doctorat : Informatique et Télécommunications : Toulouse : 2022
DOI : sans
En ligne : https://www.theses.fr/2022ESAE0019
Format de la ressource électronique : URL
Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=102136

Deep learning based 3D reconstruction: supervision and representation / François Darmon (2022)

Public

Titre : Deep learning based 3D reconstruction: supervision and representation
Type de document : Thèse/HDR
Auteurs : François Darmon, Auteur ; Pascal Monasse, Directeur de thèse ; Mathieu Aubry, Directeur de thèse
Editeur : Champs-sur-Marne : Ecole des Ponts ParisTech
Année de publication : 2022
Importance : 115 p.
Format : 21 x 30 cm
Note générale : Bibliographie
Thèse de doctorat de l'Ecole des Ponts ParisTech, spécialité informatique
Langues : Anglais (eng)
Descripteur : [Vedettes matières IGN] Traitement d'image optique
[Termes IGN] appariement d'images
[Termes IGN] carte de profondeur
[Termes IGN] classification par réseau neuronal convolutif
[Termes IGN] extraction
[Termes IGN] géométrie épipolaire
[Termes IGN] maillage
[Termes IGN] modèle stéréoscopique
[Termes IGN] point d'intérêt
[Termes IGN] Ransac (algorithme)
[Termes IGN] reconstruction 3D
[Termes IGN] reconstruction d'objet
[Termes IGN] semis de points
[Termes IGN] SIFT (algorithme)
[Termes IGN] structure-from-motion
[Termes IGN] voxel

Index. décimale : THESE Thèses et HDR
Résumé : (auteur) 3D reconstruction is a long standing problem in computer vision. Yet, state-of-the-art methods still struggle when the images used have large illumination changes, many occlusions or limited textures. Deep Learning holds promises of improving 3D reconstruction in such setups, but classical methods still produce the best results. In this thesis we analyse the specificity of deep learning applied to multiview 3D reconstruction and introduce new deep learning based methods.The first contribution of this thesis is an analysis of the possible supervision for training Deep Learning models for sparse image matching. We introduce a two-step algorithm that first computes low resolution matches using deep learning and then matches classical local features inside the matches regions. We analyze several levels of supervision and show that our new epipolar supervision leads to the best results.The second contribution is also a study of supervision for Deep Learning but applied to another scenario: calibrated 3D reconstruction in the wild. We show that existing unsupervised methods do not work on such data and we introduce a new training technique that solves this issue. We then exhaustively compare unsupervised approach and supervised approaches with different network architectures and training data.Finally, our third contribution is about data representation. Neural implicit representation were recently used for image rendering. We adapt this representation to the multiview reconstruction problem and we introduce a new method that, similar to classical 3D reconstruction techniques, optimizes photo-consistency between projections of multiple images. Our approach outperforms state-of-the-art by a large margin.
Note de contenu : 1- Introduction
2- Background
3- Deep learning for guiding keypoint matching
4- Deep Learning based Multi-View Stereo in the wild
5- Multi-view reconstruction with implicit surfaces and patch warping
6- Conclusion
Numéro de notice : 24085
Affiliation des auteurs : non IGN
Thématique : IMAGERIE/INFORMATIQUE
Nature : Thèse française
Note de thèse : Thèse de Doctorat : Informatique : Ponts ParisTech : 2022
Organisme de stage : Laboratoire d'Informatique Gaspard-Monge LIGM
DOI : sans
En ligne : https://www.theses.fr/2022ENPC0024
Format de la ressource électronique : URL
Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=102473

Deep-learning based multiple land-cover map translation / Luc Baudoux (2022)

Public

Titre : Deep-learning based multiple land-cover map translation
Type de document : Article/Communication
Auteurs : Luc Baudoux , Auteur ; Jordi Inglada, Auteur ; Clément Mallet , Auteur
Editeur : New York : Institute of Electrical and Electronics Engineers IEEE
Année de publication : 2022
Projets : 1-Pas de projet /
Conférence : IGARSS 2022, IEEE International Geoscience And Remote Sensing Symposium 17/07/2022 22/07/2022 Kuala Lumpur Malaysie Proceedings IEEE
Importance : pp 1260 - 1263
Note générale : bibliographie
Langues : Anglais (eng)
Descripteur : [Vedettes matières IGN] Bases de données localisées
[Termes IGN] apprentissage profond
[Termes IGN] base de données d'occupation du sol
[Termes IGN] cadre conceptuel
[Termes IGN] carte d'occupation du sol
[Termes IGN] classification par réseau neuronal convolutif
[Termes IGN] segmentation sémantique

Résumé : (auteur) This paper presents a framework for simultaneously translating multiple land-cover maps into a given one in a supervised way. Conversely to existing approaches working on 1–1 translation, we propose a multi-translation setup that increases the generalizability and translation performance, especially on land-cover maps covering restricted spatial extents. The proposed method mainly assumes that the map of interest spatially overlaps at least with one of the other maps. High performance translation is achieved with a Convolutional Neural Network (CNN) based encoder-decoder frame-work trained with three goals: (i) high-quality translation; (ii) self-reconstruction ability; (iii) mapping of all datasets into a common representation space. Country-scale experimental results show the method effectiveness in translating six highly heterogeneous land-cover maps, achieving significantly better results than the traditional semantic-based method and better results than CNN trained for a 1–1 translation task (+ 9.7% in Overall Accuracy (OA) and +12% in macro F1-score (mF1)).
Numéro de notice : C2022-039
Affiliation des auteurs : UGE-LASTIG+Ext (2020- )
Autre URL associée : https://hal.science/hal-03983066v1/document
Thématique : GEOMATIQUE
Nature : Communication
nature-HAL : ComAvecCL&ActesPubliésIntl
DOI : 10.1109/IGARSS46834.2022.9883056
En ligne : https://doi.org/10.1109/IGARSS46834.2022.9883056
Format de la ressource électronique : URL article
Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=101765

Deep learning-based point cloud compression / Maurice Quach (2022)

Public

Titre : Deep learning-based point cloud compression
Titre original : Compression de nuages de points par apprentissage profond
Type de document : Thèse/HDR
Auteurs : Maurice Quach, Auteur ; Frédéric Dufaux, Directeur de thèse ; Giuseppe Valenzise, Directeur de thèse
Editeur : Bures-sur-Yvette : Université Paris-Saclay
Année de publication : 2022
Importance : 165 p.
Format : 21 x 30 cm
Note générale : Bibliographie
Thèse de Doctorat de l'Université de Saclay, spécialité Traitement du signal et des images

Langues : Anglais (eng)
Descripteur : [Vedettes matières IGN] Traitement d'image
[Termes IGN] apprentissage profond
[Termes IGN] attribut
[Termes IGN] compression d'image
[Termes IGN] compression de données
[Termes IGN] géométrie
[Termes IGN] semis de points
[Termes IGN] stockage de données

Index. décimale : THESE Thèses et HDR
Résumé : (auteur) Point clouds are becoming essential in key applications with advances in capture technologies leading to large volumes of data.Compression is thus essential for storage and transmission.Point Cloud Compression can be divided into two parts: geometry and attribute compression.In addition, point cloud quality assessment is necessary in order to evaluate point cloud compression methods.Geometry compression, attribute compression and quality assessment form the three main parts of this dissertation.The common challenge across these three problems is the sparsity and irregularity of point clouds.Indeed, while other modalities such as images lie on a regular grid, point cloud geometry can be considered as a sparse binary signal over 3D space and attributes are defined on the geometry which can be both sparse and irregular.First, the state of the art for geometry and attribute compression methods with a focus on deep learning based approaches is reviewed.The challenges faced when compressing geometry and attributes are considered, with an analysis of the current approaches to address them, their limitations and the relations between deep learning and traditional ones.We present our work on geometry compression: a convolutional lossy geometry compression approach with a study on the key performance factors of such methods and a generative model for lossless geometry compression with a multiscale variant addressing its complexity issues.Then, we present a folding-based approach for attribute compression that learns a mapping from the point cloud to a 2D grid in order to reduce point cloud attribute compression to an image compression problem.Furthermore, we propose a differentiable deep perceptual quality metric that can be used to train lossy point cloud geometry compression networks while being well correlated with perceived visual quality and a convolutional neural network for point cloud quality assessment based on a patch extraction approach.Finally, we conclude the dissertation and discuss open questions in point cloud compression, existing solutions and perspectives. We highlight the link between existing point cloud compression research and research problems to relevant areas of adjacent fields, such as rendering in computer graphics, mesh compression and point cloud quality assessment.
Note de contenu : 1- Introduction
2- State of the Art on point cloud compression
3- Convolutional neural networks for lossy PCGC
4- Deep generative model for lossless PCGC
5- Deep multiscale lossless PCGC
6- Folding-based PCAC
7- Deep perceptual point cloud quality metric
8- Convolutional Neural Network for PCQA
Numéro de notice : 24081
Affiliation des auteurs : non IGN
Thématique : IMAGERIE/INFORMATIQUE
Nature : Thèse française
Note de thèse : Thèse de doctorat : Traitement du signal et des images : Paris-Saclay : 2022
Organisme de stage : Laboratoire des signaux et systèmes
DOI : sans
En ligne : https://theses.hal.science/tel-03894261
Format de la ressource électronique : URL
Permalink : https://documentation.ensg.eu/index.php?lvl=notice_display&id=102331

Deep learning for anchor detection in multi-scale maps / Quentin Potié (2022)

Permalink
Detecting openings for indoor/outdoor registration / Rahima Djahel (2022)

Permalink
Détection des micro et macroplastiques à partir de mesures spectrales / Martin Cubaud (2022)

Permalink
Détection des prairies de fauche et estimation des périodes de fauche par télédétection / Emma Seneschal (2022)

Permalink
Developing the potential of airborne lidar systems for the sustainable management of forests / Karun Dayal (2022)

Permalink
Development of object detectors for satellite images by deep learning / Alissa Kouraeva (2022)

Permalink
Développement d’une méthode innovante pour l’ajustement des paramètres internes du système de gravimétrie sous-marine GraviMob / Ossama Kharbou (2021)

Permalink
Développement d’outils et de méthodes permettant l’acquisition, le traitement et la diffusion de données issues de levés par drone / Guillaume Feuillatre (2022)

Permalink
Domain adaptation for urban scene segmentation / Antoine Saporta (2022)

Permalink
Dynamic scene understanding using deep neural networks / Ye Lyu (2021)

Permalink