
Géométrie multi-vues pour la vision par ordinateur 2e édition
Description
Introduction au livre
Ce livre traite du problème de la photographie d'un objet tridimensionnel à l'aide de plusieurs appareils photo, puis de la reconstruction de cet objet tridimensionnel à partir de ces images multiples.
Après avoir expliqué la géométrie projective, qui est la géométrie d'une image prise par une seule caméra, et introduit les géométries des points de vue duaux, triples et quadruples, nous présentons un algorithme qui utilise ces éléments pour reconstruire des objets tridimensionnels.
Avec le faible coût des appareils photo numériques, il existe de nombreuses applications où la résolution efficace de ce problème serait avantageuse, ce qui fait de ce livre une bonne ressource pour les chercheurs spécialisés en vision par ordinateur.
Après avoir expliqué la géométrie projective, qui est la géométrie d'une image prise par une seule caméra, et introduit les géométries des points de vue duaux, triples et quadruples, nous présentons un algorithme qui utilise ces éléments pour reconstruire des objets tridimensionnels.
Avec le faible coût des appareils photo numériques, il existe de nombreuses applications où la résolution efficace de ce problème serait avantageuse, ce qui fait de ce livre une bonne ressource pour les chercheurs spécialisés en vision par ordinateur.
- Vous pouvez consulter un aperçu du contenu du livre.
Aperçu
indice
Chapitre 1.
Introduction - Un tour d'horizon de la géométrie multi-vues
1.1 Introduction - La géométrie projective partout
__1.2 Projection de la caméra
1.3 Reconstruction à partir de points de vue multiples
__1.4 Géométrie à triple vue
__1.5 Géométrie de la quadruple vue et reconstruction de scènes n
__1.6 transmission
1.7 Reconstruction euclidienne
__1.8 Correction automatique
__1.9 Résultat I : Modèle graphique 3D
__1.10 Résultat II : Augmentation vidéo
Partie 0.
Contexte : Géométrie projective, transformations et approximation
Chapitre 2.
Géométrie projective bidimensionnelle et transformations
__2.1 Géométrie plane
__2.2 Plan projectif bidimensionnel
__2.3 Transformation projective
__2.4 Couche de transformation
__2.5 Géométrie projective unidimensionnelle
__2.6 Topologie des surfaces projectives
__2.7 Restauration des propriétés de transformation affine et de distance à partir d'images
__2.8 Propriétés supplémentaires des cônes
2.9 Points fixes et lignes fixes
__2.10 En sortant
Chapitre 3.
Géométrie projective 3D et transformations
3.1 Points et transformations projectives
3.2 Représentation et transformation des plans, des droites et des surfaces quadratiques
__3.3 Courbe cubique torsadée
__3.4 Couche de transformation
__3.5 Surface infinie
__3.6 Cône absolu
__3.7 Courbe quadratique duale absolue
__3.8 En sortant
Chapitre 4.
Estimation des transformations projectives bidimensionnelles
__4.1 Algorithme de transformation linéaire directe (DLT)
4.2 Différentes fonctions de coût
4.3 Fonction de coût statistique et estimation du maximum de vraisemblance
4.4 Invariance par transformation et normalisation
4.5 Comment minimiser les répétitions
4.6 Comparaison expérimentale des algorithmes
__4.7 Estimation solide
4.8 Calcul automatique du mappage à réponse unique
__4.9 En sortant
Chapitre 5.
Évaluation des algorithmes et analyse des erreurs
__5.1 Limites de performance
5.2 Covariance de la transformation estimée
5.3 Estimation de la covariance par la méthode de Monte Carlo
5.4 En sortant
Partie 1.
Géométrie de la caméra et géométrie de vue unique
Chapitre 6.
Modèle d'appareil photo
__6.1 Caméra finie
__6.2 Caméra projective
__6.3 Caméra infinie
6.4 Autres modèles d'appareils photo
__6.5 En sortant
Chapitre 7.
Calcul de la matrice de la caméra ??
__7.1 Équations fondamentales
7.2 Erreur géométrique
__7.3 Estimation limitée de la caméra
__7.4 Distorsion radiale
__7.5 En sortant
Chapitre 8.
Géométrie à point unique supplémentaire
8.1 Comportement des caméras projectives sur les plans, les lignes et les cônes
__8.2 Image de surface lisse
8.3 Comportement de la caméra projective pour les surfaces quadratiques
8.4 L'importance du centrage de la caméra
8.5 Calibrage de la caméra et images absolues du cône
8.6 Points de fuite et lignes de fuite
8.7 Mesure et reconstruction 3D affines
8.8 Calibrage de la caméra à un instant précis ? Détermination
8.9 Reconstruction à un seul point
__8.10 Cône de correction
__8.11 En sortant
Partie 2.
Géométrie à double point de vue
Chapitre 9.
Géométrie de l'entropie et matrices fondamentales
__9.1 Géométrie de l'Ascension
__9.2 Matrice de base ??
__9.3 Matrices fondamentales issues d'exercices spéciaux
__9.4 Représentation géométrique des matrices élémentaires
__9.5 Recherche de la matrice de la caméra
__9.6 Matrices essentielles
__9.7 En sortant
Chapitre 10.
Reconstruction 3D de la caméra et de la structure
10.1 Aperçu des méthodes de restauration
10.2 Ambiguïté de la reconstruction
__10.3 Théorème de reconstruction projective
10.4 Reconstruction hiérarchique
10.5 Reconstruction directe à l'aide de la réponse correcte
__10.6 En sortant
Chapitre 11.
Calcul de la matrice de base ??
__11.1 Équations de base
__11.2 Algorithme normalisé à 8 points
__11.3 Algorithme de minimisation algébrique
__11.4 Distance géométrique
__11.5 Évaluation expérimentale de l'algorithme
Calcul automatique de __11,6 ??
__11.7 ?? Cas particulier de calcul
__11.8 Correspondance avec d'autres objets
__11.9 Dégénérescence
__11.10 ?? Interprétation géométrique des calculs
__11.11 L'enveloppe des lignes du couronnement
__11.12 Correction d'image
__11.13 En sortant
Chapitre 12.
calculs structuraux
__12.1 Description du problème
__12.2 Triangulation linéaire
__12.3 Fonction de coût d'erreur géométrique
__12.4 Approximation de Sampson (correction géométrique du premier ordre)
__12.5 Solution optimale
__12.6 Distribution de probabilité des points 3D estimés
__12.7 Reconstruction en ligne droite
__12.8 En sortant
Chapitre 13.
Plan de scène et cartographie à réponse unique
13.1 Application simplexe d'un plan donné et de son opposé
__13.2 Plan induit par une application simplex lorsque ?? et la correspondance image sont données
__13.3 Calcul de ?? dans l'application simplex induite par le plan
__13.4 Carte de réponse simple infinie ??∞
__13.5 En sortant
Chapitre 14.
géométrie d'ascension affine
__14.1 Géométrie d'ascension affine
__14.2 Matrices fondamentales affines
14.3 Estimation de ??A à partir des correspondances de points de deux images
__14.4 Triangulation
__14.5 Reconstruction affine
__14.6 Le renversement et le bas-relief de Necker
__14.7 Exercice de calcul
__14.8 En sortant
Partie 3.
Géométrie à triple vue
Chapitre 15.
Tenseur à triple focalisation
__15.1 Géométrie de base du tenseur trifocal
__15.2 Tenseurs trifocaux et notation tensorielle
__15.3 Transmission
__15.4 Matrices de base pour trois instants
__15.5 En sortant
Chapitre 16.
Calcul du tenseur trifocal T
__16.1 Équations fondamentales
__16.2 Algorithme linéaire régularisé
__16.3 Algorithme de minimisation algébrique
__16.4 Distance géométrique
__16.5 Évaluation expérimentale de l'algorithme
__16.6 Calcul automatique de T
__16.7 Cas particuliers de calculs de T
__16.8 En sortant
Partie 4.
Géométrie à N points de vue
Chapitre 17.
N-linéarité et tenseurs multi-vues
__17.1 Relations bilinéaires
__17.2 Relations trilinéaires
__17.3 Relation linéaire quadruple
__17.4 Quatre intersections à la surface
__17.5 Logique de dénombrement
__17.6 Nombre d'équations indépendantes
__17.7 Sélection d'une équation
__17.8 En sortant
Chapitre 18.
Méthode de calcul à N points
__18.1 Reconstruction projective - Ajustement par grappes
__18.2 Algorithme de reconstruction-décomposition affine
__18.3 Décomposition non rigide
__18.4 Décomposition projective
__18.5 Reconstruction projective à l'aide d'un plan
__Reconstruction à partir de la séquence 18.6
__18.7 En sortant
Chapitre 19.
Correction automatique
__19.1 Introduction
__19.2 Systèmes algébriques et énoncés de problèmes
__19.3 Correction à l'aide de surfaces quadratiques doubles absolues
Équation de Krupa __19.4
__19.5 Solution stratifiée
__19.6 Étalonnage sur une caméra rotative
__19.7 Correction automatique sur l'avion
__19.8 Mouvement planaire
__19.9 Mouvement de rotation mono-axe - plateau tournant
__19.10 Calibrage automatique des équipements stéréo
__19.11 En sortant
Chapitre 20.
Dualité
__20.1 Dualité de Carlson-Vineshall
__20.2 Reconstruction abrégée
__20.3 En sortant
Chapitre 21.
Chiralité
__21.1 Transformations quasi-affines
__21.2 Face avant et arrière de l'appareil photo
__21.3 Ensemble de points 3D
__21.4 Calcul de la reconstruction quasi-affine
__21.5 L'effet de la transformation sur la chiralité
__21.6 direction
__21.7 Inégalité chirale
__21.8 Points visibles du troisième point de vue
__21.9 Position entre les points
__21.10 En sortant
Chapitre 22.
composition dégénérée
__22.1 Caméra arrière Église
__22.2 Dégénérescence à double point de vue
__22.3 Dualité de Carlson-Vineshall
__22.4 Configuration critique du point triple
__22.5 En sortant
Partie 5.
supplément
Notation tensorielle __A1
Distributions gaussiennes (normales) et χ²
Estimation des paramètres __A3
__A4 Propriétés et décomposition des matrices
__A5 Minimisation des moindres carrés
Méthode d'estimation itérative __A6
Transformation de projection sur plan spécial __A7
Introduction - Un tour d'horizon de la géométrie multi-vues
1.1 Introduction - La géométrie projective partout
__1.2 Projection de la caméra
1.3 Reconstruction à partir de points de vue multiples
__1.4 Géométrie à triple vue
__1.5 Géométrie de la quadruple vue et reconstruction de scènes n
__1.6 transmission
1.7 Reconstruction euclidienne
__1.8 Correction automatique
__1.9 Résultat I : Modèle graphique 3D
__1.10 Résultat II : Augmentation vidéo
Partie 0.
Contexte : Géométrie projective, transformations et approximation
Chapitre 2.
Géométrie projective bidimensionnelle et transformations
__2.1 Géométrie plane
__2.2 Plan projectif bidimensionnel
__2.3 Transformation projective
__2.4 Couche de transformation
__2.5 Géométrie projective unidimensionnelle
__2.6 Topologie des surfaces projectives
__2.7 Restauration des propriétés de transformation affine et de distance à partir d'images
__2.8 Propriétés supplémentaires des cônes
2.9 Points fixes et lignes fixes
__2.10 En sortant
Chapitre 3.
Géométrie projective 3D et transformations
3.1 Points et transformations projectives
3.2 Représentation et transformation des plans, des droites et des surfaces quadratiques
__3.3 Courbe cubique torsadée
__3.4 Couche de transformation
__3.5 Surface infinie
__3.6 Cône absolu
__3.7 Courbe quadratique duale absolue
__3.8 En sortant
Chapitre 4.
Estimation des transformations projectives bidimensionnelles
__4.1 Algorithme de transformation linéaire directe (DLT)
4.2 Différentes fonctions de coût
4.3 Fonction de coût statistique et estimation du maximum de vraisemblance
4.4 Invariance par transformation et normalisation
4.5 Comment minimiser les répétitions
4.6 Comparaison expérimentale des algorithmes
__4.7 Estimation solide
4.8 Calcul automatique du mappage à réponse unique
__4.9 En sortant
Chapitre 5.
Évaluation des algorithmes et analyse des erreurs
__5.1 Limites de performance
5.2 Covariance de la transformation estimée
5.3 Estimation de la covariance par la méthode de Monte Carlo
5.4 En sortant
Partie 1.
Géométrie de la caméra et géométrie de vue unique
Chapitre 6.
Modèle d'appareil photo
__6.1 Caméra finie
__6.2 Caméra projective
__6.3 Caméra infinie
6.4 Autres modèles d'appareils photo
__6.5 En sortant
Chapitre 7.
Calcul de la matrice de la caméra ??
__7.1 Équations fondamentales
7.2 Erreur géométrique
__7.3 Estimation limitée de la caméra
__7.4 Distorsion radiale
__7.5 En sortant
Chapitre 8.
Géométrie à point unique supplémentaire
8.1 Comportement des caméras projectives sur les plans, les lignes et les cônes
__8.2 Image de surface lisse
8.3 Comportement de la caméra projective pour les surfaces quadratiques
8.4 L'importance du centrage de la caméra
8.5 Calibrage de la caméra et images absolues du cône
8.6 Points de fuite et lignes de fuite
8.7 Mesure et reconstruction 3D affines
8.8 Calibrage de la caméra à un instant précis ? Détermination
8.9 Reconstruction à un seul point
__8.10 Cône de correction
__8.11 En sortant
Partie 2.
Géométrie à double point de vue
Chapitre 9.
Géométrie de l'entropie et matrices fondamentales
__9.1 Géométrie de l'Ascension
__9.2 Matrice de base ??
__9.3 Matrices fondamentales issues d'exercices spéciaux
__9.4 Représentation géométrique des matrices élémentaires
__9.5 Recherche de la matrice de la caméra
__9.6 Matrices essentielles
__9.7 En sortant
Chapitre 10.
Reconstruction 3D de la caméra et de la structure
10.1 Aperçu des méthodes de restauration
10.2 Ambiguïté de la reconstruction
__10.3 Théorème de reconstruction projective
10.4 Reconstruction hiérarchique
10.5 Reconstruction directe à l'aide de la réponse correcte
__10.6 En sortant
Chapitre 11.
Calcul de la matrice de base ??
__11.1 Équations de base
__11.2 Algorithme normalisé à 8 points
__11.3 Algorithme de minimisation algébrique
__11.4 Distance géométrique
__11.5 Évaluation expérimentale de l'algorithme
Calcul automatique de __11,6 ??
__11.7 ?? Cas particulier de calcul
__11.8 Correspondance avec d'autres objets
__11.9 Dégénérescence
__11.10 ?? Interprétation géométrique des calculs
__11.11 L'enveloppe des lignes du couronnement
__11.12 Correction d'image
__11.13 En sortant
Chapitre 12.
calculs structuraux
__12.1 Description du problème
__12.2 Triangulation linéaire
__12.3 Fonction de coût d'erreur géométrique
__12.4 Approximation de Sampson (correction géométrique du premier ordre)
__12.5 Solution optimale
__12.6 Distribution de probabilité des points 3D estimés
__12.7 Reconstruction en ligne droite
__12.8 En sortant
Chapitre 13.
Plan de scène et cartographie à réponse unique
13.1 Application simplexe d'un plan donné et de son opposé
__13.2 Plan induit par une application simplex lorsque ?? et la correspondance image sont données
__13.3 Calcul de ?? dans l'application simplex induite par le plan
__13.4 Carte de réponse simple infinie ??∞
__13.5 En sortant
Chapitre 14.
géométrie d'ascension affine
__14.1 Géométrie d'ascension affine
__14.2 Matrices fondamentales affines
14.3 Estimation de ??A à partir des correspondances de points de deux images
__14.4 Triangulation
__14.5 Reconstruction affine
__14.6 Le renversement et le bas-relief de Necker
__14.7 Exercice de calcul
__14.8 En sortant
Partie 3.
Géométrie à triple vue
Chapitre 15.
Tenseur à triple focalisation
__15.1 Géométrie de base du tenseur trifocal
__15.2 Tenseurs trifocaux et notation tensorielle
__15.3 Transmission
__15.4 Matrices de base pour trois instants
__15.5 En sortant
Chapitre 16.
Calcul du tenseur trifocal T
__16.1 Équations fondamentales
__16.2 Algorithme linéaire régularisé
__16.3 Algorithme de minimisation algébrique
__16.4 Distance géométrique
__16.5 Évaluation expérimentale de l'algorithme
__16.6 Calcul automatique de T
__16.7 Cas particuliers de calculs de T
__16.8 En sortant
Partie 4.
Géométrie à N points de vue
Chapitre 17.
N-linéarité et tenseurs multi-vues
__17.1 Relations bilinéaires
__17.2 Relations trilinéaires
__17.3 Relation linéaire quadruple
__17.4 Quatre intersections à la surface
__17.5 Logique de dénombrement
__17.6 Nombre d'équations indépendantes
__17.7 Sélection d'une équation
__17.8 En sortant
Chapitre 18.
Méthode de calcul à N points
__18.1 Reconstruction projective - Ajustement par grappes
__18.2 Algorithme de reconstruction-décomposition affine
__18.3 Décomposition non rigide
__18.4 Décomposition projective
__18.5 Reconstruction projective à l'aide d'un plan
__Reconstruction à partir de la séquence 18.6
__18.7 En sortant
Chapitre 19.
Correction automatique
__19.1 Introduction
__19.2 Systèmes algébriques et énoncés de problèmes
__19.3 Correction à l'aide de surfaces quadratiques doubles absolues
Équation de Krupa __19.4
__19.5 Solution stratifiée
__19.6 Étalonnage sur une caméra rotative
__19.7 Correction automatique sur l'avion
__19.8 Mouvement planaire
__19.9 Mouvement de rotation mono-axe - plateau tournant
__19.10 Calibrage automatique des équipements stéréo
__19.11 En sortant
Chapitre 20.
Dualité
__20.1 Dualité de Carlson-Vineshall
__20.2 Reconstruction abrégée
__20.3 En sortant
Chapitre 21.
Chiralité
__21.1 Transformations quasi-affines
__21.2 Face avant et arrière de l'appareil photo
__21.3 Ensemble de points 3D
__21.4 Calcul de la reconstruction quasi-affine
__21.5 L'effet de la transformation sur la chiralité
__21.6 direction
__21.7 Inégalité chirale
__21.8 Points visibles du troisième point de vue
__21.9 Position entre les points
__21.10 En sortant
Chapitre 22.
composition dégénérée
__22.1 Caméra arrière Église
__22.2 Dégénérescence à double point de vue
__22.3 Dualité de Carlson-Vineshall
__22.4 Configuration critique du point triple
__22.5 En sortant
Partie 5.
supplément
Notation tensorielle __A1
Distributions gaussiennes (normales) et χ²
Estimation des paramètres __A3
__A4 Propriétés et décomposition des matrices
__A5 Minimisation des moindres carrés
Méthode d'estimation itérative __A6
Transformation de projection sur plan spécial __A7
Image détaillée
.jpg)
Avis de l'éditeur
◈ Structure de ce livre ◈
Il se compose de six parties et de sept courtes annexes.
Chaque section introduit de nouvelles relations géométriques.
Une homographie pour l'arrière-plan, une matrice de caméra pour un point de vue unique, une matrice fondamentale pour deux points de vue, un tenseur trifocal pour trois points de vue et un tenseur quadfocal pour quatre points de vue.
Pour chaque cas, un chapitre décrit les relations, les propriétés et les applications, et un chapitre décrit les algorithmes qui les estiment à partir de mesures d'images.
Les algorithmes d'estimation sont décrits, allant des approches simples et peu coûteuses aux algorithmes optimaux actuellement considérés comme les meilleurs.
Partie 0 : Contexte.
La partie 0 fait davantage office de guide que les autres parties.
Présente les concepts importants de la géométrie projective dans l'espace bidimensionnel et tridimensionnel (tels que les points idéaux et les sections coniques absolues).
Nous expliquons comment représenter, manipuler et estimer la géométrie projective, et comment elle se rapporte à divers objectifs en vision par ordinateur, tels que la rectification d'images de plans pour supprimer la distorsion de perspective.
Partie 1 : Géométrie à vue unique.
Nous définissons et explorons l'architecture de différentes caméras qui modélisent la projection perspective de l'espace tridimensionnel vers des images bidimensionnelles.
Nous décrivons l'estimation des techniques existantes utilisant une cible d'étalonnage et l'étalonnage de la caméra à l'aide de points de fuite et de lignes de fuite.
Partie 2 : Géométrie à double vue.
La partie 2 décrit la géométrie épipolaire de deux caméras, la reconstruction projective à partir des correspondances de points entre les images, les méthodes de résolution des ambiguïtés projectives, la triangulation optimale et le transfert entre les photographies à travers un plan.
Partie 3 : Géométrie à triple vue.
Décrit la géométrie du trépied à trois caméras.
Cela implique de transférer les correspondances de points et de lignes de deux images à une troisième image, de calculer la forme à partir de ces correspondances et de récupérer la matrice de la caméra.
Partie 4 : Point de vue N.
La partie 4 a un double objectif.
Nous décrivons tout d'abord une méthode d'estimation qui étend (partiellement) la géométrie à triple vue à la géométrie à quadruple vue et qui peut être appliquée à N points de vue.
Nous présentons le calcul simultané de la structure et du mouvement à partir de plusieurs images en utilisant l'algorithme de factorisation de Tomasi et Kanade.
Et, bien que nous ayons abordé ce sujet dans la partie 3, nous traiterons de thèmes qui peuvent être compris plus en profondeur en mettant l'accent sur les points communs.
Par exemple, nous dérivons des contraintes de vue multilinéaires pour la correspondance, la correction automatique et l'ambiguïté.
supplément.
Il couvre les tenseurs, les statistiques, l'estimation des paramètres, l'algèbre linéaire et matricielle, l'estimation itérative, les matrices inverses de matrices creuses et les transformations projectives spéciales.
◈ Note de l'auteur ◈
Un problème fondamental dans le domaine de la vision par ordinateur consiste à recréer une scène du monde réel à partir de plusieurs images données.
La géométrie projective et la photogrammétrie peuvent être utilisées pour résoudre ce problème.
Ce livre traite des principes géométriques, des matrices de projection de caméra, des matrices fondamentales et des représentations algébriques utilisant des tenseurs trifocaux.
Nous reconstruisons des scènes à partir de plusieurs images et illustrons ces théories et méthodologies informatiques par des exemples pratiques.
Cette édition révisée propose des explications plus détaillées des concepts importants grâce à des études de cas et des annexes actualisées.
Et elle a ajouté les principales études parues après la première édition.
Ce livre fournit également les connaissances de base détaillées nécessaires à sa lecture ; ainsi, si vous connaissez l'algèbre linéaire et l'analyse numérique de base, vous serez capable de comprendre et de mettre en œuvre vous-même la géométrie projective et les algorithmes d'estimation.
◈ Note du traducteur ◈
Quand j'étais à l'université, je faisais la navette en train entre Daejeon, où se trouvait mon école, et ma ville natale, Daegu.
Le train de la ligne Gyeongbu a traversé le col escarpé de Chupungnyeong, où même les nuages se posent.
La seule vue depuis la fenêtre était celle des montagnes.
Mais en regardant de plus près, j'ai remarqué que les montagnes les plus proches de moi semblaient reculer plus vite, tandis que les montagnes plus éloignées semblaient avancer.
Après mûre réflexion, j'ai réalisé que ce phénomène était similaire à la sensation d'être suivi par la pleine lune lorsque je me déplace dans l'obscurité de la nuit.
Puisque les objets proches reculent et les objets éloignés avancent, j'ai pensé qu'il y aurait un point fixe quelque part au milieu, et j'ai réfléchi à la manière de le calculer.
La réponse à ce problème est la géométrie projective (ou géométrie des ombres) (la réponse à ce problème se trouve dans ce livre, et le point fixe qui posait problème n'existe pas).
Les principes fondamentaux de la géométrie projective ont été établis pendant la Renaissance, lorsque les peintres ont activement étudié la perspective pour exprimer plus réalistiquement les objets tridimensionnels sur un plan bidimensionnel, mais ils n'ont été pleinement établis qu'au début du XIXe siècle.
Par la suite, le professeur Heo Jun, qui a récemment remporté la médaille Fields, a développé sa spécialité en géométrie algébrique.
La projection a des racines profondes dans la pensée européenne.
Avant l'avènement de l'épistémologie de Kant, l'idée que ce que nous pouvons observer dans l'allégorie de la caverne de Platon n'est qu'une projection de la réalité était largement répandue.
Bien qu'il ne s'agisse que d'une analogie métaphysique, quelque chose de similaire a été trouvé dans le monde réel.
En mécanique quantique, la position exacte d'un objet est inconnue, et ce qui peut être observé est une projection probabiliste de l'objet réel.
En effet, Dirac, un physicien britannique qui a prédit l'existence de l'antimatière et a remporté le prix Nobel de physique, a mentionné que la géométrie projective, à laquelle il s'était brièvement intéressé pendant ses études de premier cycle, lui avait été très utile pour étudier la mécanique quantique.
Ce livre pousse cette question un cran plus loin.
Comment reconstruire une forme 3D à partir de plusieurs images d'un même objet prises simultanément par plusieurs appareils photo ? Le faible coût des appareils photo numériques ouvre un champ d'applications illimité pour le développement d'algorithmes efficaces, faisant de ce domaine une source de recherche active.
Ce livre commence par les bases de la géométrie projective et aborde ensuite la géométrie à deux vues, à trois vues et à vues multiples.
Cet ouvrage devrait être d'une grande aide aux chercheurs développant des moteurs liés à la vision par ordinateur, car il fournit une explication approfondie des principes fondamentaux de la géométrie et des algorithmes permettant de traiter le bruit inévitable qui apparaît dans les calculs numériques.
J'ai fait des études de mathématiques à l'université, mais à l'époque il n'y avait pas de cours sur la géométrie non euclidienne ; j'ai donc appris la géométrie projective, qui a un si large éventail d'applications, en traduisant un livre.
En traduisant, j'ai pu ressentir la puissance de la géométrie et travailler avec enthousiasme.
◈ Articles recommandés ◈
« La recherche en vision par ordinateur a connu un succès remarquable, tant sur le plan pratique que théorique. »
À titre d'exemple concret, le potentiel de l'utilisation de la technologie de vision par ordinateur pour guider des véhicules tels que des voitures et des camions sur les routes publiques ou sur des terrains accidentés a été démontré en Europe, aux États-Unis et au Japon depuis plusieurs années.
Cela nécessite des capacités d'analyse de scènes dynamiques 3D en temps réel très sophistiquées.
Aujourd'hui, les constructeurs automobiles utilisent de plus en plus ces technologies. Des progrès remarquables ont été réalisés dans ce que l'on pourrait théoriquement appeler la vision par ordinateur géométrique.
Cela inclut une description de la façon dont l'apparence d'un objet change lorsqu'on l'observe sous différents angles, en fonction de sa forme et des paramètres de la caméra.
Ces résultats n'auraient pas été possibles sans le recours à des mathématiques très sophistiquées, notamment aux théories géométriques classiques et modernes.
Ce livre traite plus particulièrement des relations géométriques complexes et magnifiques qui existent entre les images des objets du monde.
L'analyse de ces relations est importante en soi.
En effet, l'un des objectifs de la science est d'expliquer l'apparence.
L'analyse est également importante car les applications qui peuvent être développées grâce à cette compréhension sont illimitées. Les auteurs de cet ouvrage sont des pionniers et des experts dans le domaine de la vision par ordinateur géométrique.
Ils ont réussi à accomplir une tâche très difficile.
« Cet ouvrage présente les mathématiques nécessaires à la compréhension des concepts géométriques fondamentaux de manière simple et accessible, inclut un large éventail de résultats obtenus par ces chercheurs et d'autres à travers le monde, analyse l'interaction de la géométrie avec des mesures d'images bruitées, présente ces résultats théoriques sous une forme algorithmique facilement convertible en code informatique et fournit de nombreux exemples pratiques illustrant les concepts et montrant l'étendue des applications de la théorie. »
- Olivier Faugeras
« Les auteurs présentent un exposé clair et cohérent des principales techniques classiques et modernes qui constituent le courant dominant de la géométrie multivue. »
« Je recommande vivement cet ouvrage aux lecteurs intéressés par les fondements théoriques des techniques traditionnelles et modernes en géométrie multivue. »
- Revue informatique
« Ce livre explique clairement les concepts difficiles et présente les formules nécessaires à leur utilisation. »
Il explique la théorie et ses résultats d'une manière facile à comprendre et à mettre en œuvre pour les lecteurs.
Le contenu est bien organisé, les références sont faciles à trouver et on y trouve de bons exemples (qui seraient encore plus utiles s'il y en avait davantage), des notes utiles et des exercices pratiques à la fin de chaque chapitre.
« Grâce à son approche claire et à ses explications, il est idéal pour une utilisation lors de cours magistraux ou comme ouvrage de référence pour les chercheurs intéressés par ce domaine. »
- Actualités de la BMVA
Il se compose de six parties et de sept courtes annexes.
Chaque section introduit de nouvelles relations géométriques.
Une homographie pour l'arrière-plan, une matrice de caméra pour un point de vue unique, une matrice fondamentale pour deux points de vue, un tenseur trifocal pour trois points de vue et un tenseur quadfocal pour quatre points de vue.
Pour chaque cas, un chapitre décrit les relations, les propriétés et les applications, et un chapitre décrit les algorithmes qui les estiment à partir de mesures d'images.
Les algorithmes d'estimation sont décrits, allant des approches simples et peu coûteuses aux algorithmes optimaux actuellement considérés comme les meilleurs.
Partie 0 : Contexte.
La partie 0 fait davantage office de guide que les autres parties.
Présente les concepts importants de la géométrie projective dans l'espace bidimensionnel et tridimensionnel (tels que les points idéaux et les sections coniques absolues).
Nous expliquons comment représenter, manipuler et estimer la géométrie projective, et comment elle se rapporte à divers objectifs en vision par ordinateur, tels que la rectification d'images de plans pour supprimer la distorsion de perspective.
Partie 1 : Géométrie à vue unique.
Nous définissons et explorons l'architecture de différentes caméras qui modélisent la projection perspective de l'espace tridimensionnel vers des images bidimensionnelles.
Nous décrivons l'estimation des techniques existantes utilisant une cible d'étalonnage et l'étalonnage de la caméra à l'aide de points de fuite et de lignes de fuite.
Partie 2 : Géométrie à double vue.
La partie 2 décrit la géométrie épipolaire de deux caméras, la reconstruction projective à partir des correspondances de points entre les images, les méthodes de résolution des ambiguïtés projectives, la triangulation optimale et le transfert entre les photographies à travers un plan.
Partie 3 : Géométrie à triple vue.
Décrit la géométrie du trépied à trois caméras.
Cela implique de transférer les correspondances de points et de lignes de deux images à une troisième image, de calculer la forme à partir de ces correspondances et de récupérer la matrice de la caméra.
Partie 4 : Point de vue N.
La partie 4 a un double objectif.
Nous décrivons tout d'abord une méthode d'estimation qui étend (partiellement) la géométrie à triple vue à la géométrie à quadruple vue et qui peut être appliquée à N points de vue.
Nous présentons le calcul simultané de la structure et du mouvement à partir de plusieurs images en utilisant l'algorithme de factorisation de Tomasi et Kanade.
Et, bien que nous ayons abordé ce sujet dans la partie 3, nous traiterons de thèmes qui peuvent être compris plus en profondeur en mettant l'accent sur les points communs.
Par exemple, nous dérivons des contraintes de vue multilinéaires pour la correspondance, la correction automatique et l'ambiguïté.
supplément.
Il couvre les tenseurs, les statistiques, l'estimation des paramètres, l'algèbre linéaire et matricielle, l'estimation itérative, les matrices inverses de matrices creuses et les transformations projectives spéciales.
◈ Note de l'auteur ◈
Un problème fondamental dans le domaine de la vision par ordinateur consiste à recréer une scène du monde réel à partir de plusieurs images données.
La géométrie projective et la photogrammétrie peuvent être utilisées pour résoudre ce problème.
Ce livre traite des principes géométriques, des matrices de projection de caméra, des matrices fondamentales et des représentations algébriques utilisant des tenseurs trifocaux.
Nous reconstruisons des scènes à partir de plusieurs images et illustrons ces théories et méthodologies informatiques par des exemples pratiques.
Cette édition révisée propose des explications plus détaillées des concepts importants grâce à des études de cas et des annexes actualisées.
Et elle a ajouté les principales études parues après la première édition.
Ce livre fournit également les connaissances de base détaillées nécessaires à sa lecture ; ainsi, si vous connaissez l'algèbre linéaire et l'analyse numérique de base, vous serez capable de comprendre et de mettre en œuvre vous-même la géométrie projective et les algorithmes d'estimation.
◈ Note du traducteur ◈
Quand j'étais à l'université, je faisais la navette en train entre Daejeon, où se trouvait mon école, et ma ville natale, Daegu.
Le train de la ligne Gyeongbu a traversé le col escarpé de Chupungnyeong, où même les nuages se posent.
La seule vue depuis la fenêtre était celle des montagnes.
Mais en regardant de plus près, j'ai remarqué que les montagnes les plus proches de moi semblaient reculer plus vite, tandis que les montagnes plus éloignées semblaient avancer.
Après mûre réflexion, j'ai réalisé que ce phénomène était similaire à la sensation d'être suivi par la pleine lune lorsque je me déplace dans l'obscurité de la nuit.
Puisque les objets proches reculent et les objets éloignés avancent, j'ai pensé qu'il y aurait un point fixe quelque part au milieu, et j'ai réfléchi à la manière de le calculer.
La réponse à ce problème est la géométrie projective (ou géométrie des ombres) (la réponse à ce problème se trouve dans ce livre, et le point fixe qui posait problème n'existe pas).
Les principes fondamentaux de la géométrie projective ont été établis pendant la Renaissance, lorsque les peintres ont activement étudié la perspective pour exprimer plus réalistiquement les objets tridimensionnels sur un plan bidimensionnel, mais ils n'ont été pleinement établis qu'au début du XIXe siècle.
Par la suite, le professeur Heo Jun, qui a récemment remporté la médaille Fields, a développé sa spécialité en géométrie algébrique.
La projection a des racines profondes dans la pensée européenne.
Avant l'avènement de l'épistémologie de Kant, l'idée que ce que nous pouvons observer dans l'allégorie de la caverne de Platon n'est qu'une projection de la réalité était largement répandue.
Bien qu'il ne s'agisse que d'une analogie métaphysique, quelque chose de similaire a été trouvé dans le monde réel.
En mécanique quantique, la position exacte d'un objet est inconnue, et ce qui peut être observé est une projection probabiliste de l'objet réel.
En effet, Dirac, un physicien britannique qui a prédit l'existence de l'antimatière et a remporté le prix Nobel de physique, a mentionné que la géométrie projective, à laquelle il s'était brièvement intéressé pendant ses études de premier cycle, lui avait été très utile pour étudier la mécanique quantique.
Ce livre pousse cette question un cran plus loin.
Comment reconstruire une forme 3D à partir de plusieurs images d'un même objet prises simultanément par plusieurs appareils photo ? Le faible coût des appareils photo numériques ouvre un champ d'applications illimité pour le développement d'algorithmes efficaces, faisant de ce domaine une source de recherche active.
Ce livre commence par les bases de la géométrie projective et aborde ensuite la géométrie à deux vues, à trois vues et à vues multiples.
Cet ouvrage devrait être d'une grande aide aux chercheurs développant des moteurs liés à la vision par ordinateur, car il fournit une explication approfondie des principes fondamentaux de la géométrie et des algorithmes permettant de traiter le bruit inévitable qui apparaît dans les calculs numériques.
J'ai fait des études de mathématiques à l'université, mais à l'époque il n'y avait pas de cours sur la géométrie non euclidienne ; j'ai donc appris la géométrie projective, qui a un si large éventail d'applications, en traduisant un livre.
En traduisant, j'ai pu ressentir la puissance de la géométrie et travailler avec enthousiasme.
◈ Articles recommandés ◈
« La recherche en vision par ordinateur a connu un succès remarquable, tant sur le plan pratique que théorique. »
À titre d'exemple concret, le potentiel de l'utilisation de la technologie de vision par ordinateur pour guider des véhicules tels que des voitures et des camions sur les routes publiques ou sur des terrains accidentés a été démontré en Europe, aux États-Unis et au Japon depuis plusieurs années.
Cela nécessite des capacités d'analyse de scènes dynamiques 3D en temps réel très sophistiquées.
Aujourd'hui, les constructeurs automobiles utilisent de plus en plus ces technologies. Des progrès remarquables ont été réalisés dans ce que l'on pourrait théoriquement appeler la vision par ordinateur géométrique.
Cela inclut une description de la façon dont l'apparence d'un objet change lorsqu'on l'observe sous différents angles, en fonction de sa forme et des paramètres de la caméra.
Ces résultats n'auraient pas été possibles sans le recours à des mathématiques très sophistiquées, notamment aux théories géométriques classiques et modernes.
Ce livre traite plus particulièrement des relations géométriques complexes et magnifiques qui existent entre les images des objets du monde.
L'analyse de ces relations est importante en soi.
En effet, l'un des objectifs de la science est d'expliquer l'apparence.
L'analyse est également importante car les applications qui peuvent être développées grâce à cette compréhension sont illimitées. Les auteurs de cet ouvrage sont des pionniers et des experts dans le domaine de la vision par ordinateur géométrique.
Ils ont réussi à accomplir une tâche très difficile.
« Cet ouvrage présente les mathématiques nécessaires à la compréhension des concepts géométriques fondamentaux de manière simple et accessible, inclut un large éventail de résultats obtenus par ces chercheurs et d'autres à travers le monde, analyse l'interaction de la géométrie avec des mesures d'images bruitées, présente ces résultats théoriques sous une forme algorithmique facilement convertible en code informatique et fournit de nombreux exemples pratiques illustrant les concepts et montrant l'étendue des applications de la théorie. »
- Olivier Faugeras
« Les auteurs présentent un exposé clair et cohérent des principales techniques classiques et modernes qui constituent le courant dominant de la géométrie multivue. »
« Je recommande vivement cet ouvrage aux lecteurs intéressés par les fondements théoriques des techniques traditionnelles et modernes en géométrie multivue. »
- Revue informatique
« Ce livre explique clairement les concepts difficiles et présente les formules nécessaires à leur utilisation. »
Il explique la théorie et ses résultats d'une manière facile à comprendre et à mettre en œuvre pour les lecteurs.
Le contenu est bien organisé, les références sont faciles à trouver et on y trouve de bons exemples (qui seraient encore plus utiles s'il y en avait davantage), des notes utiles et des exercices pratiques à la fin de chaque chapitre.
« Grâce à son approche claire et à ses explications, il est idéal pour une utilisation lors de cours magistraux ou comme ouvrage de référence pour les chercheurs intéressés par ce domaine. »
- Actualités de la BMVA
SPÉCIFICATIONS DES PRODUITS
- Date de publication : 31 août 2022
- Nombre de pages, poids, dimensions : 844 pages | 188 × 235 × 39 mm
- ISBN13 : 9791161756646
- ISBN10 : 1161756647
Vous aimerez peut-être aussi
카테고리
Langue coréenne
Langue coréenne