Coordonnées homogènes - Homogeneous coordinates

Courbe de Bézier rationnelle – courbe polynomiale définie en coordonnées homogènes (bleu) et sa projection sur le plan – courbe rationnelle (rouge)

En mathématiques , les coordonnées homogènes ou coordonnées projectives , introduites par August Ferdinand Möbius dans son ouvrage de 1827 Der barycentrische Calcul , sont un système de coordonnées utilisé en géométrie projective , comme les coordonnées cartésiennes sont utilisées en géométrie euclidienne . Ils ont l'avantage que les coordonnées des points, y compris les points à l'infini, peuvent être représentées à l'aide de coordonnées finies. Les formules impliquant des coordonnées homogènes sont souvent plus simples et plus symétriques que leurs homologues cartésiennes. Les coordonnées homogènes ont une gamme d'applications, y compris l'infographie et la vision par ordinateur 3D , où elles permettent aux transformations affines et, en général, aux transformations projectives d'être facilement représentées par une matrice.

Si les coordonnées homogènes d'un point sont multipliées par un scalaire non nul, les coordonnées résultantes représentent le même point. Puisque des coordonnées homogènes sont également données aux points à l'infini , le nombre de coordonnées nécessaires pour permettre cette extension est un de plus que la dimension de l' espace projectif considéré. Par exemple, deux coordonnées homogènes sont nécessaires pour spécifier un point sur la ligne projective et trois coordonnées homogènes sont nécessaires pour spécifier un point dans le plan projectif.

introduction

Le plan projectif réel peut être considéré comme le plan euclidien avec des points supplémentaires ajoutés, appelés points à l'infini , et sont considérés comme se trouvant sur une nouvelle ligne, la ligne à l'infini . Il existe un point à l'infini correspondant à chaque direction (numériquement donné par la pente d'une ligne), défini de manière informelle comme la limite d'un point qui se déplace dans cette direction en s'éloignant de l'origine. On dit que les lignes parallèles du plan euclidien se coupent en un point à l'infini correspondant à leur direction commune. Étant donné un point ( x , y ) sur le plan euclidien, pour tout nombre réel non nul Z , le triplet ( xZ , yZ , Z ) est appelé un ensemble de coordonnées homogènes pour le point. Par cette définition, multiplier les trois coordonnées homogènes par un facteur commun non nul donne un nouvel ensemble de coordonnées homogènes pour le même point. En particulier, ( x , y , 1) est un tel système de coordonnées homogènes pour le point ( x , y ) . Par exemple, le point cartésien (1, 2) peut être représenté en coordonnées homogènes par (1, 2, 1) ou (2, 4, 2) . Les coordonnées cartésiennes d'origine sont récupérées en divisant les deux premières positions par la troisième. Ainsi, contrairement aux coordonnées cartésiennes, un même point peut être représenté par une infinité de coordonnées homogènes.

L'équation d'une droite passant par l'origine (0, 0) peut s'écrire nx + my = 0n et m ne sont pas tous les deux nuls. Sous forme paramétrique , cela peut s'écrire x = mt , y = − nt . Soit Z = 1/ t , donc les coordonnées d' un point sur la droite peuvent s'écrire ( m / Z , − n / Z ) . En coordonnées homogènes cela devient ( m , − n , Z ) . A la limite, lorsque t tend vers l'infini, c'est-à-dire lorsque le point s'éloigne de l'origine, Z tend vers 0 et les coordonnées homogènes du point deviennent ( m , − n , 0) . On définit ainsi ( m , − n , 0) comme les coordonnées homogènes du point à l'infini correspondant à la direction de la droite nx + my = 0 . Comme toute ligne du plan euclidien est parallèle à une ligne passant par l'origine, et puisque les lignes parallèles ont le même point à l'infini, le point infini sur chaque ligne du plan euclidien a reçu des coordonnées homogènes.

Résumer:

  • Tout point du plan projectif est représenté par un triplet ( X , Y , Z ) , appelé coordonnées homogènes ou coordonnées projectives du point, où X , Y et Z ne sont pas tous 0.
  • Le point représenté par un ensemble donné de coordonnées homogènes est inchangé si les coordonnées sont multipliées par un facteur commun.
  • Inversement, deux ensembles de coordonnées homogènes représentent le même point si et seulement si l'un est obtenu à partir de l'autre en multipliant toutes les coordonnées par la même constante non nulle.
  • Lorsque Z n'est pas 0, le point représenté est le point ( X/Z , Y/Z ) dans le plan euclidien.
  • Lorsque Z vaut 0, le point représenté est un point à l'infini.

Le triple (0, 0, 0) est omis et ne représente aucun point. L' origine du plan euclidien est représentée par (0, 0, 1) .

Notation

Certains auteurs utilisent des notations différentes pour les coordonnées homogènes qui permettent de les distinguer des coordonnées cartésiennes. L'utilisation de deux points au lieu de virgules, par exemple ( x : y : z ) au lieu de ( x , y , z ) , souligne que les coordonnées doivent être considérées comme des rapports. Les crochets, comme dans [ x , y , z ] soulignent que plusieurs ensembles de coordonnées sont associés à un seul point. Certains auteurs utilisent une combinaison de deux points et de crochets, comme dans [ x : y : z ].

Autres dimensions

La discussion dans la section précédente s'applique par analogie aux espaces projectifs autres que le plan. Ainsi, les points sur la ligne projective peuvent être représentés par des paires de coordonnées ( x , y ) , pas les deux zéro. Dans ce cas, le point à l'infini est (1, 0) . De même, les points dans l' espace n projectif sont représentés par ( n  + 1)-uplets.

Autres espaces projectifs

L'utilisation de nombres réels donne des coordonnées homogènes de points dans le cas classique des espaces projectifs réels, cependant n'importe quel champ peut être utilisé, en particulier, les nombres complexes peuvent être utilisés pour l'espace projectif complexe . Par exemple, la ligne projective complexe utilise deux coordonnées complexes homogènes et est connue sous le nom de sphère de Riemann . D'autres champs, y compris les champs finis , peuvent être utilisés.

Des coordonnées homogènes pour les espaces projectifs peuvent également être créées avec des éléments d'un anneau de division (un champ asymétrique). Cependant, dans ce cas, il faut prendre en compte le fait que la multiplication peut ne pas être commutative .

Pour l' anneau général A , une droite projective sur A peut être définie avec des facteurs homogènes agissant à gauche et le groupe linéaire projectif agissant à droite.

Définition alternative

Une autre définition du plan projectif réel peut être donnée en termes de classes d'équivalence . Pour les éléments non nuls de R 3 , définissez ( x 1 , y 1 , z 1 ) ~ ( x 2 , y 2 , z 2 ) pour signifier qu'il existe un λ non nul de sorte que ( x 1 , y 1 , z 1 ) = ( λx 2 , λy 2 , λz 2 ) . Alors ~ est une relation d'équivalence et le plan projectif peut être défini comme les classes d'équivalence de R 3 {0}. Si ( x , y , z ) est l' un des éléments de la classe d' équivalence p alors ceux - ci sont considérés comme des coordonnées homogènes de p .

Les lignes de cet espace sont définies comme des ensembles de solutions d'équations de la forme ax + by + cz = 0 où tous les a , b et c ne sont pas nuls. La satisfaction de la condition ax + by + cz = 0 ne dépend que de la classe d'équivalence de ( x , y , z ), donc l'équation définit un ensemble de points dans le plan projectif. L'application ( x , y ) → ( x , y , 1) définit une inclusion du plan euclidien au plan projectif et le complément de l'image est l'ensemble des points avec z = 0 . L'équation z = 0 est une équation d'une droite dans le plan projectif ( voir définition d'une droite dans le plan projectif ), et s'appelle la droite à l'infini .

Les classes d'équivalence, p , sont les lignes passant par l'origine avec l'origine supprimée. L'origine ne joue pas vraiment un rôle essentiel dans la discussion précédente, elle peut donc être rajoutée sans changer les propriétés du plan projectif. Cela produit une variation sur la définition, à savoir le plan projectif est défini comme l'ensemble des lignes dans R 3 qui passent par l'origine et les coordonnées d'un élément non nul ( x , y , z ) d'une ligne sont prises pour être coordonnées homogènes de la ligne. Ces lignes sont maintenant interprétées comme des points dans le plan projectif.

Encore une fois, cette discussion s'applique de manière analogue à d'autres dimensions. Ainsi, l'espace projectif de dimension n peut être défini comme l'ensemble des droites passant par l'origine dans R n +1 .

Homogénéité

Les coordonnées homogènes ne sont pas uniquement déterminées par un point, donc une fonction définie sur les coordonnées, disons f ( x , y , z ) , ne détermine pas une fonction définie sur des points comme avec les coordonnées cartésiennes. Mais une condition f ( x , y , z ) = 0 définie sur les coordonnées, comme on pourrait l'utiliser pour décrire une courbe, détermine une condition sur des points si la fonction est homogène . Plus précisément, supposons qu'il existe un k tel que

Si un ensemble de coordonnées représente le même point que ( x , y , z ) alors il peut être écrit x , λ y , z ) pour une valeur non nulle de . Puis

Un polynôme g ( x , y ) de degré k peut être transformé en un polynôme homogène en remplaçant x par x / z , y par y / z et en multipliant par z k , autrement dit en définissant

La fonction résultante f est un polynôme, il est donc logique d'étendre son domaine aux triplets où z = 0 . Le processus peut être inversé en définissant z = 1 , ou

L'équation f ( x , y , z ) = 0 peut alors être considérée comme la forme homogène de g ( x , y ) = 0 et elle définit la même courbe lorsqu'elle est restreinte au plan euclidien. Par exemple, la forme homogène de l'équation de la droite ax + by + c = 0 est ax + by + cz = 0.

Coordonnées de ligne et dualité

L'équation d'une droite dans le plan projectif peut être donnée par sx + ty + uz = 0s , t et u sont des constantes. Chaque triplet ( s , t , u ) détermine une ligne, la ligne déterminée est inchangée si elle est multipliée par un scalaire non nul, et au moins l'un de s , t et u doit être non nul. Ainsi, le triplet ( s , t , u ) peut être considéré comme des coordonnées homogènes d'une ligne dans le plan projectif, c'est-à-dire des coordonnées de ligne par opposition aux coordonnées de point. Si dans sx  +  ty  +  uz  = 0 les lettres s , t et u sont prises comme variables et x , y et z sont prises comme constantes alors l'équation devient une équation d'un ensemble de droites dans l'espace de toutes les droites du plan . Géométriquement, il représente l'ensemble des lignes qui passent par le point ( x , y , z ) et peut être interprété comme l'équation du point en coordonnées linéaires. De la même manière, les plans dans l'espace 3 peuvent recevoir des ensembles de quatre coordonnées homogènes, et ainsi de suite pour les dimensions supérieures.

La même relation, sx + ty + uz = 0 , peut être considérée soit comme l'équation d'une ligne, soit comme l'équation d'un point. En général, il n'y a aucune différence ni algébrique ni logique entre les coordonnées homogènes des points et des lignes. Ainsi, la géométrie plane avec des points comme éléments fondamentaux et la géométrie plane avec des lignes comme éléments fondamentaux sont équivalentes à l'exception de l'interprétation. Cela conduit au concept de dualité en géométrie projective, le principe selon lequel les rôles des points et des lignes peuvent être intervertis dans un théorème en géométrie projective et le résultat sera également un théorème. De manière analogue, la théorie des points dans l'espace 3-projectif est duelle à la théorie des plans dans l'espace 3-projectif, et ainsi de suite pour les dimensions supérieures.

Coordonnées de Plücker

L'attribution de coordonnées aux lignes dans l'espace projectif 3-est plus compliqué car il semblerait qu'un total de 8 coordonnées, soit les coordonnées de deux points situés sur la ligne, soit de deux plans dont l'intersection est la ligne, sont nécessaires. Une méthode utile, due à Julius Plücker , crée un ensemble de six coordonnées comme les déterminants x i y jx j y i (1 ≤ i < j ≤ 4) à partir des coordonnées homogènes de deux points ( x 1 , x 2 , x 3 , x 4 ) et ( y 1 , y 2 , y 3 , y 4 ) sur la ligne. Le plongement de Plücker est la généralisation de ceci pour créer des coordonnées homogènes d'éléments de n'importe quelle dimension m dans un espace projectif de dimension n .

Application au théorème de Bézout

Le théorème de Bézout prédit que le nombre de points d'intersection de deux courbes est égal au produit de leurs degrés (en supposant un corps algébriquement clos et avec certaines conventions suivies pour compter les multiplicités d'intersection). Le théorème de Bézout prédit qu'il y a un point d'intersection de deux lignes et en général c'est vrai, mais lorsque les lignes sont parallèles, le point d'intersection est infini. Des coordonnées homogènes sont utilisées pour localiser le point d'intersection dans ce cas. De même, le théorème de Bézout prédit qu'une ligne croisera une conique en deux points, mais dans certains cas un ou les deux points sont infinis et des coordonnées homogènes doivent être utilisées pour les localiser. Par exemple, y = x 2 et x = 0 n'ont qu'un seul point d'intersection dans le plan fini (affine). Pour trouver l'autre point d'intersection, convertissez les équations sous forme homogène, yz = x 2 et x = 0 . Cela produit x = yz = 0 et, en supposant que x , y et z ne valent pas tous 0, les solutions sont x = y = 0, z 0 et x = z = 0, y ≠ 0 . Cette première solution est le point (0, 0) en coordonnées cartésiennes, le point fini d'intersection. La deuxième solution donne les coordonnées homogènes (0, 1, 0) qui correspondent à la direction de l' axe y . Pour les équations xy = 1 et x = 0, il n'y a pas de points finis d'intersection. La conversion des équations sous forme homogène donne xy = z 2 et x = 0 . La résolution produit l'équation z 2 = 0 qui a une racine double en z = 0 . D'après l'équation d'origine, x = 0 , donc y ≠ 0 puisqu'au moins une coordonnée doit être non nulle. Par conséquent, (0, 1, 0) est le point d'intersection compté avec la multiplicité 2 en accord avec le théorème.

Points circulaires

La forme homogène de l'équation d'un cercle dans le plan projectif réel ou complexe est x 2 + y 2 + 2 axz + 2 byz + c z 2 = 0 . L'intersection de cette courbe avec la ligne à l'infini peut être trouvée en fixant z = 0 . Cela produit l'équation x 2 + y 2 = 0 qui a deux solutions sur les nombres complexes, donnant lieu aux points de coordonnées homogènes (1, i , 0) et (1, − i , 0) dans le plan projectif complexe. Ces points sont appelés les points circulaires à l'infini et peuvent être considérés comme les points communs d'intersection de tous les cercles. Ceci peut être généralisé à des courbes d'ordre supérieur comme des courbes algébriques circulaires .

Changement de système de coordonnées

Tout comme la sélection des axes dans le système de coordonnées cartésiennes est quelque peu arbitraire, la sélection d'un seul système de coordonnées homogènes parmi tous les systèmes possibles est quelque peu arbitraire. Par conséquent, il est utile de savoir comment les différents systèmes sont liés les uns aux autres.

Soit ( x , y , z ) les coordonnées homogènes d'un point dans le plan projectif. Une matrice fixe

avec un déterminant non nul , définit un nouveau système de coordonnées ( X , Y , Z ) par l'équation

La multiplication de ( x , y , z ) par un scalaire entraîne la multiplication de ( X , Y , Z ) par le même scalaire, et X , Y et Z ne peuvent pas être tous nuls à moins que x , y et z soient tous nuls puisque A est non singulier. Donc ( X , Y , Z ) sont un nouveau système de coordonnées homogènes pour un même point du plan projectif.

Coordonnées barycentriques

La formulation originale de Möbius des coordonnées homogènes spécifiait la position d'un point comme centre de masse (ou barycentre) d'un système de trois masses ponctuelles placées aux sommets d'un triangle fixe. Les points à l'intérieur du triangle sont représentés par des masses positives et les points à l'extérieur du triangle sont représentés en autorisant des masses négatives. La multiplication des masses du système par un scalaire n'affecte pas le centre de masse, il s'agit donc d'un cas particulier d'un système de coordonnées homogènes.

Coordonnées trilinéaires

Soit l , m , n trois droites dans le plan et définissons un ensemble de coordonnées X , Y et Z d'un point p comme les distances signées de p à ces trois droites. Celles-ci sont appelées les coordonnées trilinéaires de p par rapport au triangle dont les sommets sont les intersections par paires des lignes. À proprement parler, ceux-ci ne sont pas homogènes, puisque les valeurs de X , Y et Z sont déterminées exactement, et pas seulement à proportionnalité. Il existe cependant une relation linéaire entre eux, de sorte que ces coordonnées peuvent être rendues homogènes en permettant à des multiples de ( X , Y , Z ) de représenter le même point. Plus généralement, X , Y et Z peuvent être définis comme des constantes p , r et q fois les distances à l , m et n , résultant en un système différent de coordonnées homogènes avec le même triangle de référence. C'est en fait le type le plus général de système de coordonnées homogènes pour les points du plan si aucune des droites n'est la droite à l'infini.

Utilisation en infographie et vision par ordinateur

Les coordonnées homogènes sont omniprésentes en infographie car elles permettent de représenter des opérations vectorielles courantes telles que la translation , la rotation , la mise à l'échelle et la projection en perspective sous la forme d'une matrice par laquelle le vecteur est multiplié. Par la règle de la chaîne, toute séquence de telles opérations peut être multipliée en une seule matrice, permettant un traitement simple et efficace. En revanche, en utilisant les coordonnées cartésiennes, les translations et la projection en perspective ne peuvent pas être exprimées sous forme de multiplications matricielles, bien que d'autres opérations le puissent. Les cartes graphiques modernes OpenGL et Direct3D tirent parti de coordonnées homogènes pour implémenter efficacement un vertex shader en utilisant des processeurs vectoriels avec des registres à 4 éléments.

Par exemple, en projection perspective, une position dans l'espace est associée à la ligne qui la relie à un point fixe appelé centre de projection . Le point est ensuite mappé sur un plan en trouvant le point d'intersection de ce plan et de la ligne. Cela produit une représentation précise de la façon dont un objet tridimensionnel apparaît à l'œil. Dans la situation la plus simple, le centre de projection est l'origine et les points sont mappés sur le plan z = 1 , travaillant pour le moment en coordonnées cartésiennes. Pour un point donné de l'espace, ( x , y , z ) , le point d'intersection de la droite et du plan est ( x / z , y / z , 1) . En abandonnant la coordonnée z désormais superflue , cela devient ( x / z , y / z ) . En coordonnées homogènes, le point ( x , y , z ) est représenté par ( xw , yw , zw , w ) et le point auquel il correspond sur le plan est représenté par ( xw , yw , zw ) , donc la projection peut être représentée sous forme matricielle comme

Des matrices représentant d'autres transformations géométriques peuvent être combinées avec celle-ci et entre elles par multiplication matricielle. En conséquence, toute projection perspective de l'espace peut être représentée comme une seule matrice.

Remarques

Les références

Lectures complémentaires

Liens externes

  • Jules Bloomenthal et Jon Rokne, Coordonnées homogènes [1]
  • Ching-Kuang Shene, coordonnées homogènes [2]
  • Wolfram MathWorld