Le groupe de la relativité restreinte

Niveau de difficulté    
diagramme

H.Minkowski, Espace et temps, 1908.

Dans son interprétation moderne, le principe de relativité est profondément lié à la structure de groupe des transformations de Lorentz.

Nous allons décrire l’équivalence mathématique de ces deux points, et par la même occasion donner une description géométrique de ce qu’est un référentiel inertiel en relativité restreinte.

Le principe de relativité

\bullet Formulation originale : « Les lois de l’électrodynamique aussi bien que de l’optique doivent être valables dans tous les référentiels dans lesquels les lois de la mécanique sont vérifiées. »

(A.Einstein, On the electrodynamics of moving bodies, 1905)

« Les lois selon lesquelles les états des systèmes physiques évoluent, ne diffèrent pas entre deux systèmes de coordonnées dont l’un est en mouvement rectiligne uniforme relativement à l’autre. »

(A.Einstein, Does the inertia of a body depend upon its energy-content ?, 1905)

Cette formulation implique une relation mathématique précise entre les référentiels inertiels, donnée par les transformations de Lorentz 1.

Toutefois, il n’était pas évident à l’époque pourquoi ce principe impliquait une structure de groupe à ces transformations, sauf pour quelques mathématiciens exceptionnels tels que Henri Poincaré 2 (1854-1912), Hermann Minkowski (1864-1909) ou Félix Klein (1849-1925). Ce point n’est devenu fondamental qu’avec des travaux ultérieurs.

\bullet Formulation moderne : « il existe une infinie continue classe de référentiels dans l’espace-temps qui sont physiquement équivalents.. »

(J.M.Levy-Leblond, Une dérivation de plus des transformations de Lorentz, 1975)

Les mots “classe” et “équivalents” donnent de précieux indices quand à la signification de cette formulation. Utilisons un peu de formalisme : si l’on appelle l’ensemble de tous les référentiels X, et la relation d’équivalence \doteq, alors :

Deux référentiels F,F^\prime\in X sont dits équivalents , ce que l’on note par F\doteq F^\prime, si et seulement si toutes les lois exprimées dans ces référentiels ont la même forme (c’est-à-dire sont représentées par une même fonction des quantités physiques en jeu).

Il nous faut observer que chaque couple de référentiel peut être associé à une transformation générale des quantités physiques du premier référentiel vers le second (un changement de référentiel).

Le principe de relativité stipule que si l’on considère deux référentiels inertiels, la transformation correspondante (dite inertielle) conservera la forme de la fonction qui définit une loi quelconque donnée. Il signifie aussi que les propriétés de la relation d’équivalence \doteq détermineront les propriétés des transformations générales.

En détaillant, le principe de relativité sous sa forme moderne, plus générale, entraîne la structure de groupe des transformations générales (ces deux principes sont même en fait équivalents) : la réflexivité de la relation d’équivalence (Tout référentiel est équivalent à lui-même F\doteq F) montre l’existence de la transformation identité, sa transitivité

Pour tout référentiels F,G,H, \text{, si }F\doteq G\text{ et }G\doteq H\text{, alors }F\doteq H

montre l’associativité des transformations, et finalement sa symétrie

Pour tout référentiels F,G, \text{, si }F\doteq G\text{, alors }G\doteq F

montre l’existence des transformations inverses.

Une classe de référentiels particuliers, comme par exemple celle des référentiels inertiels, induira alors des transformations particulières, ici ces transformations seront, vous l’aurez deviné, les transformations de Lorentz (changements de référentiel inertiels).

Qu’est-ce qu’un référentiel inertiel ?

Un référentiel peut être formalisé sous la forme d’un système de coordonnées. Dans l’ensemble de tous les évènements physiques, que l’on représente par un espace-temps quadridimensionnel, il est déterminé par la donnée de cinq points affinements indépendants 3. L’un d’eux sera l’origine du repère, et les quatre autres détermineront l’unité de chaque axe. Il suffit alors de quatre nombres à chaque évènement que l’on veut désigner de manière univoque.

Pour des raisons de simplicité et pour correspondre au mieux aux propriétés topologiques de l’espace-temps, on utilise des nombres réels.

Si l’on suppose que les lois de la physique sont les mêmes en chaque point de l’espace-temps, cela signifie mathématiquement que le groupe des transformations générales agit “transitivement” sur l’ensemble des évènements. Sans aller plus loin dans la description mathématique de cette “action transitive” (pourtant fondamentale), on peut considérer de façon équivalente que l’espace-temps est supposé homogène, et l’on peut donc en conséquence le représenter par un espace géométrique de type affine.
Pourquoi un espace affine et pas vectoriel ? Tout simplement parce que l’espace n’a pas d’origine, ce qui grosso modo correspond à la différence entre un espace affine et un espace vectoriel.

Un repère affine dans l’espace affine de dimension quatre est donc simplement donné par cinq points affinement indépendants 3, et représente un référentiel. Donc l’ensemble des référentiels physiques est représenté par l’ensemble des repères affines.

Voyons à quoi ressemble géométriquement un repère affine. En dimension un, il ne s’agit que de deux points distincts. L’origine du repère n’est pas fixée et peut être n’importe lequel de ces deux points. En dimension deux, un repère affine est constitué de trois points non alignés, l’origine pouvant également être n’importe lequel de ces trois points.

Repere affine en dimension 1 Repere affine en dimension 2
Repère affine en dimension 1

Repère affine en dimension 2
(non orienté)

Ces repères ne sont pas orientés. Orienter un repère affine en dimension 1 revient à choisir le point d’origine, il y a donc deux orientations possibles :

Repere affine en dimension 1 orienté 2 Repere affine en dimension 1 orienté 1

Repères affines orientés en dimension 1

Orienter un repère en dimension supérieure revient non seulement à choisir un point d’origine, mais aussi à orienter ses axes. Par exemple deux possibilités en dimension 2 sont :

Repere affine en dimension 2 orienté 2 Repere affine en dimension 2 orienté 1

Deux repères affines orientés en dimension 2

Maintenant, prenons un repère affine quelconque en dimension quatre comme référence pour définir par convention l’orientation des trois premiers axes de tout autre repère. Nous les qualifierons ainsi de repères affines spatialement orientés. Cela revient à choisir une orientation spatiale des repères affines, ou géométriquement de choisir un sens de rotation de référence. En fait cela revient à dire qu’aucun changement de référentiel ne devrait inverser la chiralité d’un phénomène (nous ne parlons que de phénomènes macroscopiques, et ne nous préoccupons pas du cas particulier de la mécanique quantique).

Nous avons alors un repère qui est seulement partiellement orienté. Par exemple en dimension deux un tel repère serait :

Repere affine en dimension 2 semi-orienté

Repère affine semi-orienté en dimension 2

Ensuite, en dimension quatre, prenons un repère affine spatialement orienté quelconque comme référence pour définir l’orientation du quatrième axe de tous les autres repères, que nous qualifierons ainsi de repères affines spatialement et temporellement orientés. Cela revient à choisir une orientation temporelle des repères affines déjà spatialement orientés, ou géométriquement à choisir une direction temporelle privilégiée. En fait cela revient à dire qu’aucun changement de référentiel ne devrait remonter le temps, ou inverser l’entropie d’un phénomène (encore une fois, nous ne parlons que de phénomènes macroscopiques).

Pour prendre en considération la structure causale des évènements physiques, nous devons ajouter à cet espace-temps affine une structure. Pour fixer cette structure, il faut déterminer les relations spécifiques que vérifieront les coordonnées de chaque couple de points (couple d’évènements) exprimés dans tout repère affine. On postule pour cela que la “distance” entre deux points X=(x, y, z, t) et X^\prime=(x^\prime, y^\prime, z^\prime, t^\prime)
vaut d(X,X^\prime)^2=(x-x^\prime)^2+(y-y^\prime)^2+(z-z^\prime)^2-(t-t^\prime)^2.
C’est aussi équivalent à définir, dans chaque repère affine, la “distance” unité à l’origine comme étant un hyperboloïde unitaire. En dimension deux, en voici un exemple (tout point sur une branche d’hyperbole est à une distance unité de l’origine) :

Repère affine en dimension deux et métrique

Repère affine orienté muni d’une “distance”, en dimension 2

Ainsi nous avons définit mathématiquement ce qu’est un “référentiel inertiel” : il s’agit d’un repère affine spatialement orienté, temporellement orienté et dont les composantes de temps et d’espace sont liées selon une certaine relation quadratique induite par la structure causale des évènements. Les transformations de Lorentz sont donc les transformations affines qui conservent l’orientation spatiale et temporelle, ainsi que la structure causale de l’espace-temps (relation quadratique entre la dimension de temps et la dimension d’espace).

Remarque importante : le terme “distance” est ici toujours entre guillemets car ce n’est en fait pas une distance. Le concept de distance est basé sur celui du produit scalaire, et ne concerne donc que les espaces euclidiens. Ici, la forme quadratique n’est pas un produit scalaire (elle n’est pas définie positive), nous sommes dans un espace dit pseudo-euclidien. Pour cette même raison, il est complètement faux de désigner cette forme quadratique par le terme de métrique, et encore pire de la confondre avec le tenseur métrique qui dépend du référentiel choisi… Voir l’article sur les tenseurs pour plus de détails.

Le groupe de Lorentz

Maintenant que l’on sait décrire mathématiquement ce qu’est un référentiel inertiel, nous devrions facilement pouvoir déterminer le groupe des transformations de Lorentz. Il sera un sous-groupe du groupe affine, regroupant toutes les transformations affines de l’espace affine réel de dimension quatre, noté GA_4(\mathbb R)\simeq \mathbb R^4\ltimes GL_4(\mathbb R). Il contient les translations d’espace-temps ainsi que toutes les transformations linéaires inversibles (donc les matrices carrées de taille quatre et de déterminant non nul).

Le produit tordu symbolise le fait que les translations ne commutent pas avec toutes les transformations linéaires. Même si c’est une propriété importante, nous ne nous étendrons pas sur ce point.

Puisque nous avons besoin que ces transformations respectent la structure causale des évènements, ou la géométrie de l’espace-temps, elles doivent conserver la forme quadratique x^2+y^2+z^2-t^2, et cette restriction nous donne un autre sous-groupe que l’on note \mathbb R^4\ltimes O(3,1). C’est le groupe de Poincaré complet ou inhomogène (le groupe de Poincaré dit homogène ne contient pas les translations).

Afin de préserver l’orientation spatiale des repères affines, les matrices doivent être de déterminant égal à un, ce qui nous restreint au sous-groupe noté \mathbb R^4\ltimes SO(3,1) des transformations linéaire dites propres. Ensuite, et finalement, pour conserver l’orientation temporelle on se restreint au sous-groupe \mathbb R^4\ltimes SO_o(3,1) appelé le groupe de Lorentz complet ou inhomogène. L’indice zero indique que ce groupe est la composante connexe de l’identité du groupe de Poincaré complet, qui contient en plus des translations les transformations linéaires propres et orthochrones.

C’est donc ce groupe précis qui agit (dans tous les sens du terme) sur l’espace-temps de la physique relativiste. Il définit et se confond avec la structure géométrique de l’espace-temps. Nous verrons dans un prochain article sur le programme d’Erlangen la relation générale qu’entretien le concept de groupe avec la géométrie, et dont la cinématique relativiste est un cas particulier.

Tout ceci pose la question de la généralisation de son principe : pourquoi le groupe de la relativité quantique est-il différent ? Y a-t-il un groupe à la base de la relativité générale ? Nous voyons bien en tous les cas à quel point les objets mathématiques abstraits permettent au physicien une compréhension plus profonde des lois de la nature.

Notes :

1. Les transformations de Lorentz sont généralement données dans un cas particulier, celui de deux référentiels inertiels de même origine et dont les axes sont parallèles, le mouvement se produisant le long d’un axe seulement. Ce sont les transformations spéciales de Lorentz, ou “boosts”. Elles prennent la forme suivante, si l’on note (x,y,z,t) les coordonnées d’un référentiel et (\xi,\eta,\zeta, \tau) les coordonnées du nouveau référentiel :

\tau=\dfrac{t-\frac{vx}{c^2}}{\sqrt{1-\frac{v^2}{c^2}}}, \xi=\dfrac{x-vt}{\sqrt{1-\frac{v^2}{c^2}}}, \eta=y, \zeta=z.

Dans le cas d’un mouvement non restreint à un seul axe, avec un

vecteur vitesse V=(v_{_x},v_{_y},v_{_z}) de norme v :

\tau=\dfrac{t-\frac{V\cdot X}{c^2}}{\sqrt{1-\frac{v^2}{c^2}}},

\xi=x+\dfrac{\frac{v_{_x}}{v^2}V\cdot X-v_{_x}t}{\sqrt{1-\frac{v^2}{c^2}}}-\frac{v_{_x}}{v^2}V\cdot X,

\eta=y+\dfrac{\frac{v_{_y}}{v^2}V\cdot X-v_{_y}t}{\sqrt{1-\frac{v^2}{c^2}}}-\frac{v_{_y}}{v^2}V\cdot X,

\zeta=z+\dfrac{\frac{v_{_z}}{v^2}V\cdot X-{v_{_z}t}}{\sqrt{1-\frac{v^2}{c^2}}}-\frac{v_{_z}}{v^2}V\cdot X.

X=(x,y,z) et V\cdot X=xv_{_x}+yv_{_y}+zv_{_z}.

Les transformations générales, adaptées à des référentiels quelconques et non plus seulement de même origine et d’axes parallèles, contiennent de plus une rotation des axes, donc aussi des fonctions trigonométriques \cos et \sin. Les formules deviennent vite très lourdes ! Voilà un inconvénient que nous n’avons pas avec la formulation matricielle et abstraite du groupe de Lorentz.

2. Remarquons qu’Henri Poincaré cherchait déjà l’ensemble des invariants du groupe de Lorentz en utilisant ses générateurs infinitésimaux (ce que l’on fait de nos jours avec les algèbres de Lie) ! et ceci en 1905 (voir seconde référence bibliographique), la même année de la publication de l’article d’Einstein, avant même d’en avoir eu connaissance…

Précisons toutefois qu’il est erroné d’attribuer la théorie de la relativité restreinte à Poincaré puisque celui-ci n’a jamais formulé de théorie complète, il ne faisait que corriger et améliorer des résultats des physiciens de l’époque (Lorentz, Maxwell, etc.). Nous reviendrons dans un prochain article sur ce point méconnu et souvent mal interprété de l’histoire de la physique : Poincaré précurseur.

3. n points sont affinement indépendants si tout sous ensemble de point est affinement indépendant. Sont affinement indépendants deux points distincts ; trois points distincts non-alignés ; quatre points non-coplanaires dont aucun triplet n’est aligné ; cinq points distincts non-cohyperplanaires (n’appartenant pas à un même hyperplan) dont aucun quadruplet n’est coplanaire et aucun triplet n’est aligné ; etc.

Bibliographie :

\star\quad A.Einstein, On the electrodynamics of moving bodies, John Walker’s edition, based on the english translation in the book The principle of relativity, Methuen and company, Ltd. of London, 1923. Genuine Deutch publication Zur elektrodynamik bewegter körper, Annalen der Physik, 20 juin 1905.

\star\quad Henri Poincaré, La dynamique de l’électron, Comptes Rendus des Séances de l’Académie des Sciences de Palerme, 1905. Publication originale dans les Rendiconti del Circolo Mathematico di Palermo, t.21, p129-175, 1906 (reçu le 23 juillet 1905, imprimé le 14 décembre 1905).

\star\quad H.Minkowski, Espace et temps, Annales scientifiques de l’E.N.S. 3e série, tome 26, 1909, p. 499-517. Traduction française de A.Hennequin et J.Marty, 1909. Basé sur l’édition posthume de M.A.Gutzmer, B.-G. Teubner, Leipzig, 1909. Conférence originale donnée à la 80ème réunion des naturalistes et médecins allemands, Cologne, 1908.

\star\quad J.M.Levy-Leblond, Une dérivation de plus des transformations de Lorentz, traduction par O.Castera de l’article original paru dans l’American Journal of Physics, vol. 44, num. 3, p271-277, 1975.

\star\quad J.P.Lecardonnel, Un autre point de vue pour présenter la transformation de Lorentz, Bulletin de l’union des physiciens, num. 615, p1171-1196, 1979.

\star\quad J.Colombano-Rut, La mathématisation de la mécanique relativiste, mémoire de M2 (non publié), 2009.

2 Commentaires
  • Marco
    Publié à 15:53h, 06 novembre

    super. continuez avec la relativité générale. (Vous avez fais les tenseurs déjà!). Si vous pouviez expliquer l’équation de RG avec le même style que les tenseurs, Ah ce serait bien pour des autodidactes comme moi.
    Merci de votre travail.

  • Johann
    Publié à 16:18h, 06 novembre

    Bonjour,
    C’est prévu ! :-)
    Pas encore de date par contre, ça pourrait prendre un peu de temps… Inscrivez-vous à la newsletter pour être notifié.
    Merci pour votre commentaire

Laisser un commentaire