Language

lunes, 30 de julio de 2018

Sobre la imposibilidad de la cuadratura del círculo

Muchos han sido los intentos de cuadrar un círculo con las "reglas clásicas de la antigüedad", es decir, construir con "regla y compás" un cuadrado de área igual a un círculo dado. Desde hace 150 años se sabe que es una tarea completamente imposible, al igual que muchos otros, como la trisección del ángulo o la duplicación del cubo (los tres problemas délicos). ¿Qué relación tiene la cuadratura del círculo con la trascendencia de $\pi$? ¡Comencemos!


Primero vamos a probar que el número $\pi$ es irracional y trascendente (sobre $\mathbb{Q}$, que lo omitiré en adelante). Este resultado es imprescindible para lo que después desarrollaremos.

Proposición: Todo número trascendente es irracional.

Demostración: supongamos que un número trascendente $p$ es racional. Entonces $p=\displaystyle\frac{a}{b}$ para ciertos enteros $a$ y $b$. Construímos el polinomio $p(x)=bx-a$, y como tiene por raíz a $p$, entonces es algebraico. Habiendo llegado a una contradicción, es claro que todo número trascendente es irracional. Por ello nos limitaremos a demostrar la trascendencia de $\pi$.

Una vez demostrada la trascendencia de $\pi$, veremos qué tiene que ver con la imposibilidad de cuadrar un círculo con regla y compás. Finalmente estudiaremos unas cuantas consecuencias y teoremas más.


1. Teorema de Lindemann-Weierstrass


Hermite (sí, el de los polinomios) fue el primero en probar que cualquier potencia racional de $e$ es trascendente, demostrando así que el propio $e$ es trascendente. Nueve años después, Lindemann lo generalizó diciendo que $e$ elevado a cualquier número algebraico es trascendente. Sin conocer la prueba de Lindemann, el español José Echegaray llegó al mismo resultado en 1886. El artículo lo puedes encontrar aquí.

Nosotros vamos a demostrar el caso más general del teorema, para luego particularizar al resultado que nos concierne. Bueno, vamos a ello:

Lema (A): dados $c(i) \ \neq 0 \ \forall i\in\mathbb{Z}\cap [1,r]$ sean ${y(k)_1,..., y(k)_{m(k)}}$   las raíces de un polinomio con coeficientes $T_k(x)=v(k) x^{m(k)}+...+u(k)$ $\forall k\in[1,r]$ enteros y con $u(k), v(k)\neq 0$. Entonces si $y(k)_i\neq y(u)_v$ con $(k, i)\neq (u, v)$ se tiene que $\sum_{i=1}^r{c(i)(e^{y(i)_i}+...+e^{y(i)_{m(i)}})}\neq 0$.

Demostración: en primer lugar la expresión final del enunciado puede ser escrita como 

$S=\sum_{k=1}^n\beta_k e^{\alpha_k}\neq 0$

donde $n_0=0$, $n=n_r$, $n_i=\sum_{k=1}^i m(k)$ con $i=1, …, r$, $\alpha_{n_i+j}=y(i+1)_j$ con $0\leq i\leq r$, $1\leq j\leq m(i)$ y $\beta_{n_i+j}=c(i+1)$. Supongamos que $S=0$ para llegar a una contradicción. Sea ahora 

$f_i(x):=\frac{l^{np}(x-\alpha_1)^p...(x-\alpha_n)^p}{(x-\alpha_i)}$

con $l$ entero y construyamos $I_i(s)=\int_0^s e^{s-x}f_i(x) dx=e^s\sum_{j=0}^{np-1}f_i^{(j)}(0)-\sum_{j=0}^{np-1}f_i^{(j)}(s)$ integrando por partes. En caso de que $s$ sea complejo integramos en un contorno cerrado que pase por la recta real y usamos el Teorema de Cauchy. Ahora evaluemos la suma

$J_i=\sum_{k=1}^n \beta_k I_i(\alpha_k)=\sum_{j=0}^{np-1}f_i^{(j)}(0)\sum_{k=1}^n\beta_ke^{\alpha_k}-\sum_{k=1}^n\sum_{j=0}^{np-1}\beta_k f_i^{(j)}(\alpha_k)$ por lo que $J_i=-\sum_{k=1}^n\sum_{j=0}^{np-1}\beta_kf_i^{(j)}(\alpha_k)$ donde en la última igualdad hemos usado la hipótesis del absurdo.

Si $j\geq p$ entonces $f_i^{(j)}(\alpha_k)$ es un entero algebraico múltiplo de $p!$. Si $j<p-1$ es claro que $f_i^{(j)}(\alpha_k)=0$ y si $j=p-1$ y $k=i$ entonces $f_i^{(j)}(\alpha_k)=l^{np}(p-1)!\prod_{i\neq k}(\alpha_i-\alpha_k)$. Este entero no es divisible por $p$ haciendo uso del Pequeño Teorema de Fermat, como puedes comprobar en la bibligrafía. Por tanto $J_i$ es divisible por $(p-1)!$. Ahora, reescribiendo $J_i$ como sigue

$J_i=-\sum_{j=0}^{np-1}\sum_{t=0}^{r-1}c(t+1)(f_i^{(j)}(\alpha_{n_t+1})++f_i^{(j)}(\alpha_{n_{t+1}}))$

Usando el Teorema Fundamental de polinomios simétricos, se puede probar que $J_i$ es un polinomio $G(\alpha_i)$, por lo que $|J_1...J_n|$ es un entero divisible por $(p-1)!^n$. La contradicción llega del hecho de que $|I(a_k)|\leq |a_k| e^{|a_k|}F_i{|a_k|}$ donde $F_i(x)$ es el polinomio cuyos coeficientes son los de $f_i(x)$ en valor absoluto. Pero entonces $J_i(|a_k|)\leq\sum_{k=1}^n|a_k\beta_k|e^{|a_k|}F_i(|a_k|)$ por lo que de alguna forma $|J_1...J_n|$ está acotado superiormente por cierto $N^p$, lo cual contradice la desigualdad anterior ya que $p$ es arbitrario y la cota inferior supera a la superior para $p$ suficientemente grande.


Otro Lema (B): si $b(1),...,b(n)$ son naturales y $y(1),...,y(n)$ son algebraicos y diferentes, entonces $b(1)e^{y(1)}+...+b(n)e^{y(n)}\neq 0$.

Prueba: construyamos un polinomio con coeficientes enteros cuyas raíces sean $y(1),...,y(n),y(n+1),...y(N)$ y definamos $b(n+1)=…=b(N)=0$. Si suponemos que el enunciado es falso, es claro que 

$\prod_{\sigma\in S_N}(b(1)e^{y(\sigma(1)}+...+b(N)e^{y(\sigma(N)})=0$

donde estamos considerando todas las permutaciones. Pero si expandimos ese productorio nos aparecen términos en exponenciales simétricas y al agrupar nos vamos a encontrar con una suma semejante a la del enunciado del lema A. Puede probarse que se satisfacen dichas hipótesis, lo cual es contradictorio y prueba el lema B.

Teorema de Lindemann-Weierstrass: si $a_1,...,a_n$ son números algebraicos no nulos y $\beta_1,...,\beta_n$ son números algebraicos distintos, entonces $a_1e^{\beta_1}+...+a_ne^{\beta_n}\neq 0$.

Demostración: se prueba de forma muy parecida al Lema B.

La prueba que dio Lindemann originalmente de que $\pi$ es trascendente os la dejo en la bibliografía. Es menos general pero es suficiente para lo que necesitamos en esta entrada. De hecho simplemente con los lemas A y B podríamos probar la trascendencia e irracionalidad de $\pi$ y de $e$.

La trascendencia de $e$ ya fue probada en una entrada anterior, que puedes leer aquí. De hecho es trivial sin más que ver el enunciado del lema B, ya que si $e$ fuese algebraico la igualdad sería cero para ciertos coeficientes. 

Ahora bien, si $\pi$ fuera algebraico, la ecuación $e^{i\pi}+1=0$ contradeciría el Lema B, por consiguiente acabamos de demostrar que el número $\pi$ es trascendental. Ahora vamos a estudiar la relación entre la trascendencia y el hecho de que el número $\pi$ no sea construible.


2. Imposibilidad de cuadrar un círculo

En primer lugar os remito a la bibliografía para entender bien qué queremos decir con que un punto sea o no construible. Para el tema que nos concierne, es suficiente que entendáis que si $a$ y $b$ son dos puntos construibles, entonces su cociente es construible. Esto será clave para demostrar que es imposible cuadrar el círculo. Vayamos ahora a por un teorema, que tengo algo de mono.

Un número es construible sí y sólo sí es algebraico y su polinomio mínimo irreducible sobre $\mathbb{Q}$ es potencia de 2.

La demostración la puedes encontrar en el libro "What is mathematics?" que os dejo en la bibliografía, entre las páginas 127 y 140. La idea es simple y voy a tratar de ilustrarla.

Primero define un "number field" como un conjunto de números cerrado bajo operaciones racionales (suma, resta, producto y división). Llama $F_0$ al rational field y $F_1$ al irracional, que lo obtiene a partir de $F_=$. Obviamente ambos son construibles de forma muy sencillita (os vuelvo a remitir al artículo de Gaussianos). Poco a poco construye nuevos $F's$ a partir de los anteriores y observa qué números son construibles. Por ejemplo, los números de $F_1$ vienen de ecuaciones de segundo grado, los de $F_3$ de cuarto grado y así sucesivamente. Por tanto los números algebraicos son los únicos construibles. Además 


Supongamos que es posible cuadrar el círculo con regla y compás. Esto equivale a decir que $R$ y $L$ son construibles, siendo $R$ el radio del círculo y $L$ el lado del cuadrado. Como $\pi R^2=L^2$ entonces $\sqrt{\pi}=L/R$ es construible por serlo $R$ y $L$. Pero esto es falso por ser $\pi$ trascendental. Con lo cual queda probada la imposibilidad de cuadrar el círculo.


3. Otros problemas délicos 


Además de la imposibilidad de cuadrar el círculo, existen otros dos problemas clásicos que se han demostrado imposibles.

Duplicación del cubo: no es posible porque el polinomio mínimo irreducible de $\sqrt[3]{2}$ es $x^3-2=0$ y 3 no es múltilplo de 2.

Trisección del ángulo: algunos ángulos sí se pueden trisecar, pero no es posible en general. En el artículo de Gaussianos de la bibliografía lo tiene hecho con el ángulo de 60º.



4. Curiosidades


Hay otro teorema, el de Gelfond-Schneider, que garantiza que $a^b$ es trascendente si $a$ y $b$ son algebraicos y $b$ es irracional. Junto con el Teorema de Lindemann sería consecuencia de la Conjetura de Schanuel, que no es más que eso, una conjetura.

De hecho, el teorema de Gelfond es el resultado del séptimo problema de Hilbert, una lista de 23 problemas matemáticos enunciada por Hilbert a principios del siglo pasado, de los cuales se han resuelto 9. 



5. Conclusiones

La idea básica de esta entrada era probar que la cuadratura del círculo es imposible. Para ello hemos definido lo que es una construcción clásica con regla y compás, y hemos demostrado que sólo podemos construir números algebraicos que sean raíz de un polinomio irreducible de grado $2^n$ con $n$ natural. Habiendo probado que $\pi$ es trascendente gracias al Teorema de Lindemann-Weierstrass, hemos conseguido nuestro objetivo.





Bibliografía


- https://es.wikipedia.org/wiki/N%C3%BAmero_trascendente

- https://en.wikipedia.org/wiki/Lindemann–Weierstrass_theorem (Teorema de Lindemann)

http://gaussianos.com/echegaray-y-la-trascendencia-de-pi

- http://gaussianos.com/como-demostrar-que-%CF%80-pi-es-trascendente/

- http://gaussianos.com/construcciones-con-regla-y-compas-i-introduccion-y-primeras-construcciones/ (Construcciones clásicas con regla y compás)

- http://gaussianos.com/construcciones-con-regla-y-compas-ii-los-problemas-delicos/

- http://mimosa.pntic.mec.es/jgomez53/matema/conocer/numpi_lindemann.htm

- http://gaussianos.com/quien-dijo-que-la-cuadratura-del-circulo-era-imposible/

- http://www.cimat.mx/~ibrahim/LOTra_JIVG.pdf

- https://es.wikipedia.org/wiki/Problemas_de_Hilbert (Problemas de Hilbert)

- https://es.wikipedia.org/wiki/Teorema_de_Gelfond-Schneider

- What is mathematics? Courant & Robbins (los números algebraicos son los únicos construibles, pág 127-140)

- http://rodin.uca.es/xmlui/bitstream/handle/10498/7163/33925574.pdf (José Echegaray)

http://sixthform.info/maths/files/pitrans.pdf (Más sobre la trascendencia de $\pi$)



domingo, 8 de julio de 2018

Las leyes de Newton y la curvatura del espaciotiempo

Todos hemos oído hablar de las leyes de Newton desde pequeños. La primera de ellas nos dice cómo se mueve una partícula sobre la que no actúa ninguna fuerza, la segunda habla del efecto que produce la fuerza sobre la trayectoria, y la tercera es la ley de acción y reacción. En esta entrada nos vamos a centrar sólo en las dos primeras, que rezan así:

1ª Ley: un cuerpo sobre el que no actúa ninguna fuerza se mueve uniformemente y en línea recta.

2ª Ley: la desviación que sufre un cuerpo de moverse "libremente", es decir, uniformemente y en línea recta, es proporcional a la fuerza que actúa sobre él.




En un sentido clásico, la primera ley nos define lo que es un sistema inercial, concepto clave, pues sólo en estos sistemas pueden aplicarse las otras dos leyes. Pero ya vemos aquí cierto argumento circular: ¿Cómo sabemos que sobre un cuerpo no actúan fuerzas?

De hecho, la fuerza de la gravedad es de alcance infinito, lo que lleva a pensar que la primera ley de Newton carece de significado práctico. ¿Cómo podemos lidiar con la 1ª Ley y con el hecho de que exista la gravedad? Muy sencillo, exigiendo que la gravedad no sea una fuerza sino algo distinto.

Desde un punto de vista geométrico, la 1ª Ley nos define lo que es una línea recta, es decir, nos define la curvatura de nuestro espacio (tiempo), y la 2ª nos informa de la desviación de las trayectorias como consecuencia de las fuerzas.

Para entender perfectamente la Física de esta entrada necesitamos cierto background matemático que pasaré a resumir a continuación.

1. Nociones básicas de geometría.


Sea $(M,\theta,A)$ una variedad topológica diferenciable de dimensión $n$. Esto no es más que dotar a un conjunto $M$ de una topología $\theta$, osea, definir sobre ese conjunto lo que es un abierto $U$ y exigir que sea localmente homeomorfo a $\mathbb{R}^n$, es decir, que para cada abierto $U\subset M$ exista un homeomorfismo $x: U\longrightarrow \mathbb{R}^n$ biyectivo, continuo, invertible y con inversa continua. A la función $x$ se la llama "función coordenada" o "coordenadas".

Esto no es nada del otro mundo. Pensad que cada punto $p$ de una esfera puede ser representado por dos coordenadas, $\theta$ y $\phi$, que representan a la esfera como un abierto de $\mathbb{R}^2$ de forma local.

Sobre cada $p\in M$ puedo construir un espacio vectorial llamado espacio tangente de la siguiente forma:

$T_pM := span\{\partial/\partial x^1, …, \partial/\partial x^n\}$



Cada $X_p\in T_pM$ es una aplicación $X_p : C^{\infty}(M)\longrightarrow \mathbb{R}$ que de cada función sobre la variedad me dice su "derivada direccional" $X_p(f):= X^i\partial_i f$, donde entendemos que $\partial_i f := \partial/\partial x^i (f\circ x^{-1})$.

Ahora puedo construir el fibrado tangente, $TM$, como la unión disjunta de todos los espacios tangentes a cada punto de la variedad. Ciertamente puedo proyectar la topología de $M$ sobre $TM$ haciendo que $TM$ sea una variedad diferenciable. Con estas estructuras puedo definir un campo vectorial $X$ como una aplicación $X:M\longrightarrow TM$ tal que $X\circ \pi=Id$ con $\pi$ la proyección canónica de $TM$ sobre $M$. El conjunto de campos vectoriales sobre el anillo $C^{\infty}(M)$, $\Gamma(TM)$, tiene estructura de $C^{\infty}(M)$-module, pues $C^{\infty}(M)$ es un anillo, no un cuerpo. Esto va a implicar que no tiene por qué existir una base de $\Gamma(TM)$ global (pero sí local, obviamente). 

Ahora que sé derivar funciones sobre variedades, $\nabla_X f := X(f)$, me interesa saber derivar tensores en general. Para ello construyo el operador $\nabla_X$ con una serie de propiedades (imponiendo que el resultado sea tensorial) y me doy cuenta que tengo bastante libertad a la hora de escoger su funcionamiento. En particular puedo escoger arbitrariamente lo que se denomina la conexión $\Gamma^i_{j k}:=dx^i(\nabla_k \partial_j)$ para así "definir" cómo actúan sobre campos vectoriales. En cierto sentido las $\Gamma$'s portan información sobre lo que entendemos por "paralelismo" sobre la variedad.

Lo realmente bonito es el hecho de que la conexión no es un tensor, es decir, las funciones $\Gamma^i_{j k}$, no transforman como un tensor, lo cual va a ser muy relevante posteriormente. Añado en este punto que la parte antisimétrica de la conexión sí que transforma como un tensor: la torsión.

Debido a que no transforman como tensores, punto a punto puedo escoger un cambio de coordenadas que me anulen la conexión (la parte no tensorial), pero en general no puedo anular la conexión en todo mi espacio, eso dependerá de la curvatura de la misma. Vamos ahora a definir qué es eso de la curvatura.

Sea $\gamma:\mathbb{R}\longrightarrow M$ una curva suave y sea $V$ el campo de vectores tangentes a la curva sobre la curva (en realidad sólo necesito vectores punto a punto). Un vector $X$ es transportado a lo largo de la curva si $\nabla_V X=0$. Esto no es más que ir arrastrando el vector sobre la curva sin modificar sus componentes (transporte paralelo). 

Un vector transportado paralelamente a lo largo de la curva 

Cuando en una curva su vector tangente es transportado paralelamente a lo largo de ella misma, decimos que esa curva es una geodésica (afín). Vamos a calcular en coordenadas la ecuación de una geodésica. Para ello dada la curva $\gamma$ parametrizada por $t\in\mathbb{R}$ definimos su vector tangente en un punto $p=\gamma(t_0)$ como $V(f):=d/dt (f\circ \gamma)(t_0)$, de modo que en coordenadas, $V=\dot{\gamma^i}\partial_i $. Por tanto, la ecuación de la geodésica en componentes es 

$(\nabla_{\dot{\gamma^i}\partial_i}(\dot\gamma^n\partial_n))^m=\ddot\gamma^m+\Gamma^m_{a b}\dot{\gamma}^a\dot\gamma^b=0$

Las curvas que siguen las partículas libres ahora dependen de la conexión. Para una variedad plana en cartesianas, las $\Gamma$'s son nulas, y recuperamos el movimiento rectilíneo uniforme, pero en variedades curvas con conexiones arbitrarias la cosa ya no es tan sencilla.

Si has estudiado geometría diferencial sobre superficies en $\mathbb{R}^3$ habrás estudiado las geodésicas métricas como las que minimizan la distancia sobre la superficie. Es sencillo probar que usando la conexión usual de Levi-Civita, esa definición es equivalente a la nuestra. En ese caso, las geodésicas son las curvas tales que su vector de curvatura es normal a la superficie a lo largo de toda la curva, osea que su curvatura geodésica es nula. Habrás estudiado también la derivada "intrínseca" a lo largo de una curva como la derivada usual a la que le restamos la componente normal. Pues es equivalente (Levi-Civita). Nótese que nosotros no hemos dotado aún de una métrica a nuestra variedad y que diferenciamos, en principio, geodésicas métricas (minimizan la distancia) de geodésicas afines (se autotransportan paralelamente).

Definimos ahora el tensor de Riemann como 


$Riem(\omega,Z,X,Y):=\omega(\nabla_X\nabla_Y Z-\nabla_Y\nabla_X Z-\nabla_{[X,Y]} Z)$ 

que se puede entender como la curvatura de la variedad. Podemos escribirlo en coordenadas en función de la conexión y sus derivadas, por lo que en una variedad curva es imposible eliminar la conexión con un simple cambio de coordenadas, ya que $Riem$ es un tensor. Finalmente se define el tensor de Ricci contrayendo el primer y el tercer índice de $Riem$, y el escalar de Ricci contrayendo el tensor de Ricci con la métrica.

Para aclarar un poco las ideas, supongamos dos aviones que se dirigen hacia el polo norte. Uno despega desde Ecuador y otro desde Guinea. A medida que avanzan, los dos aviones tienden a acercarse. Si los pasajeros de ambos aparatos no saben que la Tierra es esférica, postularán que hay una misteriosa fuerza que los atrae. Pero alguien que sepa que la Tierra es redonda, atribuirá dicho acercamiento a un efecto de la curvatura terrestre. Esto es precisamente lo que vamos a hacer con la gravedad, salvando las distancias.


2. La motivación de Laplace


En esta sección vamos a intentar abandonar la idea de la gravedad como una fuerza para intentar entenderla como consecuencia de un espaciotiempo curvado. Esta motivación surge del principio de equivalencia, es decir, de la idea de que todas las partículas se aceleran igual independientemente de su masa. Lo que intentó Laplace fue codificar el campo gravitatorio de tal manera que la 2ª Ley de Newton para la gravedad tomase la forma de una geodésica. Pero eso es imposible, ya que la fuerza de la gravedad sólo depende de las posiciones, no de las velocidades, y en la ecuación de la geodésica intervienen las velocidades.



El problema de fondo es que hasta ahora nuestras curvas dependen de la parametrización. Para librarnos de ella simplemente pensemos en el tiempo como una coordenada más. Simplemente eso. Hasta ahora una curva era de la forma $(x^1(t), x^2(t), x^3(t))$. Ahora es una aplicación hacia $\mathbb{R}^4$ del tipo $(x^0(t)\equiv t, x^1(t), x^2(t), x^3(t))$. Entonces la ecuación de una partícula en un campo gravitatorio, teniendo en cuenta el principio de equivalencia,

$\ddot x^a-f^a(x(t))=0$

es equivalente a la ecuación de la geodésica en una variedad de dimensión 4 dotada de una conexión nula salvo los términos $\Gamma^{\alpha}_{0 0}=-f^{\alpha}(x(t))$ con $\alpha\neq 0$, ya que $\dot{x}^0=1$.



$\ddot{x}^a+\Gamma^a_{b c}\dot{x}^b\dot x^c=0$


Ciertamente existe curvatura, y no es un artificio por una extraña elección de coordenadas. Basta calcularse el tensor de Riemann para comprobarlo. En otras coordenadas donde espacio y tiempo se entremezclen, la conexión tomará formas extrañas, pero tomando $x^0=t$ (atlas estratificado) queda así de sencilla. La curvatura es por tanto temporal y la fuerza de la gravedad ahora no es más que un efecto de la curvatura del espaciotiempo de Newton. De este modo la 1ª Ley funciona y nos define la geometría de nuestro espacio. 



Como curiosidad podemos calcular la componente (0, 0) del tensor de Ricci, y usando la ecuación de Poisson para el campo gravitatorio, vemos que en cartesianas $Ri_{0 0}=-\partial_a f^a =4\pi G \rho$. Esto es una maravilla. ¡La curvatura de la variedad viene codificada por la densidad de materia! Recuerda que estamos en mecánica Newtoniana, no hemos mencionado nada de Relatividad. Sólo estamos codificando la gravedad como geometría del espacio-tiempo para que la 1ª Ley de Newton pueda ser aplicable.





3. Axiomas geométricos del espaciotiempo Newtoniano



Ahora que entendemos que existe una relación entre la gravedad y la geometría del espaciotiempo de Newton vamos a establecer 3 axiomas sobre esta nueva variedad, olvidando por un momento todo lo aprendido en la sección 2.

Partimos de una variedad $(M,\theta,A)$ diferenciable de dimensión 4 dotada de una conexión $\nabla$ sobre la que existe un tiempo absoluto $t:M\longrightarrow \mathbb{R}$ suave. ¿Cómo debe ser el tiempo absoluto para mantener la estructura del espaciotiempo de Newton? Lo más sencillo es colocarse en un punto $p\in M$ de la variedad y vamos a ver cómo cambia el tiempo al avanzar en la dirección $\partial_0\in T_pM$. Si $(dt)_p(\partial_0)=0$, el tiempo no avanzaría en esa dirección, y lo mismo podríamos hacer con el resto de coordenadas. Por eso postulamos lo siguiente:

1. $(dt)_p\neq 0 \ \forall p\in M$ implica que $M$ está "foliada" en subconjuntos $S_{\tau}:=\{p\in M:t(p)=\tau\}$ disjuntos tal que  $M=\cup S_{\tau}$. Esto es consecuencia del Teorema de la Función Implícita. De hecho, con estos requerimientos, los conjuntos $S_{\tau}$ son variedades topológicas de dimensión 3 con cartas $(x^1, x^2, x^3)$ diferenciables. Si $(dt)_p=0$ entonces el tiempo moriría o emergería de ese punto, lo cual, lejos de cualquier interpretación abstracta, no tiene sentido físico en Mecánica Newtoniana.

2. El tiempo fluye uniformemente a lo largo de cualquiera de las 4 direcciones del espaciotiempo, o simbólicamente, $\nabla dt = 0$. Esto es equivalente a decir que la 1-forma $dt$ derivada a lo largo de cualquier dirección da la forma nula, lo que implica que cuando yo quiera ver cómo de rápido fluye el tiempo a lo largo de cualquier dirección, el resultado me va a dar lo mismo sobre cualquier punto $p$ de la variedad. El tiempo sólo avanza hacia el futuro (no en el espacio) y de forma constante. No es posible un viaje en el tiempo hacia el pasado.

3. Necesitamos postular también cómo funciona $\nabla$. Tomando coordenadas cartesianas $(x^0, x^1, x^2, x^3)$ sobre la variedad tendremos, como antes, que $\Gamma_{0 0}^{\alpha}:=-f^{\alpha}(x(t))=\partial_{\alpha} U$, siendo $U$ el potencial gravitatorio. En estas coordenadas (y en cualquier otras) ahora podemos calcular la conexión, la curvatura de Riemann, la torsión, etc. La conexión $\nabla$ no tiene torsión, osea que $[\nabla_{\mu},\nabla_{\nu}]V^{\lambda}=Riem_{\mu \nu\rho}^{\lambda}V^{\rho}$. Si tuviésemos torsión, la conexión no sería simétrica y los paralelogramos a lo largo de los ejes coordenados no cerrarían, implicando que al viajar espacios iguales primero en una dirección y luego en otra, no llegaríamos al mismo punto.

Si nos fijamos en los vectores de la base en $T_pM$ y cómo varían al movernos sobre la variedad, observamos que $\nabla_0\partial_0=\Gamma_{0 0}^i\partial_i$. Visualmente, una partícula con velocidad temporal (en reposo en el espacio) se va a acelerar por la curvatura de la variedad hacia donde aumente el campo gravitatorio. Lo mismo podemos deducir si calculamos las derivadas de la base de $T_pM^*$.

Para introducir el concepto de observador necesitamos dotar de una métrica a nuestra variedad. Entonces diríamos que un observador es una curva en el espaciotiempo cuyo vector tangente apunta hacia el futuro, ie $dt(V)>0$, y que porta una elección de base de cada $T_pM$ continua (y ortonormal).

Ahora podemos reformular las leyes de Newton en términos geométricos. Nótese que no necesitamos dotar de una métrica a este espacio, la única estructura adicional ha sido una conexión. Si lees algo más sobre el tema, también puede partirse de un espacio métrico y desarrollar la misma teoría. En este marco, las leyes de Newton quedarían:

1ª Ley: la línea del mundo de una partícula sobre la que no actúan fuerzas (la gravedad no es una fuerza) es una geodésica dirigida hacia el futuro, es decir, $\nabla_V V=0$ con $dt(V)>0$.

2ª Ley: la desviación que sufren las líneas de mundo de las partículas es proporcional a la fuerza, es decir, $\nabla_V V=F/m$ con $dt(F)=0$. Las fuerzas, por tanto, te aceleran en las direcciones espaciales pero no en la temporal.

No hemos definido lo que es un sistema inercial en nuestro espacio-tiempo, ni falta que hace. Simplemente tenemos una variedad topológica dotada de una conexión (que conocemos explícitamente en unas coordenadas determinadas).

Tomemos ahora coordenadas de tal modo que $x^0=t$, igual que antes. Nadie nos lo impide y va a simplificar todo, pues ahora los elementos $\Gamma^0_{a b}$ de la conexión son todos cero, con $a,b=0, 1, 2, 3$. De este modo la 2ª Ley en coordenadas nos dice que la coordenada $x^0$ es proporcional al parámetro que define la curva, y con un cambio adecuado de unidades podemos parametrizar con el tiempo absoluto $t$. 

Si escribimos la 2ª Ley de Newton en coordenadas espaciales vamos a obtener lo siguiente:

$\ddot x^{\alpha}+\Gamma^{\alpha}_{b c}\dot x^c\dot x^d+\Gamma^{\alpha}_{0 0}+2\Gamma^{\alpha}_{0 b}\dot x^b=F^{\alpha}/m$

Donde he separado los términos espaciales de los temporales para que se entienda mejor. El término $\Gamma^{\alpha}_{0 0}$ es el único que aparece en presencia de gravedad (con una buena elección de coordenadas). En ausencia de gravedad, podríamos escoger coordenadas tales que todas las $\Gamma$'s se anulasen (espaciotiempo plano). El resto de términos de la conexión no son gravitatorios, sino debidos a las coordenadas. Son las correciones de Coriolis, Centrípeta... fruto de elegir sistemas rotantes (que son coordenadas fijas en el espaciotiempo). Si escogemos coordenadas cartesianas, en un espacio sin gravedad, tendríamos 

$\ddot x^b=F^b/m$



4. Variedad métrica

Como complemento, vamos a intentar dotar a nuestra variedad de una métrica, de modo que de ella se desprenda la conexión del apartado anterior de forma natural. Sea $(U,x)$ la carta con la que hemos trabajado anteriormente. En estas coordenadas defino la métrica 

$g_{i j}:=diag( -U, 2, 2, 2)_{i j}$

Puedes probar como ejercicio que de esta métrica puede derivarse la conexión de Levi-Civita (determinada unívocamente) y que coincide con la conexión definida en la sección anterior. De este modo dotando a la variedad de este campo métrico, obtenemos todos los resultados de antes.


5. Ejemplos


En primer lugar vamos a estudiar una partícula libre en ausencia de gravedad. Por simplicidad tomemos sólo dos componentes espaciales. Escogiendo coordenadas cartesianas y condiciones iniciales tales que $(t(0)=0,x(0)=x_0,y(0)=y_0)$ y $(\dot t(0)=1,\dot x(0)=a,\dot y(0)=b)$ tendremos, por el primer axioma de Newton (en coordenadas) que $x=at+x_0$ y $y=bt+y_0$. Nada del otro mundo. La variedad es plana, pero escogiendo otras coordenadas (como polares), en la conexión aparecen términos no nulos pero que son un mero artificio. En este caso, $\Gamma^{\phi}_{r \phi}=1/r$ y $\Gamma^r_{\phi \phi}=-r$ de modo que obtendríamos $\ddot\phi+1/r\dot\phi\dot r=0$ y $\ddot r-r\dot\phi^2=0$. No es más que una línea recta en el espacio pero descrita en polares.


La curva para una partícula libre, ahora con gravedad, vendrá dada por la primera ley de Newton. Supongamos una curva $\gamma$ en una carta $(U, x)$, que es aquella en la que la conexión tomaba esa forma tan sencilla, que parte de $(0,H,0,0)$ con vector tangente $(1,0,0,0)$. Evidentemente no podemos anular la conexión escogiendo unas "buenas coordenadas", pues la variedad es curva, ie, $Riem \neq 0$. Dicha curvatura (tensor de Riemann) viene codificada por la densidad de materia del universo. El único elemento no nulo de la conexión es $\Gamma^1_{0 0}=-g$ con $g$ constante a lo largo de la curva. La primera Ley de Newton nos dice que $\nabla_V V=0$, es decir, que la partícula se va a mover en "línea recta" por la variedad. Si resolvemos las ecuaciones (es trivial y lo propongo como ejercicio) en estas coordenadas, obtenemos las del tiro parabólico, es decir, $\gamma_x=(t, H-1/2g t^2, 0, 0)$. Por tanto, en esta geometría, ¡la "línea recta" corresponde a una parábola!

Podemos pasar a unas coordenadas $(y^0, y^1, y^2, y^3)=(y\circ x^{-1})(x^0, x^1, x^2, x^3)=(t, x^1-H+1/2g t^2, x^2, x^3)$, donde la métrica toma la forma $g_{0 0}=-U-2g^2t^2$, $g_{1 0}=g_{0 1}=4gt$, $g_{1 1}=g_{2 2}=g_{3 3}=2$ y el resto nulos. Si calculas los elementos de la conexión, te vas a llevar una sorpresa: todos son cero (en todo punto de la variedad). Esto ocurre porque te la he colado un poquito. Si $g$ fuese constante la variedad sería plana, y esto no es así por la ecuación de Poisson. Si admitimos que $g=g(x^1)$ aún podríamos eliminar la conexión, pero sólo en un punto (o en un conjunto de puntos) de la variedad. Es lo que se denominan coordenadas localmente inerciales.

Vemos por tanto que la conexión es algo ligado al observador (algo así como la sensación de peso) y la curvatura es algo intrínseco a la variedad (que codifica la materia). Dos observadores en un mismo espaciotiempo curvo pueden tener sensaciones de peso muy distintas, como acabamos de comprobar. El observador en caída libre no siente la gravedad (su conexión es nula, coordenadas localmente inerciales) mientras que el observador "en reposo" nota una conexión no nula.

De igual modo, dos observadores en un espaciotiempo plano pueden tener sensaciones muy distintas. Uno inercial no siente la gravedad (la conexión es nula), pero uno acelerado sí (por puro efecto de las coordenadas).
 

6. Conclusiones


La idea básica que subyace es la siguiente: gracias al principio de equivalencia podemos codificar la gravedad como curvatura del espaciotiempo, de modo que dejemos de considerar los efectos de la gravedad como una fuerza y los atribuyamos a una consecuencia de un espaciotiempo curvado. Las geodésicas en esta nueva geometría son las curvas que describen las partículas libres, que no son trayectorias "uniformes y rectas" en el sentido habitual de la expresión.
 

En primer lugar hemos definido la conexión de manera constructiva en unas cómodas coordenadas, para después axiomatizar la teoría a partir de la cual podemos hacer física. Con pocos axiomas sobre la conexión y el tiempo absoluto hemos construido el espaciotiempo newtoniano incorporando la gravedad como curvatura del mismo. Del mismo modo podemos axiomatizar la teoría postulando una métrica como la de la sección 4 de la que se puede deducir la conexión.

7. Bibliografía


Newton - Cartan theory on Wikipedia

Newtonian spacetime (Frederic Schuller) of Winter Scohol on gravity and light

The Geometry of Physics (Theodore Frankel)

Introducción a la Geometría Diferencial - Univ. de Granada (M.S.C & J.L.F.D)

Introducción a la Relatividad General - Bert Janssen