Language

viernes, 6 de septiembre de 2019

Energía gravitatoria

En Mecánica Clásica entendemos la energía como aquel ente capaz de realizar un trabajo. Si por ejemplo consideramos un campo de fuerzas conservativas, es decir que posean un potencial, podemos definir una energía potencial asociada a dicho campo, que se interpretaría como aquella cantidad de energía necesaria para desplazar una partícula hasta el infinito (o hasta tierra, es decir, donde el campo se anule).

Potencial gravitatorio creado por una distribución esférica de masa $M$.

Consideremos la gravitación Newtoniana, donde el campo de fuerzas viene definido por la Ley de la Gravitación Universal:

$$ \vec F = - G \frac{m_1 m_2}{r^3} \vec r$$

siendo $G$ la constante de la gravitación universal, $m_1$ y $m_2$ las masas de las partículas en interacción y $\vec r$ el vector que las une. El campo es conservativo, pues proviene del potencial gravitatorio 

$$ V = - G \frac{m_1 m_2}{r} $$

ya que $\vec F = -\nabla V$. La energía potencial se define como el potencial por unidad de masa. Si $M=m_1$ es la masa de la partícula que crea el campo y $m_2$ la que lo "siente", la energía potencial será 

$$E = - G \frac{M}{r}$$

La interpretación física es que el valor numérico de $E$ en $r=r_0$ es la energía necesaria para llevar la partícula de $r=r_0$ hasta el infinito, donde no hay influencia gravitatoria. En este sentido, hemos encontrado una expresión local para la energía gravitatoria. Sin embargo, vamos a ver cómo todo se vuelve más complicado cuando nos adentramos en las fauces de la Relatividad General.



Principio de Equivalencia


Recordemos que, según la Segunda Ley de Newton, la fuerza y la aceleración que experimenta un cuerpo de masa $m$ están relacionadas por 

$$\vec F= m \vec a$$

Por otro lado, hemos visto que la fuerza gravitatoria también depende de la masa $m$ de los cuerpos en interacción. La pregunta es, ¿son estas dos masas la misma? Esto es lo que se conoce como Principio de Equivalencia de Galileo.

En principio no tendría por qué. Fijémonos por ejemplo en la Ley de Coulomb, donde la fuerza electrostática depende de la carga $q$ de la partícula, no de la masa. De hecho, dos partículas de igual masa pero distinta carga acelerarán de forma diferente en presencia de un campo eléctrico. Esto es radicalmente distinto a lo que ocurre con el campo gravitatorio, en el que todos los cuerpos caen con la misma aceleración. ¿Qué tiene de especial la Gravitación?

A lo largo de la Historia ha habido multitud de experimentos para tratar de discernir si en efecto la masa gravitatoria (la de la Ley de la Gravitación Universal) es la misma que la masa inercial (la de la Segunda Ley de Newton). Uno de los más famosos fue el ideado por Lóránd von Eötvös, en el que aprovechó la rotación de la Tierra y la aceleración centrífuga correspondiente. En dicha experiencia y en sucesivas mejoras, se ha logrado probar que ambas masas son iguales con un error menor a $10^{-13}$ (en 1999). Actualmente la sonda espacial MicroSCOPE ha logrado llegar a cotas de $10^{-15}$, y se espera que el satélite STEP alcance hasta $10^{-18}$. Así pues, el Principio de Equivalencia de Galileo tiene una gran base experimental. Ahora bien, ¿qué conclusiones podemos obtener de él?

El Principio de Equivalencia de Galileo parece apuntar a que, de algún modo, un sistema de referencia acelerado es equivalente a uno inercial en presencia de un campo gravitatorio. Dado que el campo gravitatorio no es uniforme, esta equivalencia es sólo local. En este sentido, somos capaces de anular el efecto del campo gravitatorio dejándonos caer en él.

El ejemplo típico, atribuido a Einstein, es el del ascensor. Si consideramos un ascensor que asciende con velocidad uniforme y dejamos caer un objeto, éste impactará contra el suelo del ascensor por efecto de la gravedad. Si repetimos el experimento en el espacio (sin gravedad) pero con un ascensor que se mueva de forma acelerada, el resultado va a ser el mismo. Análogamente, la Física en un ascensor inercial en ausencia de gravedad es la misma (localmente) a la que experimentaríamos en un ascensor en caída libre en presencia de un campo gravitatorio. Si en esta situación soltásemos un objeto, éste caería con nosotros, y lo percibiríamos "suspendido" ante nuestros ojos, como un sistema inercial en Relatividad Especial.


Einstein elevó el Principio de Equivalencia a la categoría de postulado para su Teoría de la Relatividad General. Dicho postulado reza:

Todas las leyes de la Física (salvo la gravitación) son las mismas, a escalas suficientemente locales, en un sistema en caída libre en presencia de un campo gravitatorio o en un sistema inercial en ausencia de gravedad.

Una versión alternativa es:

Todas las leyes de la Física (salvo la gravedad) son iguales, localmente, en un sistema inercial en presencia de un campo gravitatorio y en un sistema de referencia acelerado en ausencia de gravedad.

La principal consecuencia de este Postulado es que la gravedad ya no es una fuerza, si no que se trata de un efecto debido a la Geometría del espacio y del tiempo. Y una consecuencia secundaria es la imposibilidad de definir el concepto de energía local gravitatoria en Relatividad General. Veamos por qué.


Energía local gravitatoria


Recordemos que el Principio de Equivalencia nos lleva a abandonar toda esperanza de poder "medir el campo gravitatorio", al igual que Dante al descender al Inferno:

" Lasciate ogni speranza, voi ch'entrate "

Inferno, La Divina Commedia, Dante Alighieri

Esto es debido a que el valor del campo (la métrica) toma valores diferentes en sistemas de referencia distintos. Por ejemplo, un observador en caída libre (coordenadas gaussinas), observa localmente la métrica de Minkowski, es decir, no siente la gravedad. En el límite newtoniano, la energía asociada al campo viene dada por el laplaciano del potencial gravitatorio, de modo que en Relatividad General esperaríamos que ésta dependiese de la métrica $g$ y sus primeras derivadas. Pero por el Principio de Equivalencia, la energía tomaría valores distintos en diferentes sistemas coordenados. Este es el motivo por el cual no se puede definir un tensor local de energía gravitatoria.

Sin embargo, sí que es posible construir un pseudo-tensor local, como por ejemplo el de Landau-Lifshitz. Este objeto no es tensorial, pues se anula en unos sistemas y no en otros, por lo que capta la esencia fundamental del Principio de Equivalencia. Además, a partir de él se pueden construir unas cantidades (masa ADM o momento ADM, en honor a Arnowitt-Deser-Misner, sus descubridores) conservados cuya interpretación es una medida global de la energía gravitatoria. La base matemática para introducir las formas de Landau-Lifshitz es bastante complicada, por lo que definiremos la masa ADM desde otra vía.

Desde los años 60 del siglo pasado se sabe que la formulación hamiltoniana de la Relatividad General (GR) es equivalente a la planteada por Albert Einstein en su teoría. A grandes rasgos, el Hamiltoniano es suma de dos términos: la ligadura hamiltoniana y la ligadura vectorial. Este formalismo canónico se sustenta en una descomposición 3+1 de la GR. Sin embargo, para normalizar el valor de la acción en GR es necesario añadir ciertos términos de frontera al hamiltoniano. Pues bien, precisamente uno de esos términos es la energía ADM:

$$E = \frac{1}{2}\int n^k(\partial_i h_{ik}-\partial_k h_{jj}) dS$$

donde la integral se realiza en la esfera del infinito, cuyo vector normal es $n$ y $h$ denota la métrica asintóticamente plana. Esta energía ADM obtenida desde el formalismo canónico es la misma que se encuentra a través del pseudo-tensor de Landau-Lifshitz.

El ejemplo clásico no trivial es la energía ADM para la métrica de Schwarzschild en coordenadas isotrópicas. Un sencillo cálculo nos permite comprobar que dicha energía es igual a la masa fuente del campo gravitatorio. De esta forma podemos interpretar la energía ADM como una medida global de la energía de campo gravitatorio en Relatividad General. Si añadimos dicha energía como término de frontera al hamiltoniano, el valor numérico de éste resulta ser la energía ADM, recuperando así la noción de que el hamiltoniano es la energía del sistema.


Conclusiones

 

Según hemos visto, el Principio de Equivalencia nos obliga a abandonar la idea de poder medir el campo gravitatorio, y con ello a ser capaces de definir una medida local de energía gravitatoria. Sin embargo, sí que se puede definir una medida global de energía, asociada a la totalidad del campo. Dicha energía (ADM) se puede obtener desde una vía puramente geométrica (a partir de las formas de Landau-Lifshitz) o desde un planteamiento hamiltoniano de la Relatividad General.


Referencias

 

- R. Arnowitt, S. Deser, C. W. Misner, "Gravitation: An introduction to current research. The dynamics of General Relativity". John Wiley, Sons Inc., New York, London (1962).

- R. M. Wald, "General Relativity", The University of Chicago Press, Chicago and London, (1984).

- Y. Choquet-Bruhat, "General Relativity and the Einstein Equations". Oxford Mathematical Monographs, (2009).
 

lunes, 30 de julio de 2018

Sobre la imposibilidad de la cuadratura del círculo

Muchos han sido los intentos de cuadrar un círculo con las "reglas clásicas de la antigüedad", es decir, construir con "regla y compás" un cuadrado de área igual a un círculo dado. Desde hace 150 años se sabe que es una tarea completamente imposible, al igual que muchos otros, como la trisección del ángulo o la duplicación del cubo (los tres problemas délicos). ¿Qué relación tiene la cuadratura del círculo con la trascendencia de $\pi$? ¡Comencemos!


Primero vamos a probar que el número $\pi$ es irracional y trascendente (sobre $\mathbb{Q}$, que lo omitiré en adelante). Este resultado es imprescindible para lo que después desarrollaremos.

Proposición: Todo número trascendente es irracional.

Demostración: supongamos que un número trascendente $p$ es racional. Entonces $p=\displaystyle\frac{a}{b}$ para ciertos enteros $a$ y $b$. Construímos el polinomio $p(x)=bx-a$, y como tiene por raíz a $p$, entonces es algebraico. Habiendo llegado a una contradicción, es claro que todo número trascendente es irracional. Por ello nos limitaremos a demostrar la trascendencia de $\pi$.

Una vez demostrada la trascendencia de $\pi$, veremos qué tiene que ver con la imposibilidad de cuadrar un círculo con regla y compás. Finalmente estudiaremos unas cuantas consecuencias y teoremas más.


1. Teorema de Lindemann-Weierstrass


Hermite (sí, el de los polinomios) fue el primero en probar que cualquier potencia racional de $e$ es trascendente, demostrando así que el propio $e$ es trascendente. Nueve años después, Lindemann lo generalizó diciendo que $e$ elevado a cualquier número algebraico es trascendente. Sin conocer la prueba de Lindemann, el español José Echegaray llegó al mismo resultado en 1886. El artículo lo puedes encontrar aquí.

Nosotros vamos a demostrar el caso más general del teorema, para luego particularizar al resultado que nos concierne. Bueno, vamos a ello:

Lema (A): dados $c(i) \ \neq 0 \ \forall i\in\mathbb{Z}\cap [1,r]$ sean ${y(k)_1,..., y(k)_{m(k)}}$   las raíces de un polinomio con coeficientes $T_k(x)=v(k) x^{m(k)}+...+u(k)$ $\forall k\in[1,r]$ enteros y con $u(k), v(k)\neq 0$. Entonces si $y(k)_i\neq y(u)_v$ con $(k, i)\neq (u, v)$ se tiene que $\sum_{i=1}^r{c(i)(e^{y(i)_i}+...+e^{y(i)_{m(i)}})}\neq 0$.

Demostración: en primer lugar la expresión final del enunciado puede ser escrita como 

$S=\sum_{k=1}^n\beta_k e^{\alpha_k}\neq 0$

donde $n_0=0$, $n=n_r$, $n_i=\sum_{k=1}^i m(k)$ con $i=1, …, r$, $\alpha_{n_i+j}=y(i+1)_j$ con $0\leq i\leq r$, $1\leq j\leq m(i)$ y $\beta_{n_i+j}=c(i+1)$. Supongamos que $S=0$ para llegar a una contradicción. Sea ahora 

$f_i(x):=\frac{l^{np}(x-\alpha_1)^p...(x-\alpha_n)^p}{(x-\alpha_i)}$

con $l$ entero y construyamos $I_i(s)=\int_0^s e^{s-x}f_i(x) dx=e^s\sum_{j=0}^{np-1}f_i^{(j)}(0)-\sum_{j=0}^{np-1}f_i^{(j)}(s)$ integrando por partes. En caso de que $s$ sea complejo integramos en un contorno cerrado que pase por la recta real y usamos el Teorema de Cauchy. Ahora evaluemos la suma

$J_i=\sum_{k=1}^n \beta_k I_i(\alpha_k)=\sum_{j=0}^{np-1}f_i^{(j)}(0)\sum_{k=1}^n\beta_ke^{\alpha_k}-\sum_{k=1}^n\sum_{j=0}^{np-1}\beta_k f_i^{(j)}(\alpha_k)$ por lo que $J_i=-\sum_{k=1}^n\sum_{j=0}^{np-1}\beta_kf_i^{(j)}(\alpha_k)$ donde en la última igualdad hemos usado la hipótesis del absurdo.

Si $j\geq p$ entonces $f_i^{(j)}(\alpha_k)$ es un entero algebraico múltiplo de $p!$. Si $j<p-1$ es claro que $f_i^{(j)}(\alpha_k)=0$ y si $j=p-1$ y $k=i$ entonces $f_i^{(j)}(\alpha_k)=l^{np}(p-1)!\prod_{i\neq k}(\alpha_i-\alpha_k)$. Este entero no es divisible por $p$ haciendo uso del Pequeño Teorema de Fermat, como puedes comprobar en la bibligrafía. Por tanto $J_i$ es divisible por $(p-1)!$. Ahora, reescribiendo $J_i$ como sigue

$J_i=-\sum_{j=0}^{np-1}\sum_{t=0}^{r-1}c(t+1)(f_i^{(j)}(\alpha_{n_t+1})++f_i^{(j)}(\alpha_{n_{t+1}}))$

Usando el Teorema Fundamental de polinomios simétricos, se puede probar que $J_i$ es un polinomio $G(\alpha_i)$, por lo que $|J_1...J_n|$ es un entero divisible por $(p-1)!^n$. La contradicción llega del hecho de que $|I(a_k)|\leq |a_k| e^{|a_k|}F_i{|a_k|}$ donde $F_i(x)$ es el polinomio cuyos coeficientes son los de $f_i(x)$ en valor absoluto. Pero entonces $J_i(|a_k|)\leq\sum_{k=1}^n|a_k\beta_k|e^{|a_k|}F_i(|a_k|)$ por lo que de alguna forma $|J_1...J_n|$ está acotado superiormente por cierto $N^p$, lo cual contradice la desigualdad anterior ya que $p$ es arbitrario y la cota inferior supera a la superior para $p$ suficientemente grande.


Otro Lema (B): si $b(1),...,b(n)$ son naturales y $y(1),...,y(n)$ son algebraicos y diferentes, entonces $b(1)e^{y(1)}+...+b(n)e^{y(n)}\neq 0$.

Prueba: construyamos un polinomio con coeficientes enteros cuyas raíces sean $y(1),...,y(n),y(n+1),...y(N)$ y definamos $b(n+1)=…=b(N)=0$. Si suponemos que el enunciado es falso, es claro que 

$\prod_{\sigma\in S_N}(b(1)e^{y(\sigma(1)}+...+b(N)e^{y(\sigma(N)})=0$

donde estamos considerando todas las permutaciones. Pero si expandimos ese productorio nos aparecen términos en exponenciales simétricas y al agrupar nos vamos a encontrar con una suma semejante a la del enunciado del lema A. Puede probarse que se satisfacen dichas hipótesis, lo cual es contradictorio y prueba el lema B.

Teorema de Lindemann-Weierstrass: si $a_1,...,a_n$ son números algebraicos no nulos y $\beta_1,...,\beta_n$ son números algebraicos distintos, entonces $a_1e^{\beta_1}+...+a_ne^{\beta_n}\neq 0$.

Demostración: se prueba de forma muy parecida al Lema B.

La prueba que dio Lindemann originalmente de que $\pi$ es trascendente os la dejo en la bibliografía. Es menos general pero es suficiente para lo que necesitamos en esta entrada. De hecho simplemente con los lemas A y B podríamos probar la trascendencia e irracionalidad de $\pi$ y de $e$.

La trascendencia de $e$ ya fue probada en una entrada anterior, que puedes leer aquí. De hecho es trivial sin más que ver el enunciado del lema B, ya que si $e$ fuese algebraico la igualdad sería cero para ciertos coeficientes. 

Ahora bien, si $\pi$ fuera algebraico, la ecuación $e^{i\pi}+1=0$ contradeciría el Lema B, por consiguiente acabamos de demostrar que el número $\pi$ es trascendental. Ahora vamos a estudiar la relación entre la trascendencia y el hecho de que el número $\pi$ no sea construible.


2. Imposibilidad de cuadrar un círculo

En primer lugar os remito a la bibliografía para entender bien qué queremos decir con que un punto sea o no construible. Para el tema que nos concierne, es suficiente que entendáis que si $a$ y $b$ son dos puntos construibles, entonces su cociente es construible. Esto será clave para demostrar que es imposible cuadrar el círculo. Vayamos ahora a por un teorema, que tengo algo de mono.

Un número es construible sí y sólo sí es algebraico y su polinomio mínimo irreducible sobre $\mathbb{Q}$ es potencia de 2.

La demostración la puedes encontrar en el libro "What is mathematics?" que os dejo en la bibliografía, entre las páginas 127 y 140. La idea es simple y voy a tratar de ilustrarla.

Primero define un "number field" como un conjunto de números cerrado bajo operaciones racionales (suma, resta, producto y división). Llama $F_0$ al rational field y $F_1$ al irracional, que lo obtiene a partir de $F_=$. Obviamente ambos son construibles de forma muy sencillita (os vuelvo a remitir al artículo de Gaussianos). Poco a poco construye nuevos $F's$ a partir de los anteriores y observa qué números son construibles. Por ejemplo, los números de $F_1$ vienen de ecuaciones de segundo grado, los de $F_3$ de cuarto grado y así sucesivamente. Por tanto los números algebraicos son los únicos construibles. Además 


Supongamos que es posible cuadrar el círculo con regla y compás. Esto equivale a decir que $R$ y $L$ son construibles, siendo $R$ el radio del círculo y $L$ el lado del cuadrado. Como $\pi R^2=L^2$ entonces $\sqrt{\pi}=L/R$ es construible por serlo $R$ y $L$. Pero esto es falso por ser $\pi$ trascendental. Con lo cual queda probada la imposibilidad de cuadrar el círculo.


3. Otros problemas délicos 


Además de la imposibilidad de cuadrar el círculo, existen otros dos problemas clásicos que se han demostrado imposibles.

Duplicación del cubo: no es posible porque el polinomio mínimo irreducible de $\sqrt[3]{2}$ es $x^3-2=0$ y 3 no es múltilplo de 2.

Trisección del ángulo: algunos ángulos sí se pueden trisecar, pero no es posible en general. En el artículo de Gaussianos de la bibliografía lo tiene hecho con el ángulo de 60º.



4. Curiosidades


Hay otro teorema, el de Gelfond-Schneider, que garantiza que $a^b$ es trascendente si $a$ y $b$ son algebraicos y $b$ es irracional. Junto con el Teorema de Lindemann sería consecuencia de la Conjetura de Schanuel, que no es más que eso, una conjetura.

De hecho, el teorema de Gelfond es el resultado del séptimo problema de Hilbert, una lista de 23 problemas matemáticos enunciada por Hilbert a principios del siglo pasado, de los cuales se han resuelto 9. 



5. Conclusiones

La idea básica de esta entrada era probar que la cuadratura del círculo es imposible. Para ello hemos definido lo que es una construcción clásica con regla y compás, y hemos demostrado que sólo podemos construir números algebraicos que sean raíz de un polinomio irreducible de grado $2^n$ con $n$ natural. Habiendo probado que $\pi$ es trascendente gracias al Teorema de Lindemann-Weierstrass, hemos conseguido nuestro objetivo.





Bibliografía


- https://es.wikipedia.org/wiki/N%C3%BAmero_trascendente

- https://en.wikipedia.org/wiki/Lindemann–Weierstrass_theorem (Teorema de Lindemann)

http://gaussianos.com/echegaray-y-la-trascendencia-de-pi

- http://gaussianos.com/como-demostrar-que-%CF%80-pi-es-trascendente/

- http://gaussianos.com/construcciones-con-regla-y-compas-i-introduccion-y-primeras-construcciones/ (Construcciones clásicas con regla y compás)

- http://gaussianos.com/construcciones-con-regla-y-compas-ii-los-problemas-delicos/

- http://mimosa.pntic.mec.es/jgomez53/matema/conocer/numpi_lindemann.htm

- http://gaussianos.com/quien-dijo-que-la-cuadratura-del-circulo-era-imposible/

- http://www.cimat.mx/~ibrahim/LOTra_JIVG.pdf

- https://es.wikipedia.org/wiki/Problemas_de_Hilbert (Problemas de Hilbert)

- https://es.wikipedia.org/wiki/Teorema_de_Gelfond-Schneider

- What is mathematics? Courant & Robbins (los números algebraicos son los únicos construibles, pág 127-140)

- http://rodin.uca.es/xmlui/bitstream/handle/10498/7163/33925574.pdf (José Echegaray)

http://sixthform.info/maths/files/pitrans.pdf (Más sobre la trascendencia de $\pi$)



domingo, 8 de julio de 2018

Las leyes de Newton y la curvatura del espaciotiempo

Todos hemos oído hablar de las leyes de Newton desde pequeños. La primera de ellas nos dice cómo se mueve una partícula sobre la que no actúa ninguna fuerza, la segunda habla del efecto que produce la fuerza sobre la trayectoria, y la tercera es la ley de acción y reacción. En esta entrada nos vamos a centrar sólo en las dos primeras, que rezan así:

1ª Ley: un cuerpo sobre el que no actúa ninguna fuerza se mueve uniformemente y en línea recta.

2ª Ley: la desviación que sufre un cuerpo de moverse "libremente", es decir, uniformemente y en línea recta, es proporcional a la fuerza que actúa sobre él.




En un sentido clásico, la primera ley nos define lo que es un sistema inercial, concepto clave, pues sólo en estos sistemas pueden aplicarse las otras dos leyes. Pero ya vemos aquí cierto argumento circular: ¿Cómo sabemos que sobre un cuerpo no actúan fuerzas?

De hecho, la fuerza de la gravedad es de alcance infinito, lo que lleva a pensar que la primera ley de Newton carece de significado práctico. ¿Cómo podemos lidiar con la 1ª Ley y con el hecho de que exista la gravedad? Muy sencillo, exigiendo que la gravedad no sea una fuerza sino algo distinto.

Desde un punto de vista geométrico, la 1ª Ley nos define lo que es una línea recta, es decir, nos define la curvatura de nuestro espacio (tiempo), y la 2ª nos informa de la desviación de las trayectorias como consecuencia de las fuerzas.

Para entender perfectamente la Física de esta entrada necesitamos cierto background matemático que pasaré a resumir a continuación.

1. Nociones básicas de geometría.


Sea $(M,\theta,A)$ una variedad topológica diferenciable de dimensión $n$. Esto no es más que dotar a un conjunto $M$ de una topología $\theta$, osea, definir sobre ese conjunto lo que es un abierto $U$ y exigir que sea localmente homeomorfo a $\mathbb{R}^n$, es decir, que para cada abierto $U\subset M$ exista un homeomorfismo $x: U\longrightarrow \mathbb{R}^n$ biyectivo, continuo, invertible y con inversa continua. A la función $x$ se la llama "función coordenada" o "coordenadas".

Esto no es nada del otro mundo. Pensad que cada punto $p$ de una esfera puede ser representado por dos coordenadas, $\theta$ y $\phi$, que representan a la esfera como un abierto de $\mathbb{R}^2$ de forma local.

Sobre cada $p\in M$ puedo construir un espacio vectorial llamado espacio tangente de la siguiente forma:

$T_pM := span\{\partial/\partial x^1, …, \partial/\partial x^n\}$



Cada $X_p\in T_pM$ es una aplicación $X_p : C^{\infty}(M)\longrightarrow \mathbb{R}$ que de cada función sobre la variedad me dice su "derivada direccional" $X_p(f):= X^i\partial_i f$, donde entendemos que $\partial_i f := \partial/\partial x^i (f\circ x^{-1})$.

Ahora puedo construir el fibrado tangente, $TM$, como la unión disjunta de todos los espacios tangentes a cada punto de la variedad. Ciertamente puedo proyectar la topología de $M$ sobre $TM$ haciendo que $TM$ sea una variedad diferenciable. Con estas estructuras puedo definir un campo vectorial $X$ como una aplicación $X:M\longrightarrow TM$ tal que $X\circ \pi=Id$ con $\pi$ la proyección canónica de $TM$ sobre $M$. El conjunto de campos vectoriales sobre el anillo $C^{\infty}(M)$, $\Gamma(TM)$, tiene estructura de $C^{\infty}(M)$-module, pues $C^{\infty}(M)$ es un anillo, no un cuerpo. Esto va a implicar que no tiene por qué existir una base de $\Gamma(TM)$ global (pero sí local, obviamente). 

Ahora que sé derivar funciones sobre variedades, $\nabla_X f := X(f)$, me interesa saber derivar tensores en general. Para ello construyo el operador $\nabla_X$ con una serie de propiedades (imponiendo que el resultado sea tensorial) y me doy cuenta que tengo bastante libertad a la hora de escoger su funcionamiento. En particular puedo escoger arbitrariamente lo que se denomina la conexión $\Gamma^i_{j k}:=dx^i(\nabla_k \partial_j)$ para así "definir" cómo actúan sobre campos vectoriales. En cierto sentido las $\Gamma$'s portan información sobre lo que entendemos por "paralelismo" sobre la variedad.

Lo realmente bonito es el hecho de que la conexión no es un tensor, es decir, las funciones $\Gamma^i_{j k}$, no transforman como un tensor, lo cual va a ser muy relevante posteriormente. Añado en este punto que la parte antisimétrica de la conexión sí que transforma como un tensor: la torsión.

Debido a que no transforman como tensores, punto a punto puedo escoger un cambio de coordenadas que me anulen la conexión (la parte no tensorial), pero en general no puedo anular la conexión en todo mi espacio, eso dependerá de la curvatura de la misma. Vamos ahora a definir qué es eso de la curvatura.

Sea $\gamma:\mathbb{R}\longrightarrow M$ una curva suave y sea $V$ el campo de vectores tangentes a la curva sobre la curva (en realidad sólo necesito vectores punto a punto). Un vector $X$ es transportado a lo largo de la curva si $\nabla_V X=0$. Esto no es más que ir arrastrando el vector sobre la curva sin modificar sus componentes (transporte paralelo). 

Un vector transportado paralelamente a lo largo de la curva 

Cuando en una curva su vector tangente es transportado paralelamente a lo largo de ella misma, decimos que esa curva es una geodésica (afín). Vamos a calcular en coordenadas la ecuación de una geodésica. Para ello dada la curva $\gamma$ parametrizada por $t\in\mathbb{R}$ definimos su vector tangente en un punto $p=\gamma(t_0)$ como $V(f):=d/dt (f\circ \gamma)(t_0)$, de modo que en coordenadas, $V=\dot{\gamma^i}\partial_i $. Por tanto, la ecuación de la geodésica en componentes es 

$(\nabla_{\dot{\gamma^i}\partial_i}(\dot\gamma^n\partial_n))^m=\ddot\gamma^m+\Gamma^m_{a b}\dot{\gamma}^a\dot\gamma^b=0$

Las curvas que siguen las partículas libres ahora dependen de la conexión. Para una variedad plana en cartesianas, las $\Gamma$'s son nulas, y recuperamos el movimiento rectilíneo uniforme, pero en variedades curvas con conexiones arbitrarias la cosa ya no es tan sencilla.

Si has estudiado geometría diferencial sobre superficies en $\mathbb{R}^3$ habrás estudiado las geodésicas métricas como las que minimizan la distancia sobre la superficie. Es sencillo probar que usando la conexión usual de Levi-Civita, esa definición es equivalente a la nuestra. En ese caso, las geodésicas son las curvas tales que su vector de curvatura es normal a la superficie a lo largo de toda la curva, osea que su curvatura geodésica es nula. Habrás estudiado también la derivada "intrínseca" a lo largo de una curva como la derivada usual a la que le restamos la componente normal. Pues es equivalente (Levi-Civita). Nótese que nosotros no hemos dotado aún de una métrica a nuestra variedad y que diferenciamos, en principio, geodésicas métricas (minimizan la distancia) de geodésicas afines (se autotransportan paralelamente).

Definimos ahora el tensor de Riemann como 


$Riem(\omega,Z,X,Y):=\omega(\nabla_X\nabla_Y Z-\nabla_Y\nabla_X Z-\nabla_{[X,Y]} Z)$ 

que se puede entender como la curvatura de la variedad. Podemos escribirlo en coordenadas en función de la conexión y sus derivadas, por lo que en una variedad curva es imposible eliminar la conexión con un simple cambio de coordenadas, ya que $Riem$ es un tensor. Finalmente se define el tensor de Ricci contrayendo el primer y el tercer índice de $Riem$, y el escalar de Ricci contrayendo el tensor de Ricci con la métrica.

Para aclarar un poco las ideas, supongamos dos aviones que se dirigen hacia el polo norte. Uno despega desde Ecuador y otro desde Guinea. A medida que avanzan, los dos aviones tienden a acercarse. Si los pasajeros de ambos aparatos no saben que la Tierra es esférica, postularán que hay una misteriosa fuerza que los atrae. Pero alguien que sepa que la Tierra es redonda, atribuirá dicho acercamiento a un efecto de la curvatura terrestre. Esto es precisamente lo que vamos a hacer con la gravedad, salvando las distancias.


2. La motivación de Laplace


En esta sección vamos a intentar abandonar la idea de la gravedad como una fuerza para intentar entenderla como consecuencia de un espaciotiempo curvado. Esta motivación surge del principio de equivalencia, es decir, de la idea de que todas las partículas se aceleran igual independientemente de su masa. Lo que intentó Laplace fue codificar el campo gravitatorio de tal manera que la 2ª Ley de Newton para la gravedad tomase la forma de una geodésica. Pero eso es imposible, ya que la fuerza de la gravedad sólo depende de las posiciones, no de las velocidades, y en la ecuación de la geodésica intervienen las velocidades.



El problema de fondo es que hasta ahora nuestras curvas dependen de la parametrización. Para librarnos de ella simplemente pensemos en el tiempo como una coordenada más. Simplemente eso. Hasta ahora una curva era de la forma $(x^1(t), x^2(t), x^3(t))$. Ahora es una aplicación hacia $\mathbb{R}^4$ del tipo $(x^0(t)\equiv t, x^1(t), x^2(t), x^3(t))$. Entonces la ecuación de una partícula en un campo gravitatorio, teniendo en cuenta el principio de equivalencia,

$\ddot x^a-f^a(x(t))=0$

es equivalente a la ecuación de la geodésica en una variedad de dimensión 4 dotada de una conexión nula salvo los términos $\Gamma^{\alpha}_{0 0}=-f^{\alpha}(x(t))$ con $\alpha\neq 0$, ya que $\dot{x}^0=1$.



$\ddot{x}^a+\Gamma^a_{b c}\dot{x}^b\dot x^c=0$


Ciertamente existe curvatura, y no es un artificio por una extraña elección de coordenadas. Basta calcularse el tensor de Riemann para comprobarlo. En otras coordenadas donde espacio y tiempo se entremezclen, la conexión tomará formas extrañas, pero tomando $x^0=t$ (atlas estratificado) queda así de sencilla. La curvatura es por tanto temporal y la fuerza de la gravedad ahora no es más que un efecto de la curvatura del espaciotiempo de Newton. De este modo la 1ª Ley funciona y nos define la geometría de nuestro espacio. 



Como curiosidad podemos calcular la componente (0, 0) del tensor de Ricci, y usando la ecuación de Poisson para el campo gravitatorio, vemos que en cartesianas $Ri_{0 0}=-\partial_a f^a =4\pi G \rho$. Esto es una maravilla. ¡La curvatura de la variedad viene codificada por la densidad de materia! Recuerda que estamos en mecánica Newtoniana, no hemos mencionado nada de Relatividad. Sólo estamos codificando la gravedad como geometría del espacio-tiempo para que la 1ª Ley de Newton pueda ser aplicable.





3. Axiomas geométricos del espaciotiempo Newtoniano



Ahora que entendemos que existe una relación entre la gravedad y la geometría del espaciotiempo de Newton vamos a establecer 3 axiomas sobre esta nueva variedad, olvidando por un momento todo lo aprendido en la sección 2.

Partimos de una variedad $(M,\theta,A)$ diferenciable de dimensión 4 dotada de una conexión $\nabla$ sobre la que existe un tiempo absoluto $t:M\longrightarrow \mathbb{R}$ suave. ¿Cómo debe ser el tiempo absoluto para mantener la estructura del espaciotiempo de Newton? Lo más sencillo es colocarse en un punto $p\in M$ de la variedad y vamos a ver cómo cambia el tiempo al avanzar en la dirección $\partial_0\in T_pM$. Si $(dt)_p(\partial_0)=0$, el tiempo no avanzaría en esa dirección, y lo mismo podríamos hacer con el resto de coordenadas. Por eso postulamos lo siguiente:

1. $(dt)_p\neq 0 \ \forall p\in M$ implica que $M$ está "foliada" en subconjuntos $S_{\tau}:=\{p\in M:t(p)=\tau\}$ disjuntos tal que  $M=\cup S_{\tau}$. Esto es consecuencia del Teorema de la Función Implícita. De hecho, con estos requerimientos, los conjuntos $S_{\tau}$ son variedades topológicas de dimensión 3 con cartas $(x^1, x^2, x^3)$ diferenciables. Si $(dt)_p=0$ entonces el tiempo moriría o emergería de ese punto, lo cual, lejos de cualquier interpretación abstracta, no tiene sentido físico en Mecánica Newtoniana.

2. El tiempo fluye uniformemente a lo largo de cualquiera de las 4 direcciones del espaciotiempo, o simbólicamente, $\nabla dt = 0$. Esto es equivalente a decir que la 1-forma $dt$ derivada a lo largo de cualquier dirección da la forma nula, lo que implica que cuando yo quiera ver cómo de rápido fluye el tiempo a lo largo de cualquier dirección, el resultado me va a dar lo mismo sobre cualquier punto $p$ de la variedad. El tiempo sólo avanza hacia el futuro (no en el espacio) y de forma constante. No es posible un viaje en el tiempo hacia el pasado.

3. Necesitamos postular también cómo funciona $\nabla$. Tomando coordenadas cartesianas $(x^0, x^1, x^2, x^3)$ sobre la variedad tendremos, como antes, que $\Gamma_{0 0}^{\alpha}:=-f^{\alpha}(x(t))=\partial_{\alpha} U$, siendo $U$ el potencial gravitatorio. En estas coordenadas (y en cualquier otras) ahora podemos calcular la conexión, la curvatura de Riemann, la torsión, etc. La conexión $\nabla$ no tiene torsión, osea que $[\nabla_{\mu},\nabla_{\nu}]V^{\lambda}=Riem_{\mu \nu\rho}^{\lambda}V^{\rho}$. Si tuviésemos torsión, la conexión no sería simétrica y los paralelogramos a lo largo de los ejes coordenados no cerrarían, implicando que al viajar espacios iguales primero en una dirección y luego en otra, no llegaríamos al mismo punto.

Si nos fijamos en los vectores de la base en $T_pM$ y cómo varían al movernos sobre la variedad, observamos que $\nabla_0\partial_0=\Gamma_{0 0}^i\partial_i$. Visualmente, una partícula con velocidad temporal (en reposo en el espacio) se va a acelerar por la curvatura de la variedad hacia donde aumente el campo gravitatorio. Lo mismo podemos deducir si calculamos las derivadas de la base de $T_pM^*$.

Para introducir el concepto de observador necesitamos dotar de una métrica a nuestra variedad. Entonces diríamos que un observador es una curva en el espaciotiempo cuyo vector tangente apunta hacia el futuro, ie $dt(V)>0$, y que porta una elección de base de cada $T_pM$ continua (y ortonormal).

Ahora podemos reformular las leyes de Newton en términos geométricos. Nótese que no necesitamos dotar de una métrica a este espacio, la única estructura adicional ha sido una conexión. Si lees algo más sobre el tema, también puede partirse de un espacio métrico y desarrollar la misma teoría. En este marco, las leyes de Newton quedarían:

1ª Ley: la línea del mundo de una partícula sobre la que no actúan fuerzas (la gravedad no es una fuerza) es una geodésica dirigida hacia el futuro, es decir, $\nabla_V V=0$ con $dt(V)>0$.

2ª Ley: la desviación que sufren las líneas de mundo de las partículas es proporcional a la fuerza, es decir, $\nabla_V V=F/m$ con $dt(F)=0$. Las fuerzas, por tanto, te aceleran en las direcciones espaciales pero no en la temporal.

No hemos definido lo que es un sistema inercial en nuestro espacio-tiempo, ni falta que hace. Simplemente tenemos una variedad topológica dotada de una conexión (que conocemos explícitamente en unas coordenadas determinadas).

Tomemos ahora coordenadas de tal modo que $x^0=t$, igual que antes. Nadie nos lo impide y va a simplificar todo, pues ahora los elementos $\Gamma^0_{a b}$ de la conexión son todos cero, con $a,b=0, 1, 2, 3$. De este modo la 2ª Ley en coordenadas nos dice que la coordenada $x^0$ es proporcional al parámetro que define la curva, y con un cambio adecuado de unidades podemos parametrizar con el tiempo absoluto $t$. 

Si escribimos la 2ª Ley de Newton en coordenadas espaciales vamos a obtener lo siguiente:

$\ddot x^{\alpha}+\Gamma^{\alpha}_{b c}\dot x^c\dot x^d+\Gamma^{\alpha}_{0 0}+2\Gamma^{\alpha}_{0 b}\dot x^b=F^{\alpha}/m$

Donde he separado los términos espaciales de los temporales para que se entienda mejor. El término $\Gamma^{\alpha}_{0 0}$ es el único que aparece en presencia de gravedad (con una buena elección de coordenadas). En ausencia de gravedad, podríamos escoger coordenadas tales que todas las $\Gamma$'s se anulasen (espaciotiempo plano). El resto de términos de la conexión no son gravitatorios, sino debidos a las coordenadas. Son las correciones de Coriolis, Centrípeta... fruto de elegir sistemas rotantes (que son coordenadas fijas en el espaciotiempo). Si escogemos coordenadas cartesianas, en un espacio sin gravedad, tendríamos 

$\ddot x^b=F^b/m$



4. Variedad métrica

Como complemento, vamos a intentar dotar a nuestra variedad de una métrica, de modo que de ella se desprenda la conexión del apartado anterior de forma natural. Sea $(U,x)$ la carta con la que hemos trabajado anteriormente. En estas coordenadas defino la métrica 

$g_{i j}:=diag( -U, 2, 2, 2)_{i j}$

Puedes probar como ejercicio que de esta métrica puede derivarse la conexión de Levi-Civita (determinada unívocamente) y que coincide con la conexión definida en la sección anterior. De este modo dotando a la variedad de este campo métrico, obtenemos todos los resultados de antes.


5. Ejemplos


En primer lugar vamos a estudiar una partícula libre en ausencia de gravedad. Por simplicidad tomemos sólo dos componentes espaciales. Escogiendo coordenadas cartesianas y condiciones iniciales tales que $(t(0)=0,x(0)=x_0,y(0)=y_0)$ y $(\dot t(0)=1,\dot x(0)=a,\dot y(0)=b)$ tendremos, por el primer axioma de Newton (en coordenadas) que $x=at+x_0$ y $y=bt+y_0$. Nada del otro mundo. La variedad es plana, pero escogiendo otras coordenadas (como polares), en la conexión aparecen términos no nulos pero que son un mero artificio. En este caso, $\Gamma^{\phi}_{r \phi}=1/r$ y $\Gamma^r_{\phi \phi}=-r$ de modo que obtendríamos $\ddot\phi+1/r\dot\phi\dot r=0$ y $\ddot r-r\dot\phi^2=0$. No es más que una línea recta en el espacio pero descrita en polares.


La curva para una partícula libre, ahora con gravedad, vendrá dada por la primera ley de Newton. Supongamos una curva $\gamma$ en una carta $(U, x)$, que es aquella en la que la conexión tomaba esa forma tan sencilla, que parte de $(0,H,0,0)$ con vector tangente $(1,0,0,0)$. Evidentemente no podemos anular la conexión escogiendo unas "buenas coordenadas", pues la variedad es curva, ie, $Riem \neq 0$. Dicha curvatura (tensor de Riemann) viene codificada por la densidad de materia del universo. El único elemento no nulo de la conexión es $\Gamma^1_{0 0}=-g$ con $g$ constante a lo largo de la curva. La primera Ley de Newton nos dice que $\nabla_V V=0$, es decir, que la partícula se va a mover en "línea recta" por la variedad. Si resolvemos las ecuaciones (es trivial y lo propongo como ejercicio) en estas coordenadas, obtenemos las del tiro parabólico, es decir, $\gamma_x=(t, H-1/2g t^2, 0, 0)$. Por tanto, en esta geometría, ¡la "línea recta" corresponde a una parábola!

Podemos pasar a unas coordenadas $(y^0, y^1, y^2, y^3)=(y\circ x^{-1})(x^0, x^1, x^2, x^3)=(t, x^1-H+1/2g t^2, x^2, x^3)$, donde la métrica toma la forma $g_{0 0}=-U-2g^2t^2$, $g_{1 0}=g_{0 1}=4gt$, $g_{1 1}=g_{2 2}=g_{3 3}=2$ y el resto nulos. Si calculas los elementos de la conexión, te vas a llevar una sorpresa: todos son cero (en todo punto de la variedad). Esto ocurre porque te la he colado un poquito. Si $g$ fuese constante la variedad sería plana, y esto no es así por la ecuación de Poisson. Si admitimos que $g=g(x^1)$ aún podríamos eliminar la conexión, pero sólo en un punto (o en un conjunto de puntos) de la variedad. Es lo que se denominan coordenadas localmente inerciales.

Vemos por tanto que la conexión es algo ligado al observador (algo así como la sensación de peso) y la curvatura es algo intrínseco a la variedad (que codifica la materia). Dos observadores en un mismo espaciotiempo curvo pueden tener sensaciones de peso muy distintas, como acabamos de comprobar. El observador en caída libre no siente la gravedad (su conexión es nula, coordenadas localmente inerciales) mientras que el observador "en reposo" nota una conexión no nula.

De igual modo, dos observadores en un espaciotiempo plano pueden tener sensaciones muy distintas. Uno inercial no siente la gravedad (la conexión es nula), pero uno acelerado sí (por puro efecto de las coordenadas).
 

6. Conclusiones


La idea básica que subyace es la siguiente: gracias al principio de equivalencia podemos codificar la gravedad como curvatura del espaciotiempo, de modo que dejemos de considerar los efectos de la gravedad como una fuerza y los atribuyamos a una consecuencia de un espaciotiempo curvado. Las geodésicas en esta nueva geometría son las curvas que describen las partículas libres, que no son trayectorias "uniformes y rectas" en el sentido habitual de la expresión.
 

En primer lugar hemos definido la conexión de manera constructiva en unas cómodas coordenadas, para después axiomatizar la teoría a partir de la cual podemos hacer física. Con pocos axiomas sobre la conexión y el tiempo absoluto hemos construido el espaciotiempo newtoniano incorporando la gravedad como curvatura del mismo. Del mismo modo podemos axiomatizar la teoría postulando una métrica como la de la sección 4 de la que se puede deducir la conexión.

7. Bibliografía


Newton - Cartan theory on Wikipedia

Newtonian spacetime (Frederic Schuller) of Winter Scohol on gravity and light

The Geometry of Physics (Theodore Frankel)

Introducción a la Geometría Diferencial - Univ. de Granada (M.S.C & J.L.F.D)

Introducción a la Relatividad General - Bert Janssen