El Teorema de Oseledets

En teoría ergódica diferenciable uno se interesa fundamentalmente en el estudio local de un sistema dinámico a través de una linearización adecuada del sistema. Una vez que estudiamos transformaciones diferenciables definidas en variedades Riemannianas (muchas veces tales transformaciones se consideran con singularidades en conjuntos razonables), uno puede reducir el estudio del sistema usando la linearización natural que proviene de la diferencial de la transformación definida en el fibrado tangente. El teorema de Oseledets es una herramienta increiblemente potente en este ámbito, y ha permitido desarrollar una inmensa teoría como consecuencia.

En palabras sencillas, el teorema de Oseledets nos entrega información precisa de la dinámica. Particularmente nos habla de la existencia de subespacios vectoriales en «casi todo» plano tangente a la variedad, sobre los cuales la diferencial se comporta (exponencialmente a lo largo de las órbitas) de manera dilatante, contractante  o sin comportamiento exponencial (lo cual es bastante útil cuando estudiamos por ejemplo la entropía). En lenguaje puramente matemático el enunciado es el siguiente

Teorema (Oseledets). Sea f:M\rightarrow M un difeomorfismo de clase C^{1}  definido en una variedad Riemanniana M. Sea \mu una medida boreliana de probabilidad en M y supongamos que \log^{\pm}\|df\|\in\mathscr{L}^{1}(M,\mu). Entonces, para \mu– casi todo x\in M

  • Existen constantes reales \lambda_{1}(x)>...>\lambda_{r(x)}(x);
  • Existen subespacios vectoriales E_{1}(x),...,E_{r(x)}(x) de T_{x}M

tales que

T_{x}M=\bigoplus_{i=1}^{r(x)}E_{i}(x)

los espacios E_{i}(x) son estables por la diferencial, es decir 

d_{x}f(E_{i}(x))=E_{i}(f(x))

y

\lim_{n\rightarrow\infty}\frac{1}{n}\log\|d_{x}f^{n}(v)\|=\lambda_{i}(x) para todo v\in E_{i}(x), 1\leq i\leq r(x).

Más aún, las aplicaciones x\mapsto r(x), x\mapsto \lambda_{i}(x), x\mapsto dim(E_{i}(x)) son medibles. La propiedad de estabilidad por la diferencial implica que tales aplicaciones son también invariantes por f. En el caso particular de \mu medida ergódica, las aplicaciones son constantes \mu– casi todas partes.

 

Definicion: Los valores \{\lambda_{i}(x)\} son llamados Exponentes de Lyapunov y los espacios  \{E_{i}(x)\} son llamados Espacios Característicos.

Un ejemplo en el cual podemos encontrar concretamente los exponentes de Lyapunov y los espacios característicos son los automorphismos del toro. Aquellos estan definidos en su espacio de cubrimiento universal por una matriz invertible a valores enteros (cuya inversa satisface lo mismo). Los exponentes de Lyapunov corresponden a los logaritmos de los valores propios de la matriz, y los espacios característicos corresponden a las proyecciones sobre el toro de los espacios propios de la matriz.

Transformaciones inducidas por Intercambio de Intervalos

Las transformaciones definidas a partir de intercambios de intervalos son un ejemplo clave en sistemas dinámicos. En efecto, Arnoux, Ornstein y Weiss mostraron que todo sistema dinámico mesurable aperiódico es realizado (es decir, isomorfo en medida) a una de esas transformaciones. La definición exacta de tales sistemas es algo compleja, por lo que el objetivo primordial de este post es dar una idea de la construcción a partir de un ejemplo sencillo. Finalmente se darán algunos resultados mas específicos en un contexto puramente formal.

  • Comenzaremos con el intervalo I=[0,1) y lo pensaremos como una columna consistente de una sola linea horizontal. La transformación en este nivel será definida como la aplicación identidad.
  • En el siguiente paso consideramos dos subintervalos [0,1/2)[1/2,0), los imaginaremos como una sola columna consistente en dos lineas horizontales, una sobre otra. Pensemos que cortamos la columna del paso uno en la mitad y colocamos la segunda mitad sobre la primera. Esta nueva columna esta dotada de una aplicación natural, la cual lleva un elemento de la primera línea en su valor correspondiente en la segunda, y la última linea es llevada en su valor correspondiente en la primera. Debemos imaginar que estamos intercambiando posiciones de intervalos de largo 1/2.
  • En el tercer paso, cortamos la nueva columna a la mitad, lo que nos deja dos columnas, la primera consistiendo de los intervalos [0,1/4), [1/2,3/4) y la segunda consistiendo de los intervalos [1/4,1/2), [3/4,1). Colocamos la segunda columna sobre la primera, y obtenemos una nueva columna de ancho 1/4, y una aplicacion natural descrita como antes; es decir,

[0,1/4)\rightarrow [1/2,3/4)\rightarrow [1/4,1/2)\rightarrow [3/4,1)\rightarrow [0,1/4)

  • De manera más general, repetimos este proceso una cantidad infinita de veces de manera inductiva (siempre cortar a la mitad una columna, separar en dos, poner una sobre la otra y concluir definiendo la aplicación que lleva una línea en la superior, salvo por la última que regresa a la primera). La aplicación natural en cada iteración representa nada más que un intercambio de intervalos de igual medida (medida que es cada vez más y más pequeña, tendiendo a cero).
  • Si escribimos T_{n} la aplicación inducida en el intervalo [0,1) descrita en el n-ésimo paso, entonces podemos definir la aplicación T:[0,1)->[0,1) como el límite puntual de las aplicaciones T_{n}. Más específicamente, sea x\not\in\{p/2^{k}, k\in\mathbb{N}, 0\leq p\leq 2^{k}\}, entonces, para n suficientemente grande, x\not\in [1-1/2^{n},1) y por lo tanto T(x) está bien definida por T(x)=T_{n}(x).

dib1

dib2

La aplicación T_{n} es una isometría por tramos. En efecto, ella está constituida por traslaciones de intervalos de longitud 1/2^{n}. De esta forma, la medida de Lebesgue en el intervalo unitario permite hablar de una transformación que preserva la medida de Lebesgue. La aplicación T deviene entonces en una transformación que preserva la medida de Lebesgue definida para todo punto del intervalo, salvo por un conjunto de medida nula (precisamente numerable). Formalmente obtenemos

dib3
El siguiente teorema proviene del artículo «An entropy estimate for infinite interval exchange transformations» del autor Frank Blume.

Teorema 1. Si la entropía de la partición formada por los intervalos que definen T es finita, entonces la entropía de la transformación es nula.

En nuestro ejemplo, la partición está definida por I_{0}=[0,1/2) y I_{n}=[1-(1/2)^{n},1-(1/2)^{n+1}). Un cálculo sencillo nos dice que su entropía -\sum_{n=0}^{\infty}m(I_{n})\log m(I_{n}) es igual a 2\log(2), por lo que la entropía de T es nula.

Uno está tentado a pensar que una transformación inducida por estos intercambios de intervalos deben ser de entropía nula en todos los casos (traslaciones en general tienen una dinámica lineal, por lo que su entropía es nula). Esto se encuentra bastante lejos de ser cierto. El teorema nombrado en un comienzo, y formalizado en el párrafo siguiente, nos da una gama gigante de tales transformaciones cuya entropía puede ser incluso infinita.

Teorema 2. Toda transformación aperiódica que preserva cierta medida de probabilidad es isomorfa a una transformación de intercambio de intervalos T:[0,1)\rightarrow[0,1) del tipo siguiente

  1. Subintervalos I_{1}, I_{2},... dados por I_{j}=(t_{j-1},t_{j}), con 0=t_{0}<t_{1}<t_{2}<...<\lim_{j}t_{j}=1;
  2. existen constantes reales \{a_{j}\} tales que para x\in I_{j}, T(x)=x+a_{j};
  3. el único punto de acumulación de \{t_{j-1}+a_{j}\}\cup\{t_{j}+a_{j}\} es 1;
  4. T es inyectiva.

 

Funciones continuas no diferenciables

1.- Consideremos la función \displaystyle f(x)=\sum_{n=1}^\infty2^{-n}g(2^{2^n}x),

donde g(x)\begin{cases}    1+x, & x\in[-2,0]\\    1-x, & x\in[0,2]\\    \end{cases}

, y g(x+4)=g(x) para todo x\in\mathbb{R}.

Mostraremos que f es continua y no diferenciable en todo \mathbb{R}.

En efecto. Para ver que f es continua basta notar que g lo es, y que por otra parte se tiene \displaystyle\sup_{x\in\mathbb{R}}\Big|2^{-n}g(2^{2^n}x)\Big|=2^{-n}, con \displaystyle\sum_{n=0}^\infty 2^{-n}<\infty. Luego, como f es el límite uniforme de una sucesión de funciones continuas, y por el M-Test de Weierstrass (http://es.wikipedia.org/wiki/Prueba_M_de_Weierstrass) f es continua.

Para mostrar que f no es diferenciable para todo x\in\mathbb{R} consideremos x\in\mathbb{R} arbitrario pero fijo y k\in\mathbb{N} arbitrario.  Luego, escojamos \displaystyle\triangle x=\pm 2^{-2^k} , donde el signo escogido es tal que x y x+\triangle x están en el mismo segmento lineal de \displaystyle g(2^{2^k}x).

Sea n\in\mathbb{N}, para n>k tenemos que:

\displaystyle g(2^{2^n}(x+\triangle x))-g(2^{2^n}x)=g(2^{2^n}x)-g(2^{2^n}x)=0, ya que g tiene periodo 4 y \displaystyle 2^{2^n}\triangle x=4q para algún q\in\mathbb{Z}.

Para n=k tenemos que :

\displaystyle |g(2^{2^k}(x+\triangle x))-g(2^{2^k}x)|=g(1+2^{2^k}x)-g(2^{2^k}x)=1.

Para n<k estimamos,

\displaystyle\sup_{n=1,..,k-1}|g(2^{2^n}(x+\triangle x))-g(2^{2^n}x)|\leq 2^{2^{k-1}}2^{-2^k}=2^{-2^{k-1}}

Y por lo tanto,

\displaystyle\Big|\sum_{n=1}^{k-1}2^{-n}(g(2^{2^n}(x+\triangle x))-g(2^{2^n}x))\Big|\leq (k-1)2^{-2^{k-1}}<2^k2^{-2^{k-1}}\leq 1

Entonces,

\displaystyle\Big|\frac{f(x+\triangle x)-f(x)}{\triangle x}\Big|=2^{2^k}\Big|\sum_{n=1}^{\infty}2^{-n}(g(2^{2^n}(x+\triangle x))-g(2^{2^n}x))\Big|

=\displaystyle2^{2^k}\Big|\sum_{n=1}^{k}2^{-n}(g(2^{2^n}(x+\triangle x))-g(2^{2^n}x))\Big|

\geq\displaystyle2^{2^k}\Big(1-\Big|\sum_{n=1}^{k-1}2^{-n}(g(2^{2^n}(x+\triangle x))-g(2^{2^n}x))\Big|\Big)

\geq\displaystyle2^{2^k}(1-2^k2^{-2^{k-1}})=2^{2^{k-1}}(2^{2^{k-1}}-2^k).

Finalmente, tomando k\rightarrow\infty se tiene que f'(x)\rightarrow \infty, concluyendo así, que f es no diferenciable para todo x\in\mathbb{R}.

Una Propiedad Exponencial

Sea f:\mathbb{R}\rightarrow\mathbb{R} una función continua tal que

f(x+y)=f(x)f(y) para todos x,y\in\mathbb{R}

entonces f\equiv 0 o f(x)=a^{x} para algún a\in\mathbb{R}^{+}.

En efecto, lo primero que debemos notar es que o bien f(0)=0 o bien f(0)=1, para mostrarlo es suficiente escribir f(0)=f(0+0)=f(0)^{2} lo que implica el resultado. Si f(0)=0 entonces f(x)=f(x+0)=f(x)f(0)=0 para cada x\in\mathbb{R}. Si no, entonces f(0)=1 y f(1)=f(\frac{1}{n}\cdot n)=f(\frac{1}{n})^{n}, lo que implica que f(1)>0 pues para n suficientemente grande, f(1/n)>0 por continuidad en el origen. Es fácil ver también que lo último implica que f(x)>0 para cada x\in\mathbb{R}.

Observemos ahora que en cada conjunto compacto (cerrado y acotado) la función es Riemann integrable por continuidad, por lo tanto

\displaystyle{\int_{0}^{x}f(t)dt=\lim_{n\rightarrow\infty}\sum_{k=0}^{n-1}f\left(\frac{kx}{n}\right)\frac{x}{n}}

Por otro lado, para todo n natural y y\in\mathbb{R}, f(ny)=f(y)^{n} y f(y/n)=f(y)^{1/n}, de donde

\displaystyle{f\left(\frac{kx}{n}\right)=f(x)^{\frac{k}{n}}}

Lo que implica

\displaystyle{\int_{0}^{x}f(t)dt=\lim_{n\rightarrow\infty}\frac{x}{n}\sum_{k=0}^{n-1}f(x)^{\frac{k}{n}}}

y luego la suma geométrica nos entrega

\displaystyle{\int_{0}^{x}f(t)dt=\lim_{n\rightarrow\infty}\frac{x}{n}\frac{f(x)-1}{f(x)^{1/n}-1}}.

Recordemos ahora que \displaystyle{\lim_{n\rightarrow\infty}n(y^{1/n}-1)} para cada y\in\mathbb{R}^{+}, entonces

\int_{0}^{x}f(t)dt=\dfrac{x(f(x)-1)}{\log{f(x)}}.

En el caso particular de $x=n$ obtenemos $f(n)=f(1)^{n}$ y por lo tanto

\int_{0}^{n}f(t)dt=\frac{f(n)-1}{\log{f(1)}}.

Por otro lado un simple cambio de variables implica

\int_{x}^{x+n}f(t)dt=\int_{0}^{n}f(t+x)dt=f(x)\int_{0}^{n}f(t)dt

por lo que si derivamos respecto a x, nos queda

f(x+n)-f(x)=\frac{df}{dx}(x)\frac{f(n)-1}{\log{f(1)}},

pero  f(x+n)-f(x)=f(x)(f(n)-1), entonces

f(x)\log{f(1)}=\frac{df}{dx}(x).

Basta considerar a=f(1) y resolver la ecuación diferencial para concluir que f(x)=a^{x}.

Otra forma de resolver el problema es una perspectiva de la densidad. En efecto, si dos funciones f,g:\mathbb{R}\rightarrow\mathbb{R} continuas coinciden en un conjunto denso, entonces las funciones coinciden en toda la recta real. Para ello basta considerar un punto arbitrario y estudiar la convergencia a tal punto por sucesiones del conjunto denso, los límites deben ser iguales al evaluar en cada función. Finalmente, para cada p,q\in\mathbb{Q}, con q\neq 0, entonces f(p/q)=f(1)^{p/q}. Es decir, para a=f(1), las funciones f(x) y g(x)=a^{x} coinciden sobre \mathbb{Q}. Nuestra primera observación en este párrafo concluye el resultado.

Principio de Inducción Matemática

El principio de inducción matemática es una herramienta poderosa para demostrar propiedades que satisfacen los números naturales. Ésta nos dice que si «1 satisface una propiedad fija» y si «dado otro natural que la satisface, su sucesor también la satisface», entonces todo número natural debe satisfacer la misma propiedad.

Denotemos \mathcal{P} una propiedad aplicable sobre los números naturales y escribamos \mathcal{P}(n) cuando el natural n satisface la propiedad \mathcal{P}

En lenguaje matemático el principio de inducción se traduce en lo siguiente

Proposición: Si \mathcal{P}(1) y \mathcal{P}(k)\Rightarrow\mathcal{P}(k+1), entonces todos los números naturales satisfacen la propiedad \mathcal{P}.

Este principio para muchos llega a ser un dolor de cabeza debido a la lógica que hay por detrás, de hecho, a juicio personal considero que la mayor dificultad proviene de la implicancia \mathcal{P}(k)\Rightarrow\mathcal{P}(k+1).
Para usar el principio de inducción matemática se debe mostrar precisamente esa implicancia y que 1 satisface la propiedad; la última siendo una simple verificación a mano. Pero muchos que no comprenden la lógica que hay de fondo creen que para demostrar una propiedad sobre los naturales basta probar justamente que \mathcal{P}(k)\Rightarrow\mathcal{P}(k+1).

¿Por qué no es así?

El mejor ejemplo que se tiene en estos casos es el efecto dominó. Imaginemos que queremos botar todas las piezas de un dominó como en el siguiente video

Para ello necesitamos dos leyes fundamentales, la primera es partir botando una ficha, esa se compara con la primera hipótesis de inducción, sin este simple acto es imposible botar alguna. La segunda ley es asegurar que dado que una ficha se ha caído la siguiente también caerá. Sin esto último no podrían caerse todas las fichas del dominó una tras otra se manera consecutiva. Es decir

Para asegurar que todas las fichas de un dominó se caerán, es necesario saber que las dos leyes anteriores se satisfacen.

Cuando pensamos en el principio de inducción matemática, queremos asegurar que todas las fichas se caerán, es decir, que todos los naturales satisfagan la propiedad buscada. Naturalmente debemos pensar en un dominó infinito, los naturales lo son, pero el problema es reducido al caso finito de manera simple. Si queremos saber si un natural N satisface una propiedad, basta considerar el dominó de naturales infinito truncado hasta la ficha N y esperar que la ficha caiga. ¡SI TENEMOS LAS DOS LEYES ENTONCES SIEMPRE CAERÁ TAL FICHA!.

Ejemplo:

Dado un natural N queremos probar lo siguiente

\displaystyle{1+2+3+4+...+(N-1)+N=\sum_{i=1}^{N}i=\frac{N(N+1)}{2}}.

Hay bastantes formas de hacerlo, pero nos centraremos solo en como aplicar la inducción matemática. La propiedad aplicada al natural 1 significa que debemos probar que la suma de los primeros 1 naturales es \frac{1(1+1)}{2}=1, lo cual es trivial. La parte interesante (e insisto, la mas complicada lógicamente para muchos) es la segunda ley. Supongamos que un natural n satisface la propiedad (o equivalentemente, que sabemos que una pieza ha caído), debemos mostrar que n+1 también satisface la propiedad (debemos asegurar que la siguiente pieza de dominó caerá). Notemos entonces que

1+2+...+n+(n+1)=(1+2+...+n)+(n+1)

pero el primer paréntesis, por nuestra hipótesis, vale \frac{n(n+1)}{2}, por lo que

1+...+(n+1)=\frac{n(n+1)}{2}+(n+1)

y si simplificamos un poco las cosas nos queda

\frac{n(n+1)}{2}+(n+1)=\frac{(n+1)(n+2)}{2}.

Hemos probado que 1+...+(n+1)=\frac{(n+1)(n+2)}{2} lo cual nos dice precisamente, si reemplazamos N por n+1 en la primera fórmula, que la propiedad se satisface para el natural n+1. Hemos probado la segunda ley.

Finalmente, lógicamente hablando y gracias al principio de inducción matemática, podemos asegurar fervientemente que todo número natural satisface esa propiedad.

Sumar los primeros 100 numeros puede ser agotador, pero ciertamente sabemos ahora que tal suma vale \frac{100\times 101}{2}=5050.

¿Por qué es útil el Principio de Inducción Matemática?

Los naturales son un conjunto infinito de elementos por lo que si queremos probar que todos los naturales satisfacen cierta propiedad, la manera inmediata es pensar en probar uno por uno, ¡pero no terminaríamos nunca!. Es por esto mismo que el principio de inducción es tan importante, es una herramienta, como muchas otras en la matemática, que nos ayuda a resolver problemas que en principio son imposibles de realizar debido al límite humano (temporal) gracias a un cambio de perspectiva. En este caso, basta botar la primera pieza, comprobar una propiedad y la teoría se encarga del resto.

Nociones Básicas en Geometría Hiperbólica (Última Parte)

Para terminar con la serie de post sobre geometría hiperbólica, me gustaría hacer hincapié en un resultado básico de la geometría euclideana. Si fijamos tres ángulos \alpha,\beta, \gamma tales que su suma es 180 grados (o mas comodamente, \pi radianes), entonces siempre existe un triángulo que contiene a tales ángulos, más aún, todas las isometrías de tal triángulo siguen satisfaciendo lo mismo, e incluso más aún, si dilatamos o contractamos el triángulo seguiremos obteniendo triángulos que tienen como componentes a los ángulos escogidos, a pesar de ya no ser isométricos entre si. Esto es algo que NO se satisface en geometría hiperbólica…

trihyp


Proposición
: Para tres valores de ángulos cuya suma sea estrictamente menor que 180 grados (propiedad que veremos al final que es necesaria), existe un triángulo (único salvo isometrias) que contiene a tales ángulos.

La existencia es algo no difícil de ver y que ciertamente no es lo que nos interesa fundamentalmente. Argumentos de continuidad en la construcción son suficientes.

Consideremos entonces un triángulo hiperbólico arbitrario ABC, de largos de lados a,b,c y ángulos \alpha, \beta, \gamma todos positivos. Vía una isometría es posible reducirnos al caso donde A=i, Re(B)=0, Im(B)<1 y Re(C)>0, esto es fácil de ver pues basta aplicar una isometría que lleve A en i (la acción de PSL(2,\mathbb{R}) es transitiva). La acción también es transitiva en las direcciones en i, entonces podemos suponer Re(B)=0 y Im(B)<1. Finalmente si es necesario consideramos reflexiones de modo que Re(C)>0.

Denotamos ahora R_{\theta} una rotación de centro i y ángulo \theta, T_{h} el elemento hiperbólico de PSL(2,\mathbb{R}) tal que tiene punto fijo repulsivo el origen, atractivo el infinito y que envía i a distancia $h$. Entonces el elemento

R_{\pi+\alpha}\cdot T_{b}\cdot T_{\pi+\gamma}\cdot T_{a}\cdot R_{\pi+\beta}\cdot T_{c}

fija i y las direcciones verticales, esto implica que esta únicamente determinado sobre PSL(2,\mathbb{R}), es decir

R_{\pi+\alpha}\cdot T_{b}\cdot T_{\pi+\gamma}\cdot T_{a}\cdot R_{\pi+\beta}\cdot T_{c}=\pm Id.

Ahora podemos aplicar la representacion adjunta, y concluimos que

Ad(R_{\pi+\alpha}\cdot T_{b}\cdot T_{\pi+\gamma}\cdot T_{a}\cdot R_{\pi+\beta}\cdot T_{c})=Ad(\pm Id).

por lo que si denotamos M_{\theta,h}=Ad(R_{\pi+\theta}\cdot T_{h}), nos queda

M_{\theta,h}=\left(\begin{array}{ccc}{\cos(\theta+\pi)}&{-sin(\theta+\pi)}&{0}\\{sin(\theta+\pi)}&{cos(\theta+\pi)}&{0}\\{0}&{0}&{1}\end{array}\right)\cdot\left(\begin{array}{ccc}{1}&{0}&{0}\\{0}&\cosh(h)&\sinh(h)\\{0}&\sinh(h)&\cosh(h)\end{array}\right)

Entonces, buscamos escribir M_{\alpha,b}\cdot M_{\gamma,a}=M^{-1}_{\beta,c}, de donde, si hacemos el cálculo e igualamos ciertos coeficientes de la matriz izquierda y derecha, se deducen las siguientes leyes

\dfrac{\sin(\alpha)}{\sinh(a)}=\dfrac{\sin(\beta)}{\sinh(b)}=\dfrac{\sin(\gamma)}{\sinh(c)}

\cosh(c)=\cosh(a)\cosh(b)-\sinh(a)\sinh(b)\cos(\gamma)

\cosh(c)=\dfrac{\cos(\alpha)\cos(\beta)+\cos(\gamma)}{\sin(\alpha)\sin(\beta)}

de las cuales la última es precisamente la que nos dice que los largos de los lados estan determinados por los ángulos del triángulo.


Observación
: Un resultado estándar es que la área de un triángulo hiperbólico esta determinada por \pi-\alpha-\beta-\gamma, lo que implica que la suma de los ángulos de un triángulo en radianes es estrictamente menor que \pi. Esto tiene una implicancia bastante bonita cuando miramos superficies de Riemann compactas de género g\geq 2. Sobre cada clase de homotopía libre existe una única geodésica de largo minimal. La existencia la entrega el teorema de Ascoli-Arzela y la unicidad proviene de usar el teorema de Uniformización, levantando dos curvas minimales al plano hiperbólico (geodésicas del plano hiperbólico pues la estructura de superficie de Riemann esta ligada a la métrica Riemanniana proveniente de la estructura hiperbólica) y llegar a una contradicción formando adecuadamente dos triángulos cuyas sumas de ángulos sea 2\pi (en el plano hiperbólico).

suphyp

Nociones Básicas en Geometría Hiperbólica (Parte IV)

En el post anterior describimos a los elementos de PSL(2,\mathbb{R}) segun tres tipos. Modulo conjugación, estos elementos se caracterizan por, o bien fijar un punto en el plano hiperbólico, o bien fijar un elemento en la frontera (de modo atractor), o bien fijar dos elementos en la frontera (uno atractor y otro repulsor). Vimos que en particular, los elementos elípticos, luego de conjugarlos de una manera adecuada, son de la forma

A_{\theta}=\left(\begin{array}{cc}\cos(\theta)&-\sin(\theta)\\\sin(\theta)&\cos(\theta)\end{array}\right).

Este elemento es en efecto una rotación con centro en i y de ángulo -2\theta. Naturalmente, con lo que sabemos hasta ahora, visualizar esto no es evidente. Se hace necesario un modelo hiperbólico en el cual la geometría sea mucho más precisa y clarificante (pero pagando ese precio, perdemos facilidad en algunos cálculos).

Sea \mathbb{D}=\{z\in\mathbb{C}:|z|<1\}, entonces la función f:\mathbb{H}\rightarrow\mathbb{D}, definida por

f(z)=\frac{z-i}{z+i}

es una biyección. Debemos probar primero que nuestro recorrido es efectivamente el disco, para ello notamos que si z\in\mathbb{H} entonces |z-i|<|z+i| (ver figura), y por lo tanto |f(z)|<1. Por otro lado, para w\in\mathbb{D} se tiene que \frac{i(w+1)}{1-w} es un elemento del plano hiperbólico, y es el único elemento tal que al componerla con f me entrega nuevamente w. Hemos encontrado una inversa continua.

fig3


Observación
: Obtuvimos un homeomorfismo, que desde el punto de vista de variable compleja representa un biholomorfismo. En particular los ángulos se preservan.

A modo de observación, podemos definir una métrica en \mathbb{D} dada por |ds|=\frac{|g'(z)||dz|}{Im(g(z))}, la cual de manera intuitiva representa la métrica imagen vía g=f^{-1} (las distancias entre dos puntos del disco son las distancias de las imagenes vía g). Un simple cálculo muestra que

|ds|=\frac{2|dz|}{1-|z|^{2}}.


Ejercicio
: Verificar que las geodésicas del disco con esta métrica son, o bien segmentos de circunferencias ortogonales al borde del disco unitario, o bien segmentos de rectas que pasan por el origen.


Observación
: Por como definimos esta métrica, f es una isometría.

Volviendo a lo que nos interesa, queremos representar en el plano hiperbólico las rotaciones. Como tenemos una aplicación conforme del plano en el disco, entonces podemos estudiar las rotaciones del disco (que son fáciles de representar) y trasladar nuestra información, vía nuestra aplicación, al semiplano:

Sabemos que f(i)=0, por lo que una rotación con centro en «latex i» se traduce en el disco en una rotación con centro en el origen. Por otro lado, una rotación en ángulo \theta en el disco es representado por z\mapsto e^{i\theta}z. Matricialmente esta acción está dada por

z\mapsto\left(\begin{array}{cc}e^{\theta/2}&{0}\\{0}&e^{-\theta/2}\end{array}\right)\cdot z

por lo que, escribiendo z\mapsto f(z) de la forma

z\mapsto \left(\begin{array}{cc}{1}&{-i}\\{1}&{i}\end{array}\right)\cdot z

nos queda, denotando R_{\theta} la rotación en ángulo \theta con centro en i del plano hiperbolico,

R_{\theta}=\frac{1}{2i}\left(\begin{array}{cc}{i}&{i}\\{-1}&{1}\end{array}\right)\left(\begin{array}{cc}e^{\theta/2}&{0}\\{0}&e^{-\theta/2}\end{array}\right)\left(\begin{array}{cc}{1}&{-i}\\{1}&{i}\end{array}\right)

o escrito en forma reducida

R_{\theta}=\left(\begin{array}{cc}\cos{\theta/2}&\sin{\theta/2}\\-\sin{\theta/2}&\cos{\theta/2}\end{array}\right).

Notar que esto muestra nuestra primera afirmación. De acuerdo a la matriz escrita al comienzo, A(\theta) es exactamente una rotación en ángulo -2\theta.

Resumiendo, en los últimos dos post hemos escrito tres tipos de matrices, de acuerdo a su comportamiento dinámico, y dos de acuerdo a su acción geométrica en el plano hiperbólico. Éstas son

R_{\theta}=\left(\begin{array}{cc}\cos{\theta/2}&\sin{\theta/2}\\-\sin{\theta/2}&\cos{\theta/2}\end{array}\right)

T_{d}=\left(\begin{array}{cc}e^{d/2}&{0}\\{0}&e^{-d/2}\end{array}\right)

La primera representando una rotación en ángulo \theta y centro i (el cual es fijo), y la segunda representando un elemento hiperbólico con dos puntos fijos 0,\infty y con distancia de desplazamiento d.

Si aplicamos entonces la matriz R_{\pi/2} a T_{d} nos queda (como vimos en el post anterior) un elemento hiperbólico con punto repulsor -1 y atractor 1. A saber, el elemento

\left(\begin{array}{cc}\cosh{d/2}&\sinh{d/2}\\\sinh{d/2}&\cosh{d/2}\end{array}\right)

Representación Adjunta

Una herramienta útil en el estudio algebraico de las acciones dada por el grupo PSL(2,\mathbb{R}) está dada por la representación adjunta. Para introducirla debemos definir el grupo sl(2,\mathbb{R}).


Definición
: El grupo sl(2,\mathbb{R}) se define como el grupo (aditivo) de todas las matrices con traza nula.

Notar que sl(2,\mathbb{R}) tiene una estructura de espacio vectorial real. Ademas, el grupo SL(2,\mathbb{R}) actúa en sl(2,\mathbb{R}) por conjugación. En efecto, si

A=\left(\begin{array}{cc}a&b\\c&d\end{array}\right)\in SL(2,\mathbb{R}) y X=\left(\begin{array}{cc}x&y\\z&-x\end{array}\right)\in sl(2,\mathbb{R})

se tiene

AXA^{-1}=\left(\begin{array}{cc}a&b\\c&d\end{array}\right)\left(\begin{array}{cc}x&y\\z&-x\end{array}\right)\left(\begin{array}{cc}d&-b\\-c&a\end{array}\right)

=\left(\begin{array}{cc}(ad+bc)x+bdz-acy&-b^{2}+a^{2}y-2abx\\d^{2}z-c^{2}y+2cdx&-(ad+bc)x-bdz+acy\end{array}\right)

de donde es claro que tr(AXA^{-1})=0 (por lo que la acción está bien definida).

Implicitamente escribimos X con cierta estructura que deja en evidencia una base (visto como espacio vectorial). Escogemos entonces una base para sl(2,\mathbb{R}) la dada por

e_{1}=\left(\begin{array}{cc}{1}&{0}\\{0}&{-1}\end{array}\right)e_{2}=\left(\begin{array}{cc}{0}&{1}\\{1}&{0}\end{array}\right)e_{3}=\left(\begin{array}{cc}{0}&{1}\\{-1}&{0}\end{array}\right)

Y por lo tanto, si definimos la aplicación adjunta de A como Ad(A):sl(2,\mathbb{R})\rightarrow sl(2,\mathbb{R}), en la base anterior se escribe matricialmente como

Ad(A)=\left(\begin{array}{ccc}{ad+bc}&{bd-ac}&-ac-bd\\-ab+cd&\frac{1}{2}(a^{2}-b^{2}-c^{2}+d^{2})&\frac{1}{2}(a^{2}+b^{2}-c^{2}-d^{2})\\-ab-cd&\frac{1}{2}(a^{2}-b^{2}+c^{2}-d^{2})&\frac{1}{2}(a^{2}+b^{2}+c^{2}+d^{2})\end{array}\right)

Y por lo tanto hemos definido una aplicación (o representación), llamada adjunta, de la forma ad:SL(2,\mathbb{R})\rightarrow End(sl(2,\mathbb{R})). Es posible verificar que Ker(ad)=\pm Id.

Por último debemos recordar que estamos trabajando sobre un espacio vectorial, y para facilitar los calculos, es mejor trabajar con la adjunta de las matrices elementales que encontramos. Éstos son los tres casos principales

  • Si A=\left(\begin{array}{cc}e^{d/2}&{0}\\{0}&e^{-d/2}\end{array}\right), entonces Ad(A)=\left(\begin{array}{ccc}{1}&{0}&{0}\\{0}&\cosh(d)&\sinh(d)\\{0}&\sinh(d)&\cosh(d)\end{array}\right)
  • Si A=\left(\begin{array}{cc}\cosh(d/2)&\sinh(d/2)\\\sinh(d/2)&\cosh(d/2)\end{array}\right), entonces Ad(A)=\left(\begin{array}{ccc}{\cosh(d)}&{0}&-\sinh(d)\\{0}&{1}&{0}\\{-\sinh(d)}&{0}&\cosh(d)\end{array}\right)
  • Si A=\left(\begin{array}{cc}\cos(\theta/2)&\sin(\theta/2)\\-\sin(\theta/2)&\cos(\theta/2)\end{array}\right), entonces Ad(A)=\left(\begin{array}{ccc}{\cos(\theta)}&{\sin(\theta)}&{0}\\{-\sin(\theta)}&{\cos(\theta)}&{0}\\{0}&{0}&{1}\end{array}\right).

Grupos Fuchsianos

En este post se asumirá que el lector tiene un conocimiento en superficies de Riemann y topología algebraica.


Definición
: Un grupo Fuchsiano es un subgrupo discreto de PSL(2,\mathbb{R}).

Observación: Aquellos que conocen el Teorema de Uniformización, probablemente tengan en mente el siguiente resultado. Una superficie de Riemann compacta de género mayor o igual a 2 proviene del cuociente del disco unitario con un subgrupo de isometrías del disco. Este subgrupo es isomorfo al grupo fundamental, y por lo tanto, en vista del isomorfismo excepcional SU(1,1)\simeq PSL(2,\mathbb{R}), concluimos que dicho grupo de isometrías es un grupo fuchsiano (o isomorfo a uno).

Primero intentaremos caracterizar a los grupos Fuchsianos, una forma se basa en el lema siguiente. De aquí en adelante denotaremos \Gamma\leq PSL(2,\mathbb{R})


Lema
: \Gamma es Fuchsiano si y solamente si él actua discontinuamente (todas las órbitas discretas) en \mathbb{H}.

Demostración:

El grupo PSL(2,\mathbb{R}) actúa libre y transitivamente sobre el fibrado tangente unitario U\mathbb{H} (pensar en el espacio tangente de \mathbb{H} considerando direcciones unitarias, si fija un punto y una dirección, debe ser la identidad). Luego \Gamma es discreto, si y solamente si, la acción en el fibrado es discreto. Así, las órbitas son discretas en PSL(2,\mathbb{R}) si y solamente si lo son en \mathbb{H}.

\blacksquare

Definición: Un polígono de \mathbb{H} es un subconjunto cerrado, convexo, con borde geodésico por tramos. Un lado es un segmento geodésico maximal en el borde y un vértice (definicion temporal) es un punto del borde definido por ser la intersección de dos lados. El polígono se dice finito si tiene un número finito de lados.

El objetivo de este post es enunciar (y dar una intuición antes de eso) el Teorema del Polígono de Dirichlet.


Definición
: Un polígono P se dice fundamental para el grupo \Gamma si las traslaciones de P por el grupo \Gamma cubren \mathbb{H} y las translaciones del interior del polígono son dos a dos disjuntas.


Definición
: Un polígono de Dirichlet P_{p} asociado a \Gamma y centrado en p es el conjunto

P_{p}=\{z\in\mathbb{H}:\forall\gamma\in\Gamma,\textmd{ }d(z,p)=d(z,\gamma\cdot p)\}.

Con estas definiciones, es posible probar que para \Gamma un grupo Fuchsiano y p\in\mathbb{H} de estabilizador trivial en \Gamma, entonces el poligono de Dirichlet P_{p} es un polígono (segun nuestra primera definición). Mas aún, dicho polígono es fundamental.

fig1

Consideramos entonces un grupo Fuchsiano \Gamma y un polígono de Dirichlet P=P_{p} centrado en un punto con estabilizador trivial. El objetivo de los siguientes parrafos es encontrar una representación del grupo.


Lema
: Sea z\in\partial P. Entonces existe Id\neq\gamma\in\Gamma tal que \gamma\cdot z pertenece también a \partial P. Además, un tal \gamma es único si z no es un vértice.

Demostración:

Por la definición de polígono de Dirichlet, z\in\partial P si y solamente si existe \gamma\neq Id tal que la distancia de z a \Gamma\cdot p (la orbita de z) es alcanzada por p y \gamma p. Así, la distancia de z a p es igual (recordar que la acción es por isometrías) a la distancia entre p y \gamma^{-1}\cdot z, y por tanto nuestro elemento buscado es \gamma^{-1}. Recíprocamente, si z y \gamma^{-1}\cdot z están en el borde del polígono, entonces z es equidistante de p y \gamma\cdot p.

Si existiera un \delta\in\Gamma tal que \delta\cdot z está en la frontera del polígono, entonces d(p,\gamma\cdot z)=d(p,\delta\cdot z) y luego, si \gamma\neq\delta entonces z esta en la intersección de los polígonos fundamentales P_{p},P_{\delta\cdot p},P_{\gamma\cdot p}. Como los polígonos cubren a \mathbb{H} se tiene que z debe ser un vértice.

\blacksquare

Naturalmente, el lema anterior no nos especifica si uno podría tener que z\neq\gamma\cdot z. La igualdad puede ser alcanzada por los vértices, pero también por los puntos medios de los segmentos geodésicos (deben pensar que no puede ser otro punto del segmento pues debe haber una acción por isometría). Definimos entonces los vértices del polígono como los vértices ya definidos unidos a los puntos medios de los segmentos que satisfacen la igualdad anterior (es decir, tienen estabilizador no trivial). Con esta nueva definición, un punto en el borde que no es un vértice, debe tener por imagen (vía el único elemento del grupo descrito como antes) un punto del borde del polígono en un segmento geodésico que no es el mismo al cual pertenece. Si enumeramos los lados L_{1},...,L_{m},..., estos son aquellos tales que para cada i\in\{1,2,...\} existe un único \gamma_{i}\neq Id del grupo, y un único j\neq i tal que \gamma_{i} envia L_{i} en L_{j} (y este invierte la orientación dada por la la usual como borde de un conjunto convexo).

Lo anterior nos dice que un polígono con cantidad finita de lados, debe tener cardinalidad de lados par. Además, por unicidad, es claro que \gamma_{j}=\gamma_{i}^{-1}. Escribimos \sigma:i\mapsto j a tal involución.


Definición
: El par (\sigma,\{\gamma_{i}\}) se conoce como apareamiento de lados para el polígono P_{p}.


Proposición
: Suponiendo que P es finito, entonces \Gamma es generado por los \gamma_{i}.

Demostración:

Sea \gamma\in\Gamma. Si \gamma es uno de los \gamma_{i}, entonces \gamma\cdot p pertenece a una copia de P vecina a P. Si no, consideremos un camino de p a \gamma\cdot p que evita vértices y es transversal a los lados (de todas las traslaciones de P en caso que las intersecte). Consideramos la sucesion finita C_{1},...,C_{N} de lados tales que el camino los cruza. Cada uno de esos lados es la imagen de un unico lado L_{i_{k}} de P. De esta forma, el vecino de P a lo largo de L_{i_{k}} es por construccion la traslacion \gamma_{i_{k}}^{-1}(P). No es dificil de ver que \gamma(P)=\gamma_{i_{1}}^{-1}...\gamma_{i_{N}}^{-1}(P). Con esto se concluye que \gamma=\gamma_{i_{1}}^{-1}...\gamma_{i_{N}}.

En la figura adjunta se muestra un diseño de lo que sucede (los cambios de notacion son evidentemente adecuables a nuestra escritura)

fig2

\blacksquare

Por último, podemos definir una relación de equivalencia entre los vértices del polígono. Dos vértices se relacionan si existe un elemento del grupo que envía uno en otro. Llamamos ciclo elíptico a una clase de equivalencia. Además, un ciclo es determinado por una cantidad finita de vértices debido al cubrimiento de las traslaciones del polígono y la discretitud del grupo. Finalmente se define como ángulo de un ciclo a la suma de los ángulos del polígono en cada vértice del ciclo.


Definición
: Denotamos \tilde{\sigma}(i)=\sigma(i)-1. Si escribimos s_{i}=L_{i}\cap L_{i+1}, entonces el ciclo de s_{i} es \{s_{i},s_{\tilde{\sigma(i)}},...,,s_{\tilde{\sigma^{l}(i)}}\} donde l es el primer entero tal que s_{\tilde{\sigma^{l+1}(i)}}=i.


Proposición
: El ángulo de un ciclo es de la forma \frac{2\pi}{q} para q\in\mathbb{Z}. En tal caso \gamma_{\tilde{\sigma^{l}(i)}}\circ...\circ\gamma_{i} genera el estabilizador de s_{i} y es de orden q.

Demostración:

Por construcción \gamma_{\tilde{\sigma^{l}(i)}}\circ...\circ\gamma_{i} fija s_{i}, luego es de orden finito (por ser discreto). Cualquier elemento \gamma que fija s_{i} debe ser una rotación en ángulo el ángulo del ciclo. Es fácil ver que tal el elemento debe ser de la forma \gamma_{\tilde{\sigma^{k}(i)}}\circ...\circ\gamma_{i} donde k es un multiplo de l.

\blacksquare

Si resumimos, partiendo de un grupo Fuchsiano y un polígono de Dirichlet asociado, encontramos un apareamiento de lados, una involución que describe el apareamiento. Cada vértice pertenece a un ciclo, con ángulo de ciclo dividiendo a 2\pi. Los elementos que relacionan los lados satisfacen \gamma_{\sigma(i)}=\gamma_{i}^{-1} y (\gamma_{\tilde{\sigma^{l}(i)}}\circ...\circ\gamma_{i})^{q}=Id donde el ángulo de ciclo es \frac{2\pi}{q}.

Con esto en mente, es natural preguntarse si existe algún tipo de recíproco. En efecto


Teorema (Polígono de Poincaré)

Sea P un polígono compacto de lados L_{1},...,L_{2n} con un apareamiento (\sigma,\{\gamma_{i}\}) tal que el ángulo de cada ciclo divide a 2\pi. Entonces el grupo \Gamma generado por los \gamma_{i} es Fuchsiano y de representación

<(\gamma_{i})_{i=1,...,2n}|\gamma_{\sigma(i)}=\gamma_{i}^{-1},(\gamma_{\tilde{\sigma^{l}(i)}}\circ...\circ\gamma_{i})^{q}=Id\textmd{ donde el angulo de ciclo es }\frac{2\pi}{q}\textmd{ en el vertice }s_{i}>.

Debemos hacer una observacion no menor. Este resultado es mucho mas general, para (por ejemplo) un polígono no compacto, el cual tiene vértices en la frontera del plano hiperbólico. Estos vértices se conocen como vértices en el infinito, y sus ciclos se llaman ciclos parabólicos (pues la isotropía en esos puntos son elementos parabólicos de PSL(2,\mathbb{R})). ¡Es un resultado precioso!.

Para concluir con este post, mostraremos una pequeña aplicación de estos resultados


Grupos Fuchsianos y Superficies de Riemann

Sea P un polígono de 2n lados, de área finita, con un apareamiento (\sigma,\{\gamma_{i}\}). Escribimos c_{e} la cantidad de ciclos elípticos y c_{p} la cantidad de ciclos parabólicos.

Proposición: Si P satisface las hipótesis del Teorema de Poincaré y \Gamma es el grupo generado por los \gamma_{i}, entonces el cuociente de \mathbb{H}\bigcup\{\textmd{vertices en el infinito}\} por \Gamma es una superficie de Riemann compacta de género

g=\dfrac{1+n-(c_{e}+c_{p})}{2}

Demostración:

Las cartas para los puntos en las traslaciones del interior del polígono se definen por la identidad para una vecindad suficientemente pequeña. En los vértices elípticos se definen por z\mapsto z^{q} donde q representa el ángulo del ciclo, y en los vértices en el infinito debemos ser mas sutiles. Después de conjugar, supongamos que el vértice es z=\infty y que el elemento parabólico definido por el ciclo es \phi(z)=z+1. Entonces la función z\mapsto\exp(2\pi iz) define una carta local. La compacidad proviene del cubrimiento finito definido por estas cartas (o también se puede pensar que estamos compactificando la superficie \mathbb{H}/\Gamma) y el cálculo del género resulta de trazar triángulos desde el centro del polígono a los vértices (mirado todo en el plano hiperbólico) y luego cuocientamos y usamos la característica de Euler. Modulo la acción la triangulación nos queda con 2n triángulos, c_{e}+c_{p}+1 vértices y 3n aristas. Es decir, 2-2g=2n-3n+(c_{e}+c_{p}+1).

\blacksquare

Bibliografía:
[Sai2011] _____, Uniformisation des surfaces de Riemann, ENS Éditions, 2011.

Nociones Básicas en Geometría Hiperbólica (Parte III), PSL(2,R)

El objetivo de este post es conocer el grupo lineal proyectivo real PSL(2,\mathbb{R}).

En el post (Nociones Básicas en Geometría Hiperbólica (Parte II)) definimos el grupo lineal especial SL(2,R) como las matrices cuadradas de 2\times 2, a coeficientes reales y determinante 1. Definimos la acción de este grupo sobre el plano de Poincaré dado por las homografías, es decir;

\begin{pmatrix}a&b\\c&d\end{pmatrix}\cdot z=\frac{az+b}{cz+d}.

Notemos que, sin embargo, existen dos tipos de matrices que tienen la misma imagen vía la acción. En efecto, si A=\begin{pmatrix}a&b\\c&d\end{pmatrix} entonces

(-A)\cdot z=\frac{-az-b}{-cz-d}=\frac{az+b}{cz+d}.

Luego, definimos PSL(2,\mathbb{R})=SL(2,\mathbb{R})/\sim donde A\sim B si y sólo si B=-A o B=A.

Por simplicidad de notación, de ahora en adelante, seguiremos escribiendo A\cdot z a la acción de PSL(2,\mathbb{R}) sobre \mathbb{H}, cuando en estricto rigor debieramos escribir (\pm A)\cdot z

Con lo anterior en mente, necesitamos establecer distintos tipos de elementos en este grupo. Por asuntos de nuestro estudio, salvo conjugación, existen 3 en esencia. Si A\neq Id (donde Id representa la identidad en PSL(2,\mathbb{R}))

Notemos que A\cdot z=z es equivalente a resolver \frac{az+b}{cz+d}=z.

  • Caso 1: Si c=0 entonces la ecuación se transforma en \frac{a}{d}z+\frac{b}{d}=z (y la ecuación siempre se satisface en infinito).  Para \frac{a}{d}\neq 1 (notar que ad=1) entonces a^{2}\neq 1. Además |tr(A)|=|a+\frac{1}{a}|\geq 2, por lo que la ecuación tiene sólo una solución (o punto fijo) en \partial\mathbb{H} si y solamente si |tr(A)|>2
  • Caso 2: Si c\neq 0 entonces la ecuación se escribe como cz^{2}+(d-a)z-b=0 y la cantidad de soluciones depende del discriminante. Notar que su discriminante es |tr(A)|^{2}-4. Si |tr(A)|<2 entonces la ecuación tiene dos soluciones complejas conjugadas (una en \mathbb{H}), si |tr(A)|=2 entonces la solución es única y se encuentra en \partial\mathbb{H}. Finalmente si |tr(A)|>2 existen exactamente dos soluciones en la frontera.

En resumen, un elemento de PSL(2,\mathbb{R}) no puede fijar mas de 2 puntos, de hacerlo entonces el elemento del grupo debe ser la identidad.


Definición
: Sea A\in PSL(2,\mathbb{R}). Decimos que A es un elemento Elíptico si |tr(A)|<2, en tal caso, A fija un solo punto en \mathbb{H}. Decimos que A es un elemento Parabólico si |tr(A)|<2, en tal caso A fija un solo punto en \partial\mathbb{H} (ojo, en este caso consideramos en la frontera a infinito). Finalmente decimos que A es Hiperbólico si |tr(A)|>2, o equivalentemente, si A fija exactamente dos puntos en la frontera de \mathbb{H}.


Observacione
s: Si A es parabólico, entonces el punto fijo es atractor. Si A es hiperbólico entonces un punto fijo es atractor y otro es repulsor.

Recordemos que dos elementos g,g' en un grupo se dicen conjugados si existe h otro elemento del grupo tal que g'=hgh^{-1}. Por otra parte, sabemos que SL(2,\mathbb{R}) actúa de manera transitiva en \mathbb{H}. Esta propiedad naturalmente se mantiene en la acción de PSL(2,\mathbb{R})

  • Si A elíptico, luego de conjugar, podemos suponer que A fija a i\in\mathbb{H}. Resolviendo le ecuación del punto fijo nos queda (d-a)i-c-d=0 por lo que a=d y b=-c. Como el determinante de la matriz es 1, entonces a^{2}+b^{2}=1. Con esto se concluye que existe \theta\in\mathbb{R} tal que 

A=\begin{pmatrix}\cos(\theta)&-\sin(\theta)\\\sin(\theta)&\cos(\theta)\end{pmatrix}

  • Si A es parabólico, podemos suponer (salvo conjugación) que A fija al infinito. Luego existe c\neq 0 tal que  

A=\begin{pmatrix}1& c\\ 0 &1\end{pmatrix}

  • Si A es hiperbólico, podemos suponer (salvo conjugación) que A fija 0 y \infty. Luego es posible encontrar \lambda>0 tal que 

A=\begin{pmatrix}\lambda &0 \\ 0&\frac{1}{\lambda}\end{pmatrix}

Notar que en el último caso, por conjugación por \begin{pmatrix}0&-1\\1&0\end{pmatrix} podemos suponer \lambda>1. Recordemos también que, de acuerdo a la métrica Riemanniana sobre el plano hiperbólico, se tiene que i es enviado a \lambda^{2}i por A

Esto quiere decir, por la fórmula encontrada de distancia, que i es trasladada a distancia 2\ln(\lambda) por el eje imaginario. Como la acción es por isometrías, todo punto en el semiplano es trasladada a distancia 2\ln(\lambda) (en cualquier dirección, no necesariamente vertical). Definimos entonces L_{A}=2\ln(\lambda) como la distancia de desplazamiento de A. Esto quiere decir que un elemento hiperbólico arbitrario A es siempre conjugado a

\begin{pmatrix}e^{L_{A}/2}&{0}\\{0}&e^{-L_{A}/2}\end{pmatrix}.

Finalmente, si conjugamos por el elemento \begin{pmatrix}\frac{1}{\sqrt{2}}&-\frac{1}{\sqrt{2}}\\\frac{1}{\sqrt{2}}&\frac{1}{\sqrt{2}}\end{pmatrix} nos queda

\begin{pmatrix}\cosh(L_{A}/2)&\sinh(L_{A}/2)\\\sinh(L_{A}/2)&\cosh(L_{A}/2)\end{pmatrix}

y en tal caso el punto fijo atractivo es 1, y el repulsivo es -1.

Un problema estándar en variable compleja

Suponga que p(z)\in\mathbb{C}[z] tal que todas sus raíces se encuentran en el semiplano superior \mathbb{H}. Demuestre que las raíces de p'(z) también están en este semiplano.

Solución:

Suponga que p(z)=\sum_{i=0}^{n}a_{i}z^{i} y que las raices son \{z_{1},...,z_{n}\} (pudiendo éstas repetirse). Entonces

p(z)=a_{n}\prod_{i=1}^{n}(z-z_{i}).

Si derivamos p(z) nos queda  p'(z)=a_{n}\sum_{i=1}^{n}\prod_{k\neq i}(z-z_{i}) por lo que

\frac{p'(z)}{p(z)}=\sum_{i=1}^{n}\frac{1}{z-z_{i}}=\sum_{i=1}^{n}\frac{\bar{z}-\bar{z_{i}}}{|z-z_{i}|^{2}}.

Por otro lado, si w=a+ib es raiz de p'(z) en el semiplano inferior (incluyendo el eje real), entonces \frac{p'(z)}{p(z)} esta bien definida en w y satisface

\frac{p'(w)}{p(w)}=0

Escribiendo z_{k}=u_{k}+iv_{k}, lo anterior se reduce a

\sum_{k=1}^{n}\frac{(a-u_{k})+i(v_{k}-b)}{|w-z_{k}|^{2}}=0

Pero cada número complejo en la suma anterior pertenece al semiplano superior pues v_{k}>0 para todo k y b\leq 0 por lo que -b\geq 0. Esta es una contradicción pues la suma de complejos con parte imaginaria estrictamente positiva no puede ser nula. Esta contradicción viene del suponer que una raíz de p'(z) tiene parte imaginaria no positiva, y por lo tanto, todas las raíces de p'(z) deben pertenecer al semiplano superior.