Transformaciones inducidas por Intercambio de Intervalos

Las transformaciones definidas a partir de intercambios de intervalos son un ejemplo clave en sistemas dinámicos. En efecto, Arnoux, Ornstein y Weiss mostraron que todo sistema dinámico mesurable aperiódico es realizado (es decir, isomorfo en medida) a una de esas transformaciones. La definición exacta de tales sistemas es algo compleja, por lo que el objetivo primordial de este post es dar una idea de la construcción a partir de un ejemplo sencillo. Finalmente se darán algunos resultados mas específicos en un contexto puramente formal.

  • Comenzaremos con el intervalo I=[0,1) y lo pensaremos como una columna consistente de una sola linea horizontal. La transformación en este nivel será definida como la aplicación identidad.
  • En el siguiente paso consideramos dos subintervalos [0,1/2)[1/2,0), los imaginaremos como una sola columna consistente en dos lineas horizontales, una sobre otra. Pensemos que cortamos la columna del paso uno en la mitad y colocamos la segunda mitad sobre la primera. Esta nueva columna esta dotada de una aplicación natural, la cual lleva un elemento de la primera línea en su valor correspondiente en la segunda, y la última linea es llevada en su valor correspondiente en la primera. Debemos imaginar que estamos intercambiando posiciones de intervalos de largo 1/2.
  • En el tercer paso, cortamos la nueva columna a la mitad, lo que nos deja dos columnas, la primera consistiendo de los intervalos [0,1/4), [1/2,3/4) y la segunda consistiendo de los intervalos [1/4,1/2), [3/4,1). Colocamos la segunda columna sobre la primera, y obtenemos una nueva columna de ancho 1/4, y una aplicacion natural descrita como antes; es decir,

[0,1/4)\rightarrow [1/2,3/4)\rightarrow [1/4,1/2)\rightarrow [3/4,1)\rightarrow [0,1/4)

  • De manera más general, repetimos este proceso una cantidad infinita de veces de manera inductiva (siempre cortar a la mitad una columna, separar en dos, poner una sobre la otra y concluir definiendo la aplicación que lleva una línea en la superior, salvo por la última que regresa a la primera). La aplicación natural en cada iteración representa nada más que un intercambio de intervalos de igual medida (medida que es cada vez más y más pequeña, tendiendo a cero).
  • Si escribimos T_{n} la aplicación inducida en el intervalo [0,1) descrita en el n-ésimo paso, entonces podemos definir la aplicación T:[0,1)->[0,1) como el límite puntual de las aplicaciones T_{n}. Más específicamente, sea x\not\in\{p/2^{k}, k\in\mathbb{N}, 0\leq p\leq 2^{k}\}, entonces, para n suficientemente grande, x\not\in [1-1/2^{n},1) y por lo tanto T(x) está bien definida por T(x)=T_{n}(x).

dib1

dib2

La aplicación T_{n} es una isometría por tramos. En efecto, ella está constituida por traslaciones de intervalos de longitud 1/2^{n}. De esta forma, la medida de Lebesgue en el intervalo unitario permite hablar de una transformación que preserva la medida de Lebesgue. La aplicación T deviene entonces en una transformación que preserva la medida de Lebesgue definida para todo punto del intervalo, salvo por un conjunto de medida nula (precisamente numerable). Formalmente obtenemos

dib3
El siguiente teorema proviene del artículo «An entropy estimate for infinite interval exchange transformations» del autor Frank Blume.

Teorema 1. Si la entropía de la partición formada por los intervalos que definen T es finita, entonces la entropía de la transformación es nula.

En nuestro ejemplo, la partición está definida por I_{0}=[0,1/2) y I_{n}=[1-(1/2)^{n},1-(1/2)^{n+1}). Un cálculo sencillo nos dice que su entropía -\sum_{n=0}^{\infty}m(I_{n})\log m(I_{n}) es igual a 2\log(2), por lo que la entropía de T es nula.

Uno está tentado a pensar que una transformación inducida por estos intercambios de intervalos deben ser de entropía nula en todos los casos (traslaciones en general tienen una dinámica lineal, por lo que su entropía es nula). Esto se encuentra bastante lejos de ser cierto. El teorema nombrado en un comienzo, y formalizado en el párrafo siguiente, nos da una gama gigante de tales transformaciones cuya entropía puede ser incluso infinita.

Teorema 2. Toda transformación aperiódica que preserva cierta medida de probabilidad es isomorfa a una transformación de intercambio de intervalos T:[0,1)\rightarrow[0,1) del tipo siguiente

  1. Subintervalos I_{1}, I_{2},... dados por I_{j}=(t_{j-1},t_{j}), con 0=t_{0}<t_{1}<t_{2}<...<\lim_{j}t_{j}=1;
  2. existen constantes reales \{a_{j}\} tales que para x\in I_{j}, T(x)=x+a_{j};
  3. el único punto de acumulación de \{t_{j-1}+a_{j}\}\cup\{t_{j}+a_{j}\} es 1;
  4. T es inyectiva.

 

Nociones Básicas en Geometría Hiperbólica (Parte III), PSL(2,R)

El objetivo de este post es conocer el grupo lineal proyectivo real PSL(2,\mathbb{R}).

En el post (Nociones Básicas en Geometría Hiperbólica (Parte II)) definimos el grupo lineal especial SL(2,R) como las matrices cuadradas de 2\times 2, a coeficientes reales y determinante 1. Definimos la acción de este grupo sobre el plano de Poincaré dado por las homografías, es decir;

\begin{pmatrix}a&b\\c&d\end{pmatrix}\cdot z=\frac{az+b}{cz+d}.

Notemos que, sin embargo, existen dos tipos de matrices que tienen la misma imagen vía la acción. En efecto, si A=\begin{pmatrix}a&b\\c&d\end{pmatrix} entonces

(-A)\cdot z=\frac{-az-b}{-cz-d}=\frac{az+b}{cz+d}.

Luego, definimos PSL(2,\mathbb{R})=SL(2,\mathbb{R})/\sim donde A\sim B si y sólo si B=-A o B=A.

Por simplicidad de notación, de ahora en adelante, seguiremos escribiendo A\cdot z a la acción de PSL(2,\mathbb{R}) sobre \mathbb{H}, cuando en estricto rigor debieramos escribir (\pm A)\cdot z

Con lo anterior en mente, necesitamos establecer distintos tipos de elementos en este grupo. Por asuntos de nuestro estudio, salvo conjugación, existen 3 en esencia. Si A\neq Id (donde Id representa la identidad en PSL(2,\mathbb{R}))

Notemos que A\cdot z=z es equivalente a resolver \frac{az+b}{cz+d}=z.

  • Caso 1: Si c=0 entonces la ecuación se transforma en \frac{a}{d}z+\frac{b}{d}=z (y la ecuación siempre se satisface en infinito).  Para \frac{a}{d}\neq 1 (notar que ad=1) entonces a^{2}\neq 1. Además |tr(A)|=|a+\frac{1}{a}|\geq 2, por lo que la ecuación tiene sólo una solución (o punto fijo) en \partial\mathbb{H} si y solamente si |tr(A)|>2
  • Caso 2: Si c\neq 0 entonces la ecuación se escribe como cz^{2}+(d-a)z-b=0 y la cantidad de soluciones depende del discriminante. Notar que su discriminante es |tr(A)|^{2}-4. Si |tr(A)|<2 entonces la ecuación tiene dos soluciones complejas conjugadas (una en \mathbb{H}), si |tr(A)|=2 entonces la solución es única y se encuentra en \partial\mathbb{H}. Finalmente si |tr(A)|>2 existen exactamente dos soluciones en la frontera.

En resumen, un elemento de PSL(2,\mathbb{R}) no puede fijar mas de 2 puntos, de hacerlo entonces el elemento del grupo debe ser la identidad.


Definición
: Sea A\in PSL(2,\mathbb{R}). Decimos que A es un elemento Elíptico si |tr(A)|<2, en tal caso, A fija un solo punto en \mathbb{H}. Decimos que A es un elemento Parabólico si |tr(A)|<2, en tal caso A fija un solo punto en \partial\mathbb{H} (ojo, en este caso consideramos en la frontera a infinito). Finalmente decimos que A es Hiperbólico si |tr(A)|>2, o equivalentemente, si A fija exactamente dos puntos en la frontera de \mathbb{H}.


Observacione
s: Si A es parabólico, entonces el punto fijo es atractor. Si A es hiperbólico entonces un punto fijo es atractor y otro es repulsor.

Recordemos que dos elementos g,g' en un grupo se dicen conjugados si existe h otro elemento del grupo tal que g'=hgh^{-1}. Por otra parte, sabemos que SL(2,\mathbb{R}) actúa de manera transitiva en \mathbb{H}. Esta propiedad naturalmente se mantiene en la acción de PSL(2,\mathbb{R})

  • Si A elíptico, luego de conjugar, podemos suponer que A fija a i\in\mathbb{H}. Resolviendo le ecuación del punto fijo nos queda (d-a)i-c-d=0 por lo que a=d y b=-c. Como el determinante de la matriz es 1, entonces a^{2}+b^{2}=1. Con esto se concluye que existe \theta\in\mathbb{R} tal que 

A=\begin{pmatrix}\cos(\theta)&-\sin(\theta)\\\sin(\theta)&\cos(\theta)\end{pmatrix}

  • Si A es parabólico, podemos suponer (salvo conjugación) que A fija al infinito. Luego existe c\neq 0 tal que  

A=\begin{pmatrix}1& c\\ 0 &1\end{pmatrix}

  • Si A es hiperbólico, podemos suponer (salvo conjugación) que A fija 0 y \infty. Luego es posible encontrar \lambda>0 tal que 

A=\begin{pmatrix}\lambda &0 \\ 0&\frac{1}{\lambda}\end{pmatrix}

Notar que en el último caso, por conjugación por \begin{pmatrix}0&-1\\1&0\end{pmatrix} podemos suponer \lambda>1. Recordemos también que, de acuerdo a la métrica Riemanniana sobre el plano hiperbólico, se tiene que i es enviado a \lambda^{2}i por A

Esto quiere decir, por la fórmula encontrada de distancia, que i es trasladada a distancia 2\ln(\lambda) por el eje imaginario. Como la acción es por isometrías, todo punto en el semiplano es trasladada a distancia 2\ln(\lambda) (en cualquier dirección, no necesariamente vertical). Definimos entonces L_{A}=2\ln(\lambda) como la distancia de desplazamiento de A. Esto quiere decir que un elemento hiperbólico arbitrario A es siempre conjugado a

\begin{pmatrix}e^{L_{A}/2}&{0}\\{0}&e^{-L_{A}/2}\end{pmatrix}.

Finalmente, si conjugamos por el elemento \begin{pmatrix}\frac{1}{\sqrt{2}}&-\frac{1}{\sqrt{2}}\\\frac{1}{\sqrt{2}}&\frac{1}{\sqrt{2}}\end{pmatrix} nos queda

\begin{pmatrix}\cosh(L_{A}/2)&\sinh(L_{A}/2)\\\sinh(L_{A}/2)&\cosh(L_{A}/2)\end{pmatrix}

y en tal caso el punto fijo atractivo es 1, y el repulsivo es -1.

Shift Unilateral

Sea A un conjunto finito de cardinal p\geq 2 (también llamado alfabeto). Denotamos por X=A^{\mathbb{N}} al conjunto de sucesiones de A. Es decir

X=\{(x_{n})_{n\geq 0}|x_{n}\in A\textmd{ },\textmd{ }\forall n\geq 0\}

Para x,y\in X definimos N(x,y) como el primer entero no negativo tal que x_{n}\neq y_{n}. Fijamos \alpha\in(0,1) y definimos para cada par x,y\in X

d(x,y)=\alpha^{N(x,y)} si x\neq y

d(x,y)=0 si x=y

Entonces (X,d) es un espacio métrico. En efecto, es claro que N(x,y)=N(y,x) para todo para x,y\in X, por lo que d es simétrica. Ademas d(x,y)\geq 0 y la igualdad se alcanza solo para x=y. Basta mostrar la desigualdad triangular. Pero notemos que, si x,y,z\in X y N(x,z)\leq N(z,y), entonces para todo 0\leq n\leq N(x,z) se tiene x_{n}=z_{n}=y_{n} y por lo tanto N(x,y)\geq N(x,z) por lo que d(x,y)\leq d(x,z) y claramente d(x,y)\leq d(x,z)+d(z,y). Analogamente podemos mostrar que se tiene lo mismo en el caso N(z,y)\leq N(x,z) y por lo tanto se concluye la desigualdad triangular.

Ya que (X,d) es un espacio métrico, la distancia define una topología. Nos gustaría conocer mas a fondo nuestros abiertos de la base. Para esto consideremos w=(w_{0},...,w_{m-1}) una palabra de largo m y un entero n_{0}\geq 0. Definimos un cilindro con base w en n_{0} como

C_{w}^{n_{0}}=\{x=(x_{n})_{n\geq 0}\in X\textmd{ }|\textmd{ }x_{n+n_{0}}=w_{n}\textmd{ para todo }n\in\{0,...,m-1\}\}

es decir, el conjunto de todas las palabras que contienen la palabra w empezando en la posición n_{0}.

Proposición: Los abiertos de (X,d) son uniones de cilindros.

Demostración:

De partida, todo cilindro es abierto pues para N=n_{0}+m-1 se tiene

x\in C_{w}^{n_{0}} y N(x,y)>N implica y\in C_{w}^{n_{0}}

por lo que B(x,\alpha^{N})\subset C_{w}^{n_{0}}.

Recíprocamente, para cada x\in X, N\geq 0, se satisface B(x,\alpha^{N})=C_{w}^{0} para w=\{x_{0},...,x_{N}\}.

\blacksquare

Observaciones:

  • Notar que (x^{m})_{m\geq 0} converge a x si para cada N>0 existe M\geq 0 tal que x_{n}^{m}=x_{n} para n\leq N y m\geq M.
  • Los cilindros son numerables y forman una base para la topología, esto implica que X es separable.
  • La primera observación implica que los cilindros son cerrados, asi X es un espacio totalmente discontinuo (los únicos subconjuntos conexos son los singleton).
  • X no tiene puntos aislados.

Las observaciones anteriores permiten mostrar un resultado bastante curioso para este tipo de conjuntos si lograsemos mostrar que X es compacto. X es un conjunto de cantor.


Teorema
: Los espacios topológicos compactos, totalmente discontinuos y sin puntos aislados son homeomorfos entre si. Estos se llaman Conjuntos de Cantor.

No daremos una demostración de lo anterior, pero si de lo siguiente…

Proposición: X es compacto

Demostración 1:

Por las observaciones es posible probar que la topología en X es la topología producto, para el producto numerable A^{\mathbb{N}}. Basta considerar la topología discreta en A (lo que hace que A sea compacto) y notar que los cilindros son justamente los abiertos basales definidos por la topología producto. El teorema de Tychonov (producto arbitrario de conjuntos compactos es compacto) concluye el teorema.

Demostración 2:

Consideremos (x^{m})_{m\geq 0} una sucesión de elementos en X. Mostrar la compacidad es justamente encontrar una subsucesión convergente en X. Como el alfabeto A es finito y nuestra sucesión es infinita, existe x_{0} y una función de índices estrictamente creciente \phi_{0}:\mathbb{N}\rightarrow\mathbb{N} tal que x_{0}^{\phi_{0}(m)}=x_{0} para cada m\geq 0. Así mismo, existe x_{1} y una función \phi_{1}:\mathbb{N}\rightarrow\mathbb{N} tal que x_{1}^{\phi_{0}\circ\phi_{1}(m)}=x_{1} para cada m\geq 0. Recursivamente entonces, existe una sucesión x=(x_{n})_{n\geq 0} y una sucesión de funciones \phi_{n}:\mathbb{N}\rightarrow\mathbb{N} tal que x_{n}^{\phi_{0}\circ\phi_{1}\circ...\circ\phi_{n}(m)}=x_{n} para todo m\geq 0. Consideramos entonces la función \phi:m\mapsto\phi_{0}\circ\phi_{1}\circ...\circ\phi_{m}(m) la cual es estrictamente creciente y satisface (x^{\phi(m)})_{m\geq 0} converge a x.

\blacksquare

Finalmente definimos el Shift


Proposición
: La aplicación \sigma:X\rightarrow X definida por (x_{n})_{n\geq 0}\mapsto(x_{n+1})_{n\geq 0} es continua. Uno la llama el Shift unilateral.

Demostración:

Notar que si x,y\in X y N(x,y)\geq N entonces N(\sigma(x),\sigma(y))\geq N-1. Sea \varepsilon>0 y consideremos N\in\mathbb{N} tal que \alpha^{N-1}<\varepsilon. Basta escoger \delta=\alpha^{N} y se tiene la continuidad.

\blacksquare