You are currently browsing the category archive for the ‘math.AN’ category.

   Hace unos días veía un comentario preguntando sobre el error en un argumento donde se suponía que

\displaystyle  a/b = 6/4,

entonces

\displaystyle  4a = 6b.

Realizando la transformación

\displaystyle  14a-10a = 21b-15b.

Transponiendo términos

\displaystyle  15b-10a = 21b-14a.

Sacando un factor común

\displaystyle  5(3b-2a) = 7(3b-2a).

Simplificando el factor {(3b-2a)}, resulta {5=7}, lo que claramente es falso.

   Hay una cierta satisfacción filosófica en saber por qué las cosas funcionan, pero una persona pragmática puede argüir que uno solamente necesita saber cómo funcionan las cosas para resolver problemas de la vida real. La formación matemática que uno recibe en clases introductorias es sin duda el adecuado para que comience solucionando muchos problemas en física, química, biología, economía, ciencias de la computación, finanzas, ingeniería, o cualquier otra actividad que termine haciendo —y que sin duda puede aplicar cosas como la regla de la cadena, la regla de L’Hôspital, o la integración por partes, sin saber porqué funcionan estas reglas, o si existe alguna excepción a dichas reglas. Sin embargo, uno puede meterse en problemas si se aplican las reglas sin conocer de dónde vienen y cuáles son los límites de su aplicabilidad. Déjenme dar algunos ejemplos en los cuales muchas de estas reglas familiares, si son aplicadas a ciegas, sin un conocimiento del análisis subyacente, pueden conducir al desastre.

Ejemplo 1 (División por cero). Esto le debe resultar muy familiar: la ley de cancelación {ac = bc \implies a = b} no funciona cuando {c = 0}. Por ejemplo, la identidad {1 \times 0 = 2 \times 0} es cierta, pero si uno cancela ciegamente el {0}, entonces obtiene {1 = 2}, lo cual es falso. En este caso fue obvio que se dividió por cero; pero otros casos puede estar más oculto.

Ejemplo 2 (Series divergentes). Probablemente ha visto series geométricas como la de la suma infinita

\displaystyle  S = 1 + \frac{1}{2} + \frac{1}{4} + \frac{1}{8} + \frac{1}{16} + \cdots

Probablemente ha visto el siguiente truco para sumar estar series: si llamamos a la suma anterior {S}, entonces si multiplicamos ambos lados por {2}, obtenemos

\displaystyle  2S = 2 + 1 + \frac{1}{2} + \frac{1}{4} + \frac{1}{8} + \frac{1}{16} + \cdots = 2 + S

y, por lo tanto, {S = 2}, así la serie suma {2}. Sin embargo, si aplica el mismo truco para la serie

\displaystyle  S = 1 + 2 + 4 + 8 + 16 + \cdots

uno obtiene un resultado sin sentido:

\displaystyle  2S = 2 + 4 + 8 + 16 + \cdots = S - 1 \implies S = -1.

Así, el mismo razonamiento que muestra que {1 + \frac{1}{2} + \frac{1}{4} + \frac{1}{8} + \frac{1}{16} + \cdots = 2}, también da que {1 + 2 + 4 + 8 + \cdots = -1}. ¿Por qué es cierta la primera ecuación, pero no la segunda? Un ejemplo similar surge con la serie

\displaystyle  S = 1 - 1 + 1 - 1 + 1 - 1 + \cdots;

podemos escribir

\displaystyle  S = 1 + (1 - 1 + 1 - 1 + \cdots) = 1 - S

y, por lo tanto, que {S = 1/2}; o, en su lugar, podemos escribir

\displaystyle  S = (1 - 1) + (1 - 1) + (1 - 1) + \cdots = 0 + 0 + \cdots

y, por lo tanto, que {S = 0}; o, en su lugar, podemos escribir

\displaystyle  S = 1 + (-1 + 1) + (-1 + 1) + \dotsb = 1 + 0 + 0 + \dotsb

y, por lo tanto, que {S = 1}. ¿Cuál es la correcta?

Ejemplo 3 (Secuencias divergentes). Aquí hay una pequeña variación del ejemplo anterior. Sea {x} un número real, y sea {L} el límite

\displaystyle  L = \lim_{n \rightarrow \infty} x^n.

Cambiando las variables {n = m + 1}, tenemos

\displaystyle  L = \lim_{m+1 \rightarrow \infty} x^{m+1} = \lim_{m+1 \rightarrow \infty} x \times x^m = x \lim_{m+1 \rightarrow \infty} x^m.

Pero si {m + 1 \rightarrow \infty}, entonces {m \rightarrow \infty}, por lo tanto

\displaystyle  \lim_{m+1 \rightarrow \infty} x^m = \lim_{m \rightarrow \infty} x^m = = \lim_{n \rightarrow \infty} x^n = L,

y así

\displaystyle  xL = L.

En este punto podríamos cancelar las {L}‘s y concluir que {x = 1} para un número real arbitrario {x}, lo que es absurdo. Pero ya que estamos conscientes del problema de la división por cero, podríamos ser un poco más inteligentes y concluir en su lugar que {x = 1} o { L = 0}. En particular, parece que hemos demostrado que

\displaystyle  \lim_{n \rightarrow \infty} x^n = 0 \text{ para todo } x \ne 1.

Pero esta conclusión es absurda si lo aplicamos a ciertos valores de {x}, por ejemplo, para el caso {x = 2} podríamos concluir que la secuencia {1, 2, 4, 8, \dotso} converge a cero, y para el caso {x = -1} podríamos concluir que la secuencia {1, -1, 1, -1, \dotso} también converge a cero. Estas conclusiones parecen ser absurdas; ¿cuál es el problema con el argumento anterior?

Ejemplo 4 (Valores límite de funciones). Se empieza por la expresión {\lim_{x \rightarrow \infty} \sin(x)}, se hace el cambio de variable {x = y + \pi} y recordando que {\sin(y + \pi) = -\sin(y)} para obtener

\displaystyle  \lim_{x \rightarrow \infty} \sin(x) = \lim_{y+\pi \rightarrow \infty} \sin(y + \pi) = \lim_{y \rightarrow \infty} (-\sin(y)) = -\lim_{y \rightarrow \infty} \sin(y).

Ya que {\lim_{x \rightarrow \infty} \sin(x) = \lim_{y \rightarrow \infty} \sin(y)} tenemos así que

\displaystyle  \lim_{x \rightarrow \infty} \sin(x) = -\lim_{x \rightarrow \infty} \sin(x)

y por lo tanto

\displaystyle  \lim_{x \rightarrow \infty} \sin(x) = 0.

Si hacemos entonces el cambio de variables {x = \pi/2 - z} y recordamos que {\sin(\pi/2 - z) = \cos(z)} concluimos que

\displaystyle  \lim_{x \rightarrow \infty} \cos(x) = 0.

Elevando al cuadrado ambos límites y sumándolos, vemos que

\displaystyle  \lim_{x \rightarrow \infty} (\sin^2(x) + \cos^2(x)) = 0^2 + 0^2 = 0.

Por otro lado, tenemos {\sin^2(x) + \cos^2(x) = 1} para todo {x}. Así, hemos demostrado que ¡{1 = 0}! ¿Cuál es la dificultad aquí?

Ejemplo 5 (Intercambiando sumas). Consideremos el siguiente hecho aritmético. Consideremos cualquier matriz de números, e.g.,

\displaystyle  \left({\begin{array}{ccc} 1 & 2 & 3 \\ 4 & 5 & 6 \\ 7 & 8 & 9 \end{array}}\right)

y calculemos la sumas de todas las filas y las sumas de todas las columnas , y entonces el total de las sumas de las filas y el total de las sumas de las columnas. En ambos casos obtendrá el mismo número —la suma total de todas las entradas en las matriz:

\displaystyle  \begin{array}{c@{ }c} \left(\begin{array}{ccc} \phantom{0}1 & \phantom{0}2 & \phantom{0}3 \\ \phantom{0}4 & \phantom{0}5 & \phantom{0}6 \\ \phantom{0}7 & \phantom{0}8 & \phantom{0}9 \end{array}\right) & \begin{array}{l}\phantom{0}6 \\ 15 \\ 24\end{array} \\ \begin{array}{ccc}12 & 15 & 18\end{array} & \begin{array}{l}45\end{array} \end{array}

Para ponerlo de otro modo, si desea sumar todas los elementos en una matriz {m \times n}, no importa si se suma las filas primero o las columnas primero, acabará con la misma respuesta. (Antes de la invención de las computadoras, los contadores usarían este hecho para evitar cometer errores al balancear sus libros.) En notación de serie, este hecho podría ser expresado como

\displaystyle  \sum_{i=1}^m \sum_{j=1}^n a_{ij} = \sum_{j=1}^n \sum_{i=1}^m a_{ij},

si {a_{ij}} denota el elemento de la {i}-ésima fila y {j}-ésima columna de la matriz.

   Ahora, uno puede pensar que esta regla debe extenderse fácilmente para series infinitas:

\displaystyle  \sum_{i=1}^\infty \sum_{j=1}^\infty a_{ij} = \sum_{j=1}^\infty \sum_{i=1}^\infty a_{ij},

En efecto, si usa series infinitas mucho en su trabajo, encontrará que intercambiar las sumas como estas es muy frecuentes. Otra manear de expresar este hecho es que en una matriz infinita, las sumas totales por filas debería ser igual a las sumas totales por columnas. Sin embargo, a pesar de lo razonable de esta afirmación, !es en realidad falsa! Aquí un contra ejemplo:

\displaystyle  \left({\begin{array}{rrrrr} 1 & 0 & 0 & 0 & \dotsb \\ -1 & 1 & 0 & 0 & \dotsb \\ 0 & -1 & 1 & 0 & \dotsb \\ 0 & 0 & -1 & 1 & \dotsb \\ 0 & 0 & 0 & -1 & \dotsb \\ \vdots & \vdots & \vdots & \vdots & \ddots \end{array}}\right)

Si suma todas las filas, y luego suma el total de las filas, obtiene {1}; pero si suma todas las columna, y luego suma el total de las columnas, obtiene ¡{0}! Así, ¿esto significa que las sumas para series infinitas no deben ser intercambiadas, y que se debería desconfiar de cualquier argumento que use un intercambio?

Ejemplo 6 (Intercambiando integrales). El intercambio de integrales es un truco que ocurre en matemáticas tan comúnmente como el intercambio de sumas. Suponiendo que uno quiere calcular el volumen bajo una superficie {x = f(x,y)} (ignoramos los límites de integración por el momento). Uno puede hacerlo mediante el corte paralelo al eje {x}: por cada valor fijo de {y}, se puede calcular el área {\int f(x,y) \,dx}, y entonces integramos el área en la variable {y} para obtener el volumen

\displaystyle  V = \int\int f(x,y) dx dy.

O podría cortar paralelo al eje {y} para cada {x} fijo y calcular el área {\int f(x,y) \,dy}, y entonces integrar en el eje {x} para obtener

\displaystyle  V = \int\int f(x,y) dy dx.

Esto parece sugerir que uno siempre debe ser capaz de intercambiar los signos integrales:

\displaystyle  \int\int f(x,y) dx dy = \int\int f(x,y) dy dx.

Y en efecto, las personas cambian los signos integrales todo el tiempo, porque a veces una variable es más sencilla para integrar primero que la otra. Sin embargo, como en las sumas infinitas a veces no es posibles intercambiarlas, las integrales son también en ocasiones peligrosas para intercambiar. Un ejemplo se da con el integrando {e^{-xy} - xye^{-xy}}. Supongamos que creemos que podemos intercambiar las integrales:

\displaystyle  \int_0^\infty \int_0^1 (e^{-xy} - xye^{-xy}) \, dy \,dx = \int_0^1 \int_0^\infty (e^{-xy} - xye^{-xy}) \, dx \,dy.

Ya que

\displaystyle  \int_0^1 (e^{-xy} - xye^{-xy}) \, dy = ye^{-xy}|_{y=0}^{y=1} = e^{-x},

el lado izquierdo es {\int_0^\infty e^{-x} \, dx = -e^{-x}|_{0}^{\infty} = 1}. Pero, ya que

\displaystyle  \int_0^\infty (e^{-xy} - xye^{-xy}) \, dx = xe^{-xy}|_{x=0}^{x=\infty} = 0,

el lado derecho es {\int_0^1 0 \, dx = 0}. Sin duda, {1 \ne 0}, por lo que existe un error en algún lugar; pero no lo encontrará buscándolo dondequiera, excepto en el paso donde intercambiamos las integrales. Así que ¿cómo sabemos cuándo confiar en el intercambio de integrales?

Ejemplo 7 (Intercambiando límites). Supongamos que empezamos viendo convincentemente la expresión

\displaystyle   \lim_{x \rightarrow 0} \lim_{y \rightarrow 0} \frac{x^2}{x^2 + y^2} = \lim_{y \rightarrow 0} \lim_{x \rightarrow 0} \frac{x^2}{x^2 + y^2} \ \ \ \ \ (1)

Pero tenemos

\displaystyle  \lim_{y \rightarrow 0} \frac{x^2}{x^2 + y^2} = \frac{x^2}{x^2 + 0^2} = 1,

así, el lado izquierdo de (1) es {1}; por otro lado, tenemos

\displaystyle  \lim_{x \ to 0} \frac{x^2}{x^2 + y^2} = \frac{x^2}{x^2 + y^2} = 0,

así, el lado derecho de (1) es {0}. Ya que, evidentemente, {1} no es igual a {0}, esto sugiere que el intercambio de límites es poco fiable. Pero ¿existen otras circunstancias en las que el intercambio de límites es legítimo?

Ejemplo 8 (Intercambiando límites, otra vez). Consideremos ver convincentemente la expresión

\displaystyle  \lim_{x \rightarrow 1^-} \lim_{n \rightarrow \infty} x^n = \lim_{x \ to 1^-} \lim_{n \rightarrow \infty} x^n

donde la notación {x \rightarrow 1^-} significa que {x} se aproxima a {1} desde la izquierda. Cuando {x} es la izquierda de {1}, entonces {\lim_{n \rightarrow \infty} x^n = 0}, y por lo tanto, el lado izquierdo es cero. Pero, también tenemos que {\lim_{x \rightarrow 1^-} x^n = 1} para toda {n}, y por lo tanto, el lado derecho tiene límite {1}. ¿Esto demuestra que este tipo de intercambio de límites es siempre inseguro?

Ejemplo 9 (Intercambiando límites e integrales). Para cualquier número real {y}, tenemos

\displaystyle  \int_{-\infty}^\infty \frac{1}{1 + (x-y)^2} \,dx = \arctan(x - y)|_{x=-\infty}^\infty = \frac{\pi}{2} - \left({-\frac{\pi}{2}}\right) = \pi.

Tomando los límites como {y \rightarrow \infty}, deberíamos obtener

\displaystyle  \int_{-\infty}^\infty \lim_{y \rightarrow \infty} \frac{1}{1 + (x-y)^2} \,dx = \lim_{y \rightarrow \infty} \int_{-\infty}^\infty \frac{1}{1 + (x-y)^2} \,dx = \pi.

Pero, para cada {x}, tenemos {\lim_{y \rightarrow \infty} \frac{1}{1 + (x-y)^2} = 0}. Así, vemos que se ha concluido que {0 = \pi}. ¿Cuál es el con problema con el argumento anterior? ¿Uno debería abandonar la técnica (muy útil) de intercambiar límites e integrales?

Ejemplo 10 (Intercambiando límites y derivadas). Observe que si {\epsilon > 0}, entonces

\displaystyle  \frac{d}{dx} \left({\frac{x^3}{\epsilon^2 + x^2}}\right) = \frac{3x^2(\epsilon^2 + x^2) - 2x^4}{(\epsilon^2 + x^2)^2}

y, en particular, que

\displaystyle  \frac{d}{dx} \left({\frac{x^3}{\epsilon^2 + x^2}}\right)\Big|_{x=0} = 0.

Tomando límites como {\epsilon \rightarrow 0}, entonces uno puede esperar que

\displaystyle  \frac{d}{dx} \left({\frac{x^3}{0 + x^2}}\right)\Big|_{x=0} = 0.

Pero el lado derecho es {\frac{d}{dx} x = 1}. ¿Esto significa que siempre es ilegítimo intercambiar los límites y derivadas?

Ejemplo 11 (Intercambiando derivadas). Sea* {f(x,y)} la función {f(x,y) := \frac{xy^3}{x^2 + y^2}}. Un maniobra común en análisis es intercambiar las dos derivadas parciales; así, uno espera

\displaystyle  \frac{\partial^2 f}{\partial x \partial y} (0,0) = \frac{\partial^2 f}{\partial y \partial x} (0,0).

Pero, por la regla del cociente, tenemos

\displaystyle  \frac{\partial f}{\partial y} (x,y) = \frac{3xy^2}{x^2 + y^2} - \frac{2xy^4}{(x^2 + y^2)^2}

y, en particular

\displaystyle  \frac{\partial f}{\partial y} (x, 0) = \frac{0}{x^2} - \frac{0}{x^4} = 0.

Así

\displaystyle  \frac{\partial^2 f}{\partial x \partial y} (0,0) = 0.

Por otro lado, nuevamente, por la regla del cociente, tenemos

\displaystyle  \frac{\partial f}{\partial x} (x,y) = \frac{y^3}{x^2 + y^2} - \frac{2x^2y^3}{(x^2 + y^2)^2}

y, por lo tanto

\displaystyle  \frac{\partial f}{\partial x} (0,y) = \frac{y^3}{y^2} - \frac{0}{y^4} = y.

Así

\displaystyle  \frac{\partial^2 f}{\partial x \partial y} (0,0) = 1.

Ya que {1 \ne 0}, vemos que el intercambio de derivadas es poco fiable. Pero ¿hay otras circunstancias en las que el intercambio de derivadas es legítimo?

(Uno puede objetar que esta función no está definida en {(x,y) = (0,0)}, pero si establecemos {f(0,0) := (0.0)} entonces esta función se vuelve continua y diferenciable para todo {(x,y)}, y, de hecho, ambas derivadas parciales {\frac{\partial}{\partial x}, \frac{\partial}{\partial y}} ¡son continuas y diferenciables para todo {(x,y)}!)

Anuncios

   Usualmente en un primer cursor de Análisis se asume que hay un cuerpo ordenado con la propiedad de la mínima cota superior, para luego desarrollar la teoría de sucesiones y series. Así que nuestro objetivo es probar la existencia y la unicidad (hasta una noción de isomorfismo) de tales objetos.

— 1. Unicidad —

Definición 1. Un cuerpo ordenado es un cuerpo {K} con el orden total {\le} tal que

  1. {\forall x,y,z \in K : x \leq y \implies x+z \leq y+z} (Transitividad).
  2. {\forall x,y \in K : 0 \leq x \land 0 \leq y \implies 0 \leq xy} (Positividad del producto).

   Además, definimos la función valor absoluto {\vert\cdot\vert: K\rightarrow K} mediante

\displaystyle  \vert x \vert = \begin{cases} x & \text{cuando } 0 \leq x \\ -x & \text{en cualquier otro caso.} \end{cases}

Ejercicio 1. Hay una definición alternativa de un cuerpo ordenado: se dice que {K} es ordenado cuando hay un subconjunto {P} de {K}, llamado elementos positivos de {K}, tal que

  1. {K} es la unión disjunta de {P}, {-P} y {\lbrace0\rbrace}.
  2. {x,y \in P \implies x+y \in P} y {xy \in P}.

Formalizar la afirmación «Las dos definiciones de cuerpo ordenado son equivalentes» y probar dicha equivalencia.

   Notemos que podríamos establecer que la desigualdad en la Definición 1 sea estricta, ya que {x<y\lor x=y\iff x\leq y} nos permite pasar entre ordenamientos estrictos y no estrictos sin ninguna complicación.

Definición 2. Sean {K} y {L} cuerpos ordenados. Un orden-preservado ({f} preserva el orden significa que {x\leq y\implies f(x)\leq f(y)}) en un anillo homomórfico se dice que es un orden incrustado.

   Notar que cualquier incrustación debe ser inyectiva, pues el núcleo de un anillo homomórfico es un ideal y {0<1}.

Proposición 3. Si {K} es un cuerpo ordenado, entonces {K} tiene un subcuerpo isomórfico a {\mathbb Q}.

Ejercicio 2. Probar la Proposición 3 mostrando que {\varphi\colon\mathbb N\rightarrow K} definido por

\displaystyle  \varphi(n) = \underbrace{1+\dotsb+1}_{n \text{ } 1\text{s}}

extiende a una incrustación de {\mathbb Q} en {K}.

Definición 4. Un cuerpo ordenado {K} es un cuerpo arquimediano cuando, para todo {x} en {K} distinto de cero, hay un número natural {n} tal que {n|x|>1}, o equivalentemente: hay un número natural {n} tal que {n>|x|}.

Proposición 5. Sea {K} un cuerpo ordenado. Si {K} tiene la propiedad de la mínima cota superior, entonces {K} es arquimediano.

Ejercicio 3. Mostrar que el contrapositivo de la Proposición 5 considerando el conjunto

\displaystyle  I = \lbrace x\in K \;\vert\; 0<x\land\forall n\in\mathbb N: nx<1\rbrace.

Mostrar que {I} no es vacío, {1} es una cota superior para {I} e {I} no tiene mínima cota superior. [Sugerencia: asumir que {y} es la mínima cota superior y dividir en dos casos: (i) para {y\in I} y considerar {2y}, y (ii) para {y\notin I} considerar {y/2}.]

   Abusando un poco del lenguaje, los elementos de {I} puede llamarse infinitamente pequeños. Para un ejemplo de un cuerpo ordenado que no es arquimediano, considerar {\mathbb Q(X)}, el conjunto de las funciones racionales en una variable sobre {\mathbb Q} (ver algunos ejemplos de cuerpos que tienen un orden definido) donde {0<\frac1X<q} para todos los racionales positivos {q}.

   Ahora, vamos a considerar el orden topológico en un cuerpo ordenado y arquimediano, es decir, la topología generada por los intervalos abiertos {(a,b)} definidos de la maneara usual.

Ejercicio 4. Mostrar que los intervalos abiertos en un cuerpo ordenado {K} forman una base para una topología en {K}.

Proposición 6. Se tiene que {\mathbb Q} es denso en cualquier cuerpo arquimediano field {K}.

Demostración. (Esquema) Ya que los intervalos abiertos son una base, sólo se necesita verificar que cualquier intervalo abierto contiene un racional. Definamos la función techo {\lceil\cdot\rceil\colon K\rightarrow\mathbb Z} mediante

\displaystyle  \lceil x\rceil=\min\lbrace n\in\mathbb Z\;\vert\; n\geq x\rbrace,

que está bien definida ya que {K} es arquimediano.

   Ahora, sean {x\in K} y un {K\owns\varepsilon>0}. Ya que {K} es arquimediano, podemos hallar un {n\in\mathbb N} tal que {n\varepsilon>1}. Ahora tenemos:

\displaystyle  0\leq\left\lvert\frac{\lceil nx\rceil}{n}-x\right\rvert \leq\left\lvert\frac{\lceil nx\rceil-nx}{n}\right\rvert \leq\frac1n<\varepsilon.

Por lo tanto, tenemos {\frac{\lceil nx \rceil}{n}\in(x-\varepsilon,x+\varepsilon)} de lo que el resultado se cumple. \Box

Corolario 7. Se tiene que {\mathbb Q} es densamente ordenado en cualquier cuerpo arquimediano, i.e, cuando {K} es arquimediano, {x,y\in K} y {x<y}, hay un {q\in\mathbb Q} tal que {x<q<y}.

Proposición 8. Cualquier cuerpo arquimediano es 2do-numerable.

Ejercicio 5. Probar la Proposición 8. [Sugerencia: considerar el conjunto de los intervalos con puntos extremos racionales. Mostrar que es una base para una topología. Argumentar que esta es grande que la topología estándar, y luego mostrar que cualquier base para la topología estándar (i.e., un intervalo) contiene un intervalo con puntos extremos racionales.]

Proposición 9. Cualquier cuerpo arquimediano {K} es un cuerpo topológico, i.e., {K\times K\owns (x,y)\mapsto x+y\in K}, {K^\times \times K^\times\owns (x,y) \mapsto xy \in K^\times} y {K^\times\owns x\mapsto x^{-1}\in K^\times} son continúas.

Ejercicio 6. Probar la Proposición 9. [Sugerencia: considerar las sucesiones {x_n} e {y_n} que convergen a {x} e {y} respectivamente; luego, usar el hecho que esas sucesiones convergentes son acotadas.]

   Notar que la Proposición 9 de hecho se cumple para cuerpos ordenados también. Sólo hay que considerar redes en su lugar.

Definición 10. Sea {G} un grupo topológico. Una sucesión {(x_n)} en {G} se dice que es una sucesión de Cauchy cuando, para cualquier vecindad {U} de {e}, existe un {N} tal que {m,n \geq N \implies x_nx_m^{-1} \in U}. Denotaremos el conjunto de las sucesiones de Cauchy en {G} mediante {G^\mathbb{N}_c}.

   Observemos que esta definición también puede usarse para definir redes de Cauchy en grupos topológicos, pero no los vamos a necesitar. También, observemos que los intervalos con puntos extremos racionales nos da una base numerable en {0} en cualquier cuerpo arquimediano, de manera que veremos que para cualquier cuerpo arquimediano, la definición se reduce a lo siguiente:

\displaystyle  \forall\varepsilon\in\mathbb Q^+\exists N : n,m \geq N\implies |x_n-x_m|<\varepsilon.

Proposición 11. Sea {K} un cuerpo arquimediano y {(x_n)} una sucesión en {K}. Se cumple lo siguiente:

  1. Si {(x_n)} es convergente, entonces {(x_n)} es una sucesión de Cauchy, y cualquier subsucesión de {(x_n)} converge al mismo límite.
  2. Si {(x_n)} es una sucesión de Cauchy, entonces es acotada.
  3. Si {(x_n)} es acotada, entonces {(x_n)} tiene una subsucesión de Cauchy (pre Bolzano-Weierstraß).
  4. Si {(x_n)} es un sucesión de Cauchy, entonces cualquier subsucesión es una sucesión de Cauchy. Además, si {(x_n)} tiene una subsucesión convergente, entonces {(x_n)} converge al mismo límite.
  5. Si {(x_n)} es una sucesión de Cauchy y {(x_{k_n})} es una subsucesión, entonces {\lim_{n \rightarrow \infty} |x_n - x_{k_n}| = 0}.

Ejercicio 7. Probar la Proposición 11.

Proposición 12. Sea {K} un cuerpo arquimediano. Las siguiente afirmaciones son equivalentes:

  1. {K} tiene la propiedad de la mínima cota superior.
  2. Cualquier sucesión de Cauchy en {K} es convergente ({K} es completo).

Ejercicio 8. Analizar el siguiente esquema de prueba de la Proposición 12:

Demostración. ({1\!\Rightarrow\!2}) Sea {(x_n)} una sucesión de Cauchy en {K}. Si {(x_n)} es eventualmente constante, obviamente es convergente, de manera que asumiendo que no lo es y considerando el conjunto

\displaystyle  X=\lbrace x\in K\;\vert\;\exists N\in\mathbb N : n\geq N\implies x<x_n \rbrace,

tenemos que {X} es no vacío y tiene una cota superior (¿por qué?) y así {\sup X} existe, y postulamos que {x_n \rightarrow\sup X}. Dado un {\varepsilon>0}, hallamos {N} tal que {|x_n-x_m|<\frac\varepsilon2}, y consideramos el intervalo {(x_N-\frac\varepsilon2, x_N+\frac\varepsilon2)}. Hay sólo finitos elementos de la sucesión fuera de este intervalo, de modo que {x_N-\frac\varepsilon2\in X}. Además, {x+\frac\varepsilon2} es una cota superior para {X}. La desigualdad triangular (nota: probar la desigualdad triangular para cuerpos arquimedianos) ahora nos da

\displaystyle  |x_n-\sup X|\leq|x_n-x_N|+|x_N-\sup X|<\varepsilon.

({2\!\Rightarrow\!1}) Sea {A\subset K} no vacío y acotado superiormente por {y_0\in K}. Sea {x_0} algún elemento que no es cota superior para {A}, e.g., tenemos {a-1} para algún {a\in A}, y recursivamente define un pair de sucesiones {(x_n)} e {(y_n)} sobre {\mathbb N_0} mediante

\displaystyle  \begin{array}{rl} y_{n+1} & = \begin{cases} \displaystyle\frac{y_n + x_n}{2} & \text{si } \displaystyle\frac{y_n+x_n}{2} \text{ es una cota superior para } A, \\ y_n & \text{en cualquier otro caso} \end{cases} \\ x_{n+1} & = \begin{cases} \displaystyle\frac{y_n+x_n}{2} & \text{si } \displaystyle\frac{y_n+x_n}{2} \text{ no es una no cota superior para } A, \\ x_n & \text{en cualquier otro caso.} \end{cases} \end{array}

Por inducción tenemos que {(x_n)} es creciente, {(y_n)} es decreciente, y para todo {i,j}: {x_i\leq y_j}. Igualmente, por inducción tenemos que para todo {i}: {0\leq y_i-x_i \leq 2^{-i}(y_0-x_0)}. Ahora es sencillo mostrar que {(y_n)} es una sucesión de Cauchy. Asumiendo que {n\geq m} y tenemos:

\displaystyle  \begin{array}{rl} y_m-y_n & = y_m - y_{m+1} + y_{m+1} - \dotsb - y_{n-1} + y_{n-1} - y_n \\ & \leq (2^{-m-1} + 2^{-m-2} + 2^{-n})(y_0 - x_0) \\ & \leq 2^{-m}(y_0 - x_0) \end{array}

de lo que es fácil concluir que {(y_n)} es Cauchy. Similarmente, se muestra que {(x_n)} es Cauchy. Así, ambas sucesiones son convergentes, y sus límites debe ser el mismo ya que {y_n-x_n\leq 2^{-n}(y_0-x_0)}. Denotemos este límite por {s}. Finalmente, observemos que para todo {a\in A}, {a\leq y_n}, de manera que {a\leq s} (¿por qué?), i.e., {s} es una cota superior para {A}. Además, cuando {u} es una cota superior para {A}, se tiene que {x_n\leq u} para todo {n}; así, {s \leq u} (¿por qué?). Por lo tanto, {s} es la mínima cota superior para {A}. \Box

Proposición 13. Sean {K} y {L} cuerpos arquimedianos. Si {f\colon K\rightarrow L} y {g\colon L\rightarrow K} están incrustados, entonces {K} y {L} son isomórficos.

Demostración. Sea {g\circ f=\phi\colon K\rightarrow K}. Por definición, {\phi} está incrustada. Asumiendo que {\phi} no es la identidad. Entonces existe un {x} para el cual {\phi(x)\neq x}. Hallar un {q\in\mathbb Q} entre {x} y {\phi(x)} y observar que {\phi} tiene que se la identidad en {\mathbb Q}, pero no puede preservar el ordenamiento de {x} y {q}. Esto da una contradicción, y así {\phi} debe ser la identidad. La prueba que {f \circ g} es la identidad es similar. \Box

Lema 14. Sean {G} y {H} be grupos topológicos y sea {G'} un subgrupo denso de {G}. Si {\phi\colon G\rightarrow H} es continúo y {\phi|_{G'}} es un homomorfismo, entonces {\phi} e un homomorfismo.

Demostración. Sea {x,y\in G} y asumamos que {\phi(xy)\neq\phi(x)\phi(y)}. Ya que {G'} es denso, existe una red {(x_\alpha)} y {(y_\alpha)} en {G'} convergiendo hacia {x} e {y} respectivamente. Ya que {\phi} es un homomorfismo sobre {G'}, tenemos que para todo {\alpha} que {\phi(x_\alpha y_\alpha)=\phi(x_\alpha)\phi(y_\alpha)}, y ya que {\phi} es continuo y {\cdot} es continuo, tenemos que {\phi(xy)=\phi(x)\phi(y)}. \Box

Observación 15. Esto no es un uso vacuo del reductio ad absurdum, ya que una prueba directa podría tener que trabajar con redes arbitrarias convergiendo hacia {x} e {y}. Por supuesto, este lema se puede generalizar para aplicar también a anillos en una manera usual.

Teorema 16 (Teorema de incrustados para cuerpos arquimedianos). Sean {K} y {L} cuerpos arquimedianos donde {L} es completo. Entonces hay un incrustado {\phi\colon K\rightarrow L}.

Demostración. Definamos {\phi\colon K\rightarrow L} mediante {\phi(x)=\sup\lbrace q\in\mathbb Q\;\vert\; q<x\rbrace}. Es sencillo mostrar que {\phi} preserva el orden, de manera que sólo la parte dura está mostrando que es un homomorfismo. Deseamos usar el lema precedente, de modo que primero notemos que es obvio que la restricción de {\phi} a {\mathbb Q} es la identidad, de manera que sólo la parte dura está verificando que es continua. Consideremos un {k\in K} y sea {V} una vecindad de {\phi(k)}. Hallar racionales {p} y {q} tal que {\phi(k)\in(p,q)\subset V}. Postulamos que {\phi((p,q))\subset(p,q)}. Sea {k'\in(p,q)\subset K} y hallamos {q'\in\mathbb Q} tal que {p<k'<q'<q}. Es sencillo ver que {p<\phi(k')\leq q'<q}, así {\phi(k')\in(p,q)}, y concluimos que {\phi} es continua.. \Box

Teorema 17 (Unicidad del cuerpo ordenado completo). Existe un, y sólo un, cuerpo ordenado completo con un isomorfismo que preserva el orden.

Demostración. Sean {K} y {L} cuerpos ordenados completos. El Teorema 16 incrusta {\phi\colon K\rightarrow L} y {\varphi\colon L\rightarrow K}. La Proposición 12 nos muestra que {K} y {L} son isomórficos. \Box

— 2. Existencia —

   Ya hemos comentado mucho acerca de la unicidad, por lo que ahora escribiremos menos. Recordemos que {\mathbb Q} bajo la adición es un grupo topológico, de manera que usaremos la notación establecida antes para su conjunto de sucesiones de Cauchy: {\mathbb Q^\mathbb N_c}.

Proposición 18. Se tiene que {\mathbb Q^\mathbb N_c} es un anillo unitario conmutativo bajo la adición y la multiplicación por coordenadas.

Ejercicio 9. Probar la Proposición 18.

Proposición 19. El conjunto de las sucesiones racionales de Cauchy que convergen a cero, i.e.,

\displaystyle  \mathfrak z = \left\lbrace (z_n) \in \mathbb Q^\mathbb N_c \;\bigg\vert\; z_n \rightarrow 0 \right\rbrace,

es un ideal maximal en {\mathbb Q^\mathbb N_c}.

Ejercicio 10. Probar la Proposición 19. [Sugerencia: considerar un ideal{\mathfrak a\supset\mathfrak z} con un {(q_n)\in\mathfrak a\setminus\mathfrak z}. Mostrar que hay un {N} tal que {n\geq N\implies q_n\neq0} y considerar que la sucesión {(z_n)=(1-q_1,\dotsc,1-q_N,0,0,\dotsc)}. Argumentar que {(q_n+z_n)\in\mathfrak a} y concluir que {\mathfrak a=\mathbb Q^\mathbb N_c}.]

   Así {\mathfrak z} es un ideal maximal y, por lo tanto, el cociente, que vamos a denotar por {R}, debe ser un cuerpo. Desde aquí, el resto es un esquema que tiene varios detalles por verificar y que son bastante aburridas. 🙂

   Adoptaremos el convenio de escribir las sucesiones con negrita, e.g., escribiremos {(x_n) = {\bf x}} y usaremos la notación {[{\bf x}]} para una clase equivalente que contiene a {{\bf x}}.

   Definimos {<} en {R} mediante {[{\bf p}]<[{\bf q}]\iff\exists (p_n)\in [{\bf p}], (q_n)\in[{\bf q}],\alpha\in\mathbb{Q}^+ : p_n < q_n + \alpha \text{ eventualmente}}. En particular, notar que la existencia del positivo {\alpha} no puede ser descartado; e.g., considerar {(1/n)}, {(0)} y {(-1/n)}. Sin el requisito que ese positivo {\alpha} existe, tendríamos {0 < 0}, que es claramente tonto.

Ejercicio 11. Verificar que cuando {(p_n)\in[{\bf p}]} y {(q_n) \in [{\bf q}]} son muestras que {[{\bf p}] < [{\bf q}]}, entonces cualquier par de representantes funcionarán bien, i.e., si {(p'_n)\in[{\bf p}]} y {(q'_n) \in [{\bf q}]}, entonces {(p'_n)} y {(q'_n)} también son muestras.

Ejercicio 12. Mostrar que {<} es un orden total estricto, i.e., se tiene que {<} irreflexivo, transitivo y total. [Sugerencia (para totalidad): necesitas mostrar que sólo uno de {[{\bf x}]<[{\bf y}]}, {[{\bf x}]=[{\bf y}]} o {[{\bf y}]<[{\bf x}]} se cumple, de manera que primero se tiene que mostrar que al menos uno de ellos se cumple, asumiendo que ninguno de ellos se cumple y se obtiene una contradicción; luego, mostrar que a lo más uno de ellos se cumple, igualmente, por contradicción usando que {[{\bf x}]\nless[{\bf y}]\iff[{\bf y}]\leq[{\bf x}]}. Probablemente necesitará pasar muchas veces a subsucesiones «más agradables», de manera que la Proposición 11(e) será muy útil.]

   Y ahora podemos descansar un poco y cosechar la recompensa con estos ejercicios sencillos:

Ejercicio 13. Mostrar que {R} es un cuerpo ordenado.

Ejercicio 14. Mostrar que {R} es arquimediano.

Ejercicio 15. Completar los detalles del siguiente esquema de prueba que cualquier sucesión de Cauchy en {R} es convergente:

Demostración. Empezando con una sucesión arbitraria de Cauchy {([{\bf q}]^i)} de clases equivalentes, la Proposición 11(d) nos permite asumir que para todo {i,j} con {j\geq i} que {\left\lvert[{\bf q}]^i-[{\bf q}]^j]\right\rvert<4^{-i}}. Observar que la convergencia significa que se tiene que mostrar que alguna de las desigualdades se cumple, de manera que sólo se necesita mostrar que se cumple para algunos representantes, así estamos en libertad de elegir los que más nos gusten. 🙂

   Elegir los representantes, {(q^i_n)}, tal que {|q^i_n - q^i_m| < 4^{-n}}.

   Tomar {{\bf x}=(q^1_1,q^2_2,\dotsc)}. Esto es obviamente una sucesión de Cauchy (¿por qué?), y postulamos que {[{\bf q}]^i \rightarrow [{\bf x}]}. Convéncete que esto es lo mismo que

\displaystyle  \forall \varepsilon \in \mathbb{Q}^+ \exists K,N : k \geq K, n \geq N \implies \left\lvert q^k_n - q^n_n \right\rvert < \varepsilon.

   Notar que el requisito de existencia del positivo {\alpha} se deja de lado ya que tenemos que se cumple que para cualquier {\varepsilon>0}. De manera que dejamos {\varepsilon>0} tal cual. Usamos el truco de insertar un elemento apropiado en la desigualdad {|q^k_n - q^n_n| \leq |q^k_n - q^k_k| + |q^k_k - q^n_n|} y usamos el hecho que ambas, la sucesión y el representante, tiene la “{4^{-m}}“-propiedad para concluir que si elegimos {N,K} tales que {N=K} y {2^{-N}<\varepsilon}, entones el LD es eventualmente menor que {\varepsilon}. \Box

   Hasta aquí, hemos cumplido, y tenemos las licencias para conducirnos con los números reales. 🙂

   Es sencillo ver que, para mostrar que {\mathbb Q} es numerable, es suficiente mostrar la numerabilidad de {\mathbb Q^+} o incluso de {\mathbb Q\cap(0,1]}.

   Hay una manera sencilla de enumerar este último: primero las fracciones con denominados {1}, luego aquellos con denominador {2} (obviando los que ya fueron listados), luego aquellos con denominador {3} (nuevamente, evitando repeticiones), etc. Esta lista empieza con

\displaystyle  \frac11;\frac12;\frac13,\frac23;\frac14,\frac34;\frac15,\frac25,\frac35,\frac45;\dots

   La primera prueba de Cantor de la no numerabilidad de los reales (el argumento de los intervalos anidados) de 1874 procede como sigue:

   Dado cualquier sucesión (inyectiva) {a_1,a_2,\dots} de números reales, deseamos mostrar un número real que no es listado. Tenemos dos casos: hay {i\ne j} con {a_i<a_j}, y tal que no hay {k} con {a_k\in(a_i,a_j)}, en cual caso obviamente se ha culminado; o (más interesante), siempre que {a_i<a_j}, podemos hallar un {a_k} estrictamente entre ellos (el rango de la sucesión es dense sobre sí mismo). Asumamos que estamos en esta situación.

   Definimos dos sucesiones {b_1,b_2,\dots} y {c_1,c_2,\dots} como sigue:

  1. Primero, {b_1=a_1} y {c_1=a_2}.
  2. Por definición, suponer que {a_1>a_2}. El otro caso es tratado similarmente. Sea {b_2=a_i}, donde {i} es el menor tal que {a_i\in(c_1,b_1)}. Entonces definimos {c_2} como {a_j}, donde {j} es el menor tal que {a_j\in(c_1,b_2)}.
  3. En general, dado {c_n<b_n}, definimos {b_{n+1}} como {a_k}, donde {k} es el menor tal que {a_k\in(c_n,b_n)}, y luego definimos {c_{n+1}} como {a_m}, donde {m} es el menor tal que {a_m\in(c_n,b_{n+1})}. Notar que estas sucesiones están bien definidas debido a nuestra hipótesis de densidad.

   La construcción que se acaba de describir asegura que si {I_n=[c_n,b_n]}, entonces:

  1. Para cualquier {n}, tenemos que {a_n\notin I_{n+1}}, y
  2. Los intervalos están anidados y son decrecientes: {I_1\supsetneq I_2\supsetneq I_3\dots}

   Se sigue (de la completitud de los reales) que {\bigcap_n I_n\ne\emptyset}, y (de a.) que cualquier número real en esta intersección no está en el rango de la sucesión {a_1,a_2,\dots}

   Resulta que si llevamos a cabo la construcción de Cantor cuando la sucesión de {a_i} es la enumeración de los números racionales en {(0,1]} con los que comenzamos, entonces {\bigcap_n I_n=\{1/\phi\}}, donde {\phi} es la proporción áurea.

   Hay una agradable enumeración de {\mathbb Q^+} con un significado de combinatoria.

   Los racionales son usados para etiquetar los nodos de un árbol binario completo infinito, y la enumeración resultante simplemente sigue los nodos del árbol lexicográficamente.

\displaystyle  \begin{array}{ccccccccccccccc} & & & & & & & \frac11 \\\\ & & & \frac12 & & & & & & & & \frac21 \\\\ & \frac13 & & & & \frac32 & & & & \frac23 & & & & \frac31 \\\\ \frac14 & & \frac43 & & \frac35 & & \frac52 & & \frac25 & & \frac53 & & \frac34 & & \frac41 \end{array}

Empezamos poniendo {1/1} en la raíz del árbol. Una vez que un nodo ha sido etiquetado con {m/n}, su sucesor izquierdo es etiquetado {m/(m+n)}, y su sucesor derecho es {(m+n)/n}.

¡Y eso es todo! La lista así producida empieza

\displaystyle  \frac11;\frac12,\frac21;\frac13,\frac32,\frac23,\frac31;\dots

   La prueba de que esta es en efecto una lista biyectiva de {\mathbb Q^+} es muy simple; se verifica en el siguiente orden de afirmaciones:

  1. El numerado y el denominador de cualquiera de las fracciones asignadas son primos relativos.
  2. Todo racional positivo es asignado a algún nodo.

   Para esto, procedemos por inducción. Por ejemplo, si hay una fracción {m/n} no en su forma reducida, y usado como una etiqueta, escoger esa fracción que aparece en el menor nivel posible, y notar que la fracción no puede ser {1/1}. Una contradicción es ahora alcanza señalando que {\mathrm{gcd}(m,n)=\mathrm{gcd}(m-n,n)=\mathrm{gcd}(m,n-m)}.

   Similarmente, si {m/n} aparece en más de un nodo, entonces {m\ne n}, y su predecesor inmediato (bien {(m-n)/n} o {m/(n-m)}, dependiendo de si {m>n} o {m<n}) debe también aparecer en más de una vez.

   Finalmente, si alguna fracción no está listada, podemos elegir su denominador {n} menos entre los denominadores de todos las fracciones omitidas, y entonces elegimos su numerador {m} menos entre los numeradores de todas las fracciones omitidas con denominador {n}. Una contradicción sigue debido a que {m\ne n}, y si {m>n}, entonces {(m-n)/n} también debe haber sido omitido, pero {m-n<m}, mientras que si {m<n}, entonces {m/(n-m)} deben haber sido omitida, pero {n-m<n}

   También se muestran las siguientes las siguientes propiedades combinatorias interesantes:

  1. Hay una sucesión {b(0),b(1),b(2),\dots} de enteros positivos tal que la {n}-ésima fracción en la enumeración es sólo {\displaystyle\frac{b(n)}{b(n+1)}} (en su forma reducida). En particular, el denominador de una fracción es el numerador de su sucesor en la enumeración. De manera que {b(0)=1}, {b(1)=1}, {b(2)=2}, {b(3)=1}, {b(4)=3}, {b(5)=2}, {b(6)=3}, etc.
  2. De hecho, {b(n)} es precisamente el número de maneras de escribir {n} como una suma de potencias de {2}, donde cada potencia puede ser usada a lo sumo dos veces. Por ejemplo, {b(6)=3}, debido a que podemos escribir {6} como {2^2+2^1}, como {2^2+2^0+2^0}, o como {2^1+2^1+2^0+2^0}.

   Algunas preguntas naturales:

  1. ¿Qué podemos decir acerca del real (o los reales) que salen cuando el procedimiento de la prueba de Cantor es aplicado para esta enumeración?
  2. ¿Cualquier camino infinito a través del árbol binario define una sucesión de racionales? ¿Qué números reales aparecen como puntos límites de estas sucesiones?

   Es usual definir los límites superior e inferior de una sucesión {(a_n)_{n=1}^\infty} de números reales de la siguiente manera:

\displaystyle  \limsup a_n := \lim_{N\rightarrow\infty}\sup\{a_n:n>N\}

y

\displaystyle  \liminf a_n := \lim_{N\rightarrow\infty}\inf\{a_n:n>N\}.

Del lado derecho de ambas definiciones, ¿podemos pensar {\sup\{a_n:n>N\}} y {\inf\{s_n:n>N\}} como una sucesión con {n>N}? ¿Cómo se comportan cuando {n} incrementa? ¿Decrecen confirme {n} crece?

   Consideremos este ejemplo:

\displaystyle  3-\frac12,\quad 5+\frac13,\quad 3-\frac14,\quad 5+\frac15,\quad 3-\frac16,\quad 5+\frac17,\quad 3-\frac18,\quad 5+\frac19,\quad\ldots

   Esta sucesión alterna aproximándose algo a {3} desde abajo y aproximándose algo a {5} desde arriba. Así, su límite inferior es {3} y su límite superior es {5}.

   El ínfimo de toda la sucesión es {3-\frac12}.

   Si uno retira el primer término, o los dos primeros, el ínfimo de los que queda es {3-\frac14}.

   De los restante, si uno retira el primer término, o los dos primeros, el ínfimo de los que queda es {3-\frac16}.

   De los restante, si uno retira el primer término, o los dos primeros, el ínfimo de los que queda es {3-\frac18}.

   De los restante, si uno retira el primer término, o los dos primeros, el ínfimo de los que queda es {3-\frac1{10}}.

… y así sucesivamente. Vemos que estos ínfimos son cada vez más grandes.

   Observando la sucesión de ínfimos, vemos que sus supremo es {3}.

   Así el límite inferior es el supremo de la sucesión de ínfimos de todos las sucesiones restantes de la sucesión inicial, es decir, las colas de la sucesión inicial. Con la notación, tenemos

\displaystyle  \begin{aligned} \liminf_{n\rightarrow\infty} a_n & = \sup_{n=1,2,3,\ldots} \inf_{m=n,n+1,n+2,\ldots} a_m \\ & = \sup_{n=1,2,3,\ldots} \inf\left\{ a_n, a_{n+1}, a_{n+2}, a_{n+3},\ldots \right\} \\ & = \sup\left\{ \inf\left\{ a_n, a_{n+1}, a_{n+2}, a_{n+3},\ldots \right\} : n=1,2,3,\ldots \right\} \\ & = \sup\left\{ \inf\{ a_m : m\ge n\} : n=1,2,3,\ldots \right\}. \end{aligned}

   Así como el límite inferior es el supremo de los ínfimos, tenemos que el límite superior es el ínfimo de los supremos.

   Uno también puede decir que {L=\liminf_{n\rightarrow\infty} a_n} precisamente si para cualquier de los {\varepsilon>0}, sin importar cuan pequeños, hay algún índice {N} arbitrariamente grande de manera que para cada {n\ge N}, {a_n>L-\varepsilon}, y {L} es el mayor número para el cual esto se cumple.

   Consideremos un conjunto no numerable de números positivos. ¿Es posible que su suma sea finita? En otras palabras, se quiere verificar que la serie infinita definida mediante este conjunto es convergente. De hecho, trabajar con series sobre conjuntos no numerables es algo complicado de entender. Veremos algunas aproximaciones: una intuitiva y otra rigurosa.

   Podríamos considerar el conjunto {S} de números y definir

\displaystyle  \sum S = \left\{\sum A : A\subseteq S, A \text{ finito}\right\}.

Sin embargo esta definición falla cuando se permite que un mismo número ocurra más de una vez en la suma, ya que podría ocurrir una infinidad no numerable de veces.

   Corrigiendo lo anterior, supongamos que {\{s_i : i\in I\}} es un conjunto de números positivos. Definimos

\displaystyle  \sum_{i\in I} s_i = \sup\left\{ \sum_{i\in I_0} s_i : I_0\subseteq I, I_0 \text{ finito}\right\}.

(Si tanto números positivos como negativos están involucrados, hablamos acerca de un límite en lugar de un supremo; lo que hace la definición más complicada ya que tenemos que tratar con la convergencia condicional y reordenamientos.)

   Ahora, consideremos

\displaystyle \begin{aligned}  & \{i\in I : s_i \ge 1\} \\  & \{i\in I : 1/2 \le s_i < 1 \} \\  & \{i\in I : 1/3 \le s_i < 1/2 \} \\  & \{i\in I : 1/4 \le s_i < 1/3 \} \\  & \quad \quad \quad \vdots  \end{aligned}

Si uno de estos conjuntos es infinito, obtenemos {\sum_{i\in I} s_i=\infty}. Pero si todos son finitos, tenemos que {I} es a lo sumo infinito numerable.

   Así, la suma de infinitos números positivos no numerable es infinito.

   Ahora bien, podemos mostrar esto desde un punto de vista riguroso. Partamos de la definición

Definición 1 (Series sobre conjuntos numerables). Sea {X} un conjunto numerable, y sea {f\colon X\rightarrow\mathbf R} una función. Decimos que la serie {\sum_{x\in X}f(x)} es absolutamente convergente si, y sólo si, para alguna biyección {g\colon\mathbf N\rightarrow X}, la suma {\sum_{n=0}^\infty f(g(n))} es absolutamente convergente. Entonces definimos la suma {\sum_{x\in X}f(x)} mediante la fórmula

\displaystyle \sum_{x\in X}f(x)=\sum_{n=0}^\infty f(g(n)).

   Con esta definición podemos mostrar una caracterización de las series absolutamente convergentes.

Lema 2. Sea {X} un conjunto a lo más numerable, y sea {f\colon X\rightarrow\mathbf R} una función. Entonces la serie {\sum_{x\in X} f(x)} es absolutamente si, y sólo si,

\displaystyle \sup\left\{\sum_{x\in A}|f(x)|:A\subseteq X, A\text{ finito}\right\}<\infty.

   Inspirados por esta proposición, podemos definir el concepto de serie absolutamente convergente incluso cuando el conjunto {X} podría ser no numerable.

Definición 3. Sea {X} un conjunto (que podría ser no numerable), y sea {f\colon X\rightarrow\mathbf R} una función. Decimos que la serie {\sum_{x\in X} f(x)} es absolutamente convergente si, y sólo si,

\displaystyle \sup\left\{\sum_{x\in A}|f(x)|:A\subseteq X, A\text{ finito}\right\}<\infty.

   Notar que todavía nos hemos dicho a qué es igual la serie {\sum_{x\in X} f(x)}. Cumpliremos con esto mediante la siguiente proposición:

Lema 4. Sea {X} un conjunto (que podría ser no numerable), y sea {f\colon X\rightarrow\mathbf R} una función tal que la serie {\sum_{x\in X} f(x)} es absolutamente convergente. Entonces el conjunto {\{x\in X:f(x)\ne0\}} es a lo sumo numerable.

   Debido a esto, podemos definir el valor de {\sum_{x\in X} f(x)} para cualquier serie absolutamente convergente sobre un conjunto no numerable {X} mediante la fórmula

\displaystyle \sum_{x\in X} f(x):=\sum_{x\in X:f(x)\ne0} f(x),

ya que hemos reemplazado una suma sobre un conjunto no numerable {X} por una suma sobre el conjunto numerable {\{x\in X:f(x)\ne0\}}. (Notar que si la primera suma es absolutamente convergente, la última también lo es.) También, notar que esta definición es consistente con las definiciones para series sobre conjuntos numerables.

   Leía un problema propuesto sobre límites de sucesiones. Me pareció interesante como de manera intuitiva se puede formar una expresión exacta de “un índice tiende a infinito cuando el otro índice tiende a infinito, y viceversa”. Es evidente que lo primero que uno se podría preguntar es ¿qué es lo que se desea probar, que toda subsucesión de una sucesión convergente, es también convergente y converge al mismo límite? ¿Cómo damos sentido a que un índice tienda a infinito mientras otro lo hace? ¿No deberíamos tener como premisa que hay al menos una relación (tal vez funcional) entre ellos?

   Veamos… El problema en cuestión es

Ejercicio 1. Sea {(a_n)^\infty_{n=p}} una sucesión de números reales, y sea {L} un número real. Supongamos que {(a_n)^\infty_{n=p}} es convergente y su límite es {L}, es decir, tenemos que {\lim_{n\rightarrow\infty}a_n=L}. Además, tenemos que {n\rightarrow\infty} siempre que {m\rightarrow\infty} y el recíproco también es cierto. ¿Cómo probar rigurosamente que {\lim_{n\rightarrow\infty}a_n=\lim_{m\rightarrow\infty}a_n=L}.

   El punto aquí es que no tenemos una definición clara de qué debe entenderse por “{n\rightarrow\infty} siempre que {m\rightarrow\infty}” ni de {\lim_{m\rightarrow\infty}a_n}. Aunque es más o menos compresible lo que se quiere decir: hay alguna relación entre {m} y {n} de modo que crece mientras la otra también lo hace.

   El primer intento presentado fue el siguiente: sea {m(n)} una función monótona desde {\mathbf N} hasta {\mathbf N}. Entonces {(a_m)^\infty_{m=q}:=(a_{m(n)})^\infty_{n=p}} es una subsucesión de {(a_n)^\infty_{n=p}}. Como sabemos que toda subsucesión converge al mismo límite que la sucesión convergente original, podemos afirmar que {\lim_{n\rightarrow\infty}a_{m(n)}=L}.

   Pero se asume mucho… La existencia de una función monótona ya es una sugerencia a que dicha función ha de ser creciente, de otro modo no podría definir una subsucesión y el problema es trivial. Afirma que “{m\rightarrow\infty} cuando {n\rightarrow\infty}” implica la existencia de dicha función, y en esto estamos de acuerdo: ha de existir una función que relacione ambos índices. Lo que si me parece una suposición fuerte es que esta sea monótona; es más, esto lleva a decir que dicha función define una subsucesión convergente.

   Ahora bien, {m(n)} no tiene porqué ser monótona. Basta ver la sucesión {1,1,1,10,2,2,50,3,60,1,100,0,200,\dotsc} para notar que esta tiende a infinito pero no es estrictamente monótona. Ya que estamos de acuerdo en que existe una relación funcional, partiré sólo de esa premisa.

   Sea {m\colon\mathbf N\rightarrow\mathbf N} una función con {f(n)\in\mathbf N}. (Esto es irrelevante, pero lo pongo para que se note el uso del índice {n}.) Con esto, la afirmación “{m\rightarrow\infty} cuando {n\rightarrow\infty}” puede expresarse con {\lim_{n\rightarrow\infty}m(n)=\infty}. Por definición, tenemos que para cualquier {M>0}, existe un {N\ge q} tal que {m(n)\ge M} para todo {n\ge N}.

   Por definición de convergencia, tenemos que {(a_n)^\infty_{n=p}} converge a {L} siempre que para cualquier {\epsilon>0}, existe un {N\ge p} tal que {d(a_j,L)\le\epsilon} para todo {j\ge N}.

   Así ¿podemos fijar un {N':=m(j)} para algún {j\in\mathbf N} y {j\ge q} de manera que {N'\ge N} sirva para satisfacer la definición de convergencia con {(a_m)^\infty_{m=q}}?

   La respuesta es obvia. Con esto vemos que suponer que dicha función permite definir una subsucesión es una afirmación fuerte y usarla es asumir demasiado de las premisas. Finalmente dejo el enunciado de la proposición que supongo fue la que llevo a considerar la existencia de una subsucesión.

Proposición 1. Sea {(a_n)^\infty_{n=0}} una sucesión de números reales, y sea {L} un número real. Entonces los siguientes dos enunciados son lógicamente equivalentes (cada una implica la otra):

  1. La sucesión {(a_n)^\infty_{n=0}} converge a {L}.
  2. Toda subsucesión de {(a_n)^\infty_{n=0}} converge a {L}.

(Notar que una de las dos implicaciones tiene una prueba muy breve.) 🙂

   A veces, uno se pregunta por qué la inducción es una técnica de demostración válida. Desde luego, es una cuestión natural por más intuitiva que parezca esa validez. Incluso, podemos comparar el misterio de la inducción con otras técnicas usuales de demostración, como el principio del buen ordenamiento o la inducción fuerte. La cuestión es más precisa al enfocarla desde la perspectiva del por qué podemos aplicar la inducción en los números naturales, pero no profundizaré dicha explicación aquí; una de las razones es que la respuesta depende de cómo se define los números naturales. El lector puede inferir de esto que estoy diciendo que la inducción es independiente de los números naturales. ¿Es esto posible? ¿Acaso es la inducción algo más que probar que una afirmación se cumple para {0} y que también se cumple para {n+1} cuando {n} la cumple? ¿Cómo puede tener sentido esto fuera del ámbito de los números naturales?

   Bueno, lo de estar fuera del “ámbito” es un tanto exagerado; pero es posible adaptar la idea de inducción a ámbitos más generales que sólo los números naturales. Este es el punto de vista que veremos a continuación con mayor detalle: dado algún conjunto {X}, ¿qué necesitamos para habilitar la inducción en {X} y que sea una herramienta para demostrar que una afirmación se cumple para todos elementos de {X}?

— 1. Lo usual —

   Veamos como formulamos usualmente la inducción.

Teorema 1. Sea {A\subseteq\mathbf N} tal que {0\in A} y {n\in A\implies n+1\in A} para cualquier {n\in \mathbf N}. Entonces {A=\mathbf N}.

   Aparentemente esta formulación parece requerir algunas propiedades de los números naturales: el hecho que hay un elemento {0} y que podemos “añadir” una unidad {1} a cualquier elemento. Pero veamos una versión diferente de la inducción (frecuentemente llamada inducción fuerte). Es común decir que esta versión es equivalente a la inducción usual; aunque, veremos que este hecho es un tanto trivial en tanto ambos se aplican sobre los números naturales, o falso cuando empecemos a generalizarlos sobre los mismos conjuntos.

Teorema 2. Sea {A\subseteq\mathbf N} tal que {(m<n\implies m\in A)\implies n\in A} para cualquier {n\in\mathbf N}. Entonces {A=\mathbf N}.

   Notar que parece no haber caso base, pero esto es satisfecho trivialmente; se cumple para el {0} ya que si {n=0} entonces {m<n} es falso y, por lo tanto, la primera implicación es cierta, sin importar si {m\in A}, lo que quiere decir que la segunda implicación es únicamente cierta si {n\in A}. De esta manera, tenemos un versión de la inducción que usa únicamente el ordenamiento de los números naturales, lo que luce como algo más sencillo de generalizar. Así, tomemos un conjunto {X} cualquiera. ¿Qué clase de ordenamiento deberíamos aplicar en {X} para poder demostrar que una afirmación es cierta para todo {x\in X} mediante la inducción? La respuesta usual es el un buen ordenamiento; pero esto no es del todo preciso, principalmente porque un buen ordenamiento es un ordenamiento total, lo que a nos permite afirmar que es posible usar la inducción con sólo un orden parcial. Pero iniciaremos con una cuestión más específica: ¿qué clase de orden total en {X} nos permite aplicar la inducción?

— 2. Órdenes totales —

Analicemos un poco la siguiente definición:

Definición 3. Un orden total sobre un conjunto no vacío {X} es un buen orden si cualquier subconjunto no vacío de {X} tiene un elemento mínimo.

   Así, dado que {X} es un conjunto totalmente ordenado, podemos aplicar la inducción sobre {X} si, y sólo si, {X} está bien ordenado. Pero esto se refiere a la inducción fuerte. ¿Es posible aplicar la inducción si contamos sólo con un orden total? Casi. S contamos con un conjunto bien ordenado (con una pequeña condición adicional), podemos aplicar la inducción usual. Pero de hecho, es necesario afinar algunos detalles. Antes veamos por qué para aplicar la inducción usual es suficiente y necesario tener un buen ordenamiento. Primero veamos que es suficiente.

Teorema 4. Sea {X} un conjunto bien ordenado y {A\subseteq X} tal que {(y<x\implies y\in A)\implies x\in A} cualquiera que sea {x\in X}. Entonces {A=X}.

Demostración. Sea {B:=X\setminus A} y supongamos en pos de la contradicción que {B} es no vacío. Ya que {X} está bien ordenado, se tiene que {X} tiene un elemento mínimo, digamos {b:=\min B}. Pero, si {x\in X} con {x<b}, entonces {x\notin B} ya que {b} es el mínimo elemento en {B}. Por lo tanto, por hipótesis, para todo {x\in X} con {x<b} tenemos {x\in A}, lo que quiere decir que {b\in A}, una contradicción a la elección de {b}. \Box

   Veamos que es necesario.

Teorema 5. Sea {X} un conjunto no vacío totalmente ordenado tal que {A=X} siempre que {A\subseteq X} satisface {(y<x\implies y\in A)\implies x\in A} para cualquier {x\in A}. Entonces {X} está bien ordenado.

Teorema 6. Sea {B\subseteq X} un subconjunto de {B} que no tiene elemento mínimo. Sea {A:=X\setminus B}. Necesitamos mostrar que {A=X} y así, por hipótesis, basta con probar que si {x\in X} e {y\in A} para cualquier {y<x}, entonces {x\in A}. Pero si {y\in A} para todo {y<x}, entonces {x} no puede encontrarse en {B}, ya que sería el mínimo elemento de {B} (porque todos elementos estrictamente menores no están en {B}), así tenemos {x\in A}, como se deseaba.

   Ahora, la cuestión que queda es cómo podemos darle sentido a la inducción usual; para lo cual, necesitamos contar con un elemento {0} y ser capaces de añadir {1} a cualquier elemento. Hay una manera natural de dar ese sentido a un conjunto bien ordenado {X} si asumimos una condición extra: {X} no tiene elemento máximo. De esta manera, podemos tomar por {0} al elemento mínimo del conjunto (que existe por hipótesis), y, para añadir {1}, es decir, tomar el siguiente elemento, basta considerar que para cualquier {x\in X} sabemos que el conjunto {\{y\in X:y>x\}} es no vacío (para esto necesitamos que {X} no tenga elemento máximo); así, su mínimo elemento es el siguiente elemento de {x} (llamado sucesor de {x}). Contando con estas definiciones, ¿podemos aplicar la inducción sobre {X}? ¡No! El siguiente ejemplo ilustra aquello que necesitamos cambiar para lograr hacer funcionar la inducción:

Ejemplo 1. Sea {X:=\{0,1\}\times\mathbf N} y el orden lexicográfico sobre {X} (i.e., {(m,n)\le(m',n')} si {m<m'} o {m=m'} y {n\le n'}). Entonces es sencillo verificar que {(0,0)} es el elemento mínimo de {X} (denotamos {0:=(0,0)}); también, es fácil verificar que “{+1}” se puede definir mediante {(m,n)+1=(m,n+1)}. Ahora, sea {A:=\{(0,n):n\in\mathbf N\}\subseteq X}. Entonces podemos mostrar que {0\in A} y {a\in A\implies a+1\in A} pero {A\ne X}. Pero {X} está de hecho bien ordenado (¿por qué?), de manera que es un conjunto bien ordenado sin un elemento máximo donde no podemos aplicar el primer tipo de inducción.

¿Qué va mal en el ejemplo anterior? Al parecer la inducción sólo funciona para los números naturales, pero es muy similar a la inducción fuerte que aplicamos a cualquier conjunto bien ordenado, excepto en un punto: necesitamos que si {n\ne0}, entonces {n-1} tenga sentido (consideremos que complemento de un conjunto, tomando el elemento mínimo del elemento {n} es fácil ve que este no puede ser {0} y así podríamos usar la hipótesis inductiva en {n-1}). Pero, ¿cómo no sería posible definir “restar {1}” en cualquier conjunto bien ordenado? Esto es imposible, por eso es precisamente el quid de la cuestión del ejemplo: el elemento {(1,0)} no tiene un predecesor inmediato ya que los elementos menores que {(1,0)} son aquellos que están en el conjunto {A}, y un predecesor inmediato no puede ser un elemento máximo en {A}, que ciertamente no existe. Esto sugiere cómo podríamos remediar la situación: reemplazar “{0\in A}” por “{x\in A} para cualquier {x\in X} que no tiene un predecesor inmediato”. Así, con esta versión, podemos aplicar la inducción. (¿Por qué? Basta con adaptar las demostraciones anteriores.)

— 3. Órdenes parciales —

Veamos el caso más general: sea {X} un conjunto parcialmente ordenado. ¿Qué necesitamos para aplicar la inducción fuerte en {X}? (En este caso, no podemos hablar de un inducción simple, ya que no tiene sentido en este nivel de generalidad.) La respuesta es que {X} debe ser bien fundado. (De hecho, no es necesario tener algún ordenamiento, basta tener una relación bien fundada.) De esta manera, definimos

Definición 7. Una conjunto no vació parcialmente ordenado {X} está bien fundado si cualquier subconjunto no vacío de {X} tiene un elemento minimal.

   Como hicimos con los órdenes totales, ahora necesitamos probar que esta condición es suficiente y necesaria para aplicar la inducción. Primero, veamos que es suficiente.

Teorema 8. Sea {X} un conjunto bien fundado y {A\subseteq X} tal que {(y<x\implies y\in A)\implies x\in A} cualquiera que sea {x\in X}. Entonces {A=X}.

Demostración. Sea {B:=X\setminus A}. Supongamos en pos de la contradicción que {B} es no vacío y sea {b\in B} un elemento minimal. Es claro que si {x\in X} con {x<b}, entonces {x\in A} ya que de otro modo {b} no sería minimal. Pero entonces {b\in A}, lo que contradice la elección de {b}. \Box

   Ahora, veamos que es necesario.

Teorema 9. Sea {X} un conjunto no vacío parcialmente ordenado tal que {A=X} siempre que {A\subseteq X} satisface {(y<x\implies y\in A)\implies x\in A} para cualquier {x\in A}. Entonces {X} está bien fundado.

Demostración. Sea {B\subseteq X} y asumamos que {B} no tiene elemento minimal. Sea {A:=X\setminus B}. Tenemos que si {x\in X} e {y\in A} para todo {y<x}, entonces también {x\in A}, caso contrario, {x} sería un elemento minimal de {B}. Pero, por hipótesis, {A=X}, de modo que {B} es vacío. \Box

   Ahora sabemos cuándo podemos aplicar la inducción. ¿Pero siempre es útil? ¡Seguro! Para un ejemplo de un conjunto bien fundado sin orden total, podemos tomar {\mathbf Z} con el orden {m\ne n} si {m=n} o {|m|<|n|} (el ordenamiento “más cercano a cero”). A veces, uno puede querer contar con un orden total. (Añadiré un ejemplo elaborado pronto.) También es útil para probar que cierto conjuntos son bien fundados; por ejemplo

Proposición 10. Sea {X} un conjunto no vacío parcialmente ordenado tal que {\{y\in X:y\le x\}} es finito para todo {x\in X}. Entonces {X} es bien fundado.

Demostración. Sea {A\subseteq X} un subconjunto no vacío de {X} y sea {x\in A}. Tenemos que el conjunto {\{x\in X:x\le a\}\cap A} es finito y no vacío; así, tiene un elemento minimal, que, a su vez, es elemento minimal en {A}. \Box