You are currently browsing the monthly archive for diciembre 2014.

Tanto en películas, artículos periodísticos como en los comentarios variopintos sobre lo complejo que es entender algo, suele ser mentado el Efecto mariposa. Seguro muchos tendrán una idea: “El aleteo de las alas de una mariposa puede provocar un Tsunami al otro lado del mundo.” Pero ¿a qué se refiere realmente? Nadie que no se tenga por ingenuo lo tomaría literalmente. En esta oportunidad revisaremos de qué va esto del efecto mariposa y por qué es mal interpretado ¿La mariposa produce el caos en el mundo? Pues no. Veremos que en realidad es el caos el origen de la mariposa.

— 1. El efecto mariposa —

   A finales del siglo XIX, había un esfuerzo de parte de los matemáticos por comprender la naturaleza del caos, el desorden dentro de un sistema. Un fenómeno a menudo asociado al caos es el Efecto mariposa. Una perturbación mínima podría tener consecuencias de gran impacto a largo plazo. A esto, un matemático diría que existe dependencia sensible respecto de las condiciones iniciales.

   El caos también se caracteriza por la existencia de condiciones iniciales que conducen a cualquier configuración posible del sistema: Una nave espacial que parta desde un lugar “privilegiado” acabará visitando cada rincón del espacio. Un matemático diría que dicha trayectoria es de órbita densa.

— 2. La matemática del caos —

   Matemáticamente, el caos es un concepto que se aplica a los Sistemas dinámicos. Para entender este tipo de sistemas, pensemos en procesos que van cambian un sistema con el tiempo bajo ciertas reglas. Dado un conjunto {X} que contiene todos los posibles estados de un sistema, una aplicación {\varphi\colon X\rightarrow X} del conjunto {X} sobre sí mismo y un estado inicial {x_o\in X}, definimos la órbita de {x_0} bajo la acción de {\varphi} a la sucesión {x_0,x_1:=\varphi(x_0),x_2:=\varphi(x_1),\dotsc} En principio, esto es lo que debemos entender sistema dinámico (discreto). (Siendo rigurosos, un sistema dinámico es (la iteración de) la aplicación {\varphi} y, para cada posible estado inicial, se tiene una órbita distinta del sistema dinámico)

   Ahora bien, ¿qué debe entenderse por caos? Brevemente, un sistema dinámico se considera caótico cuando las órbitas que genera son impredecibles y complicadas. Por ejemplo, partimos de dos puntos muy cercanos, después de cierto tiempo, las órbitas podrían estar alejadas (esto es el efecto mariposa). También hay otras maneras en la que las órbitas son complicadas, es posible que una única órbita esté cerca de cualquier punto del espacio; e.g., la curva de Peano.

   Existen varias maneras de definir el caos en sistema dinámico, siendo la más extendida la propuesta por R. Devaney, en 1986, que impone condiciones muy fuertes, a primera vista. Un sistema dinámico {\varphi:X\rightarrow X}, donde {X} es un espacio métrico, es caótico si en dicho sistema se verifican las propiedades:

  1. dependencia sensible respecto de las condiciones iniciales;
  2. existe una órbita densa; y
  3. existe un conjunto denso de puntos con órbita periódica.

Donde, las dos últimas condiciones implican que, cerca de cada punto, siempre podemos encontrar una órbita densa y una órbita periódica. Veremos esto con mayor detalle luego.

   La primera propiedad es precisamente el efecto mariposa y quiere decir que existe una distancia fija {\delta_0} (constante de sensibilidad) de modo que si elegimos un punto de partida, siempre podremos hallar otro punto de partida, tan cercano como queramos al anterior de manera que ambas órbitas tarde o temprano estarán a una distancia mayor que {\delta_0}. Esta constante es fija para cada sistema dinámico caótico, y pueden ser muy grande (con lo que las órbitas se separarían mucho) o muy pequeña (con lo que las órbitas se separarían poco). Da igual cuan cerca busquemos el segundo punto, siempre podremos encontrarlo.

   La segunda condición significa que existe una órbita que prácticamente llena todo el espacio, mientras que la tercera dice siempre se podremos hallar puntos cuyas órbitas sean periódicas,i.e., órbitas que cada cierto tiempo, periodo, vuelven a su estado inicial.

   Devaney decía que un sistema dinámico caótico

  1. debe ser impredecible, esto es el efecto mariposa;
  2. debe ser indescomponible, es decir, que no se puede descomponer en sistemas más sencillos e independientes entre sí, y por ello la segunda condición, ya que al existir un punto cuya órbita llena prácticamente el espacio, no es posible dividir el espacio sin romper esta órbita de alguna forma; y
  3. debe tener un amplio elemento de regularidad en medio de este comportamiento aleatorio, estos son los puntos periódicos que han de poder encontrarse en cualquier sitio.

— 3. El efecto mariposa —

   Como hemos visto, el efecto mariposa parece ser parte importante de la definición de caos; es más, es la primera propiedad que debe cumplir un sistema dinámico caótico, lo que nos da a entender que debe ser parte fundamental del caos.

   Y sin embargo… las cosas no son lo que parecen: el efecto mariposa es una condición superflua. ¿Qué quiere decir esto? Pues que esta condición se puede eliminar de la definición y todo sigue igual. En este artículo se puede apreciar que un sistema dinámico que cumpla las dos últimas condiciones, automáticamente debe cumplir la primera. En otras palabras, el efecto mariposa no es más que una consecuencia del caos.

— 4. Sistemas dinámicos —

   Veamos como enfocar lo que queremos decir. Iniciemos con algunas definiciones

Definición 1 (Sistema dinámico). Un sistema dinámico (discreto) está definido por una función {\varphi\colon X\rightarrow X} de un conjunto {X} sobre sí mismo.

   Si {x_0} es el estado inicial, los demás estados se obtiene por la fórmula {x_{n+1}:=\varphi(x_n)}, con {n\in\mathbb N}, donde {n} se interpreta como el tiempo o momento. La órbita de un punto {x_0} está definida como la sucesión {(x_n)_{n=0}^\infty}, i.e., {x_0,x_1,x_2,\dotsc}, donde {x_n\in X}.

   Uno puede pensar que las condiciones de un sistema dinámico caótico son demasiado fuertes, pero no es así; por ejemplo, un sistema descrito por la función {\varphi(x):=1-|2x-1|}, con {0\le x\le1}, y por estado inicial {x_0:=2/9} nos da la sucesión {x_1=\varphi(2/9)=4/9}, {x_2=\varphi(4/9)=8/9}, {x_3=\varphi(8/9)=2/9}, etc. De esto se deduce que la órbita de {x_0} viene dada por {2/9,4/9,8/9,2/9,2/9,4/9,8/9,2/9,\dotsc}, y así el punto {x_0} tiene una órbita periódica con periodo {3}. Ahora, veamos como se comporta la dependencia sensible de las condiciones iniciales, notemos que un leve cambio en el punto inicial genera cambios notables en el tiempo,

\displaystyle  \begin{array}{ccc} & \text{\'Orbita original} & \text{\'Orbita perturbada} \\ x_0 & 0.16 & 0.17 \\ x_1 & 0.32 & 0.34 \\ x_2 & 0.64 & 0.68 \\ x_3 & 0.72 & 0.64 \\ x_4 & 0.56 & 0.72 \\ x_5 & 0.88 & 0.56 \\ x_6 & 0.24 & 0.88. \end{array}

Para el estado inicial {x_0=0.16} se obtiene {x_6=0.24}, mientras que para el estado inicial ligeramente diferente {x_0=0.17} se obtiene {x_6=0.88}, bastante alejado de {0.24}. Además, si bien es más difícil de apreciar, este sistema tiene órbitas densas.

   Usemos la notación, para {x\in X}, la órbita de {x} es {O(x):=\{\varphi^n(x)\in X:n\le 0\}}, donde {\varphi^0(x):=x}. (Esto es esencialmente lo mismo que lo expuesto en la Definición 1.)

   Ahora veamos que quieren decir las condiciones de un sistema dinámico caótico.

{\varphi\colon X\rightarrow X} es sensible respecto de las condiciones iniciales si existe una constante de sensibilidad {\delta>0} (que sólo depende de {\varphi}) tal que para cada {x\in X} y {\epsilon>0} existe {y\in X} y {n\in\mathbb N} tales que {d(x,y)<\epsilon} y {d(\varphi^n(x),\varphi^n(y))>\delta}. Esto quiere decir que no importa cuánto se busque, siempre se podrá hallar un punto {y} tal que tarde o temprano su órbita se aleja de la de {x} una cierta constante prefijada {\delta}.

   La segunda condición dice que existe un punto {x_0} tal que, para cada punto {y\in X} y {\epsilon>0}, existe un {n\in\mathbb N} tal que {d(\varphi^n(x),y)<\epsilon}.

   La tercera condición significa que, para cada punto {x\in X} y {\epsilon>0}, existe un punto periódico {p\in X}, tal que {d(x,p)<\epsilon}. Notar que un punto {p\in X} es periódico, o tiene órbita periódica, cuando existe {n_p\in\mathbb N} tal que {\varphi^{n_p}(p)=p}.

   Ahora centremos nuestro foco de atención.

Teorema 2. Sea {X} un espacio métrico sin puntos aislados. Si la aplicación {\varphi\colon X\rightarrow X} posee un punto con órbita densa y un conjunto denso de puntos periódicos, entonces es sensible respecto de las condiciones iniciales.

Demostración. Sea {X} es un espacio métrico sin puntos aislados. Entonces tenemos que si existe un punto {x_0\in X} con órbita densa, entonces existe un conjunto denso de puntos con órbita densa. En efecto, ya contamos con que la órbita {O(x_0)} es densa. Pero para cada {n\in\mathbb N} se tiene

\displaystyle  O(\varphi^n(x_0))=\{\varphi^n(x_0),\varphi^{n+1}(x_0),\dotsc\}=O(x_0)\setminus\{x_0,\dotsc,\varphi^{n-1}(x_0)\},

y este conjunto sigue siendo denso, ya que sólo se ha retirado una cantidad finito de puntos a un conjunto denso. (Precisamente, para que esto sea cierto, es necesario que no haya puntos aislados.) Resumiendo, sabemos que existe un conjunto denso órbitas densas.

   Ahora, elijamos dos puntos periódicos distintos {p} y {q}. Como sus órbitas {O(p)} y {O(q)} son periódicas, han de ser finitas. Sea {\delta_0:=d(O(p),O(q))}, i.e., la distancia entre sus órbitas. Fijando un punto {x\in X}, es claro que {d(x,O(p))>\delta_0/2} o bien {d(x,O(q))>\delta_0/2}. Así, en cualquier caso, tenemos que: existe {\delta_0>0} tal que, para cada {x\in X}, existe un punto periódico {p}, de manera que {d(x,O(p))>\delta_0/2}.

   Ahora, mostramos que {\varphi} es sensible respecto a las condiciones iniciales y con constante de sensibilidad {\delta=\delta_0/8}. Vamos a por ello.

   Sea {x\in X} y {\epsilon>0}. Podemos suponer, sin pérdida de generalidad, que {\epsilon<\delta}. Como el conjunto de puntos periódicos es denso, existe un punto periódico {p} tal que {d(x,p)<\epsilon<\delta}.

   Tal como hemos visto, dado {x\in X} existe un punto periódico {q} tal que {d(x,O(q))>\delta_0/2=4\delta}.

   Sea {n} el periodo de {p} y sea {V:=\bigcap_{i=0}^n\varphi^{-i}(B(\varphi^i(q),\delta))}, donde {B(z,r)} es la bola de centro {z\in X} y radio {r>0}, i.e., {B(z,r):=\{w\in X:d(w,z)<r\}}. Como {\varphi} es continua, se tiene que {V} es una intersección finita de conjuntos abiertos (una aplicación es continua si la preimagen de un abierto es abierto), por lo tanto, {V} es un abierto. Además, obviamente {q\in V}, pues para cada {i=0,\dotsc,n} se tiene que {\varphi^i(q)\in B(\varphi^i(q),\delta)}. Por lo tanto, existe un número {\delta_q>0} tal que {B(q,\delta_q)\subseteq V}.

   Ahora, sabemos que existe un conjunto denso de puntos con órbita densa, por lo tanto, existe un punto {x_0} con orbita densa tal que {d(x,x_0)<\epsilon}. Como {O(x_0)} es densa, existe un {k\in\mathbb N} tal que {d(\varphi^k(x_0),q)<\delta_q}, de donde se deduce que {\varphi^k(x_0)\in V}, y esto quiere decir que para todo {i=0,\dotsc,n} se tiene que {d(\varphi^i(q),\varphi^{i+k}(x_0))<\delta}.

   Ya estamos cerca. Sea {j} la parte entera de {k/n+1}. Así, tenemos que {1\le nj-k\le n} y, por lo anterior, {d(\varphi^{nj-k}(q),\varphi^{nj}(x_0))<\delta}.

   Ahora, queda darnos cuenta que, como {n} es el periodo de {p}, se cumple que {\varphi^{nj}(p)=p} y, aplicando la desigualdad triangular, tenemos que

\displaystyle  \begin{array}{rcl}d(\varphi^{nj}(p),\varphi^{nj}(x_0))&=&d(p,\varphi^{nj}(x_0))\\&\ge&d(x,\varphi^{nj-k}(q))\\&&\;-d(\varphi^{nj-k}(q),\varphi^{nj}(x_0))\\&&\;-d(p,x).\end{array}

Por un lado, sabemos que {d(p,x)<\epsilon<\delta}; por otro, que {d(\varphi^{nj-k}(q),\varphi^{nj}(x_0))}; y finalmente, como {\varphi^{nj-k}(q)\in O(q)} y {d(x,O(q))>4\delta}, se tiene que {d(x,\varphi^{nj-k}(q))>4\delta}. Así, tenemos que {d(\varphi^{nj}(p),\varphi^{nj}(x_0))>4\delta-\delta-\delta=2\delta}.

   Y llegamos. Usando la desigualdad triangular, se tiene que o bien {d(\varphi^{nj}(p),\varphi^{nj}(x))>\delta} o bien {d(\varphi^{nj}(x_0),\varphi^{nj}(x))>\delta}. Pero, como {d(x,p)<\epsilon} y {d(x,x_0)<\epsilon}, en cualquiera de los dos casos hemos demostrado la existencia de un punto {z\in X} y {N\in\mathbb N}, con {N:=nj}, tales que {d(z,x)<\epsilon} y {d(\varphi^N(z),\varphi^N(x))>\delta}. Por lo tanto, {\varphi} es sensible respecto a las condiciones iniciales y con constante de sensibilidad {\delta}. \Box

   Notemos que para entender la demostración apenas se necesitan conocimientos básicos sobre espacios métricos.

— 5. Fin del viaje —

   En conclusión, para poder caracterizar el caos, basta con tener una órbita que (casi) llene todo el espacio y muchas órbitas periódicas. Podríamos decir que un sistema caótico divide al espacio en dos partes: una de gran regularidad (conjunto denso de puntos periódicos) y otra totalmente conectada e indescomponible (una órbita densa). Amabas partes están tan entrelazadas entre sí, que es imposible separar una de la otra. Y que, el efecto mariposa es una simple consecuencia de todo lo anterior.

   Así que, a partir de ahora, cuando veamos comentarios acerca del efecto mariposa recordemos que no es lo que caracteriza el caos: existe otro tipo de impredecibilidad que refleje mejor el caos…

Anuncios

Ariana y David ganan dos monedas de un nuevo sol cada día y gastan dos de ellas.

   Ariana organiza sus ahorros del siguiente modo: el día {n} gana dos monedas {r_n} y {s_n}. Alquila un almacén, deposita allí la moneda {r_n} en una pila de monedas de los días anteriores, y gasta {s_n}. De este modo, el primer día ahorrado {\{r_1\}}, el segundo {\{r_1,r_2\}}, el tercero {\{r_1,r_2,r_3\}}, etc. (Así,la moneda situada arriba de la pila es la escrita a la derecha.)

   David se organiza de otra manera, y hace circular todas sus monedas: el día {n} coloca bajo la pila de monedas ahorradas las monedas {r_n} y {s_n} que acaba de ganar; coge la moneda que se encuentra encima de la pila y la gasta. Así, el primer día su pila tiene la moneda {\{s_1\}} (ha colocado {r_1} y {s_1} y gastado la moneda {r_1}), el segundo día sus monedas son {\{r_2,s_2\}} (ha añadido {r_2} y {s_2} debajo de la pila, quedando {\{s_1,r_2,s_2\}}, y ha gastado la moneda de encima {s_1}), el tercer día su montón se transforma en {\{s_2,r_3,s_3\}}, el cuarto en {\{r_3,s_3,r_4,s_4\}}, el quinto en {\{s_3,r_4,s_4,r_5,s_5\}}, etc.

   Así expuesto, ambos ahorran y gastan la misma cantidad de dinero. Veremos que sorprendentemente Ariana será infinitamente rica y David estará en la más absoluta ruina.

   En efecto, Ariana tendrá ahorradas las monedas

\displaystyle  \{r_1,r_2,r_3,r_4,r_5,r_6,r_7,\dotsc,r_n,r_{n+1},\dotsc\}.

Sin embargo, David no tendrá nada: la moneda {r_n} —colocada el día {n}–– se gastará el día {2n-1}, y la moneda {s_n} ––también colocada el día {n}–– se invertirá el día {2n}. Así, toda moneda termina siendo desembolsada por David, con lo cual, “al final de los tiempos”… no le quedará nada.

¿Parece absurdo, no: ganando y gastando ambos lo mismo, Ariana es rica y David, pobre? Esta es una de las muchas paradojas que minan nuestro razonamiento intuitivo acerca del infinito; la misma que involucra la noción de cardinal. El cardinal de un conjunto finito es el número de elementos que posee. Definimos {card(A)} como el cardinal del conjunto {A}.

   Diremos que {A_n} es el conjunto de las monedas conservadas por Ariana en el instante {n},

\displaystyle  A_n = \{r_1,r_2,r_3,r_4,r_5,r_6,r_7,\dotsc,r_n\},

y {A} es el conjunto con las monedas que posee Ariana al final de los tiempos. El cardinal de {A_n}, es {card(A_n)=n}, que tiende a infinito cuando {n} tiende al infinito, de modo que {card(A)=\infty}, y, así, Ariana termina siendo infinitamente rica.

   Similarmente, sea {D_n} el conjunto de las monedas ahorradas por David en el instante {n} y {D} el número de ellas que conserva al final de los tiempos. Como dijimos, David gasta todas sus monedas, ya que invierte la moneda {r_n} el día {2n-1}, y la moneda {s_n} el día {2n}. Así, {card(D)=0}, ya que {D} es el conjunto vacío. ¡David está en la ruina!

   Comprobemos el resultado. Al cabo de {2n} días:

\displaystyle  A_{2n}=\{r_1,r_2,r_3\dotsc,r_{2n-1},r_{2n}\},

y {card(A_{2n})=2n}, que tiende a infinito cuando {n\rightarrow\infty}, de modo que {card(A)=\infty}. En el caso de Ariana, confirmamos que obtiene una fortuna infinita. Al cabo de esos mismos {2n} días, David tiene guardado

\displaystyle  D_{2n}=\{r_{2n},s_{2n},r_{2n-1},r_{2n-1},\dotsc,r_{n+2},s_{n+2},r_{n+1},s_{n+1}\},

es decir, {card(D_{2n})=2n}, que tiende a infinito cuando {n\rightarrow\infty}, así

\displaystyle  card(D)=\lim card(D_{2n})=\lim(2n)=\infty.

¿No habíamos dicho antes que {D} era el conjunto vacío?

   El problema en este razonamiento se produce al pensar que los límites se pueden intercambiar con el cardinal. Si fuera

\displaystyle  \lim card(D_{2n})=card(\lim D_{2n}),

se obtendría

\displaystyle  \infty=\lim card(D_{2n})=card(\lim D_{2n})=card(D)=0.

   Vemos que debemos ser cuidadosos con los razonamientos sobre sucesiones infinitas. En una próxima entrega podríamos revisar con algo más de detalle este tipo de argumentos… mientras, ¡mucho cuidado con el infinito!

   Hace poco en un hilo de conversación comentaban este tema: que la matemática sólo es aplicación de las leyes lógicas. Ya había comentado algo similar en una publicación previa. Ahora presentaré algunos comentarios hechos por el matemático Henri Poincaré.

   Henri Poincaré (1854-1912), matemático, físico y filósofo, ha influenciado indudablemente sobre la ciencia actual. Uno de sus intereses fue la manera en la que intuición matemática se manifestaba. En Henri Poincaré, Ciencia y método, Espasa, 1965, comentaba: “Por entonces salí de Caen, donde a la sazón vivía, para participar en una excursión geológica organizada por la escuela de minas. Las incidencias del viaje me hicieron olvidar mis trabajos matemáticos. En determinado momento estábamos en Coutances y habíamos de subir a un ómnibus para desplazarnos a otro sitio. Justo al poner el pie en el estribo, sin que ninguno de mis pensamientos precedentes pareciese haberla propiciado, me vino la idea de que las transformaciones que había usado para definir las funciones fuchsianas eran idénticas a las de la geometría no euclídea. No proseguí el razonamiento, ni hubiese tenido ocasión de ello, pues me senté en mi asiento y continué una conversación previa, pero estaba completamente seguro. A mi regreso a Caen lo comprobé concienzudamente por pundonor.”

   En la publicación Henri Poincaré, El valor de la ciencia, Espasa, 1964 dedicada a las ciencias matemáticas, en el capítulo titulado La intuición y la lógica en matemáticas, Poincaré comenta sobre el papel que juegan la intuición y la lógica en la creación matemática:

“Buscamos la realidad, pero ¿qué es la realidad?

   Los fisiólogos nos enseñan que los organismos están formados por células; los químicos agregan que las células mismas están formadas por átomos. ¿Quiere decir esto que esos átomos o esas células constituyen la realidad o, por lo menos, la única realidad? La forma en que estas células están dispuestas y de la cual resulta la unidad del individuo, ¿no es también una realidad mucho más interesante que la de los elementos aislados? Un naturalista que no hubiera estudiado nunca al elefante sino con el microscopio, ¿creería conocer suficientemente a este animal?

   Pues bien, en matemáticas ocurre algo análogo. El lógico descompone, por decirlo así, cada demostración en un número muy grande de operaciones elementales; cuando se hayan examinado estas operaciones, unas después de otras, y se haya comprobado que cada una de ellas es correcta, ¿se creerá haber comprendido el verdadero sentido de la demostración? ¿Asimismo, se habrá comprendido cuando, por un esfuerzo de memoria, nos hayamos capacitado para repetirla, reproduciendo todas esas operaciones elementales en el mismo ordenen que las había colocado el inventor?

   Evidentemente, no; todavía no poseeremos la realidad completa; ese no sé qué que hace la unidad de la demostración, se nos escapará totalmente.

   El análisis puro pone a nuestra disposición una multitud de procedimientos cuya infalibilidad nos garantiza; nos abre mil caminos diferentes en los que podemos entrar con toda confianza; estamos seguros de no encontrar obstáculos en ellos, pero ¿cuál todos de esos caminos es el que nos llevará más rápidamente al fin? ¿Quién nos dirá cuál hay que elegir? Nos hace falta una facultad que nos haga ver el objeto de lejos y esa facultad es la intuición. Es necesaria al explorador para elegir su ruta; no lo es menos a quien sigue sus huellas y quiere saber por qué la ha elegido.

   Si asistís a una partida de ajedrez, para comprenderla no os bastará saber las reglas del movimiento de las piezas. Esto os permitirá solamente reconocer que cada jugada ha sido hecha conforme a estas reglas, y esta ventaja tendrá verdaderamente muy poco valor. Es, sin embargo, lo que haría un lector de un libro de matemáticas, si no fuera más que lógico. Comprender la partida es enteramente otra cosa; es saber por el jugador avanza tal pieza más bien que tal otra que habría podido mover sin violar las reglas del juego. Es advertir la razón íntima que hace de esta serie de jugadas sucesivas una especie de todo organizado. Con mayor razón, esta facultad es necesaria al jugador mismo, es decir, al inventor.

[…] Por ejemplo, veamos lo que ha ocurrido con la idea de función continua. Al principio no era más que una imagen sensible, por ejemplo, la de un trazo continuo descrito con tiza en un pizarrón. Después se ha depurado poco a poco; pronto se ha utilizado para construir un complicado sistema de desigualdades, que reproduciría, por decirlo así, todas las líneas de la imagen primitiva; cuando esta construcción estuvo terminada, se ha descimbrado, por decirlo así, se ha desechado esta representación grosera que momentáneamente le había servido de apoyo y que sería inútil en adelante; no ha quedado más que la construcción misma, irreprochable ante los ojos del lógico.

   Sin embargo, si la imagen primitiva hubiera desaparecido totalmente de nuestro recuerdo, ¿cómo adivinaríamos por qué capricho se han dispuesto estas desigualdades de esa manera, unas sobre otras?

[…] Así es como las antiguas nociones intuitivas de nuestros antepasados, aun cuando las hayamos abandonado, todavía imprimen su forma a los andamiajes lógicos que hemos colocado en su lugar.

   Esta vista de conjunto es necesaria al inventor; es necesaria igualmente a aquél que quiere realmente comprender al inventor. ¿Puede dárnosla la lógica?

   No, el nombre que le dan los matemáticos bastaría para probarlo. En matemáticas, la lógica se llama análisis, y análisis significa división, disección. No puede tener, pues, otra herramienta que el escalpelo y el microscopio.

   De este modo, la lógica y la intuición tienen cada una un papel necesario. Ambas son indispensables. La lógica, que puede dar por sí misma la certeza, es el instrumento de la demostración; la intuición es el instrumento de la invención.”

   Hace un par de días un amigo, César Verde, compartía un artículo sobre la situación de la matemática en el Perú; en sus palabras: “Un estudio realizado por el investigador Alvaro Delgado, una de las razones por la que el Perú figura en último lugar en el último lugar en matemática, según el último examen internacional Pisa, se debe a que la mayoría de los estudiantes peruanos dicen: ‘si estudio matemática, no voy a conseguir enamorada’. En lugar de estar asociada con la solución de problemas, creatividad, construcción, ingeniería y afines, la matemática es vista como un obstáculo para la vida social.”

   Uno puede ver un panorama interesante y desolador, para un investigador social y para un espectador de nuestra sociedad, respectivamente. No me gusta la idea de “adaptar a la moda, actualizar la imagen” de los estudiantes de matemáticas. No obstante, la idea de ser sede de un evento matemático es una idea bastante antigua (incluso aplicada en ciertos contextos por pocas organizaciones), que si hubiera sido considerada por las personas pertinentes, no leeríamos artículos como el mencionado. (Supongo que es de poco interés para las estructuras sociales.)

   Pienso que el problema de fondo —y esto es estrictamente personal— es en parte un “proceso” que ha desvirtuado en nuestra sociedad la idea de un matemático. Si ya carecíamos de programas educativos en comunicación, arte, música, etc., era puro sentido común darse cuenta que con la matemática esto es peor; sino comparemos con la realidad japonesa, aunque hay mejores ejemplos, pero leí sobre ellos hace mucho, mucho, tiempo atrás: usando algún buscador web debe ser posible hallarlos.

   Personalmente, me ha costado saber qué es hacer matemáticas y, más aún, cómo hacerlas. Ni imaginar cómo estarán las personan que han tenido menos contacto con libros de (verdaderas) matemáticas.

   Es evidente concluir que usando las mejoras en redes de comunicación e internet podríamos mejorar la divulgación (incluso se podría diseñar redes basadas en ondas radioeléctricas y llegar a más lugares donde la internet no puede —algo que conversé con un ingeniero de telecomunicaciones del ejército, pero llegamos a la conclusión que requiere inversión civil). Sin embargo, sigue latente el “para qué aprender”. (Por cierto, estoy preparando una publicación para mi bitácora sobre algo similar respecto a la filosofía.)

   Sobre lo último, pongo un ejemplo que puede permitir extrapolar una posible solución (no digo una definitiva ni factible). Considera la realidad sobre los “realities” actuales: ¿por qué unos sujetos que arman torres con vasitos, que tienden a “lacearse” el cabello, que, en resumen, hacen lo mismo que una persona de su edad hacía en el colegio son considerados íconos para la mayoría de la juventud? (¿Es que serán mentalmente niños?) La respuesta más simple es que sucede esto por la falta de “personajes icónicos” en otros aspectos. Veamos: tres a dos décadas atrás, la gente joven quería emular al “cholo Sotil” porque era el “ídolo de multitudes”, y ese deseo de emularlo invocaba tener disciplina (no quiero decir que todo era bueno, pero, vamos, se entiende mi punto: quienes querían ser como él necesitaban mantenerse entrenando, no hacer desarreglos; una vida desordenada era inconcebible.).

   En consecuencia, creo que falta que los paradigmas de matemáticos sean reconocidos en sociedad y, para ello, es necesario poner seriedad en la aplicación de las matemáticas en nuestras profesiones, cuya formación matemática es deficiente en muchos de los programas de estudio (al menos en ingeniería) de varias universidades (este tema está harto tratado, así que no comentaré más sobre ello).

   Sólo para que lo dicho en el párrafo anterior no quede en simples palabras, pongo un ejemplo que sucedió en una reunión de ingenieros de software: imagina un “programador” que tiene que mostrar una “valoración” de ciertos productos en función de los votos positivos y/o negativos de los usuarios. Veamos cómo proceder:

  1. valoración = (votos positivos) – (votos negativos). El problema aquí es que si tienes un producto con 60 votos positivos y 40 negativos: tiene 60% positivo. Supón un segundo producto con 550 votos positivos y 450 votos negativos: 55% positivo. Esto ubica al segundo producto con valoración=100, pero únicamente 55% positivos, sobre el primer producto con valoración=20, pero con 60% positivos. Error.
  2. valoración = promedio de votos = (votos positivos) / (total votos). También es un error: supón un primer producto que tiene 2 votos positivos y 0 votos negativos. Supón un segundo producto con 100 votos positivos y 1 voto negativo. Esto pone el segundo producto debajo del primero. Error.

La respuesta adecuada a la situación es usar el límite inferior del intervalo de confianza de Wilson para un parámetro de Bernoulli, que está bien documentada, cuya implementación puede ser trivial (incluso se puede programar en SQL) si uno fija el nivel de confianza de antemano.

   El problema de fondo es que “los profesionales” cometen este tipo de “sutilezas” a niveles que uno podría imaginar que es imposible que ocurran (v.g., uno de los ejemplos es de Amazon), y, lo peor, se justifican invocando a la filosofía KISS. (No digo que sea un error seguir los principios KISS, pero es análogo a querer adaptar, por ejemplo, los principios del catolicismo a mis gustos, sólo para justificar mis pecados.)

   Finalmente, ¿qué puede hacer el estado? Evidentemente necesitan un faro, una persona cabal que dirija las tareas:

  • Recluta, recluta, recluta… con las condiciones adecuadas.
  • Rompe el concepto de exámenes y asistencia a clases.
  • Realizar proyectos aplicables y publicables.

Así dicho, parece pura cháchara. Pero es un resumen de la receta de Solomon Lefschetz, quien llevó a Princeton, y el Edificio Fine, a ser el Olimpo matemático en la pos-guerra. (Sólo para precisar, el proceso de Princeton empezó justo antes de la pos-guerra, pero fue en esta época cuando alcanzó su auge.)

   Ya veremos…

   En una publicación anterior mencionábamos algunos aspectos de la demostración de Zhang acerca de las brechas acotadas entre primos. Ahora veremos algunos comentarios adicionales.

   En una publicación, Yitang Zhang probó el siguiente teorema:

Teorema 1 (Brechas acotadas entre primos). Existe un número natural {H} tal que hay infinitos pares de primos distintos {p,q} con {|p-q|\le H}.

   Zhang obtuvo el valor explícito de {70,000,000} para {H}. No obstante, se propusieron menores valores y que también mejoran la comprensión de los resultados de Zhang. No obstante la cota ha ido disminuyendo: uno de los valores que más me sorprendió fue {H=246}.

   El argumento de Zhang se divide en tres pasos, los cuales describimos en orden inverso. El último paso, que es el más elemental, es deducir el teorema anterior de las siguiente versión débil de la conjetura Dickson-Hardy-Littlewood (DHL) para algún {k_0}:

Teorema 2. ({DHL[k_0,2]}) Sea {\mathcal H} una {k_0}-tupla admisible, es decir, una tupla de {k_0} enteros distintos que evita al menos una clase de residuos módulo {p} para cada primo {p}. Entonces existen infinitas traducciones de {\mathcal H} que contienen al menos dos primos.

   Zhang obtuvo {DHL[k_0,2]} para {k_0 = 3,500,000}. Para obtener desde {DHL[k_0,2]} al Teorema 1, uno tiene una {k_0}-tupla admisible de diámetro a lo más {H}. Por ejemplo, con {k_0 = 341,640}, la más estrecha {k_0}-tupla admisible que podemos construir con diámetro {4,802,222}. Hay una discusión activa tratando de mejorar la construcción de las tuplas admisibles en este blog; es concebible que alguna búsqueda combinada por computador y construcción combinatorias inteligentes podrían obtener unos cuántos valores mejorados de {H} para un valor dado de {k_0}. La relación entre {H} y {k_0} es aproximadamente de la forma {H \approx k_0 \log k_0} (y una estimación clásica de Montgomery y Vaughan nos dice que no podemos hacer a {H} más estrecho que {\frac{1}{2} k_0 \log k_0}).

   El segundo paso en el argumento de Zhang, que es algo menos elemental (basándose principalmente en la teoría de cribas de Goldston, Yildirim, Pintz y Motohashi), es para deducir {DHL[k_0,2]} desde una cierta conjetura {MPZ[\varpi,\delta]} para algunos {\varpi,\delta > 0}. Aquí hay otra formulación de la conjetura, más o menos como (implícitamente) se indica en la publicación de Zhang:

Conjetura 3. ({MPZ[\varpi,\delta]}) Sea {\mathcal H} una tupla admisible, sea {h_i} un elemento de {\mathcal H}, sea {x} un parámetro grande y se define

\displaystyle  D := x^{1/4+\varpi},

\displaystyle {\mathcal P} := \prod_{p: p < x^{\delta}} p,

\displaystyle  P(n) := \prod_{h \in {\mathcal H}} (n+h),

\displaystyle  C_i(d) := \{ c \in {\bf Z}/d{\bf Z}: (c,d) = 1; P(c-h_i) = 0 \hbox{ mod } d \}

para cualquier número natural {d}, y

\displaystyle  \Delta(\gamma;d,c) = \sum_{x \leq n \leq 2x: n = c \hbox{ mod } d} \gamma(n) - \frac{1}{\varphi(d)} \sum_{x \leq n \leq 2x: (n,d) = 1} \gamma(n)

para cualquier función {\gamma: {\bf N} \rightarrow {\bf C}}. Sea {\theta(n)} igual a {\log p} cuando {n} es un primo {p}, y {\theta(n)=0} en cualquier otro caso. Entonces uno tiene

\displaystyle  \sum_{d < D^2; d|{\mathcal P}} \sum_{c \in C_i(d)} |\Delta(\theta; d, c )| \ll x \log^{-A} x

para cualquier {A > 0} fijo.

   Notar que acá se ha invertido la formulación de Zhang con el propósito de describir lo expuesto en la publicación. Sin embargo se distingue dos parámetros aquí {\varpi,\delta} en lugar de uno, ya que parece que hay algún margen de optimización mediante el uso de dos parámetros distintos.

   Uno puede deducir {DHL[k_0,2]} desde {MPZ[\varpi,\delta]}. Ignorando el error exponencialmente pequeño {\kappa}, uno puede deducir {DHL[k_0,2]} desde {MPZ[\varpi,\delta]} siempre que uno pueda hallar una función suave {g\colon [0,1] \rightarrow {\bf R}} que se desvanece para un orden de almenos {k_0} en {1} tal que

\displaystyle  k_0 \int_0^1 g^{(k_0-1)}(x)^2 \frac{x^{k_0-2}}{(k_0-2)!}\ dx > \frac{4}{1+4\varpi} \int_0^1 g^{(k_0)}(x)^2 \frac{x^{k_0-1}}{(k_0-1)!}\ dx.

   Mediante la selección {g(x) := \frac{1}{(k_0+l_0)!} (1-x)^{k_0+l_0}} para un parámetro real {l_0>0} para optimizar el excedente y, técnicamente, ignorando el término {\kappa} mencionado previamente (el cual es la única cantidad aquí que depende de {\delta}), esto da {DHL[k_0,2]} desde {MPZ[\varpi,\delta]} siempre que

\displaystyle   k_0 > (\sqrt{1+4\varpi} - 1)^{-2} \ \ \ \ \ (1)

   Puede ser posible mejorar esto mediante elecciones más inteligentes para {g} o la ejecución de alguna especie de cálculo numérico de variaciones o teoría espectral.

   La última, y más profunda, parte del trabajo de Zhanges el siguiente teorema (Teorema 2 de la publicación de Zhang, cuya demostración ocupa las Secciones 6-13 de dicha publicación and ocupa como 32 páginas):

Teorema 4 (Zhang). {MPZ[\varpi,\varpi]} es cierto para todo {0 < \varpi \leq \frac{1}{1168}}.

   El significado de la fracción {1/1168} es que el argumento de Zhang procede para una elección general de {\varpi > 0}, pero en última instancia el argumento sólo concluye si uno tiene

\displaystyle  \frac{31}{32} + 36 \varpi \leq 1 - \frac{\varpi}{2}

(ver página 53 de Zhang) el cual es equivalente a {\varpi \leq 1/1168}. La conexión en esta elección de {\varpi} en (1) entonces da {DHL[k_0,2]} con {k_0 = 341,640} como se indicó anteriormente.

   Mejorar el valor de {\varpi} en el Teorema 4 daría lugar a mejoras en {k_0} y, entonces, {H} en como se expuso anteriormente.

   Todo estudio requiere de una fase previa en la que se obtienen los conocimientos necesarios para avanzar en el aprendizaje. El problema es decidir cuánto de ese conocimiento es necesario. Particularmente, cuando empecé a estudiar Análisis, tenía problemas al tratar con las sutilezas de la Teoría de conjuntos, así como ciertas propiedades del álgebra. Aunque es posible avanzar “intuitivamente”, deja un sin sabor ciertas grietas que uno tiene que saltar, en lugar de sellar. Ahora presentaré un resumen de los fundamentos, que considero, me ayudaron a tener un soporte.

   Supondré que tiene el cierta familiaridad con las matemáticas elementales (e.g., manejo de expresiones algebraicas: {a^ma^n=a^{m+n}}, {a/b+c/d=(ad+bc)/bd}, etc.) En general, que conoce los números naturales, enteros racionales, y que esté familiarizado con los números reales sería conveniente.

   Mi principal propósito es conectar los conocimientos informales con otros conceptos más abstractos que son necesarios par abordar con el rigor necesario otros temas más delicados. Con “rigor necesario” no me refiero a trabajar en sistema axiomático formal, sino a lo esencial para distinguir informalmente un razonamiento válido de otro que pretende serlo.

— 1. El comienzo del viaje —

   Al ver una película somos espectadores de lo que quiere contarnos. Algunas son de género realista y, otras, fantásticas; así mismo, es posible que combinarlas en distintas proporciones. Lo que sí se mantiene constante es el hecho que cada película tiene su propia realidad interna, la cual debemos asumir cierta para poder comprender lo que se nos quiere mostrar; cualquier juicio sobre cualquier escena no debe remitirse a la realidad externa. Por ejemplo, si estamos ante una película de vampiros, debemos ser capaces de asumir su existencia según el caso. Si es de género fantástico, es necesario creer que existen de manera interna los vampiros y, por lo tanto, es inconcebible pasear durante las noches. Por otro lado, de ser de género realista, sería tonto no buscar un tesoro en el castillo de Drácula. Los importante es aislar lo que sea que creamos de la realidad interna de la película, independientemente de lo que sepamos de la realidad externa (que no existen); sino, no sería posible concebir el final de la misma, cuando los vampiros aparezcan y manifiesten su realidad (interna). En resumen, la realidad interna son todas las leyes que hacen posible la trama, mientras que la realidad externa es la que vivimos y que no tiene por qué necesariamente afectar la película.

   En nuestra historia acerca de los conjuntos, quienes la consideran histórica son los que los filósofos llamados platonistas; aquellos para los cuales es pura fantasía son los formalistas; mientras que quienes adoptan posturas intermedias se distribuyen entre una amplia gama de escuelas, una de las más populares es el finitismo.

   En el relato que vamos a presentar acá, nuestros personajes son llamados conjuntos internos. Del mismo modo en el que un personaje pretende ser una persona (interna), en nuestro relato, los conjuntos internos pretende ser (internamente) colecciones de objetos. ¿De qué objetos? Nuestra teoría será muy cómoda, dichos objetos serán otros conjuntos internos. No hay nada más que conjuntos internos. (De aquí en adelante usaremos los términos conjunto y conjunto interno para hacer referencia a la misma entidad. Quien termine la lectura verá que la expresión “conjunto interno” ayuda a clarificar las ideas, pero que, en la práctica posterior a esta lectura, usará el término “conjunto”.)

   Así, un conjunto {B} es una colección de conjuntos. Si {A} es uno de los conjuntos que forman parte de {B}, escribimos

\displaystyle  A \in B.

Se lee {A} pertenece a {B}, {A} es un elemento de {B}, {A} está en {B}, etc. Para indicar lo opuesto usamos {A \notin B}.

   Toda historia coherente debe respetar ciertas normas, que se establecen (posiblemente de manera arbitraria) para no incurrir en contradicciones. Por ejemplo, en una película que trate de seres humanos, no deberíamos ver uno de seis dedos.

   Entonces se tienen leyes internas, llamadas axiomas, que todo conjunto debe respetar para que el argumento sera coherente e interesante. En ese sentido, con estas leyes logramos que nuestros conjuntos internos se comporten internamente como esperamos. Veamos cuando dos conjuntos son iguales

Axioma 1 (de extensionalidad). Si dos conjuntos {A,B} tienen los mismos elementos, entonces son iguales, {A = B}.

   Para confirmar la igualdad bastará con tomar un elemento arbitrario {x \in A} y lograr probar que también {x \in B}, y viceversa.

   Para referirnos a la mitad de este hecho, diremos que {A} es un subconjunto de {B}, {A \subset B}, si todo elemento de {A} es también un elemento de {B}. Así, {A = B} equivale a las dos inclusiones {A \subset B} y {B \subset A}.

   Se llama extensión de un conjunto {B} a todos los conjuntos {A} que cumplen {A \in B}. Así, el axioma de extensionalidad afirma que dos conjuntos son iguales si, y sólo si, tienen la misma extensión. Esto nos permite afirmar que un conjunto no es ni más ni menos que su extensión{{}^*}, es decir, una colección de conjuntos. (Esto no es necesidad lógica. Podríamos tener conjuntos que cumplen otras propiedades además de su extensión. Por ejemplo, podríamos haber establecido que hubieran conjuntos altos y bajos, de manera que dos conjuntos {A,B}, ambas con un único elemento {C}, fueran distintos porque uno es alto y el otro bajo. Lo que afirma el axioma de extensionalidad es que un conjunto no tiene ninguna otra propiedad distintiva más que si extensión.)

(Paradojas) Una manera usual de especificar una colección es a través de una propiedad común a ciertos objetos. Por ejemplo, tenemos la propiedad {P(x) \equiv x \notin x}, i.e., dado un conjunto {x}, este cumple la propiedad {P} si no se pertenece a sí mismo. Notar que en ningún momento se ha dicho que tenga que haber conjuntos que se pertenezcan a sí mismos. Si no los hubiera, todos cumple la propiedad {P}.

   En cualquier caso, diremos que {R} es la colección de todos los conjuntos que cumplen {P}. En efecto, es una colección definida con toda precisión. ¿Es {R} la extensión de un conjunto? o, dicho de otro modo, ¿existe un conjunto {R} cuyos elementos sean precisamente los conjuntos que no se pertenecen a sí mismos?

   No. Si existiera tal {R}, o bien {R \in R}, o bien {R \notin R}. Pero ambas nos llevan a una contradicción. Si suponemos que {R \in R}, entonces, por la definición de {R}, se cumple {P(R)}, i.e., {R \notin R}, y estábamos suponiendo lo contrario, una contradicción. Por otra parte, si {R \notin R}, entonces {R} cumple la propiedad {P}, luego {R \in R}, lo cual nuevamente es absurdo.

   Desde la óptica de los matemáticos, esto es equivalente a decir que no existe ningún conjunto que contenga a los conjuntos que no se pertenecen a sí mismos. Pero, expresado así, es algo brusco, ya que niega la posibilidad de pensar en una colección de conjuntos con una propiedad nada ambigua.

   No obstante, entendida, esta “paradoja” deja de ser extraña. Lo que hemos probado es que la colección {R} no es la extensión de ningún conjunto. Los matemáticos expresan esto de diciendo que {R} es una clase propia, una colección de objetos pero que no es conjunto, es decir, una colección de personajes de nuestro relato que no es ella misma un personaje, una colección externa.

   Por ejemplo, podemos imaginar una obra de teatral del renacimiento donde los personajes llevan un micrófono oculto. En efecto, este “objeto” no existe internamente, ya que, de ser así, la historia sería contradictoria, pues en el renacimiento no existían tales objetos. Igualmente, la clase {R} “está ahí”, pero es externa a nuestro relato; podemos demostrar que no existe internamente, pero incluirla como parte de los personajes nos lleva a una contradicción.

   Bajo este enfoque, la clase {R} no es contradictoria. Haciendo un uso externo del signo {\in}, podemos decir que {R \in R}, y no tener una contradicción, ya que para pertenecer a {R} es necesario (a) ser un conjunto interno y (b) no pertenecerse a sí mismo. Como {R} falla (a), no podemos concluir que {R \in R}, y así no llegamos a ninguna contradicción. Incluso, notemos que un conjunto interno es una colección de conjuntos internos; una colección de conjuntos externos puede contener algunos conjuntos internos, pero no puede formar parte de un conjunto interno.

¿Con qué colecciones de conjuntos internos contamos para nuestra película? Hemos visto que no podemos afirmar existe un conjunto para cualquier propiedad {P}, ya que si {P(x)\equiv x\notin x}, entonces concluiríamos que {R} es un conjunto interno y en nuestra película sería como si un rabino mostrara una esvástica. No obstante, y afortunadamente para nosotros, las únicas propiedades que dan lugar a clases propias son las que definirían conjunto “demasiado grandes”; así, por ejemplo, podemos demostrar que no hay un conjunto interno que contenga a todos los conjuntos internos o, lo que es lo mismo, que la clase de todos los conjuntos internos no es un conjunto interno, como tampoco lo es la clase de todos los conjuntos internos que tiene un único elemento, etc. Aunque resalto que decimos “afortunadamente” porque, en la práctica, para hacer matemáticas no requerimos de tales colecciones enormes. Hablamos de conjuntos internos con un elemento sin necesidad de tratar con la clase enorme de todos los conjunto internos con un elemento; similarmente, podemos hablar de conjuntos internos sin que necesitemos recurrir a la clase enorme de todos los conjuntos internos, etc.

   Dejamos nuestra disertación sobre las paradojas para volver a nuestro relato sobre los conjuntos internos.

   Veamos como formar nuevos conjuntos internos a partir de propiedades. Para ello contamos con un axioma al que podemos considerar como el más general acerca de la formación de conjuntos.

Axioma 2 (de especificación). Sean {A,x_1,\dotsc,x_n} conjuntos internos y una propiedad interna {P(x,x_1,\dotsc,x_n)}. Entonces existe un conjunto interno cuyos elementos son precisamente los conjuntos internos {x\in A} que cumplen la propiedad {P}. Escribimos

\displaystyle  \{x\in A : P(x,x_1,\dotsc,x_n) \text{ es verdadero}\}

o brevemente {\{x\in A : P(x,x_1,\dotsc,x_n)\}}.

   Notar que aquí hemos empleado la expresión propiedad interna por primera vez, la cual usaremos para referirnos a cualquier propiedad que pueda ser expresada exclusivamente en términos del signo {\in} y de conceptos lógicos, como “y”, “o”, “no”, “si… entonces…”, “existe”, “para todo”, “=”, etc. Con esto, queremos decir que no podemos definir el conjunto de los conjuntos que son “altos”, pues “alto” no es una propiedad definida a partir de {\in} y los conceptos lógicos mencionados.

   Vemos que el axioma de especificación sólo nos permite que una propiedad seleccione algunos conjuntos internos de entre los conjuntos internos que pertenecen a un conjunto interno dado. La clave está en que debemos tener un conjunto interno de antemano. Así, aun si podemos escribir {\{x : P(x,x_1,\dotsc,x_n)\}}, para referirnos a la colección de conjuntos internos que cumplen la propiedad {P}, no podemos pretender que tal colección sea a extensión de un conjunto interno. Como vimos, podemos encontrarnos con una contradicción, demostrando que tal colección de conjuntos es una clase propia, externa a nuestra película. De este modo, dado un conjunto interno {A}, podemos considerar como personaje de nuestra película a {R_A:=\{x\in A : x\notin x\}}, y este conjunto no da lugar a ninguna contradicción. Sería una contradicción que satisfaga {R_A\in R_A}, de lo que deducimos {R_A\notin R_A}, a su vez de esto obtenemos {R_A\notin A}, ya que si {R_A \in A}, entonces {R_A\in R_A}, una contradicción.

   No obstante, el axioma de especificación no es suficiente para garantizar la la existencia de todos los conjuntos internos con los que nos gustaría contar para nuestra película. Por ejemplo, dados dos conjuntos internos {a,b}, nos gustaría tener un conjunto interno {c} formado ni más ni menos que por {a} y {b}, i.e., {c:=\{x : x=a \text{ o } x=b\}}, pero la forma de esta expresión no nos permite apelar al axioma de especificación. Así, veremos que problemas como éste se nos presentarán en muy pocas ocasiones, y sólo serán necesarios unos pocos axiomas específicos para asegurar la existencia de algunos conjuntos internos como {c}. Ahora bien, una vez tengamos a disposición estos conceptos básicos, el único principio general de formación de conjuntos que necesitaremos (y del tendremos derecho a echar mano si no queremos caer en contradicciones) será el axioma de especificación.

— 2. Fundamentos —

   Ahora nos toca describir a los personajes elementales de nuestra película. Recordemos que el axioma de especificación que ya hemos discutido requiere la existencia de al menos un conjunto interno, para genera a partir de él nuevos conjuntos internos, y de momento no conocemos ninguno. En consecuencia, necesitamos axiomas que garanticen la existencia de algunos conjuntos para que formen nuestro “reparto”.

Axioma 3 (del conjunto vacío). Existe un conjunto interno que no tiene ningún elemento.

   El axioma de extensionalidad nos asegura este conjunto es único, pues si existieran dos conjuntos internos sin elementos, entonces ambos tendrían los mismos elementos (i.e., ninguno), así tendrían que ser el mismo (¿por qué?). Esta unicidad nos permite llamarlo el conjunto vacío, representado por {\emptyset}.

   Aun con estos axiomas, no podemos generar conjuntos más grandes que el conjunto vacío. Para lograr formar otros conjuntos necesitamos un axioma más.

Axioma 4 (del par). Sean dos conjuntos internos {u} y {v}. Entonces existe un conjunto interno cuyos elementos son exactamente {u} y {v}.

   De nuevo, el axioma de extensionalidad garantiza que sólo puede haber un conjunto interno cuyos elementos sean {u} y {v}. Llamamos a tal conjunto el par desordenado formado por {u} y {v}, representado por {\{u,v\}}.

   Notar que, si tenemos dos conjuntos internos, no necesitamos ningún axioma que nos de derecho a pensar coherentemente en la colección formada por ellos dos. Lo que garantiza el axioma del par es que dicha colección no es externa a nuestra película, sino que también forma parte de ella.

   Observemos que el axioma no requiere los conjuntos {u} y {v} sean distintos. Al ser iguales se cumple {\{u,v\}=\{u\}=\{v\}}, el cual es un conjunto interno con un único elemento.

   El nombre “par desordenado” evidentemente hace referencia a que {\{u,v\}=\{v,u\}} y así no podemos definir un objeto “antes” o “después” de otro. Cuando queramos dar importancia al orden, podemos agrupar los conjuntos en un par ordenado:

\displaystyle  (u,v):=\left\{{\{u\},\{u,v\}}\right\}.

   Observar que {(u,v)} es un conjunto interno cuya existencia se demuestra aplicando tres veces el axioma del par. Ahora, es sencillo mostrar que la igualdad {(u,v)=(p,q)} se da únicamente cuando {u=p} y {v=q}. En particular, si {u\ne v}, entonces {(u,v)\ne(v,u)}.

   Ahora podemos definir la terna ordenada {(u,v,w)=((u,v),w)}, la cuádrupla ordenada {(u,v,w,x)=((u,v,w),x)}, etc.

   Seguro estamos familiarizados con el hecho que dados dos conjunto {u} y {v}, informalmente definimos su unión e intersección como

\displaystyle  u\cup v:=\{x:x\in u\text{ o }x\in v\}

y

\displaystyle  u\cap v:=\{x:x\in u\text{ y }x\in v\}.

   Observemos que estas definiciones parecen aplicaciones del axioma de especificación que, sin embargo, no respetan su estructura, ya que no estamos restringiendo la selección de los {x} que pertenecen a un conjunto prefijado, cuya existencia ha sido comprobada de antemano. No obstante, en el caso de la intersección no es complicado arreglar el problema, podemos escribir

\displaystyle  u\cap v:=\{x\in u:x\in v\}

y con ello estamos usando el conjunto {u} como base para construir la intersección. Sin embargo, para la unión la objeción es irrefutable; lo que nos lleva a necesitar un axioma específico:

Axioma 5 (de la unión). Dados dos conjuntos internos, existe un conjunto internos cuyos elementos son precisamente los conjuntos internos que pertenecen a cualquiera de los dos conjuntos dados. (En realidad, la teoría de conjuntos requiere un axioma de la unión más fuerte que éste, pero no necesitamos explicitar este hecho.)

   Con este axioma, nos permitimos hablar de conjuntos internos como

\displaystyle  \{a,b,c,d\} = \{a\}\cup\{d\}\cup\{c\}\cup\{d\},

que es el conjunto interno cuyos elementos son los cuatro conjuntos internos {a,b,c,d}.

   Aplicando el axioma de especificación, podemos definir el complementario de un conjunto interno en otro:

\displaystyle  u\setminus v:=\{x\in u:x\notin v\}.

   Ahora, para dar el último concepto básico a usar, requerimos su axioma específico:

Axioma 6 (del conjunto de partes). Dado un conjunto interno {A}, existe un conjunto interno cuyos elementos son todos los subconjuntos de {A}.

   A dicho conjunto lo llamaremos conjunto de las partes de {A}:

\displaystyle  \mathcal P A := \{x:x\subset A\}.

   Notar que si {u\in A} y {v\in B}, entonces {u,v\in A\cup B}, luego

\displaystyle  \{u\},\{u,v\}\in\mathcal P(A\cup B),

así

\displaystyle  (u,v)=\{\{u\},\{u,v\}\}\in\mathcal P\left({\mathcal P(A\cup B)}\right).

Lo que implica que, aunque la definición

\displaystyle  A\times B:=\{(u,v):u\in A, v\in B\}

podría parecer un uso fraudulento del axioma de especificación, en realidad es legítima, porque se podría haber escrito

\displaystyle  A\times B:=\{(u,v)\in\mathcal P\left({\mathcal P(A\cup B)}\right):u\in A, v\in B\}.

A este conjunto, es decir, el conjunto de todos los pares ordenados con primera componente en {A} y segunda componente en {B}, lo llamamos producto cartesiano de {A} y {B}.

   Terminaremos este apartado esbozando la construcción del conjunto {\mathbb N} de los números naturales. La idea es demostrar la existencia de un conjunto interno que tenga el aspecto

\displaystyle  \mathbb N = \{0,1,2,3,4,5,\dotsc\}.

   Pero, para ello, tenemos que resolver dos cuestiones:

  1. para que {\mathbb N} sea un conjunto interno hemos de definir sus elementos {0}, {1}, {2}, etc. de tal modo que podamos considerar a cada uno de ellos como un conjunto interno, y
  2. hemos de arreglárnoslas para definir un conjunto {\mathbb N} que los tenga a ellos por elementos y sólo a ellos.

   La primera es fácil de resolver. Si pensamos en los números naturales como ciertos “personajes históricos”, lo que necesitamos es seleccionar unos actores que interpreten estos papeles en nuestra película. Como número 0, ninguno parece más idóneo que el conjunto vacío. Así, llamaremos número natural {0} a {0 = \emptyset}. Esto quiere decir que, cuando pensemos en el conjunto vacío como el único conjunto interno sin elementos, escribiremos {\emptyset}, mientras que cuando pensemos en él como número natural cero escribiremos {0}, si bien se trata en ambos casos del mismo conjunto.

   Luego definimos, para cualquier conjunto interno {x}, el siguiente de {x}, que será {x'=x\cup\{x\}}. En particular,

\displaystyle  \begin{array}{l} 1=0'=\emptyset\cup\{\emptyset\}=\{\emptyset\}=\{0\},\\ 2=1'=1\cup\{1\}=\{0\}\cup\{1\}=\{0,1\},\\ 3=2'=2\cup\{2\}=\{0,1\}\cup\{2\}=\{0,1,2\}, \end{array}

y así sucesivamente. La cuestión que nos queda es convertir el “así sucesivamente” en una propiedad interna que podamos usar para definir el conjunto interno {\mathbb N}. Para ello definimos:

Definición 1 (Conjunto inductivo). Un conjunto interno {A} es inductivo si {0\in A} y, siempre que un conjunto {x\in A}, también se cumple que {x'\in A}.

   Es decir, un conjunto es inductivo si contiene a todos los conjuntos internos que queremos tomar como números naturales. Ahora necesitamos el último axioma que perfilará el comportamiento básico de los conjuntos internos:

Axioma 7 (de infinitud). Existe un conjunto interno inductivo.

   Este axioma de infinitud se llama así porque sin él es imposible, no ya construir los números naturales, sino siquiera demostrar la existencia de un conjunto interno que sea infinito.

   El problema de los conjuntos inductivos es que, además de los números naturales, pueden contener otros conjuntos. Para resolver este problema definimos:

Definición 2 (Conjunto de los números naturales). Llamaremos conjunto de los números naturales al conjunto interno

\displaystyle  \mathbb N := \{x\in A : x \text{ pertenece a todos los conjuntos internos inductivos}\},

donde {A} es un conjunto inductivo arbitrario. Es claro que {\mathbb N} no depende de la elección de {A}, pues si llamamos {\mathbb N_A} y {\mathbb N_B} a los conjuntos definidos de estemos modo a partir de dos conjuntos inductivos {A} y {B}, entonces todo {x\in\mathbb N_A} pertenece a todos los conjuntos inductivos, en particular a {B}, luego también {x\in\mathbb N_B}, y viceversa, luego {\mathbb N_A=\mathbb N_B}.

   A partir de aquí, es pura rutina demostrar los siguientes hechos básicos sobre los números naturales:

Proposición 3. {0\in\mathbb N} y, si {n\in\mathbb N}, entonces {n'\in\mathbb N} (el cero es un número natural y el siguiente de un número natural es también un número natural).

Proposición 4. No existen ningún {n\in\mathbb N} tal que {n'=0} (el cero no es el siguiente de ningún número natural).

Proposición 5. Si {n\in\mathbb N} y {n\ne 0}, existe un {m\in\mathbb N} tal que {n=m'} (todo número natural no nulo es el siguiente de otro número natural).

Proposición 6. Si {m,n\in\mathbb N} y {m'=n'}, entonces {m=n} (números distintos tienen siguientes distintos).

Proposición 7. Si {A\subset\mathbb N} es un conjunto interno tal que {0\in A} y, cuando {n\in A}, también {n'\in A}, entonces {A=\mathbb N}.

   La última propiedad se conoce como principio de inducción y, aunque parezca la propiedad más compleja de las cinco, es una de las más fáciles de demostrar:

Demostración. (De la propiedad 7) Un conjunto {A} en tales condiciones es, por definición, inductivo; luego, si {n\in\mathbb N}, se cumple que {n\in A} por definición de {\mathbb N}, es decir, porque {n} ha de pertenecer a todos los conjuntos internos inductivos. Por consiguiente, {\mathbb N\subset A}, lo que, unido a la hipótesis de que {A\subset\mathbb N}, nos da que {A=\mathbb N}. \Box

   Las propiedades 3 y 4 son inmediatas, 5 se prueba trivialmente usando 7 (que ya está probada).

Ejercicio 1. Probar 6 siguiendo este esquema:

  1. Demostrar por inducción sobre {n} que si {m\in n\in \mathbb N}, entonces {m\subset n}.
  2. Demostrar por inducción que, si {n\in\mathbb N}, entonces {n\notin n}.
  3. Demostrar 6 por reducción al absurdo: si {m\ne n}, entonces {m\in n} y {n\in m}. Llegar de aquí a una contradicción.

Observación 8. A veces es más cómodo expresar el principio de inducción en término de propiedades: Dados unos conjuntos internos {x_1,\dotsc,x_n} y una propiedad interna {P(n,x_1,\dotsc,x_n)}, podemos considerar el conjunto interno

\displaystyle  A := \{n\in\mathbb N : P(n,x_1,\dotsc,x_n)\}.

   Lo que dice el principio de inducción para el caso del conjunto {A} es que, si {0} tiene la propiedad {P} y, supuesto que un {n\in\mathbb N} tiene {P}, podemos probar que {n'} también tiene la propiedad {P}, entonces podemos asegurar que todo número natural tiene la propiedad {P}.

   Las cinco propiedades que hemos enunciado sobre los números naturales se conocen como axiomas de Peano (aunque no son axiomas, sino proposiciones de nuestra película). Peano creía, y muchos matemáticos siguen creyendo actualmente, que determinan completamente al conjunto {\mathbb N} de los números naturales, en el sentido que no puede haber más que un conjunto que cumpla esas cinco propiedades. Esto es cierto si, por “conjunto”, entendemos “conjunto interno”, es decir, un conjunto de los que forman parte de nuestra película. (El lector perspicaz se dará cuenta que aquí vemos que todo lo hemos dicho, sobre los conjuntos internos y los números naturales, no son un estudio de la realidad tal cual se nos presenta en el sentido de la filosofía kantiana. Queda claro que sólo es un modelo de lo que podría ser “realmente” un conjunto y número natural, pero esto queda fuera del alcance de la lectura.)

Ejercicio 2. Demostrar que si {\mathbb N_1} y {\mathbb N_2} son dos conjuntos internos que cumplen los cinco axiomas de Peano, entonces {\mathbb N_1=\mathbb N_1\cap\mathbb N_2=\mathbb N_2}. Esto nos induce a pensar que sólo existe un único conjunto de números naturales.

   Ahora bien, quienes creen que los axiomas de Peano determinan la forma absoluta el conjunto de los números naturales no tiene en cuenta que las películas son películas. No es éste el mejor momento para discutir sobre la cuestión. Volveremos sobre ella más tarde. De momento dejamos únicamente esta idea al lector: En el mundo real sólo ha habido un Napoleón, y, por ello, en una película sobre Napoleón sólo puede haber un personaje que sea Napoleón, pero eso no garantiza que el Napoleón que presenta la película sea una imagen fiel del Napoleón histórico. Sería un error garrafal afirmar que el Napoleón de la película ha de ser idéntico al Napoleón real porque no puede haber más que un Napoleón. En realidad tenemos dos unicidades: hay un único Napoleón externo y un único Napoleón interno, pero el Napoleón interno puede ser muy diferente del Napoleón externo.

— 3. Elementos de teoría de conjuntos —

   Presentados los principales personajes de nuestra película, ahora vamos a dar algunos detalles del argumento.

— 3.1. Funciones —

Definición 9. Dados dos conjuntos {A} y {B}, una aplicación (o una función) {f\colon A\rightarrow B} es un subconjunto {f\subset A\times B} tal que, para cada {a\in A}, existe un único {b\in B} tal que {(a,b)\in f}. Este único {b} se llama imagen por {f} del conjunto {a}, y se representa por {b=f(a)}. También se dice que {a} es una antiimagen (o preimagen) de {b} por {f}.

   En la práctica, para definir una aplicación {f\colon A\rightarrow B} podemos olvidar que estamos definiendo un conjunto de pares ordenados y definir simplemente {f(a)} para todo {a\in A}. En el fondo, esto es siempre una aplicación del axioma de especificación; e.g., si definimos {s\colon\mathbb N\rightarrow\mathbb N} como la aplicación dada por {s(n):=n'}, con más precisión estamos definiendo el conjunto

\displaystyle  s:=\{(n,m)\in\mathbb N\times\mathbb N : m=n'\}.

Definición 10 (Uno a uno). Una aplicación {f\colon A\rightarrow B} es inyectiva su elementos distintos de {A} tiene imágenes distintas en {B} o, alternativamente, si cuando {f(a)=f(a')}, entonces {a=a'}.

Observación 11. Con esto podríamos expresar de manera sucinta los axiomas de Peano:

  1. Existe una función inyectiva {s\colon\mathbb N\rightarrow\mathbb N}. La imagen de {s(n)} de cada número natural {n} se llama siguiente de {n}.
  2. Existe un único número natural {0\in\mathbb N} tal que {0\ne s(n)} para cualquier {n\in\mathbb N}.
  3. Si un conjunto {X\subset\mathbb N} es tal que {0\in\mathbb N} y {s(X)\subset\mathbb N} (esto es, {n\in X\implies s(n)\in X}), entonces {X=\mathbb N}.

Definición 12 (Onto). Una aplicación {f\colon A\rightarrow B} es suprayectiva si todo elemento de {B} tiene al menos una antiimagen en {A}

Definición 13 (Biyección). Una aplicación {f\colon A\rightarrow B} es biyectiva si es inyectiva y suprayectiva.

Definición 14 (Conjunto de todas las funciones). Definimos

\displaystyle  B^A := \{f : f\colon A\rightarrow B\}.

Podemos usar el axioma de especificación porque, de hecho,

\displaystyle  B^A := \{f\in\mathcal P(A\times B) : f\colon A\rightarrow B\}.

Definición 15 (Composición). Si {f\colon A\rightarrow B} y {g\colon B\rightarrow C}, definimos la composición {f\circ g\colon A\rightarrow C} como la aplicación dada por {(f\circ g)(a):=g(f(a))}.

Definición 16 (Identidad). La aplicación identidad {I_A\colon A\rightarrow A} en un conjunto {A} es la aplicación biyectiva dada por {I_A(a):=a}.

Definición 17 (Inclusión). Si {A\subset B}, la inclusión de {A} en {B} es la aplicación {i\colon A\rightarrow B} dada por {i(a):=a}.

   De modo que la identidad es la inclusión de un conjunto en sí mismo.

Definición 18 (Inversa). Si {f\colon A\rightarrow B} es una aplicación biyectiva, podemos definir la aplicación inversa {f^{-1}\colon B\rightarrow A} como la aplicación

\displaystyle  f^{-1}:=\{(b,a)\in B\times A : b=f(a)\}.

   De este modo, {b=f(a)} equivale a {a=f^{-1}(b)}. Es fácil ver que {f^{-1}} es también biyectiva y es la única aplicación {g\colon B\rightarrow A} que cumple {f\circ g=I_A} y {g\circ f=I_B}.

Definición 19 (Restricción). Si {f\colon A\rightarrow B} y {C\subset A}, llamaremos restricción de {f} a {C} a la aplicación {f|_C\colon C\rightarrow B} dada por {f|_C(c):=f(c)}, para todo {c\in C}.

Ejercicio 3. Comprobar que la composición de aplicaciones inyectivas, suprayectivas o biyectivas es también biyectiva, suprayectiva o biyectiva.

   Ahora, daremos uno de los teoremas que nos permitirán hablar de sucesiones sobre los números naturales. La prueba es bastante técnica, y los argumentos que requiere son de naturaleza algo distinta a los que nos van a interesar en esta oportunidad, por lo que podemos pasarla por alto sin que ello vaya a afectar a nuestra comprensión de lo que sigue. La incluiremos únicamente por si acaso, más adelante, encontramos motivos para desconfiar de la construcción de los números naturales y queramos revisarla con detalle.

Teorema 20 (Teorema de recursión). Dado un conjunto {A}, un conjunto {a\in A} y una aplicación {g\colon A\rightarrow A}, existe una única aplicación {f\colon\mathbb N\rightarrow A} que cumple {f(0)=a} y, para todo {n\in\mathbb N}, {f(n')=g(f(n))}.

   Es decir, para definir una aplicación {f\colon\mathbb N\rightarrow A} basta definir {f(0)} y definir {f(n')} a partir de {f(n)}.

Demostración. Por inducción se demuestra que, si {m\in\mathbb N}, se cumple que {0\in m'},todos los elementos de {m'} son números naturales y, si {n\in m}, entonces {n'\in m'}.

   En efecto esto es cierto para {m=0}, ya que {0\in 0'=\{0\}}, el único elemento de {0'} es {0}, que es un número natural, y la tercera propiedad es trivial, ya que no existe ningún {n\in 0=\emptyset}.

   Supongámoslo cierto para {m} y veámoslo para m’. Hemos de probar que {0\in m''=m'\cup\{m'\}}. Como suponemos que {0\in m'}, es claro que también {0\in m''}. Si todos los elementos de {m'} son números naturales, también lo son todos los de {m''}, ya que son los de {m'} y el propio {m'}, que es un número natural. Además, si {n\in m'=m\cup\{m\}}, o bien {n\in m}, en cuyo caso {n'\in m'\subset m''} por la hipótesis de inducción, o bien {n=m}, en cuyo caso {n'=m'\in m''} por definición de {m''}.

   Ahora vamos a probar que, para cada {m\in\mathbb N}, existe una única aplicación {f_m\colon m'\rightarrow A} que cumple {f_m(0)=a} y, para todo {n\in m}, {f_m(n')=g(f_m(n))}.

   En efecto, para {m=0} basta tomar {f_0:=\{(0,a)\}}. Si existe {f_m}, definimos {f_{m'}:=f_m\cup\{(m',g(f_m(m))\}}. De este modo, {f_{m'}(n)=f_m(n)} para todo {n\in m}, por lo que la propiedad que suponemos que cumple {f_m} puede reformularse así:

\displaystyle  f_{m'}(0):=a, \qquad f_{m'}(n'):=g(f_{m'}(m)).

para todo {n\in m'}. Como {m'=m\cup\{m\}}, sólo falta probar que la segunda parte se cumple también para {n=m}. Ahora bien, por definición,

\displaystyle  f_{m'}=g(f_m(m))=g(f_{m'}(m)).

   Para probar la unicidad, sea {h\colon m''\rightarrow A} cualquier aplicación que cumpla las condiciones

\displaystyle  h(0):=a

y

\displaystyle  h(n'):=g(h(n)), \quad \text{para todo } n\in m',

y vamos a probar que es justamente la {f_{m'}} que hemos definido. Demostramos por inducción que si {n\in m''}, entonces {h(n)=f_{m'}(n)}.

   En efecto, si {n=0}, entonces {h(0)=a=f_{m'}(0)}. Si {h(n)=f_{m'}(n)} y {n'\in m''}, entonces

\displaystyle  h(n')=g(h(n))=g(f_{m'}(n))=f_{m'}(n').

   Así pues, {h=f_{m'}}, como queríamos probar.

   Ahora definimos {f\colon\mathbb N\rightarrow A} mediante {f(n):=f_n(n)}. La aplicación {f} tiene la propiedad indicada, pues {f(0)=f_0(0)=a} y, si {n\in\mathbb N}, entonces

\displaystyle  f(n')=f_{n'}(n')=g(f_{n'}(n))=g(f_n(n))=g(f(n)).

La unicidad se demuestra por inducción exactamente igual a como hemos probado la unicidad de {f_{m'}}. \Box

   Veamos ahora una primera aplicación del teorema de recursión:

Definición 21 (Adición). Para cada {m\in\mathbb N}, definimos la aplicación {(m+)\colon\mathbb N\rightarrow\mathbb N} determinada recursivamente por {m} y la aplicación siguiente {s\colon\mathbb N\rightarrow\mathbb N}, es decir, como la única aplicación que cumple:

\displaystyle  (m+)(0):=m

y

\displaystyle  (m+)(n'):=s((m+)(n))=((m+)(n))'.

   En la práctica escribiremos {m+n} en lugar de {(m+)(n)}, con los que las propiedades anteriores se vuelven más legibles:

\displaystyle  m+0:=m, \qquad m+n':=(m+n)'.

Más aún, definiendo {1:=0'}, tenemos que

\displaystyle  m+1=m+0'=(m+0)'=m'.

   Por ello, en lo sucesivo dejaremos de representar el siguiente de {m} por {m'}, sino que nos referiremos a él como {m+1}. En estos términos, las propiedades que definen a la suma las escribiremos

\displaystyle  m+0:=m \quad\text{y}\quad m+(n+1):=(m+n)+1.

Más en general, las condiciones del teorema de recursión se expresan como

\displaystyle  f(0):=a \quad\text{y}\quad f(n+1):=g(f(n)).

Definición 22. Para cada {m\in\mathbb N}, definimos la aplicación {(m\cdot)\colon\mathbb N\rightarrow\mathbb N} como la única que cumple

\displaystyle  m\cdot 0:=0, \qquad m\cdot(n+1):=m\cdot n+m,

donde hemos utilizado el teorema de recursión con la función {g\colon\mathbb N\rightarrow\mathbb N} dada por {g(n):=n+m}.

   A partir de aquí, es pura rutina demostrar todas las propiedades conocidas de la suma y el producto de números naturales. Veamos algunos ejemplos:

Proposición 23 (Propiedad asociativa de la suma). {(m+n)+r=m+(n+r)}.

Demostración. Por inducción sobre {r}. Si {r=0} se reduce a

\displaystyle  (m+n)+0 = m+n = m+(n+0).

Si vale para {r}, lo probaremos para {r+1}:

\displaystyle  \begin{array}{l} (m+n)+(r+1)=((m+n)+r)+1=(m+(n+r))+1\\ \qquad =m+((n+r)+1)=m+(n+(r+1)), \end{array}

donde hemos usado la definición de suma, la hipótesis de inducción y dos veces más la definición de suma. \Box

Proposición 24 (Propiedad conmutativa de la suma). {m+n=n+m}.

Demostración. Dejamos como ejercicio probarlo para {m=0} y {m=1}, es decir probar por inducción sobre {n} que {0+n=n+=0} y que {1+n=n+1}.

   Ahora probamos el resultado general, también por inducción sobre {n}. Para {n=0} es: uno de los casos que hemos dejado como ejercicio: {m+0=m=0+m}. Si vale para {n}, tenemos

\displaystyle  \begin{array}{l} m+(n+1)=(m+n)+1=(n+m)+1=n+(m+1)\\ \qquad =n+(1+m)=(n+1)+m, \end{array}

donde hemos usado la definición de suma, la hipótesis de inducción, la definición de suma, el casi que hemos dejado como ejercicio y la propiedad asociativa. \Box

Proposición 25 (Simplificación de la suma). Si {u+n=v+n}, entonces {u=v}.

Demostración. Por inducción sobre {n}. Para {n=0} es {u+0=v+0}, luego {u=v}. Si vale para {n}, entonces, si {u+(n+1)=v+(n+1)}, también {(u+n)+1=(v+n)+1}, luego {u+n=v+n} (por el cuarto axioma de Peano), luego {u=v}, por hipótesis de inducción. \Box

— 3.2. Relaciones —

Definición 26 (Relación). Una relación en un conjunto {A} es un conjunto {R\subset A\times A}. En lugar de escribir {(a,b)\in R}, escribiremos {a\,R\,b} y diremos que {a} está relacionado con {b} (según la relación {R}).

Definición 27 (Relación de orden). Una relación de orden (total) en un conjunto {A} es una relación {\le} en {A} que cumple las propiedades

  1. (Reflexiva) {a\le a}.
  2. (Antisimétrica) Si {a\le b} y {b\le a}, entonces {a=b}.
  3. (Transitiva) Si {a\le b} y {b\le c}, entonces {a\le c}.
  4. (De conexión) {a\le b} o {b\le a}. (Esto es lo que garantiza un orden total.)

   Escribiremos $latex {ab}&fg=000000&bg=ffffff$ como equivalente a {b<a}.

   Un conjunto ordenado es un par {(A,\le)}, donde {\le} es una relación de orden en el conjunto {A}.

Proposición 28. La relación en {\mathbb N} dada por {m\le n} es una relación de orden si, y sólo si, existe un {r\in\mathbb N} tal que {m+r=n}.

Demostración. Las propiedades reflexiva y transitiva son inmediatas. Para probar la propiedad antisimétrica suponemos que {m\le n} y {n\le m}, de modo que {n=m+r} y {m=n+s}, para ciertos {r,s\in\mathbb N}. Entonces {m+r+s=m=m+0}.

   Por la propiedad de simplificación,{r+s=0}. De aquí se sigue que {s=0}, ya que en caso contrario, para algún {t\in\mathbb N}, {s=t+1}, con lo que {r+s+t+1=0}, en contra del segundo axioma de Peano. Por lo tanto, {m=n+s=n+0=n}.

   La conexión la demostramos por inducción sobre {a}. Si {a=0} entonces {0\le b}, ya que {b=0+b}. Si vale para {a}, entonces {a\le b} o {b\le a}. En el segundo caso {b\le a\le a+1}, luego {b\le a+1}. En el primer caso tenemos que {a+r=b}, para cierto {r\in\mathbb N}. Si {r\ne 0}, entonces {r=s+1}, luego {a+1+s=b}, lo que prueba que {a+1\le b}. Si {r=0} tenemos que {a=b}, luego {b\le b+1\le a+1}. En cualquier caso, tenemos la conexión. \Box

   En lo sucesivo nos basaremos en la siguiente definición.

Definición 29. Si {m\le n} son dos números naturales, por definición existe un {r\in\mathbb N} tal que {m+r=n}. Por la propiedad de cancelación, este {r} es único, y escribiremos {r=n-m}.

Ejercicio 4. Demostrar que, si {n\in\mathbb N}, no existe ningún {m\in\mathbb N} tal que {n<m<n+1}. Equivalentemente, si {m<n+1}, entonces {m\le n} y si {m<n}, entonces {m+1\le n}.

Definición 30 (Mínimo y máximo). Si {(A,\le)} es un conjunto ordenado y {B\subset A}, el mínimos de {B} es una elemento {m\in B} tal que {m\le b} para todo {b\in B}. El máximo de {B} es un elemento {M\in B} tal que {b\le M} para todo {b\in B}.

   Un conjunto {B\subset A} no tiene por qué tener mínimo elemento, pero si lo tiene es único, ya que, si hubiera dos {m} y {m'}, entonces tendría que se {m\le m'}, porque {m} es mínimo, y {m'\le m}, porque {m'} es mínimo. Por la antisimetría, sería {m=m'}. Similarmente sucede lo mismo con el máximo.

   Con la relación de orden definida, el conjunto {\mathbb N} de los números naturales cumple la siguiente propiedad fundamental:

Teorema 31 (Principio de buena ordenación). Todo subconjunto de {\mathbb N} no vacío tiene mínimo elemento.

Demostración. Vamos a probar por inducción sobre {n} que todo subconjunto {A\subset N} que contenga un número {\le n} tiene un mínimos elemento. Si {A} contiene un número {m\le 0}, entonces ha de ser {m=0}, porque {0+m=m}, luego {0\le m}, luego {m=0}. Por el mismo motivo, {0} es menor o igual que todo números de {A}, luego {0} es el mínimo de {A}.

   Supongamos que todo conjunto de números naturales que contenga un número {\le n} tiene mínimo elemento y supongamos que {A} contiene un número {a\le n+1}.

   Distinguimos dos casos: si {A} no contiene ningún número menor que {a}, es que {a} es el mínimo de {A}. En caso contrario, {A} contiene un elemento {b<a\le n+1}, luego {b<n+1}, luego {b\le n} y, por hipótesis de inducción, {A} tiene mínimo elemento. \Box

   En particular, el mínimos de {\mathbb N} es {0}, y {n+1} es el menor natural mayor que {n}. Por otra parte, {\mathbb N} no tiene máximo elemento, ya que todo número natural {n} es menor que {n+1}.

Definición 32. Si {(A,\le)} es un conjunto ordenado, diremos que un {M\in A} es una cota superior de un conjunto {B\subset A} si {b\le M} para todo {b\in B} (pero, al contrario que en la definición de máximo, no exigimos que {M\in B}). Análogamente se define una cota inferior. Diremos que un conjunto {B\subset A} está acotado superiormente o inferiormente si tiene una cota superior o inferior.

Teorema 33. Todo subconjunto de {\mathbb N} no vació acotado superiormente tiene un máximo elemento.

Demostración. Sea {A\subset\mathbb N}. Si {A} tiene una cota superior, el conjunto de sus cotas superior es un subconjunto de {\mathbb N} no vacío, luego podemos considerar la menor cota superior {M} de {A}. Vamos a probar que éste es el máximo de {A}. Sólo hay que probar que {M\in A}. Si {M\notin A}, entonces todo {a\in A} cumple {a<M}. Como {A} no es vacío, no puede ser {M=0}, luego {M=c+1}, para cierto {c\in\mathbb N}. Entonces, si {a\in A}, tenemos que {a<c+1}, luego {a\le c}, luego {c} es una cota superior de {A}, pero {c<M}, en contradicción con que {M} era la menor cota posible. Así pues, {M\in A} y {M} es el máximo de {A}. \Box

   Ahora veamos el último tipo de relaciones que nos interesarán.

Definición 34 (Equivalencia). Una relación {R} en un conjunto {A} es una relación de equivalente si cumple las propiedades

  1. (Reflexiva) {a\,R\,a}.
  2. (Simétrica) Si {a\,R\,b}, entonces {b\,R\,a}.
  3. (Transitiva) Si {a\,R\,b} y {b\,R\,c}, entonces {a\,R\,c}.

   En estas condiciones:

Definición 35 (Clase de equivalencia). Definimos la clase de equivalencia de un elemento {a\in A} como el conjunto

\displaystyle  [a] = \{b\in A : a\,R\,b\}.

Definición 36 (Conjunto cociente). El conjunto cociente de {A} sobre {R} es el conjunto {A/R} que contiene a todas las clases de equivalencia de los elementos de {A}.

Ejercicio 5. Demostrar que, en las condiciones anteriores, {a\,R\,b} si, y sólo si, {[a]=[b]}, mientras que no {a\,R\,b} si, y sólo si, {[a]\cap[b]=\emptyset}.

— 3.3. Conjuntos finitos —

Definición 37 (Conjunto finito). Si {n\in\mathbb N}, definimos

\displaystyle  I_n := \{m\in\mathbb N : m < n\}.

Un conjunto {A} es finito si existe un número natural {n} y una aplicación biyectiva {f\colon I_n\rightarrow A}. En caso contrario es infinito.

   Notar que, {I_0=\emptyset} y, técnicamente, {\emptyset\colon\emptyset\rightarrow\emptyset} es biyectiva, por lo que {\emptyset} es un conjunto finito.

   Los conjuntos {I_n} son finitos, pues cumple la definición con la aplicación identidad.

   Otro hecho obvio es que, si existe una aplicación biyectiva {g\colon A\rightarrow B}, entonces {A} es finito si, y sólo si, {B} es finito. En efecto, si existe una aplicación biyectiva {f\colon I_n\rightarrow A}, entonces {f\circ g\colon I_n\rightarrow B} también es biyectiva.

Proposición 38. Un subconjunto de {\mathbb N} es finito si, y sólo si, está acotado superiormente.

Demostración. Para incluir al conjunto vacío, hay que entender que éste está trivialmente acotado. (De hecho, {0} es una cota superior.)

   Si {A\subset\mathbb N} es finito, existe una aplicación biyectiva {f\colon I_n\rightarrow A}. Vamos a probar que {A} está acotado por inducción sobre {n}. Si {n=0} entonces {A=\emptyset} y, como acabamos de decir, está trivialmente acotado.

   Supongamos que el teorema es cierto para {n} y pongamos que {f\colon I_{n+1}\rightarrow A} es biyectiva. Si {a:=f(n)}, entonces {f} se restringe a una aplicación biyectiva {f'\colon I_n\rightarrow A\setminus\{a\}}, luego {A\setminus\{a\}} está acotados superiormente. Sea {M\in\mathbb N} un cota superior de {A\setminus\{a\}}, es decir, {b\le M} para todo {b\in A} que no sea {b=a}. Así, si {a\le M}, entonces {M} es una cota superior de {A}. Si {M\le a}, entonces {a} es, de hecho, el máximo de {A}.

   Supongamos ahora que {A} está acotado superiormente. También podemos suponer que {A\ne\emptyset}. Vamos a probar que es finito por inducción sobre una cota superior.

   Si {A} tiene a {0} por cota superior, entonces {A=\{0\}=I_1}, luego es finito.

   Si es cierto para conjuntos acotados por {n}, supongamos que una cota superior de {A} es {n+1}. Si {n} es también una cota superior, entonces {A} es finito por hipótesis de inducción. En caso contrario es que {n+1\in A}. El conjunto {A\setminus\{n+1\}} tiene a {n} por cota superior, luego por hipótesis de inducción es finito. Sea {f\colon I_m\rightarrow A\setminus\{n+1\}} biyectiva para cierto {m\in\mathbb N}. Entonces,

\displaystyle  f\cup\{(m,n+1)\}\colon I_{m+1}\rightarrow A \text{ es biyectiva},

luego {A} es finito. \Box

   En particular, {\mathbb N} es infinito.

Proposición 39. Un conjunto {A} es finito si, y sólo si, existe una aplicación inyectiva {A\rightarrow I_n}, para cierto {n\in\mathbb N}.

Demostración. Si {A} es finito, existe una aplicación biyectiva {I_n\rightarrow A}, y su inversa es también biyectiva, en particular inyectiva.

   Si existe una aplicación {A\rightarrow I_n} inyectiva, podemos verla también como una aplicación biyectiva {A\rightarrow B}, donde {B\subset I_n}. Como {I_n} es finito, {B} también lo es, luego {A} también lo es. \Box

Ejercicio 6. Demostrar que si {A\rightarrow B} es inyectiva y {B} es finito, entonces {A} es finito.

Proposición 40. Todo subconjunto de un conjunto finito es finito.

Demostración. Sea {A} un conjunto finito y sea {B\subset A}. Existe una aplicación inyectiva {A\rightarrow I_n} que se restringe a otra aplicación inyectiva {B\rightarrow I_n}, luego {B} es finito. \Box

Ejercicio 7. Probar que un conjunto {A} es infinito si, y sólo si, existe una aplicación suprayectiva {I_n\rightarrow A}, para cierto {n\in\mathbb N}.

Proposición 41. Si {m,n\in\mathbb N} y existe una aplicación biyectiva {I_m\rightarrow I_n}, entonces {m=n}.

Demostración. Lo probamos por inducción sobre {n}. Si {n=0}, entonces {I_n=\emptyset}, por lo que {I_m} ha de ser también vacío, luego {m=0}.

   Supongamos que la proposición es cierta para {n} y supongamos que tenemos una aplicación biyectiva {f\colon I_m\rightarrow I_{n+1}}. Claramente, {m\ne 0}, luego {m=r+1} si {f(r)=n}, entonces {f} se restringe a una aplicación biyectiva {I_r\rightarrow I_n}, luego {r=n}, luego {m=n+1}.

   Si {f(r)\ne n}, consideramos los números {f(r)=u\ne n} y {v=f^{-1}(n)\ne r}. Es fácil ver que

\displaystyle  (f\setminus\{(r,u),(v,n)\})\cup\{(v,u)\}\colon I_r\rightarrow I_n \text{ es biyectiva},

luego nuevamente {r=n} y {m=n+1}. \Box

   Así pues, si {A} es un conjunto finito, existe un único {n\in\mathbb N} tal que existe una aplicación biyectiva {f\colon I_n\rightarrow A}, pues si {g\colon I_m\rightarrow A}, entonces se cumple que {g\circ f^{-1}\colon I_m\rightarrow I_n} es biyectiva, luego {m=n}.

Definición 42 (Cardinal). Si {A} es un conjunto finito, llamaremos cardinal de {A} al único {n\in\mathbb N} tal que existe una aplicación biyectiva {f\colon I_n\rightarrow A}. Escribiremos {|A|}.

   El cardinal de un conjunto finito es lo que habitualmente se lama su “número de elementos”. Claramente {|A|=0} si, y sólo si, {A=\emptyset}.

   Si {A\ne\emptyset} tiene {n} elementos, existe {x\colon I_n\rightarrow A} biyectiva. Si escribimos {x_i:=x(i-1)}, podemos representar {A} en la forma {A=\{x_1,\dotsc,x_n\}}.

Proposición 43. Si {A} y {B} son conjuntos finitos, entonces {A\cup B} es finito y

\displaystyle  |A\cup B|+|A\cap B|=|A|+|B|.

Demostración. Supongamos que {A\cap B=\emptyset}. Sean {m=|A|} y {n=|B|}, de modo que existen {f\colon A\rightarrow I_m} y {g\colon B\rightarrow I_n} biyectivas. Podemos definir una aplicación biyectiva {h\colon A\cup B\rightarrow I_{m+n}} mediante

\displaystyle  h(x) := \begin{cases} f(x) & \text{si } x\in A,\\ m+g(x) & \text{si } x\in B. \end{cases}

Por consiguiente, {|A\cup B|=m+n=|A|+|B|}.

   En el caso general, sea {B':=B\setminus(A\cap B)}. Como {B=B'\cup(A\cap B)} y ambos conjuntos son disjuntos, la parte ya probada nos da que {|B|=|B'|+|A\cap B|}.

   Por otra parte, {A\cup B=A\cup B'} y {A\cap B'=\emptyset}. De nuevo por la parte ya probada, {|A\cup B|=|A|+|B'|}. Sumando {|A\cap B|} a ambos miembros tenemos la fórmula del enunciado. \Box

Ejercicio 8. Probar que si {A} y {B} son conjuntos finitos, entonces {A\times B} también es finito, y {|A\times B|=|A|\,|B|}.

Proposición 44. Todo conjunto (totalmente) ordenado finito no vacío tiene un máximo y un mínimo elemento.

Demostración. Supongamos, por reducción al absurdo, que existe un conjunto ordenado no vacío sin máximo elemento. Sea {n} el mínimo cardinal posible para un conjunto con tales condiciones. Esto significa que cualquier conjunto ordenado con menos de {n} elementos tiene un máximo elemento.

   Sea, pues, {A} un conjunto de {n} elementos, no vacío y sin máximo. No puede ser {n=0}, así que {n=m+1}. Tampoco puede ser {n=1}, porque entonces {A=\{a\}} y obviamente, tiene máximo. Por lo tanto, {m\ne 0}. Si {a\in A}, entonces {A\setminus\{a\}} es un conjunto ordenado no vacío con {m} elementos, luego tiene un máximo {a'}. Si {a'\ge a}, entonces {a'} es el máximo de {A}. Si {a'<a}, entonces {a} es el máximo de {A}. Igualmente se razona con los mínimos. \Box

   Si {A} es un conjunto ordenado finito, todo subconjunto también lo es, luego, de hecho, todos los subconjuntos no vacíos de {A} tienen máximo y mínimo elemento. En particular, todo elementos que o sea el máximo tiene un inmediato posterior (el mínimo de los elementos mayores que él), y todo elemento que no esa el mínimo tiene un inmediato anterior.

— 3.4. Estructura algebraicas y de orden —

Definición 45 (Ley de composición interna). Una ley de composición interna en un conjunto {A} es una aplicación

\displaystyle  *\colon A\times A\rightarrow A.

   En lugar de escribir {*(a,b)}, escribiremos {a*b}. En resumen, una ley de composición interna en {A} es cualquier forma de operar dos elementos de {A} para obtener un nuevo elementos de {A}.

   Por ejemplo, aunque hemos definido la suma y el producto de números naturales como una familia de aplicaciones {(m+)} y {(m\cdot)}, para cada {m\in\mathbb N}, es más natural reunirlas en dos únicas leyes de composición interna

\displaystyle  +\colon\mathbb N\times\mathbb N\rightarrow \mathbb N

y

\displaystyle  \cdot\colon\mathbb N\times\mathbb N\rightarrow \mathbb N.

Por definición, {m+n:=(m+)(n)} y {m\cdot n=(m\cdot)(n)}.

Definición 46 (Anillo conmutativo y unitario). Un anillo conmutativo y unitario es una terna {(A,+,\cdot)}, donde {A} es un conjunto y {+:A\times A\rightarrow A} y {\cdot:A\times A\rightarrow A} son dos leyes de composición interna en {A} que cumplen las propiedades

  1. (Asociativa) {(a+b)+c=a+(b+c)} y {(ab)c=a(bc)}.
  2. (Conmutativa) {a+b=b+a} y {ab=ba}.
  3. (Distributiva) {a(b+c)=ab+ac}.
  4. (Elemento neutro) Existen {0,1\in A} tales que {a+0=1} y {a\cdot 1=a}.
  5. (Elemento simétrico) Para cada {a\in A} existe un elemento {-a\in A} tal que {a+(-a)=0}.

   En lo sucesivo, siempre que mencionemos acerca de anillos se entenderá que son anillos conmutativos y unitarios.

   Notemos que los elementos neutros {0} y {1} son únicos. Si {0} y {0'} fueran elementos neutros para la suma, entonces {0=0+0'=0'}; similarmente con el producto. También el elemento simétrico ha de ser único, ya que si existe otro {(-a)'} que {a+(-a)=0=a+(-a)'}, entonces {-a=-a+0=-a+a+(-a)'=0+(-a)'=(-a)'}. Escribiremos {a-b} en lugar de {a+(-b)}.

   Observemos que en cualquier anillo se cumple {a\cdot 0=0}, pues {a\cdot 0=a\cdot (0+0)=a\cdot 0+a\cdot 0}, y sumando {-(a\cdot 0)} a ambos miembros, llegamos a {0=a\cdot 0}.

Ejercicio 9. Demostrar que ene cualquier anillo se cumple {(-a)b=a(-b)=-(ab)}, {(-a)(-b)=ab} y {-(a+b)=-a-b}.

Definición 47 (Ideal y congruencia). Si {A} es un anillo, un ideal de {A} es un subconjunto {I\subset A} con las propiedades

  1. {0\in I}.
  2. Si {a,b\in I}, entonces {a+b\in I}.
  3. Si {a\in I} y {b\in A}, entonces {ab\in I}.

En tal caso, definimos en {A} la relación {a\equiv b\pmod I} dada por {a-b\in I}. Diremos que {a} y {b} son congruentes módulo el ideal {I}.

Proposición 48. Sea {A} un anillo e {I} un ideal de {A}. Entonces

  1. La congruencia en {A} módulo {I} es una relación de equivalencia.
  2. Si {a\equiv a'\pmod I} y {b\equiv b'\pmod I}, entonces {a+b\equiv a'+b'\pmod I} y {ab=a'b'\pmod I}.

Demostración.

  1. Se cumple {a\equiv a\pmod I} porque {a-a=0\in I}.

       Si {a\equiv b\pmod I}, entonces {a-b\in I}, luego {(-1)(a-b)=b-a\in I}, luego {b\equiv a\pmod I}.

       Si {a\equiv b\pmod I} y {b\equiv c\pmod I}, entonces {a-b\in I} y {b-c\in I}. La suma también está en {I}, y es {a-c\in I}, luego {a\equiv c\pmod I}.

  2. Sea {a=a'+i} y {b=b'+j}, con {i,j\in I}. Entonces {a+b=b+b'+i+j}, con {i+k\in I} y {ab=a'b'+a'j+ib'+ij}, donde los tres últimos productos están en {I}, luego su suma también. Por lo tanto, tenemos que {a+b\equiv a'+b'\pmod I} y {ab\equiv a'b'\pmod I}.

\Box

Definición 49 (Cociente respecto a un ideal). Si {A} es un anillo e {I} es un ideal de {A}, diremos que {A/I} es el conjunto cociente de {A} respecto a la relación de congruencia módulo {I}. Así, con el teorema anterior, probamos que podemos definir una suma y un producto en {A/I} mediante

\displaystyle  [a]+[b]=[a+b]

y

\displaystyle  [a][b]=[ab].

   El punto crucial es que estas definiciones no depende del elemento de la clase de equivalencia con el que hacemos las operaciones, es decir, que si {[a]=[a']} y {[b]=[b']}, llegamos a la misma clase de equivalencia si evaluamos {[a+b]} que si evaluamos {[a'+b']}, e igualmente con el producto.

Definición 50 (Anillo cociente). Las operaciones de la definición anterior convierten a {A/I} en un anillo, llamado anillo cociente de {A} sobre {I}.

Ejercicio 10. Demostrar mediante razonamientos inductivos, que {\mathbb N} cumple todas las propiedades de la definición de anillo excepto la existencia de elementos simétricos.

   Al añadir un elemento simétrico a cada número natural obtenemos el anillo de los números enteros:

Definición 51. Definimos en {\mathbb N\times\mathbb N} la relación dada por

\displaystyle  (m,n)\,R\,(m',n') \quad\text{si y s\'olo si}\quad m+n'=n+m'.

   Si pudiéramos “restar” dos números naturales cualesquiera, esta relación podría escribirse {m-n=m'-n'}. Vamos así que e significa de la relación {R} es que dos pares de números están relacionados si, y sólo si, “deberían” tener la misma resta.

Ejercicio 11. Demostrar que la relación {R} es de equivalencia.

   Llamaremos conjunto de los números enteros al conjunto cociente

\displaystyle  \mathbb Z := (\mathbb N\times\mathbb N)/R.

Ejercicio 12. Demostrar que si {(m,n)\,R\,(m',n')} y {(u,v)\,R\,(u',v')}, entonces

\displaystyle  (m+u,n+v)\,R\,(m'+u',n'+v')

y

\displaystyle  (mu+nv,mv+nu)\,R\,(m'u'+n'v',m'v'+n'u'),

así como que

\displaystyle  m+v\le n+u \quad\text{si y s\'olo si}\quad m'+v'\le n'+u'.

Definición 52 (Operaciones básicas y orden en los enteros). Este último ejercicio nos permite definir en {\mathbb Z} las operaciones

\displaystyle  [(m+n)]+[(u,v)] := [(m+u,n+v)]

y

\displaystyle  [(m+n)][(u,v)] := [(mu+nv,mv+nu)],

así como la relación

\displaystyle  [(m,n)]\le [(u,v)] \quad\text{si y s\'olo si}\quad m+v\le n+u.

   La interpretación es que si imaginamos que {[(m,n)]} representa a la “resta” {m-n} y {[(u,v)]}, {u-v}, entonces su suma debe ser {m-n+u-v=(m+u)-(n+v)} y su producto, {(m-n)(u-v)=mu+nv-mv-nu=(mu+nv)-(mv+nu)}, y estas dos restas se corresponden con las clases de pares que hemos definido como suma y producto de las clases dadas. Igualmente, {m-n\le u-v} debe ser equivalente a {m+v\le n+u}.

Ejercicio 13. Demostrar que {\mathbb Z} es uno anillo con las operaciones que acabamos de definir. Los elementos neutros son {0:=[(0,0)]} y {1:=[(1,0)]}. Los elementos simétricos son {-[(m,n)]:=[(n,m)]}.

Ejercicio 14. Demostrar que la relación {\le} que hemos definido en {\mathbb Z} es una relación de orden.

   Para cada {n\in\mathbb N}, definimos los enteros {+n:=[(n,0)]} y {-n:=[(0,n)]}. Si {[(m,n)]} es un entero arbitrario, vemos que, si {m\ge n}, entonces

\displaystyle  [(m,n)]=[(m-n,0)]=+(m-n),

mientras que si {m\le n}, entonces

\displaystyle  [(m,n)]=[(0,n-m)]=-(n-n).

   Además, {+0=[(0,0)]=-0} es el elemento neutro {0\in\mathbb Z}. Por consiguiente, si definimos {\mathbb Z^+:=\{+n : n\in\mathbb N, n\ne 0\}} y {\mathbb Z^-:=\{-n : n\in\mathbb N, n\ne 0\}}, se cumple

\displaystyle  \mathbb Z=\mathbb Z^-\cup\{0\}\cup\mathbb Z^+.

   Es sencillo verificar que la aplicación {i\colon\mathbb N\rightarrow\mathbb Z} dada por {i(n):=+n} es inyectiva y cumple

\displaystyle  i(m+n)=i(m)+i(n), \qquad i(mn)=i(m)i(n)

y

\displaystyle  m\le n \quad\text{si y s\'olo si}\quad i(m)\le i(n).

   Esto quiere decir que podemos identificar cada número natural {n} con el número entero {+n}, de manera que la suma, el producto y la relación de orden entre números naturales se evalúan igual si los consideramos como naturales o como enteros. Por ello, consideraremos que {\mathbb N\subset\mathbb Z}.

   Notar que, si {n\in\mathbb N}, entonces {-n} es el elemento simétrico de {n} en {\mathbb Z}, de modo que {\mathbb Z} consta únicamente de los números naturales y de sus simétricos (teniendo en cuenta que, en el caso de {0} —y sólo en este casi, se cumple {0=-0}).

Ejercicio 15. Demostrar que {\mathbb N=\{n\in\mathbb Z : n\ge 0\}}.

   El anillo {\mathbb Z} cumple una propiedad que no exige la definición de anillo.

Proposición 53 (Los enteros no tienen divisores de cero). Si {mn=0}, entonces {m=0} o {n=0}.

Demostración. En efecto, observemos que en primer lugar esto lo cumplen los números naturales, ya que si {m\ne 0} y {n\ne 0}, entonces {m=r+1}, luego {mn=rn+n}, luego {mn\ge n>0}.

   En general, si {mn=0}, también {-mn=m(-n)=0} y {(-m)(-n)=0}, y una de estas cuatro combinaciones corresponde a números naturales, luego ha de ser {\pm m=0} o {\pm n=0}, lo cual implica {m=0} o {n=0}. \Box

Definición 54 (Anillo ordenado). Un anillo ordenado es una cuádrupla {(A,+,\cdot,\le)} que cumple la definición de anillo y la definición de conjunto (totalmente) ordenado, y además la relación de orden verifica las propiedades de compatibilidad

  1. (Compatibilidad con la suma) Si {a\le b}, entonces {a+c\le b+c}.
  2. (Compatibilidad con el producto) Si {a\le b} y {c\ge 0}, entonces {ac\le bc}.

Proposición 55. {(\mathbb Z,+,\cdot,\le)} es un anillo ordenado.

Demostración. Para probar que {(\mathbb Z,+,\cdot,\le)} es un anillo ordenado, conviene observar que si {a:=[(m,n)]} y {b:=[(u,v)]}, entonces

\displaystyle  b-a=[(u,v)]+[(n,m)]=[(n+u,m+v)]

luego {b-a\ge 0} equivale a que {m+v\le n+u}, es decir, a que {a\le b}.

   Así pues, si {a\le b}, tenemos que {b-a=b+c-(a-c)\ge 0}, luego {a+c\le b+c}. Igualmente, si {a\le b} y {c\ge 0}, tenemos que {b-a\ge0} y {c\ge0}, es decir, que ambos son números naturales, y también lo será su producto {bc-ac\ge0}, lo que equivale a {ac\le bc}. \Box

   Veamos algunas propiedades de los anillos ordenados:

  1. Si {a\le b}, entonces {-b\le -a} (pues {0=a-a\le b-a} y {-b\le-b+b-a=-a}).
  2. Si {a\ge0}, entonces {-a\le0}. (Caso particular de a.)
  3. Si {b,c\ge0}, entonces {bc\ge0} (por la compatibilidad del producto).
  4. {aa\ge0} (porque {aa=(-a)(-a)} y a una de las dos expresiones se le puede aplicar b).
  5. {1\ge0} y {-1\le0} (porque {1=1\cdot1}).
  6. Si {a\le b} y {c\le 0 }, entonces {ac\ge bc} (porque {-ac\le -bc}).

Definición 56 (Unidad e inverso en un anillo). Un elemento {a} de una anillo {A} es una unidad si existe un {a^{-1}\in A} tal que {aa^{-1}=1}. El elemento {a^{-1}} se llama inverso de {a}, y es único, pues si existe otro {a'^{-1}}, entonces {a'^{-1}=a'^{-1}\cdot1=a'^{-1}aa^{-1}=1\cdot a^{-1}=a^{-1}}.

Definición 57 (Cuerpo). Un cuerpo es un anillo en el que todo elemento distinto de {0} es una unidad.

Ejercicio 16. Demostrar que las únicas unidades de {\mathbb Z} son {\pm 1}.

   Para dotar de inverso a cada número entero construimos el cuerpo de los números racionales por un procedimiento similar al que seguimos para construir {\mathbb Z} a partir de {\mathbb N}.

Definición 58. Sea {A:=\{(m,n)\in\mathbb Z\times\mathbb Z : n\ne0\}}. Definimos en {A} la relación

\displaystyle  (m,n)\,R\,(m',n') \quad\text{si y s\'olo si}\quad mn'=nm'.

   Es sencillo mostrar que se trata de una relación de equivalencia. La clase de equivalencia de un par {(m,n)} se representa por {m/n}; diremos que es una fracción de numerador {m} y denominador {n}. De este modo, tenemos que

\displaystyle  \frac{m}{n}=\frac{m'}{n'} \quad\text{si y s\'lo si}\quad mn'=nm'.

   El conjunto cociente {\mathbb Q:=A/R} se llama conjunto de los números racionales. Definimos en {\mathbb Q} las operaciones

\displaystyle  \frac{m}{n}+\frac{u}{v}:=\frac{mv+nu}{nv}

y

\displaystyle  \frac{m}{n}\frac{u}{v}:=\frac{mu}{nv}.

   Como el denominador de una fracción no puede ser {0}, aquí estamos usando el hecho que el producto de números enteros no nulos es no nulo.

Ejercicio 17. Comprobar que estas operaciones están bien-definidas, en el sentido de que, si tomamos dos representantes distintos de cada fracción, {m/n=m'/n'} y {u/v=u'/v'}, las fracciones que obtenemos al sumar y multiplicar son la misma.

Ejercicio 18. Comprobar que {(\mathbb Q,+,\cdot)} es un cuerpo. Los elementos neutros son {0/1} y {1/1}, los simétricos son {-(m/n):=(-m)/n}, y los inversos, {(m/n)^{-1}:=n/m}.

   Observemos que de la definición de las fracciones se sigue que

\displaystyle  \frac{am}{an}=\frac{m}{n}.

En particular, para {a=-1}, esto implica que podemos cambiar el signo al numerador y denominador de una fracción, por lo que

\displaystyle  \mathbb Q=\{m/n : m\in\mathbb Z, n\in\mathbb N, n\ne0\}.

En otras palabras, no perdemos generalidad su suponemos que el denominador de una fracción es positivo.

Definición 59 (Orden en los racionales). Definimos en {\mathbb Q} la relación {\le} dada por

\displaystyle  \frac{m}{n}\le\frac{u}{v} \quad\text{si y s\'olo si}\quad mv\le nu,

donde {n,v>0}.

Ejercicio 19. Demostrar que la relación que acabamos de definir es corresponde, en el sentido de que no depende del representante de cada fracción con la que se comprueba.

Ejercicio 20. Demostrar que, con esta relación, {(\mathbb Q,+,\cdot,\le)} es un cuerpo ordenado, es decir, un cuerpo que verifica las propiedades de anillo ordenado.

   Consideramos ahora la aplicación {i\colon\mathbb Z\rightarrow\mathbb Q} dada por {i(n):=n/1}. Se comprueba sin dificultad que es inyectiva, y además cumple

\displaystyle  i(m+n)=i(m)+i(n),\qquad i(mn)=i(m)i(n)

y

\displaystyle  m\le n \quad\text{si y s\'olo si}\quad i(m)\le i(n).

   Una vez más, esto significa que podemos identificar a cada número entero con su imagen en {\mathbb Q}, de modo que las propiedades de los números enteros son las misma cuando las consideramos como números enteros o como números racionales. Así pues, consideramos que {\mathbb N\subset\mathbb Z\subset\mathbb Q}.

   Observemos que

\displaystyle  \frac{m}{n}=\frac{m}{1}\frac{1}{n}=\frac{m}{1}\left({\frac{n}{1}}\right)^{-1}=i(m)i(n)^{-1}=mn^{-1},

donde en el último paso hemos usado la identificación que acabamos de establecer. Esto significa que, podemos “olvidarnos” de que las fracciones son clases de equivalencia de pares de números enteros y considerar que {m/n=mn^{-1}}, donde el producto y el inverso del miembro derecho son las operaciones de {\mathbb Q}. Más aun, si {K} es un cuerpo arbitrario, usaremos la notación {a/b:=ab^{-1}}, para todo {a,b\in K}, {b\ne0}. En particular, en el caso de {\mathbb Q} podemos considerar fracciones con numerador y denominador fraccionario:

\displaystyle  \frac{m/n}{u/v}=\frac{m}{n}\left({\frac{u}{v}}\right)^{-1}=\frac{m}{n}\frac{v}{u}=\frac{mv}{nu}.

— 3.5. Elementos de aritmética —

   Ahora veremos algunos resultados variados sobre la aritmética de los anillos y os cuerpos en general, y de los conjuntos numéricos en particular.

   Observamos que si {A} es un anillo y {a\in A}, podemos definir una aplicación {\mathbb N\rightarrow A} mediante el teorema de recursión, estableciendo que

\displaystyle  0a:=0 \qquad\text{y}\qquad (n+1)a:=na+a.

A su vez, podemos extenderla a una aplicación {\mathbb Z\rightarrow A} mediante

\displaystyle  (-n)a:=-(na), \qquad\text{para todo } n\in\mathbb N.

   Hemos definido una aplicación para cada {a\in A}, pero podemos unirlas todas en una única aplicación {\mathbb Z\times A\rightarrow A}.

Ejercicio 21. Demostrar que

\displaystyle  \begin{array}{lll} 0a=0, & & (-1)a=-a,\\ (m+n)a=ma+na, & & (mn)a=m(na). \end{array}

   Por ejemplo, {5a=(1+1+1+1+1)a=a+a+a+a+a}. Notemos que si {A=\mathbb Z}, el producto que acabamos de definir no es sino el producto usual en {\mathbb Z}.

   Similarmente, para cada {a\in A}, podemos definir una aplicación {\mathbb N\rightarrow A} mediante {a^0:=1} y {a^{n+1}:=a^n\cdot a}. Si {a} es una unidad de {A}, podemos extender esta aplicación a otra {\mathbb Z\rightarrow A} mediante {a^{-n}:=(a^{-1})^n}. Observemos que {a^{-1}} en este sentido resulta ser {a^{-1}} en el sentido del inverso de {a}.

Ejercicio 22. Demostrar que {a^{m+n}=a^ma^n} y {(a^m)^n=a^{mn}}, donde {m,n\in\mathbb N} si {a} no es una unidad, o {m,n\in\mathbb Z} si lo es. En este último caso, tenemos también que {a^{-n}=1/a^n} y {a^m/a^n=a^{m-n}}.

   Ahora, definimos la aplicación factorial {\mathbb N\rightarrow\mathbb N} mediante

\displaystyle  0!:=1 \qquad\text{y}\qquad (n+1)!:=n!(n+1).

   Si {0\le m\le n}, definimos el número combinatorio

\displaystyle  \binom{n}{m}:=\frac{n!}{m!(n-m)!}.

Proposición 60. Sean {m\le n} números naturales.

  1. \displaystyle  \binom{n}{m}=\binom{n}{n-m}.

  2. \displaystyle  \binom{n}{0}=\binom{n}{n}=1,\qquad\binom{n}{1}=n.

  3. Si {m<n},

    \displaystyle  \binom{n}{m}+\binom{n}{m+1}=\binom{n+1}{m+1}.

  4. Los números combinatorios son números naturales.

Demostración.

  1. Como ejercicio.
  2. Como ejercicio.
  3. Hay que probar que

    \displaystyle  \frac{n!}{m!(n-m)!}+\frac{n!}{(m+1)!(n-m-1)!}=\frac{(n+1)!}{(m+1)!(n-m)!}.

    Ahora bien,

    \displaystyle \left({\frac{n!}{m!(n-m)!}+\frac{n!}{(m+1)!(n-m-1)!}}\right)(m+1)!(n-m)!

    \displaystyle  =\frac{n!(m+1)m!(n-m)!}{m!(n-m)!}+\frac{n!(m+1)!(n-m)(n-m-1)!}{(m+1)!(n-m-1)!}

    \displaystyle  =n!(m+1)+n!(n-m)=mn!+n!+nn!-mn!=(n+1)n!=(n+1)!.

  4. Usando inducción obtenemos que {\binom{n}{m}} es un número natural, pues cada combinatorio con {n+1} es suma de dos con {n}, por el punto c.

\Box

   Ahora veamos el resultado principal sobre los números combinatorios.

Teorema 61 (Binomio de Newton). Sea {A} un anillo, {n\in\mathbb N} y {a,b\in A}. Entonces

\displaystyle  (a+b)^n=\sum_{m=0}^n\binom{n}{m}a^mb^{n-m}.

   Se puede objetar que no hemos definido el signo {\sum}. Las sumas finito en un anillo {A} se definen recurrentemente. Consideramos una aplicación {a\colon I_{n+1}\rightarrow A}. Convenimos representar {a_i:=a(i)}. Por comodidad, la extendemos a una aplicación {\mathbb N\rightarrow A} tomando {a_i:=0} para {i>n}. Entonces, definimos, en virtud del teorema de recursión:

\displaystyle  \sum_{i=0}^0a_i:=a_0

y

\displaystyle  \sum_{i=0}^{r+1}a_i:=\sum_{i=0}^ra_i+a_{r+1}.

   Es usual escribir

\displaystyle  \sum_{i=0}^na_i=a_0+\dotsb+a_n,

y entonces hemos de tener presente que los puntos suspensivos son sólo un signo que hemos elegido para representar la suma finita, tan legítimo como pueda serlo la letra {\Sigma}. Todas las propiedades de las sumas finitas se demuestran rutinariamente por inducción. Similarmente pueden definirse productos finitos en un anillo, usualmente representador por

\displaystyle  \prod_{i=0}^na_i=a_0\dotsm a_n.

   Por último, mencionaremos un hecho cotidiano sobre la aritmética de los números naturales sobre el que no hemos dicho nada hasta ahora, y es la posibilidad de expresarlos con la notación decimal.

   Si definimos

\displaystyle  2:=1+1,\quad 3:=2+1,\quad 4:=3+1,\quad 5:=4+1,

\displaystyle  6:=5+1,\quad 7:=6+1,\quad 8:=7+1,\quad 9:=8+1,\quad d:=9+1,

entonces se demuestra que todo número natural no nulo {N} se expresa de forma única como

\displaystyle  N=a_nd^n+a_{n-1}d^{n-1}+\dotsb+a_2d^2+a_1d+a_0,

donde {n\in\mathbb N}, {a_i\in\{0,\dotsc,9\}} y {a_n\ne0}. Esto nos permite adoptar el convenio de referirnos a {N} como {N=\overline{a_n\dotso a_0}}, donde esto no hay que entenderlos como un producto, sino como la mera yuxtaposición de las cifras {a_i}. Como el número {d} se expresa en la forma {d=1\cdot d+0}, tenemos que {d=10}, por lo que el desarrollo anterior puede escribirse como

\displaystyle  N=a_n(10)^n+a_{n-1}(10)^{n-1}+\dotsb+a_2(10)^2+a_110+a_0.

   La elección de {d} es arbitraria. Sirve cualquier número natural {d\ge2}.

— 4. Los números reales —

— 4.1. Los números naturales —

— 4.2. Cuerpos ordenados —

— 4.3. Convergencia de sucesiones —

— 4.4. La incompletitud de {\mathbb Q}

— 4.5. La construcción de {\mathbb R}

— 4.6. Consecuencias de la completitud de {\mathbb R}