You are currently browsing the category archive for the ‘math.TC’ category.

Hola a todos. Volviendo de una temporada de inactividad, leía sobre una duda sobre la aplicabilidad del axioma de elección sobre conjuntos finitos. (Espero retomar el ritmo de publicaciones pronto.) 😉

En la Wikipedia se expone que «informalmente, el axioma de elección dice que dada cualquier colección de contenedores, donde cada uno contiene al menos un objeto, es posible hacer una selección de exactamente un objeto de cada contenedor. En muchos casos dicha selección puede hacerse sin invocar el axioma de elección; en particular, cuando el número de contenedores es finito […]». Hasta aquí uno se pregunta cómo puede realizarse una selección (como la descrita) cuando los contenedores son finitos; incluso, cómo puede realizarse la selección de un contenedor.

Luego se da un ejemplo: […] para cualquier colección (que podría ser infinita) de pares de zapatos, se puede seleccionar el zapato izquierdo de cada par, pero para una colección infinita de pares de calcetines (asumiendo que no tienen una característica distintiva), dicha selección puede obtenerse sólo usando el axioma de elección. ¿Cómo se puede hacer una selección de un calcetín si estos no tienen alguna característica distintiva? ¿Estamos obviando otro axioma?

Vamos a recorrer postulados elementales de elección hasta llegar al Axioma de Elección. Lo que nos permitirá conducirnos en los expuesto por la Wikipedia.

Empezamos fijando uno de los axiomas de la Teoría de Conjuntos.

Axioma 1 (Conjunto vacío). Hay un conjunto {\emptyset} que no contiene ningún elemento, es decir, para cualquier objeto {x} tenemos {x\notin\emptyset}.

Ahora bien, este axioma es suficiente para probar que podemos «elegir» un elementos de un conjunto no vacío:

Lema 2 (Elección simple). Si {X} es un conjunto no vacío, hay un objeto {x} de manera que {x\in X}.

Demostración. Supongamos que no hay ningún objeto {x} que cumpla {x\in X}, es decir, tenemos {x\notin X} para cualquier objeto {x}. Además {x\notin\emptyset} por el Axioma 1. Luego {x\in X} si, y sólo si, {x\in\emptyset} (son equivalentemente falsas) y así {X=\emptyset} por la definición de igualdad de conjuntos; lo que es una contradicción.\Box

Con este lema, podemos ver que, dada una colección de conjuntos no vacíos, podemos elegir un elemento de cada uno y así obtener una colección de objetos seleccionados. Una versión de esta idea se da con la siguiente proposición:

Proposición 3 (Elección finita). Sea {n\ge1} un número natural y, para cada número natural {1\le i\le n}, sea {X_i} un conjunto no vacío. Entonces existe un tupla {n} {(x_i)_{1\le i\le n}} tal que {x_i\in X_i} para todo {1\le i\le n}. En otras palabras, si cada {X_i} no es vacío, el conjunto {\prod_{1\le i\le n}X_i} tampoco es vacío.

Demostración. Procedamos por inducción. Cuando {n=1}, se cumple por el Lema 2. Ahora, sea {X_1,\dotsc,X_{n^+}} una colección de conjuntos no vacíos. Por hipótesis hay una tupla {n} {(x_i)_{1\le i\le n}} tal que {x_i\in X_i} para todo {1\le i\le n}. Además, como {X_{n^+}} no es vacío, hay un {x} tal que {x\in X_{n^+}} por el Lema 2. Si definimos la tupla {n^+} {(y_i)_{1\le i\le n}} fijando {y_i=x_i} cuando {1\le i\le n} e {y_i=x} cuando {i=n^+}, evidentemente tenemos {y_i\in X_i} para todo {1\le i\le n^+}. Esto cierra la inducción.\Box

Como vemos, no ha sido necesario el Axioma de Elección para poder hacer una selección de una colección finita de conjuntos.

Lo que el Axioma de Elección asegura es que la Proposición 3 de elección finita también es verdadera para productos cartesianos infinitos.

Axioma 4 (Elección). Sea {I} un conjunto y, por cada {\alpha\in I}, sea {X_\alpha} un conjunto no vacío. Entonces {\prod_{\alpha\in I}X_\alpha} tampoco es vacío. En otras palabras, hay una función {(x_\alpha)_{\alpha\in I}} que asigna un elemento {x_\alpha\in X_\alpha} a cada {\alpha\in I}.

La idea detrás de este axioma es la misma que la elección finita: dada un colección (posiblemente infinita) de conjuntos no vacíos {X_\alpha}, podemos elegir un elemento simple {x_\alpha} de cada uno, y formar una tupla (posiblemente infinita) {(x_\alpha)_{\alpha\in I}} de todas las elecciones hechas. Por un lado, esto es muy intuitivo en el sentido que aplicamos el Lema 2 una y otra vez. Por otro lado, el hecho de generar elecciones arbitrarias infinitas veces, sin una regla explícita sobre cómo hacerlas, es un tanto desconcertante. De hecho, muchos teoremas afirman la existencia de algún objeto {x} con ciertas propiedades sin manifestar qué objeto es o cómo se construye. No hay un diferencia entre una afirmación de existencia no constructiva y una de existencia constructiva (que puede ser preferible pero no necesario en muchos casos), excepto a un nivel filosófico.

En ocasiones no se necesita toda la capacidad del Axioma de Elección. En su lugar, suele usarse el axioma de elección numerable que es lo mismo que el axioma de elección pero restringida a un conjunto a lo sumo numerable. Por ejemplo,

Proposición 5. Sea {E} un subconjunto no vacío de la recta real con {\sup(E)<\infty} (es decir, {E} está acotado superiormente). Entonces hay una sucesión {(a_n)_{n=1}^\infty} cuyos elementos {a_n} se encuentran en {E}, de manera que {\lim_{n\to\infty}a_n=\sup(E)}.

Demostración. Para cada número natural positivo {n}, {X_n} denota al conjunto

\displaystyle X_n:=\{x\in E:\sup(E)-1/n\le x\le\sup(E)\}.

Ya que {\sup(E)} es la mínima cota superior para {E}, {\sup(E)-1/n} no puede ser una cota superior para {E}, y así {X_n} no es vacío para cada {n}. Usando el axioma de elección (o el axioma de elección numerable), podemos hallar una sucesión {(a_n)_{n=1}^\infty} tal que {a_n\in X_n} para cualquier {n\ge1}. En particular {a_n\in E} para cualquier {n}, y {\sup(E)-1/n\le a_n\le\sup(E)} para cualquier {n}. Luego, tenemos {\lim_{n\to\infty}a_n=\sup(E)} por la prueba del sanguchito. 🙂\Box

Uno puede obtener esta proposición sin el axioma de elección en algunos casos especiales. Por ejemplo, si {E} es un conjunto cerrado, podemos definir {a_n} sin elección mediante {a_n:=\inf(X_n)}.

El axioma de elección tiene otras formulaciones, como que existe una función elección para cualquier colección de conjuntos no vacíos. La siguiente proposición es otra formulación del axioma de elección.

Proposición 6. Sean los conjuntos {X} e {Y}, y sea {P(x,y)} una propiedad perteneciente a los objetos {x\in X} e {y\in Y} de manera que, para cada {x\in X}, hay al menos un {y\in Y} tal que {P(x,y)} es verdadera. Entonces existe una función {f\colon X\to Y} tal que {P(x,f(x))} es verdadera para todo {x\in X}.

Anuncios

   La hipótesis del continuo establece que {2^{\aleph_0}=\aleph_1}. Cantor postuló que es equivalente al hecho que no hay un subconjunto no numerable {A} de {\mathbf R} de manera que {|A|<\mathbf R}. ¿Por qué son equivalentes?

   Sabemos que {|\mathbf R|=2^{\aleph_0}}, lo que puede ser probado mediante la expansión binario de los números reales en el intervalo {[0,1]} (si contar una cantidad numerable de números sin una expansión única).

   El cardinal {\aleph_1} es por definición el menor cardinal mayor que {\aleph_0} lo que quiere decir que no hay un conjunto {A} tal que {\aleph_0<|A|<\aleph_1}. Así, en particular, {2^{\aleph_0}\not<\aleph_1}.

   Para el converso, en caso de tener {\aleph_1<2^{\aleph_0}=|\mathbf R|}, se tendría una inyección {f\colon\aleph_1\rightarrow\mathbf R} y, fijando a {A} como el rango de {f}, se tendría {A\subseteq\mathbf R} y {\aleph_0<|A|=\aleph_1<|\mathbf R|}.

   Por lo tanto, asumiendo que no hay ningún conjunto {A}, también se tiene {\aleph_1\not<2^{\aleph_0}} y, asumiendo el axioma de la elección, esto implica {\aleph_1=2^{\aleph_0}}.

   Estaba pensando escribir acerca del impacto e importancia de la teoría de conjuntos, con la idea de completar lo que expuse en una publicación anterior. Precisamente de por qué hubo la necesidad de desarrollarla para las matemáticas. Así, estuve buscando distintas fuentes y me di con que muchos explican bien los aspectos teóricos, a veces complementados con lo que estimuló su desarrollo. Llegué a la conclusión que un artículo con esas características sería tedioso de hacer y, seguramente, de leer, por lo que decidí mostrar una opinión personal que ayuda a dar una idea de los temas que originalmente planteé.

   Solemos pensar que las matemáticas han sido desarrolladas a partir de la necesidad de contar de nuestros ancestros. Esa necesidad de contar cuántos años tenemos, cuántas ovejas; una luna, dos ojos, seis esposas… muchos etcéteras. Pero si miramos de cerca, al contar la cantidad de cosas de un cierto tipo que tenemos, lo primero que requerimos es poder reunirlas en una sola colección: la colección de las ovejas o la colección de planetas, y así sucesivamente.

   Los conjuntos vinieron a resolver un problema similar. Son colecciones de objetos matemáticos que son a la vez objetos matemáticos.

   Desde luego, esto no quiere decir que deberíamos aprende la teoría de conjuntos con ese único objetivo. Las aplicaciones inmediatas de la teoría de conjuntos no son dedicadas a las colecciones finitas, o, más bien, colecciones suficientemente pequeñas como las que vimos al inicio. No necesitamos pensar en parejas o grupos de 17 elementos como objetos particulares. Independientemente de lo que queremos hacer con ellas, podemos realizar eso mismo a mano, o casi a mano.

   Los conjuntos entran en juego cuando se quiere hablar de conjuntos infinitos. Estos conjuntos infinitos recogen un número infinito de objetos de un colección; por ejemplo, el conjunto de los números naturales, el conjunto de conjuntos finitos de conjuntos de números naturales, el conjunto de los números irracionales, etcétera. Una vez establecido qué objetos matemáticos se puede englobar en otros objetos matemáticos, podemos comenzar a analizar su estructura.

   Pero justamente aquí viene el problema. Los conjuntos infinitos desafían nuestra intuición, la que proviene de los conjuntos finitos. Las paradojas de la infinitud, como la paradoja de Galileo, la del hotel de Hilbert, entre otros, son las paradojas que vienen a representar la naturaleza del infinito como una contradicción a nuestra intuición física.

   El estudio de la teoría de conjunto, incluso intuitivamente, es la columna vertebral técnica de cómo se manejan los conjunto infinitos. La matemática moderna tiene que ver mucho con conjuntos infinitos, unos infinitos más grandes que otros, más grandes o más pequeños, y es una buena idea aprender acerca de los conjuntos infinitos si se quiere entender mejor a los objetos matemáticos.

   Uno puede estudiar intuitivamente una gran parte de la teoría de conjuntos, sobre todo si realmente se enseña la teoría axiomática de conjuntos con una presentación intuitiva. Este tipo de aprendizaje puede, y tal vez debería, incluir discusiones sobre el axioma de la elección, sobre los ordinales y algo de cardinales. Por ejemplo, los ordinales y cardinales son dos maneras de contar que se extienden más allá de nuestro entendimiento intuitivo de que el conteo se realizar mediante el uso de los números naturales, y que además nos permiten contar objetos infinitos, lo que no es posible con los números naturales.

   Si combinados estas ideas con los fundamentos de la lógica de primer orden, el cálculo de predicados y la lógica elemental de primer orden, se puede ver que la teoría de conjuntos puede ser utilizada como base para las matemáticas modernas; lo que a su vez, nos permite ver mejor algunas partes de las matemáticas.

   La teoría axiomática de conjuntos, por otra parte, es una rama matemática como cualquier otra. Posee ciertos tipos de problemas típicos, los que una vez establecidos son trabajados por los teóricos en sus formas típicas y atípicas para lograr resolverlos o, al menos, entenderlos mejor. Sin embargo, la teoría axiomática de conjuntos puede manejar mejor los problemas más delicados que vienen desde el infinito.

¿Qué quiero decir con esto? Muchos de los conjuntos infinitos en las matemáticas modernas son numerables o tienen un “tamaño” continuo. Rara vez nos encontramos con conjuntos más grandes; por ejemplo, el conjunto de todos los conjuntos Lebesgue medibles es muy grande, pero aún así no es usual preocuparse por esos conjuntos. Pero, ahora que entendemos mejor los conjuntos infinitos, nos podemos preguntar cosas como: Dado un grupo abeliano con determinadas propiedades, ¿es necesariamente libre (en términos abelianos)? Por lo general, podemos probar este tipo de teoremas para objetos numerables, en este caso, los grupos numerables, pero no más allá de eso.

   Cuando estamos interesados en la topología, que nos permite ampliar nuestra capacidad de manipulación de los objetos numerables a los entes que se pueden aproximas “en el buen sentido” con objetos numerables (como espacios separables). Pero incluso entonces, podemos formularnos preguntas que implican objetos arbitrarios y que, no necesariamente, tengan estas buenas propiedades.

   Resulta que nuestra falta de intuición para los conjuntos infinitos se refleja en la falta de una “estructura intuitivamente demostrable” de los conjuntos infinitos. No podemos siquiera hacer una demostración para determinar cuántas cardinalidades distintas se encuentran entre la cardinalidad de {\mathbb N} y la de {\mathbb R}. Podría no haber ninguno o podría ser uno o dos o muchos más. Aquí es cuando la teoría axiomática de conjuntos entra en el ruedo.

   La teoría axiomática de conjuntos se ocupa de los axiomas adicionales que podríamos requerir en universo teórico para ajustarlo a lo que deseamos tener en él, y cómo afectan a la estructura de los conjuntos infinitos. Y ésta es también una importancia más de la teoría de conjuntos en la investigación matemática. Se trata de la resolución de la existencia de supuestos o qué tipos de ellos necesitamos para demostrar o refutar la existencia de ciertos objetos.

   Estos objetos, que resultan aparentemente arbitrarias, puede tener una gran influencia y fuertes efectos sobre la estructura de los “conjuntos matemáticamente interesantes”. Por ejemplo, sabemos que cada conjunto de Borel es medible Lebesgue. Pero la imagen continua de un conjunto de Borel no es necesariamente de Borel. ¿Será medible Lebesgue? Resulta que sí, pero si cerramos los conjuntos de Borel bajo sus complements y funciones continua, ¿los conjuntos resultantes serán medibles Lebesgue? ¿Podrán satisfacer alguna de las versiones de la hipótesis del continuo? ¿Tendrán la propiedad de Baire? Y hay muchas más preguntas, todos ellos muy naturales, que se origina en todo tipo de objetos teóricos extraños y axiomas que afirman su existencia.

   Y si uno se pregunta: ¿a cuenta de qué debemos aprender la teoría de conjuntos y cuál es su importancia? Es por esto, que nos permite entender mejor los objetos infinitos y los supuestos necesarios para controlar mejor su comportamiento.

Epílogo. Veamos una breves descripciones.

La teoría de conjuntos intuitiva. La teoría de conjuntos es el lenguaje común para hablar de las matemáticas, por lo que el aprendizaje de la teoría de conjuntos significa aprender este idioma común. Otro aspecto, como mencioné, es el de conteo. La cardinalidad de los conjuntos es una noción muy fundamental que puede ser entendido bastante bien intuitivamente. La cardinalidad significa contar, así que aprender la teoría de conjuntos significa aprender a contar —más allá de los números finitos. Una aplicación clásica es la prueba de la existencia de los números trascendentes. Por último, la teoría de conjuntos se ata de forma segura con la lógica, por lo que el aprendizaje de la teoría de conjuntos significa aprender la lógica, de que la que podemos hacer uso todo el tiempo.

Teoría axiomática de conjuntos. La teoría de conjuntos es tan fundamental que la única manera de estudiarla rigurosamente es axiomáticamente. Por otra parte, desde el inicio del estudio intuitivo de los conjuntos uno se encuentra con preguntas muy simples que no pueden ser respondidas. Por ejemplo, ¿cada subconjunto de los números reales tiene la cardinalidad de los números reales o la de los números naturales. Otro punto es el axioma de la elección, que por un lado es equivalente a muchas declaraciones obviamente verdaderas tanto como los es a declaraciones evidentemente falsas. Esta situación requiere un estudio axiomático muy cuidadoso y, por supuesto, hay varias maneras de axiomatizar la teoría de conjunto, lo que da lugar a diferentes teorías de conjuntos —haciendo el tema aun más divertido.

Coda. En términos generales la teoría se ocupa del universo matemático. Concretamente, la teoría de conjuntos tiene la capacidad para describir los resultados de independencia, que es un aspecto importante de la teoría de conjuntos. Por ejemplo, consideremos {\mathbb R}. ¿Existe un conjunto {X} tal que {|\mathbb N|<|X|<|\mathbb R|}? La teoría de conjuntos nos muestra que la solución a esta pregunta está más allá de nuestra intuición (ZFC). Es posible construir modelos del universo de las teoría de conjuntos donde esta afirmación es cierta, así como construcciones de universos donde es falsa. Por lo tanto, nunca podremos saber la solución a esta pregunta. Lo que hecha luz sobre nuestra capacidad de percibir el infinito.

   También existen ciertos objetos combinatorios que también son independientes de nuestra intuición. Sin embargo, también hay que señalar que la teoría de conjuntos no existe en una burbuja. Los resultados en la teoría de conjuntos sangran a otras áreas de las matemáticas. Consideremos, por casos, la solución de Shelah al problema de Whitehead. Resultados de independencia aparecen a lo largo de matemáticas y es el trabajo de la teoría de conjuntos de explicar por qué y cómo estos resultados de indepedencia ocurren.

   La filosofía de la teoría de conjuntos es un campo vivo y que se necesitaría un estudio mayor para comprender los argumentos de Woodin, Hamkins y otros que han discutido estos temas con mayor detalle.

   Todo estudio requiere de una fase previa en la que se obtienen los conocimientos necesarios para avanzar en el aprendizaje. El problema es decidir cuánto de ese conocimiento es necesario. Particularmente, cuando empecé a estudiar Análisis, tenía problemas al tratar con las sutilezas de la Teoría de conjuntos, así como ciertas propiedades del álgebra. Aunque es posible avanzar “intuitivamente”, deja un sin sabor ciertas grietas que uno tiene que saltar, en lugar de sellar. Ahora presentaré un resumen de los fundamentos, que considero, me ayudaron a tener un soporte.

   Supondré que tiene el cierta familiaridad con las matemáticas elementales (e.g., manejo de expresiones algebraicas: {a^ma^n=a^{m+n}}, {a/b+c/d=(ad+bc)/bd}, etc.) En general, que conoce los números naturales, enteros racionales, y que esté familiarizado con los números reales sería conveniente.

   Mi principal propósito es conectar los conocimientos informales con otros conceptos más abstractos que son necesarios par abordar con el rigor necesario otros temas más delicados. Con “rigor necesario” no me refiero a trabajar en sistema axiomático formal, sino a lo esencial para distinguir informalmente un razonamiento válido de otro que pretende serlo.

— 1. El comienzo del viaje —

   Al ver una película somos espectadores de lo que quiere contarnos. Algunas son de género realista y, otras, fantásticas; así mismo, es posible que combinarlas en distintas proporciones. Lo que sí se mantiene constante es el hecho que cada película tiene su propia realidad interna, la cual debemos asumir cierta para poder comprender lo que se nos quiere mostrar; cualquier juicio sobre cualquier escena no debe remitirse a la realidad externa. Por ejemplo, si estamos ante una película de vampiros, debemos ser capaces de asumir su existencia según el caso. Si es de género fantástico, es necesario creer que existen de manera interna los vampiros y, por lo tanto, es inconcebible pasear durante las noches. Por otro lado, de ser de género realista, sería tonto no buscar un tesoro en el castillo de Drácula. Los importante es aislar lo que sea que creamos de la realidad interna de la película, independientemente de lo que sepamos de la realidad externa (que no existen); sino, no sería posible concebir el final de la misma, cuando los vampiros aparezcan y manifiesten su realidad (interna). En resumen, la realidad interna son todas las leyes que hacen posible la trama, mientras que la realidad externa es la que vivimos y que no tiene por qué necesariamente afectar la película.

   En nuestra historia acerca de los conjuntos, quienes la consideran histórica son los que los filósofos llamados platonistas; aquellos para los cuales es pura fantasía son los formalistas; mientras que quienes adoptan posturas intermedias se distribuyen entre una amplia gama de escuelas, una de las más populares es el finitismo.

   En el relato que vamos a presentar acá, nuestros personajes son llamados conjuntos internos. Del mismo modo en el que un personaje pretende ser una persona (interna), en nuestro relato, los conjuntos internos pretende ser (internamente) colecciones de objetos. ¿De qué objetos? Nuestra teoría será muy cómoda, dichos objetos serán otros conjuntos internos. No hay nada más que conjuntos internos. (De aquí en adelante usaremos los términos conjunto y conjunto interno para hacer referencia a la misma entidad. Quien termine la lectura verá que la expresión “conjunto interno” ayuda a clarificar las ideas, pero que, en la práctica posterior a esta lectura, usará el término “conjunto”.)

   Así, un conjunto {B} es una colección de conjuntos. Si {A} es uno de los conjuntos que forman parte de {B}, escribimos

\displaystyle  A \in B.

Se lee {A} pertenece a {B}, {A} es un elemento de {B}, {A} está en {B}, etc. Para indicar lo opuesto usamos {A \notin B}.

   Toda historia coherente debe respetar ciertas normas, que se establecen (posiblemente de manera arbitraria) para no incurrir en contradicciones. Por ejemplo, en una película que trate de seres humanos, no deberíamos ver uno de seis dedos.

   Entonces se tienen leyes internas, llamadas axiomas, que todo conjunto debe respetar para que el argumento sera coherente e interesante. En ese sentido, con estas leyes logramos que nuestros conjuntos internos se comporten internamente como esperamos. Veamos cuando dos conjuntos son iguales

Axioma 1 (de extensionalidad). Si dos conjuntos {A,B} tienen los mismos elementos, entonces son iguales, {A = B}.

   Para confirmar la igualdad bastará con tomar un elemento arbitrario {x \in A} y lograr probar que también {x \in B}, y viceversa.

   Para referirnos a la mitad de este hecho, diremos que {A} es un subconjunto de {B}, {A \subset B}, si todo elemento de {A} es también un elemento de {B}. Así, {A = B} equivale a las dos inclusiones {A \subset B} y {B \subset A}.

   Se llama extensión de un conjunto {B} a todos los conjuntos {A} que cumplen {A \in B}. Así, el axioma de extensionalidad afirma que dos conjuntos son iguales si, y sólo si, tienen la misma extensión. Esto nos permite afirmar que un conjunto no es ni más ni menos que su extensión{{}^*}, es decir, una colección de conjuntos. (Esto no es necesidad lógica. Podríamos tener conjuntos que cumplen otras propiedades además de su extensión. Por ejemplo, podríamos haber establecido que hubieran conjuntos altos y bajos, de manera que dos conjuntos {A,B}, ambas con un único elemento {C}, fueran distintos porque uno es alto y el otro bajo. Lo que afirma el axioma de extensionalidad es que un conjunto no tiene ninguna otra propiedad distintiva más que si extensión.)

(Paradojas) Una manera usual de especificar una colección es a través de una propiedad común a ciertos objetos. Por ejemplo, tenemos la propiedad {P(x) \equiv x \notin x}, i.e., dado un conjunto {x}, este cumple la propiedad {P} si no se pertenece a sí mismo. Notar que en ningún momento se ha dicho que tenga que haber conjuntos que se pertenezcan a sí mismos. Si no los hubiera, todos cumple la propiedad {P}.

   En cualquier caso, diremos que {R} es la colección de todos los conjuntos que cumplen {P}. En efecto, es una colección definida con toda precisión. ¿Es {R} la extensión de un conjunto? o, dicho de otro modo, ¿existe un conjunto {R} cuyos elementos sean precisamente los conjuntos que no se pertenecen a sí mismos?

   No. Si existiera tal {R}, o bien {R \in R}, o bien {R \notin R}. Pero ambas nos llevan a una contradicción. Si suponemos que {R \in R}, entonces, por la definición de {R}, se cumple {P(R)}, i.e., {R \notin R}, y estábamos suponiendo lo contrario, una contradicción. Por otra parte, si {R \notin R}, entonces {R} cumple la propiedad {P}, luego {R \in R}, lo cual nuevamente es absurdo.

   Desde la óptica de los matemáticos, esto es equivalente a decir que no existe ningún conjunto que contenga a los conjuntos que no se pertenecen a sí mismos. Pero, expresado así, es algo brusco, ya que niega la posibilidad de pensar en una colección de conjuntos con una propiedad nada ambigua.

   No obstante, entendida, esta “paradoja” deja de ser extraña. Lo que hemos probado es que la colección {R} no es la extensión de ningún conjunto. Los matemáticos expresan esto de diciendo que {R} es una clase propia, una colección de objetos pero que no es conjunto, es decir, una colección de personajes de nuestro relato que no es ella misma un personaje, una colección externa.

   Por ejemplo, podemos imaginar una obra de teatral del renacimiento donde los personajes llevan un micrófono oculto. En efecto, este “objeto” no existe internamente, ya que, de ser así, la historia sería contradictoria, pues en el renacimiento no existían tales objetos. Igualmente, la clase {R} “está ahí”, pero es externa a nuestro relato; podemos demostrar que no existe internamente, pero incluirla como parte de los personajes nos lleva a una contradicción.

   Bajo este enfoque, la clase {R} no es contradictoria. Haciendo un uso externo del signo {\in}, podemos decir que {R \in R}, y no tener una contradicción, ya que para pertenecer a {R} es necesario (a) ser un conjunto interno y (b) no pertenecerse a sí mismo. Como {R} falla (a), no podemos concluir que {R \in R}, y así no llegamos a ninguna contradicción. Incluso, notemos que un conjunto interno es una colección de conjuntos internos; una colección de conjuntos externos puede contener algunos conjuntos internos, pero no puede formar parte de un conjunto interno.

¿Con qué colecciones de conjuntos internos contamos para nuestra película? Hemos visto que no podemos afirmar existe un conjunto para cualquier propiedad {P}, ya que si {P(x)\equiv x\notin x}, entonces concluiríamos que {R} es un conjunto interno y en nuestra película sería como si un rabino mostrara una esvástica. No obstante, y afortunadamente para nosotros, las únicas propiedades que dan lugar a clases propias son las que definirían conjunto “demasiado grandes”; así, por ejemplo, podemos demostrar que no hay un conjunto interno que contenga a todos los conjuntos internos o, lo que es lo mismo, que la clase de todos los conjuntos internos no es un conjunto interno, como tampoco lo es la clase de todos los conjuntos internos que tiene un único elemento, etc. Aunque resalto que decimos “afortunadamente” porque, en la práctica, para hacer matemáticas no requerimos de tales colecciones enormes. Hablamos de conjuntos internos con un elemento sin necesidad de tratar con la clase enorme de todos los conjunto internos con un elemento; similarmente, podemos hablar de conjuntos internos sin que necesitemos recurrir a la clase enorme de todos los conjuntos internos, etc.

   Dejamos nuestra disertación sobre las paradojas para volver a nuestro relato sobre los conjuntos internos.

   Veamos como formar nuevos conjuntos internos a partir de propiedades. Para ello contamos con un axioma al que podemos considerar como el más general acerca de la formación de conjuntos.

Axioma 2 (de especificación). Sean {A,x_1,\dotsc,x_n} conjuntos internos y una propiedad interna {P(x,x_1,\dotsc,x_n)}. Entonces existe un conjunto interno cuyos elementos son precisamente los conjuntos internos {x\in A} que cumplen la propiedad {P}. Escribimos

\displaystyle  \{x\in A : P(x,x_1,\dotsc,x_n) \text{ es verdadero}\}

o brevemente {\{x\in A : P(x,x_1,\dotsc,x_n)\}}.

   Notar que aquí hemos empleado la expresión propiedad interna por primera vez, la cual usaremos para referirnos a cualquier propiedad que pueda ser expresada exclusivamente en términos del signo {\in} y de conceptos lógicos, como “y”, “o”, “no”, “si… entonces…”, “existe”, “para todo”, “=”, etc. Con esto, queremos decir que no podemos definir el conjunto de los conjuntos que son “altos”, pues “alto” no es una propiedad definida a partir de {\in} y los conceptos lógicos mencionados.

   Vemos que el axioma de especificación sólo nos permite que una propiedad seleccione algunos conjuntos internos de entre los conjuntos internos que pertenecen a un conjunto interno dado. La clave está en que debemos tener un conjunto interno de antemano. Así, aun si podemos escribir {\{x : P(x,x_1,\dotsc,x_n)\}}, para referirnos a la colección de conjuntos internos que cumplen la propiedad {P}, no podemos pretender que tal colección sea a extensión de un conjunto interno. Como vimos, podemos encontrarnos con una contradicción, demostrando que tal colección de conjuntos es una clase propia, externa a nuestra película. De este modo, dado un conjunto interno {A}, podemos considerar como personaje de nuestra película a {R_A:=\{x\in A : x\notin x\}}, y este conjunto no da lugar a ninguna contradicción. Sería una contradicción que satisfaga {R_A\in R_A}, de lo que deducimos {R_A\notin R_A}, a su vez de esto obtenemos {R_A\notin A}, ya que si {R_A \in A}, entonces {R_A\in R_A}, una contradicción.

   No obstante, el axioma de especificación no es suficiente para garantizar la la existencia de todos los conjuntos internos con los que nos gustaría contar para nuestra película. Por ejemplo, dados dos conjuntos internos {a,b}, nos gustaría tener un conjunto interno {c} formado ni más ni menos que por {a} y {b}, i.e., {c:=\{x : x=a \text{ o } x=b\}}, pero la forma de esta expresión no nos permite apelar al axioma de especificación. Así, veremos que problemas como éste se nos presentarán en muy pocas ocasiones, y sólo serán necesarios unos pocos axiomas específicos para asegurar la existencia de algunos conjuntos internos como {c}. Ahora bien, una vez tengamos a disposición estos conceptos básicos, el único principio general de formación de conjuntos que necesitaremos (y del tendremos derecho a echar mano si no queremos caer en contradicciones) será el axioma de especificación.

— 2. Fundamentos —

   Ahora nos toca describir a los personajes elementales de nuestra película. Recordemos que el axioma de especificación que ya hemos discutido requiere la existencia de al menos un conjunto interno, para genera a partir de él nuevos conjuntos internos, y de momento no conocemos ninguno. En consecuencia, necesitamos axiomas que garanticen la existencia de algunos conjuntos para que formen nuestro “reparto”.

Axioma 3 (del conjunto vacío). Existe un conjunto interno que no tiene ningún elemento.

   El axioma de extensionalidad nos asegura este conjunto es único, pues si existieran dos conjuntos internos sin elementos, entonces ambos tendrían los mismos elementos (i.e., ninguno), así tendrían que ser el mismo (¿por qué?). Esta unicidad nos permite llamarlo el conjunto vacío, representado por {\emptyset}.

   Aun con estos axiomas, no podemos generar conjuntos más grandes que el conjunto vacío. Para lograr formar otros conjuntos necesitamos un axioma más.

Axioma 4 (del par). Sean dos conjuntos internos {u} y {v}. Entonces existe un conjunto interno cuyos elementos son exactamente {u} y {v}.

   De nuevo, el axioma de extensionalidad garantiza que sólo puede haber un conjunto interno cuyos elementos sean {u} y {v}. Llamamos a tal conjunto el par desordenado formado por {u} y {v}, representado por {\{u,v\}}.

   Notar que, si tenemos dos conjuntos internos, no necesitamos ningún axioma que nos de derecho a pensar coherentemente en la colección formada por ellos dos. Lo que garantiza el axioma del par es que dicha colección no es externa a nuestra película, sino que también forma parte de ella.

   Observemos que el axioma no requiere los conjuntos {u} y {v} sean distintos. Al ser iguales se cumple {\{u,v\}=\{u\}=\{v\}}, el cual es un conjunto interno con un único elemento.

   El nombre “par desordenado” evidentemente hace referencia a que {\{u,v\}=\{v,u\}} y así no podemos definir un objeto “antes” o “después” de otro. Cuando queramos dar importancia al orden, podemos agrupar los conjuntos en un par ordenado:

\displaystyle  (u,v):=\left\{{\{u\},\{u,v\}}\right\}.

   Observar que {(u,v)} es un conjunto interno cuya existencia se demuestra aplicando tres veces el axioma del par. Ahora, es sencillo mostrar que la igualdad {(u,v)=(p,q)} se da únicamente cuando {u=p} y {v=q}. En particular, si {u\ne v}, entonces {(u,v)\ne(v,u)}.

   Ahora podemos definir la terna ordenada {(u,v,w)=((u,v),w)}, la cuádrupla ordenada {(u,v,w,x)=((u,v,w),x)}, etc.

   Seguro estamos familiarizados con el hecho que dados dos conjunto {u} y {v}, informalmente definimos su unión e intersección como

\displaystyle  u\cup v:=\{x:x\in u\text{ o }x\in v\}

y

\displaystyle  u\cap v:=\{x:x\in u\text{ y }x\in v\}.

   Observemos que estas definiciones parecen aplicaciones del axioma de especificación que, sin embargo, no respetan su estructura, ya que no estamos restringiendo la selección de los {x} que pertenecen a un conjunto prefijado, cuya existencia ha sido comprobada de antemano. No obstante, en el caso de la intersección no es complicado arreglar el problema, podemos escribir

\displaystyle  u\cap v:=\{x\in u:x\in v\}

y con ello estamos usando el conjunto {u} como base para construir la intersección. Sin embargo, para la unión la objeción es irrefutable; lo que nos lleva a necesitar un axioma específico:

Axioma 5 (de la unión). Dados dos conjuntos internos, existe un conjunto internos cuyos elementos son precisamente los conjuntos internos que pertenecen a cualquiera de los dos conjuntos dados. (En realidad, la teoría de conjuntos requiere un axioma de la unión más fuerte que éste, pero no necesitamos explicitar este hecho.)

   Con este axioma, nos permitimos hablar de conjuntos internos como

\displaystyle  \{a,b,c,d\} = \{a\}\cup\{d\}\cup\{c\}\cup\{d\},

que es el conjunto interno cuyos elementos son los cuatro conjuntos internos {a,b,c,d}.

   Aplicando el axioma de especificación, podemos definir el complementario de un conjunto interno en otro:

\displaystyle  u\setminus v:=\{x\in u:x\notin v\}.

   Ahora, para dar el último concepto básico a usar, requerimos su axioma específico:

Axioma 6 (del conjunto de partes). Dado un conjunto interno {A}, existe un conjunto interno cuyos elementos son todos los subconjuntos de {A}.

   A dicho conjunto lo llamaremos conjunto de las partes de {A}:

\displaystyle  \mathcal P A := \{x:x\subset A\}.

   Notar que si {u\in A} y {v\in B}, entonces {u,v\in A\cup B}, luego

\displaystyle  \{u\},\{u,v\}\in\mathcal P(A\cup B),

así

\displaystyle  (u,v)=\{\{u\},\{u,v\}\}\in\mathcal P\left({\mathcal P(A\cup B)}\right).

Lo que implica que, aunque la definición

\displaystyle  A\times B:=\{(u,v):u\in A, v\in B\}

podría parecer un uso fraudulento del axioma de especificación, en realidad es legítima, porque se podría haber escrito

\displaystyle  A\times B:=\{(u,v)\in\mathcal P\left({\mathcal P(A\cup B)}\right):u\in A, v\in B\}.

A este conjunto, es decir, el conjunto de todos los pares ordenados con primera componente en {A} y segunda componente en {B}, lo llamamos producto cartesiano de {A} y {B}.

   Terminaremos este apartado esbozando la construcción del conjunto {\mathbb N} de los números naturales. La idea es demostrar la existencia de un conjunto interno que tenga el aspecto

\displaystyle  \mathbb N = \{0,1,2,3,4,5,\dotsc\}.

   Pero, para ello, tenemos que resolver dos cuestiones:

  1. para que {\mathbb N} sea un conjunto interno hemos de definir sus elementos {0}, {1}, {2}, etc. de tal modo que podamos considerar a cada uno de ellos como un conjunto interno, y
  2. hemos de arreglárnoslas para definir un conjunto {\mathbb N} que los tenga a ellos por elementos y sólo a ellos.

   La primera es fácil de resolver. Si pensamos en los números naturales como ciertos “personajes históricos”, lo que necesitamos es seleccionar unos actores que interpreten estos papeles en nuestra película. Como número 0, ninguno parece más idóneo que el conjunto vacío. Así, llamaremos número natural {0} a {0 = \emptyset}. Esto quiere decir que, cuando pensemos en el conjunto vacío como el único conjunto interno sin elementos, escribiremos {\emptyset}, mientras que cuando pensemos en él como número natural cero escribiremos {0}, si bien se trata en ambos casos del mismo conjunto.

   Luego definimos, para cualquier conjunto interno {x}, el siguiente de {x}, que será {x'=x\cup\{x\}}. En particular,

\displaystyle  \begin{array}{l} 1=0'=\emptyset\cup\{\emptyset\}=\{\emptyset\}=\{0\},\\ 2=1'=1\cup\{1\}=\{0\}\cup\{1\}=\{0,1\},\\ 3=2'=2\cup\{2\}=\{0,1\}\cup\{2\}=\{0,1,2\}, \end{array}

y así sucesivamente. La cuestión que nos queda es convertir el “así sucesivamente” en una propiedad interna que podamos usar para definir el conjunto interno {\mathbb N}. Para ello definimos:

Definición 1 (Conjunto inductivo). Un conjunto interno {A} es inductivo si {0\in A} y, siempre que un conjunto {x\in A}, también se cumple que {x'\in A}.

   Es decir, un conjunto es inductivo si contiene a todos los conjuntos internos que queremos tomar como números naturales. Ahora necesitamos el último axioma que perfilará el comportamiento básico de los conjuntos internos:

Axioma 7 (de infinitud). Existe un conjunto interno inductivo.

   Este axioma de infinitud se llama así porque sin él es imposible, no ya construir los números naturales, sino siquiera demostrar la existencia de un conjunto interno que sea infinito.

   El problema de los conjuntos inductivos es que, además de los números naturales, pueden contener otros conjuntos. Para resolver este problema definimos:

Definición 2 (Conjunto de los números naturales). Llamaremos conjunto de los números naturales al conjunto interno

\displaystyle  \mathbb N := \{x\in A : x \text{ pertenece a todos los conjuntos internos inductivos}\},

donde {A} es un conjunto inductivo arbitrario. Es claro que {\mathbb N} no depende de la elección de {A}, pues si llamamos {\mathbb N_A} y {\mathbb N_B} a los conjuntos definidos de estemos modo a partir de dos conjuntos inductivos {A} y {B}, entonces todo {x\in\mathbb N_A} pertenece a todos los conjuntos inductivos, en particular a {B}, luego también {x\in\mathbb N_B}, y viceversa, luego {\mathbb N_A=\mathbb N_B}.

   A partir de aquí, es pura rutina demostrar los siguientes hechos básicos sobre los números naturales:

Proposición 3. {0\in\mathbb N} y, si {n\in\mathbb N}, entonces {n'\in\mathbb N} (el cero es un número natural y el siguiente de un número natural es también un número natural).

Proposición 4. No existen ningún {n\in\mathbb N} tal que {n'=0} (el cero no es el siguiente de ningún número natural).

Proposición 5. Si {n\in\mathbb N} y {n\ne 0}, existe un {m\in\mathbb N} tal que {n=m'} (todo número natural no nulo es el siguiente de otro número natural).

Proposición 6. Si {m,n\in\mathbb N} y {m'=n'}, entonces {m=n} (números distintos tienen siguientes distintos).

Proposición 7. Si {A\subset\mathbb N} es un conjunto interno tal que {0\in A} y, cuando {n\in A}, también {n'\in A}, entonces {A=\mathbb N}.

   La última propiedad se conoce como principio de inducción y, aunque parezca la propiedad más compleja de las cinco, es una de las más fáciles de demostrar:

Demostración. (De la propiedad 7) Un conjunto {A} en tales condiciones es, por definición, inductivo; luego, si {n\in\mathbb N}, se cumple que {n\in A} por definición de {\mathbb N}, es decir, porque {n} ha de pertenecer a todos los conjuntos internos inductivos. Por consiguiente, {\mathbb N\subset A}, lo que, unido a la hipótesis de que {A\subset\mathbb N}, nos da que {A=\mathbb N}. \Box

   Las propiedades 3 y 4 son inmediatas, 5 se prueba trivialmente usando 7 (que ya está probada).

Ejercicio 1. Probar 6 siguiendo este esquema:

  1. Demostrar por inducción sobre {n} que si {m\in n\in \mathbb N}, entonces {m\subset n}.
  2. Demostrar por inducción que, si {n\in\mathbb N}, entonces {n\notin n}.
  3. Demostrar 6 por reducción al absurdo: si {m\ne n}, entonces {m\in n} y {n\in m}. Llegar de aquí a una contradicción.

Observación 8. A veces es más cómodo expresar el principio de inducción en término de propiedades: Dados unos conjuntos internos {x_1,\dotsc,x_n} y una propiedad interna {P(n,x_1,\dotsc,x_n)}, podemos considerar el conjunto interno

\displaystyle  A := \{n\in\mathbb N : P(n,x_1,\dotsc,x_n)\}.

   Lo que dice el principio de inducción para el caso del conjunto {A} es que, si {0} tiene la propiedad {P} y, supuesto que un {n\in\mathbb N} tiene {P}, podemos probar que {n'} también tiene la propiedad {P}, entonces podemos asegurar que todo número natural tiene la propiedad {P}.

   Las cinco propiedades que hemos enunciado sobre los números naturales se conocen como axiomas de Peano (aunque no son axiomas, sino proposiciones de nuestra película). Peano creía, y muchos matemáticos siguen creyendo actualmente, que determinan completamente al conjunto {\mathbb N} de los números naturales, en el sentido que no puede haber más que un conjunto que cumpla esas cinco propiedades. Esto es cierto si, por “conjunto”, entendemos “conjunto interno”, es decir, un conjunto de los que forman parte de nuestra película. (El lector perspicaz se dará cuenta que aquí vemos que todo lo hemos dicho, sobre los conjuntos internos y los números naturales, no son un estudio de la realidad tal cual se nos presenta en el sentido de la filosofía kantiana. Queda claro que sólo es un modelo de lo que podría ser “realmente” un conjunto y número natural, pero esto queda fuera del alcance de la lectura.)

Ejercicio 2. Demostrar que si {\mathbb N_1} y {\mathbb N_2} son dos conjuntos internos que cumplen los cinco axiomas de Peano, entonces {\mathbb N_1=\mathbb N_1\cap\mathbb N_2=\mathbb N_2}. Esto nos induce a pensar que sólo existe un único conjunto de números naturales.

   Ahora bien, quienes creen que los axiomas de Peano determinan la forma absoluta el conjunto de los números naturales no tiene en cuenta que las películas son películas. No es éste el mejor momento para discutir sobre la cuestión. Volveremos sobre ella más tarde. De momento dejamos únicamente esta idea al lector: En el mundo real sólo ha habido un Napoleón, y, por ello, en una película sobre Napoleón sólo puede haber un personaje que sea Napoleón, pero eso no garantiza que el Napoleón que presenta la película sea una imagen fiel del Napoleón histórico. Sería un error garrafal afirmar que el Napoleón de la película ha de ser idéntico al Napoleón real porque no puede haber más que un Napoleón. En realidad tenemos dos unicidades: hay un único Napoleón externo y un único Napoleón interno, pero el Napoleón interno puede ser muy diferente del Napoleón externo.

— 3. Elementos de teoría de conjuntos —

   Presentados los principales personajes de nuestra película, ahora vamos a dar algunos detalles del argumento.

— 3.1. Funciones —

Definición 9. Dados dos conjuntos {A} y {B}, una aplicación (o una función) {f\colon A\rightarrow B} es un subconjunto {f\subset A\times B} tal que, para cada {a\in A}, existe un único {b\in B} tal que {(a,b)\in f}. Este único {b} se llama imagen por {f} del conjunto {a}, y se representa por {b=f(a)}. También se dice que {a} es una antiimagen (o preimagen) de {b} por {f}.

   En la práctica, para definir una aplicación {f\colon A\rightarrow B} podemos olvidar que estamos definiendo un conjunto de pares ordenados y definir simplemente {f(a)} para todo {a\in A}. En el fondo, esto es siempre una aplicación del axioma de especificación; e.g., si definimos {s\colon\mathbb N\rightarrow\mathbb N} como la aplicación dada por {s(n):=n'}, con más precisión estamos definiendo el conjunto

\displaystyle  s:=\{(n,m)\in\mathbb N\times\mathbb N : m=n'\}.

Definición 10 (Uno a uno). Una aplicación {f\colon A\rightarrow B} es inyectiva su elementos distintos de {A} tiene imágenes distintas en {B} o, alternativamente, si cuando {f(a)=f(a')}, entonces {a=a'}.

Observación 11. Con esto podríamos expresar de manera sucinta los axiomas de Peano:

  1. Existe una función inyectiva {s\colon\mathbb N\rightarrow\mathbb N}. La imagen de {s(n)} de cada número natural {n} se llama siguiente de {n}.
  2. Existe un único número natural {0\in\mathbb N} tal que {0\ne s(n)} para cualquier {n\in\mathbb N}.
  3. Si un conjunto {X\subset\mathbb N} es tal que {0\in\mathbb N} y {s(X)\subset\mathbb N} (esto es, {n\in X\implies s(n)\in X}), entonces {X=\mathbb N}.

Definición 12 (Onto). Una aplicación {f\colon A\rightarrow B} es suprayectiva si todo elemento de {B} tiene al menos una antiimagen en {A}

Definición 13 (Biyección). Una aplicación {f\colon A\rightarrow B} es biyectiva si es inyectiva y suprayectiva.

Definición 14 (Conjunto de todas las funciones). Definimos

\displaystyle  B^A := \{f : f\colon A\rightarrow B\}.

Podemos usar el axioma de especificación porque, de hecho,

\displaystyle  B^A := \{f\in\mathcal P(A\times B) : f\colon A\rightarrow B\}.

Definición 15 (Composición). Si {f\colon A\rightarrow B} y {g\colon B\rightarrow C}, definimos la composición {f\circ g\colon A\rightarrow C} como la aplicación dada por {(f\circ g)(a):=g(f(a))}.

Definición 16 (Identidad). La aplicación identidad {I_A\colon A\rightarrow A} en un conjunto {A} es la aplicación biyectiva dada por {I_A(a):=a}.

Definición 17 (Inclusión). Si {A\subset B}, la inclusión de {A} en {B} es la aplicación {i\colon A\rightarrow B} dada por {i(a):=a}.

   De modo que la identidad es la inclusión de un conjunto en sí mismo.

Definición 18 (Inversa). Si {f\colon A\rightarrow B} es una aplicación biyectiva, podemos definir la aplicación inversa {f^{-1}\colon B\rightarrow A} como la aplicación

\displaystyle  f^{-1}:=\{(b,a)\in B\times A : b=f(a)\}.

   De este modo, {b=f(a)} equivale a {a=f^{-1}(b)}. Es fácil ver que {f^{-1}} es también biyectiva y es la única aplicación {g\colon B\rightarrow A} que cumple {f\circ g=I_A} y {g\circ f=I_B}.

Definición 19 (Restricción). Si {f\colon A\rightarrow B} y {C\subset A}, llamaremos restricción de {f} a {C} a la aplicación {f|_C\colon C\rightarrow B} dada por {f|_C(c):=f(c)}, para todo {c\in C}.

Ejercicio 3. Comprobar que la composición de aplicaciones inyectivas, suprayectivas o biyectivas es también biyectiva, suprayectiva o biyectiva.

   Ahora, daremos uno de los teoremas que nos permitirán hablar de sucesiones sobre los números naturales. La prueba es bastante técnica, y los argumentos que requiere son de naturaleza algo distinta a los que nos van a interesar en esta oportunidad, por lo que podemos pasarla por alto sin que ello vaya a afectar a nuestra comprensión de lo que sigue. La incluiremos únicamente por si acaso, más adelante, encontramos motivos para desconfiar de la construcción de los números naturales y queramos revisarla con detalle.

Teorema 20 (Teorema de recursión). Dado un conjunto {A}, un conjunto {a\in A} y una aplicación {g\colon A\rightarrow A}, existe una única aplicación {f\colon\mathbb N\rightarrow A} que cumple {f(0)=a} y, para todo {n\in\mathbb N}, {f(n')=g(f(n))}.

   Es decir, para definir una aplicación {f\colon\mathbb N\rightarrow A} basta definir {f(0)} y definir {f(n')} a partir de {f(n)}.

Demostración. Por inducción se demuestra que, si {m\in\mathbb N}, se cumple que {0\in m'},todos los elementos de {m'} son números naturales y, si {n\in m}, entonces {n'\in m'}.

   En efecto esto es cierto para {m=0}, ya que {0\in 0'=\{0\}}, el único elemento de {0'} es {0}, que es un número natural, y la tercera propiedad es trivial, ya que no existe ningún {n\in 0=\emptyset}.

   Supongámoslo cierto para {m} y veámoslo para m’. Hemos de probar que {0\in m''=m'\cup\{m'\}}. Como suponemos que {0\in m'}, es claro que también {0\in m''}. Si todos los elementos de {m'} son números naturales, también lo son todos los de {m''}, ya que son los de {m'} y el propio {m'}, que es un número natural. Además, si {n\in m'=m\cup\{m\}}, o bien {n\in m}, en cuyo caso {n'\in m'\subset m''} por la hipótesis de inducción, o bien {n=m}, en cuyo caso {n'=m'\in m''} por definición de {m''}.

   Ahora vamos a probar que, para cada {m\in\mathbb N}, existe una única aplicación {f_m\colon m'\rightarrow A} que cumple {f_m(0)=a} y, para todo {n\in m}, {f_m(n')=g(f_m(n))}.

   En efecto, para {m=0} basta tomar {f_0:=\{(0,a)\}}. Si existe {f_m}, definimos {f_{m'}:=f_m\cup\{(m',g(f_m(m))\}}. De este modo, {f_{m'}(n)=f_m(n)} para todo {n\in m}, por lo que la propiedad que suponemos que cumple {f_m} puede reformularse así:

\displaystyle  f_{m'}(0):=a, \qquad f_{m'}(n'):=g(f_{m'}(m)).

para todo {n\in m'}. Como {m'=m\cup\{m\}}, sólo falta probar que la segunda parte se cumple también para {n=m}. Ahora bien, por definición,

\displaystyle  f_{m'}=g(f_m(m))=g(f_{m'}(m)).

   Para probar la unicidad, sea {h\colon m''\rightarrow A} cualquier aplicación que cumpla las condiciones

\displaystyle  h(0):=a

y

\displaystyle  h(n'):=g(h(n)), \quad \text{para todo } n\in m',

y vamos a probar que es justamente la {f_{m'}} que hemos definido. Demostramos por inducción que si {n\in m''}, entonces {h(n)=f_{m'}(n)}.

   En efecto, si {n=0}, entonces {h(0)=a=f_{m'}(0)}. Si {h(n)=f_{m'}(n)} y {n'\in m''}, entonces

\displaystyle  h(n')=g(h(n))=g(f_{m'}(n))=f_{m'}(n').

   Así pues, {h=f_{m'}}, como queríamos probar.

   Ahora definimos {f\colon\mathbb N\rightarrow A} mediante {f(n):=f_n(n)}. La aplicación {f} tiene la propiedad indicada, pues {f(0)=f_0(0)=a} y, si {n\in\mathbb N}, entonces

\displaystyle  f(n')=f_{n'}(n')=g(f_{n'}(n))=g(f_n(n))=g(f(n)).

La unicidad se demuestra por inducción exactamente igual a como hemos probado la unicidad de {f_{m'}}. \Box

   Veamos ahora una primera aplicación del teorema de recursión:

Definición 21 (Adición). Para cada {m\in\mathbb N}, definimos la aplicación {(m+)\colon\mathbb N\rightarrow\mathbb N} determinada recursivamente por {m} y la aplicación siguiente {s\colon\mathbb N\rightarrow\mathbb N}, es decir, como la única aplicación que cumple:

\displaystyle  (m+)(0):=m

y

\displaystyle  (m+)(n'):=s((m+)(n))=((m+)(n))'.

   En la práctica escribiremos {m+n} en lugar de {(m+)(n)}, con los que las propiedades anteriores se vuelven más legibles:

\displaystyle  m+0:=m, \qquad m+n':=(m+n)'.

Más aún, definiendo {1:=0'}, tenemos que

\displaystyle  m+1=m+0'=(m+0)'=m'.

   Por ello, en lo sucesivo dejaremos de representar el siguiente de {m} por {m'}, sino que nos referiremos a él como {m+1}. En estos términos, las propiedades que definen a la suma las escribiremos

\displaystyle  m+0:=m \quad\text{y}\quad m+(n+1):=(m+n)+1.

Más en general, las condiciones del teorema de recursión se expresan como

\displaystyle  f(0):=a \quad\text{y}\quad f(n+1):=g(f(n)).

Definición 22. Para cada {m\in\mathbb N}, definimos la aplicación {(m\cdot)\colon\mathbb N\rightarrow\mathbb N} como la única que cumple

\displaystyle  m\cdot 0:=0, \qquad m\cdot(n+1):=m\cdot n+m,

donde hemos utilizado el teorema de recursión con la función {g\colon\mathbb N\rightarrow\mathbb N} dada por {g(n):=n+m}.

   A partir de aquí, es pura rutina demostrar todas las propiedades conocidas de la suma y el producto de números naturales. Veamos algunos ejemplos:

Proposición 23 (Propiedad asociativa de la suma). {(m+n)+r=m+(n+r)}.

Demostración. Por inducción sobre {r}. Si {r=0} se reduce a

\displaystyle  (m+n)+0 = m+n = m+(n+0).

Si vale para {r}, lo probaremos para {r+1}:

\displaystyle  \begin{array}{l} (m+n)+(r+1)=((m+n)+r)+1=(m+(n+r))+1\\ \qquad =m+((n+r)+1)=m+(n+(r+1)), \end{array}

donde hemos usado la definición de suma, la hipótesis de inducción y dos veces más la definición de suma. \Box

Proposición 24 (Propiedad conmutativa de la suma). {m+n=n+m}.

Demostración. Dejamos como ejercicio probarlo para {m=0} y {m=1}, es decir probar por inducción sobre {n} que {0+n=n+=0} y que {1+n=n+1}.

   Ahora probamos el resultado general, también por inducción sobre {n}. Para {n=0} es: uno de los casos que hemos dejado como ejercicio: {m+0=m=0+m}. Si vale para {n}, tenemos

\displaystyle  \begin{array}{l} m+(n+1)=(m+n)+1=(n+m)+1=n+(m+1)\\ \qquad =n+(1+m)=(n+1)+m, \end{array}

donde hemos usado la definición de suma, la hipótesis de inducción, la definición de suma, el casi que hemos dejado como ejercicio y la propiedad asociativa. \Box

Proposición 25 (Simplificación de la suma). Si {u+n=v+n}, entonces {u=v}.

Demostración. Por inducción sobre {n}. Para {n=0} es {u+0=v+0}, luego {u=v}. Si vale para {n}, entonces, si {u+(n+1)=v+(n+1)}, también {(u+n)+1=(v+n)+1}, luego {u+n=v+n} (por el cuarto axioma de Peano), luego {u=v}, por hipótesis de inducción. \Box

— 3.2. Relaciones —

Definición 26 (Relación). Una relación en un conjunto {A} es un conjunto {R\subset A\times A}. En lugar de escribir {(a,b)\in R}, escribiremos {a\,R\,b} y diremos que {a} está relacionado con {b} (según la relación {R}).

Definición 27 (Relación de orden). Una relación de orden (total) en un conjunto {A} es una relación {\le} en {A} que cumple las propiedades

  1. (Reflexiva) {a\le a}.
  2. (Antisimétrica) Si {a\le b} y {b\le a}, entonces {a=b}.
  3. (Transitiva) Si {a\le b} y {b\le c}, entonces {a\le c}.
  4. (De conexión) {a\le b} o {b\le a}. (Esto es lo que garantiza un orden total.)

   Escribiremos $latex {ab}&fg=000000&bg=ffffff$ como equivalente a {b<a}.

   Un conjunto ordenado es un par {(A,\le)}, donde {\le} es una relación de orden en el conjunto {A}.

Proposición 28. La relación en {\mathbb N} dada por {m\le n} es una relación de orden si, y sólo si, existe un {r\in\mathbb N} tal que {m+r=n}.

Demostración. Las propiedades reflexiva y transitiva son inmediatas. Para probar la propiedad antisimétrica suponemos que {m\le n} y {n\le m}, de modo que {n=m+r} y {m=n+s}, para ciertos {r,s\in\mathbb N}. Entonces {m+r+s=m=m+0}.

   Por la propiedad de simplificación,{r+s=0}. De aquí se sigue que {s=0}, ya que en caso contrario, para algún {t\in\mathbb N}, {s=t+1}, con lo que {r+s+t+1=0}, en contra del segundo axioma de Peano. Por lo tanto, {m=n+s=n+0=n}.

   La conexión la demostramos por inducción sobre {a}. Si {a=0} entonces {0\le b}, ya que {b=0+b}. Si vale para {a}, entonces {a\le b} o {b\le a}. En el segundo caso {b\le a\le a+1}, luego {b\le a+1}. En el primer caso tenemos que {a+r=b}, para cierto {r\in\mathbb N}. Si {r\ne 0}, entonces {r=s+1}, luego {a+1+s=b}, lo que prueba que {a+1\le b}. Si {r=0} tenemos que {a=b}, luego {b\le b+1\le a+1}. En cualquier caso, tenemos la conexión. \Box

   En lo sucesivo nos basaremos en la siguiente definición.

Definición 29. Si {m\le n} son dos números naturales, por definición existe un {r\in\mathbb N} tal que {m+r=n}. Por la propiedad de cancelación, este {r} es único, y escribiremos {r=n-m}.

Ejercicio 4. Demostrar que, si {n\in\mathbb N}, no existe ningún {m\in\mathbb N} tal que {n<m<n+1}. Equivalentemente, si {m<n+1}, entonces {m\le n} y si {m<n}, entonces {m+1\le n}.

Definición 30 (Mínimo y máximo). Si {(A,\le)} es un conjunto ordenado y {B\subset A}, el mínimos de {B} es una elemento {m\in B} tal que {m\le b} para todo {b\in B}. El máximo de {B} es un elemento {M\in B} tal que {b\le M} para todo {b\in B}.

   Un conjunto {B\subset A} no tiene por qué tener mínimo elemento, pero si lo tiene es único, ya que, si hubiera dos {m} y {m'}, entonces tendría que se {m\le m'}, porque {m} es mínimo, y {m'\le m}, porque {m'} es mínimo. Por la antisimetría, sería {m=m'}. Similarmente sucede lo mismo con el máximo.

   Con la relación de orden definida, el conjunto {\mathbb N} de los números naturales cumple la siguiente propiedad fundamental:

Teorema 31 (Principio de buena ordenación). Todo subconjunto de {\mathbb N} no vacío tiene mínimo elemento.

Demostración. Vamos a probar por inducción sobre {n} que todo subconjunto {A\subset N} que contenga un número {\le n} tiene un mínimos elemento. Si {A} contiene un número {m\le 0}, entonces ha de ser {m=0}, porque {0+m=m}, luego {0\le m}, luego {m=0}. Por el mismo motivo, {0} es menor o igual que todo números de {A}, luego {0} es el mínimo de {A}.

   Supongamos que todo conjunto de números naturales que contenga un número {\le n} tiene mínimo elemento y supongamos que {A} contiene un número {a\le n+1}.

   Distinguimos dos casos: si {A} no contiene ningún número menor que {a}, es que {a} es el mínimo de {A}. En caso contrario, {A} contiene un elemento {b<a\le n+1}, luego {b<n+1}, luego {b\le n} y, por hipótesis de inducción, {A} tiene mínimo elemento. \Box

   En particular, el mínimos de {\mathbb N} es {0}, y {n+1} es el menor natural mayor que {n}. Por otra parte, {\mathbb N} no tiene máximo elemento, ya que todo número natural {n} es menor que {n+1}.

Definición 32. Si {(A,\le)} es un conjunto ordenado, diremos que un {M\in A} es una cota superior de un conjunto {B\subset A} si {b\le M} para todo {b\in B} (pero, al contrario que en la definición de máximo, no exigimos que {M\in B}). Análogamente se define una cota inferior. Diremos que un conjunto {B\subset A} está acotado superiormente o inferiormente si tiene una cota superior o inferior.

Teorema 33. Todo subconjunto de {\mathbb N} no vació acotado superiormente tiene un máximo elemento.

Demostración. Sea {A\subset\mathbb N}. Si {A} tiene una cota superior, el conjunto de sus cotas superior es un subconjunto de {\mathbb N} no vacío, luego podemos considerar la menor cota superior {M} de {A}. Vamos a probar que éste es el máximo de {A}. Sólo hay que probar que {M\in A}. Si {M\notin A}, entonces todo {a\in A} cumple {a<M}. Como {A} no es vacío, no puede ser {M=0}, luego {M=c+1}, para cierto {c\in\mathbb N}. Entonces, si {a\in A}, tenemos que {a<c+1}, luego {a\le c}, luego {c} es una cota superior de {A}, pero {c<M}, en contradicción con que {M} era la menor cota posible. Así pues, {M\in A} y {M} es el máximo de {A}. \Box

   Ahora veamos el último tipo de relaciones que nos interesarán.

Definición 34 (Equivalencia). Una relación {R} en un conjunto {A} es una relación de equivalente si cumple las propiedades

  1. (Reflexiva) {a\,R\,a}.
  2. (Simétrica) Si {a\,R\,b}, entonces {b\,R\,a}.
  3. (Transitiva) Si {a\,R\,b} y {b\,R\,c}, entonces {a\,R\,c}.

   En estas condiciones:

Definición 35 (Clase de equivalencia). Definimos la clase de equivalencia de un elemento {a\in A} como el conjunto

\displaystyle  [a] = \{b\in A : a\,R\,b\}.

Definición 36 (Conjunto cociente). El conjunto cociente de {A} sobre {R} es el conjunto {A/R} que contiene a todas las clases de equivalencia de los elementos de {A}.

Ejercicio 5. Demostrar que, en las condiciones anteriores, {a\,R\,b} si, y sólo si, {[a]=[b]}, mientras que no {a\,R\,b} si, y sólo si, {[a]\cap[b]=\emptyset}.

— 3.3. Conjuntos finitos —

Definición 37 (Conjunto finito). Si {n\in\mathbb N}, definimos

\displaystyle  I_n := \{m\in\mathbb N : m < n\}.

Un conjunto {A} es finito si existe un número natural {n} y una aplicación biyectiva {f\colon I_n\rightarrow A}. En caso contrario es infinito.

   Notar que, {I_0=\emptyset} y, técnicamente, {\emptyset\colon\emptyset\rightarrow\emptyset} es biyectiva, por lo que {\emptyset} es un conjunto finito.

   Los conjuntos {I_n} son finitos, pues cumple la definición con la aplicación identidad.

   Otro hecho obvio es que, si existe una aplicación biyectiva {g\colon A\rightarrow B}, entonces {A} es finito si, y sólo si, {B} es finito. En efecto, si existe una aplicación biyectiva {f\colon I_n\rightarrow A}, entonces {f\circ g\colon I_n\rightarrow B} también es biyectiva.

Proposición 38. Un subconjunto de {\mathbb N} es finito si, y sólo si, está acotado superiormente.

Demostración. Para incluir al conjunto vacío, hay que entender que éste está trivialmente acotado. (De hecho, {0} es una cota superior.)

   Si {A\subset\mathbb N} es finito, existe una aplicación biyectiva {f\colon I_n\rightarrow A}. Vamos a probar que {A} está acotado por inducción sobre {n}. Si {n=0} entonces {A=\emptyset} y, como acabamos de decir, está trivialmente acotado.

   Supongamos que el teorema es cierto para {n} y pongamos que {f\colon I_{n+1}\rightarrow A} es biyectiva. Si {a:=f(n)}, entonces {f} se restringe a una aplicación biyectiva {f'\colon I_n\rightarrow A\setminus\{a\}}, luego {A\setminus\{a\}} está acotados superiormente. Sea {M\in\mathbb N} un cota superior de {A\setminus\{a\}}, es decir, {b\le M} para todo {b\in A} que no sea {b=a}. Así, si {a\le M}, entonces {M} es una cota superior de {A}. Si {M\le a}, entonces {a} es, de hecho, el máximo de {A}.

   Supongamos ahora que {A} está acotado superiormente. También podemos suponer que {A\ne\emptyset}. Vamos a probar que es finito por inducción sobre una cota superior.

   Si {A} tiene a {0} por cota superior, entonces {A=\{0\}=I_1}, luego es finito.

   Si es cierto para conjuntos acotados por {n}, supongamos que una cota superior de {A} es {n+1}. Si {n} es también una cota superior, entonces {A} es finito por hipótesis de inducción. En caso contrario es que {n+1\in A}. El conjunto {A\setminus\{n+1\}} tiene a {n} por cota superior, luego por hipótesis de inducción es finito. Sea {f\colon I_m\rightarrow A\setminus\{n+1\}} biyectiva para cierto {m\in\mathbb N}. Entonces,

\displaystyle  f\cup\{(m,n+1)\}\colon I_{m+1}\rightarrow A \text{ es biyectiva},

luego {A} es finito. \Box

   En particular, {\mathbb N} es infinito.

Proposición 39. Un conjunto {A} es finito si, y sólo si, existe una aplicación inyectiva {A\rightarrow I_n}, para cierto {n\in\mathbb N}.

Demostración. Si {A} es finito, existe una aplicación biyectiva {I_n\rightarrow A}, y su inversa es también biyectiva, en particular inyectiva.

   Si existe una aplicación {A\rightarrow I_n} inyectiva, podemos verla también como una aplicación biyectiva {A\rightarrow B}, donde {B\subset I_n}. Como {I_n} es finito, {B} también lo es, luego {A} también lo es. \Box

Ejercicio 6. Demostrar que si {A\rightarrow B} es inyectiva y {B} es finito, entonces {A} es finito.

Proposición 40. Todo subconjunto de un conjunto finito es finito.

Demostración. Sea {A} un conjunto finito y sea {B\subset A}. Existe una aplicación inyectiva {A\rightarrow I_n} que se restringe a otra aplicación inyectiva {B\rightarrow I_n}, luego {B} es finito. \Box

Ejercicio 7. Probar que un conjunto {A} es infinito si, y sólo si, existe una aplicación suprayectiva {I_n\rightarrow A}, para cierto {n\in\mathbb N}.

Proposición 41. Si {m,n\in\mathbb N} y existe una aplicación biyectiva {I_m\rightarrow I_n}, entonces {m=n}.

Demostración. Lo probamos por inducción sobre {n}. Si {n=0}, entonces {I_n=\emptyset}, por lo que {I_m} ha de ser también vacío, luego {m=0}.

   Supongamos que la proposición es cierta para {n} y supongamos que tenemos una aplicación biyectiva {f\colon I_m\rightarrow I_{n+1}}. Claramente, {m\ne 0}, luego {m=r+1} si {f(r)=n}, entonces {f} se restringe a una aplicación biyectiva {I_r\rightarrow I_n}, luego {r=n}, luego {m=n+1}.

   Si {f(r)\ne n}, consideramos los números {f(r)=u\ne n} y {v=f^{-1}(n)\ne r}. Es fácil ver que

\displaystyle  (f\setminus\{(r,u),(v,n)\})\cup\{(v,u)\}\colon I_r\rightarrow I_n \text{ es biyectiva},

luego nuevamente {r=n} y {m=n+1}. \Box

   Así pues, si {A} es un conjunto finito, existe un único {n\in\mathbb N} tal que existe una aplicación biyectiva {f\colon I_n\rightarrow A}, pues si {g\colon I_m\rightarrow A}, entonces se cumple que {g\circ f^{-1}\colon I_m\rightarrow I_n} es biyectiva, luego {m=n}.

Definición 42 (Cardinal). Si {A} es un conjunto finito, llamaremos cardinal de {A} al único {n\in\mathbb N} tal que existe una aplicación biyectiva {f\colon I_n\rightarrow A}. Escribiremos {|A|}.

   El cardinal de un conjunto finito es lo que habitualmente se lama su “número de elementos”. Claramente {|A|=0} si, y sólo si, {A=\emptyset}.

   Si {A\ne\emptyset} tiene {n} elementos, existe {x\colon I_n\rightarrow A} biyectiva. Si escribimos {x_i:=x(i-1)}, podemos representar {A} en la forma {A=\{x_1,\dotsc,x_n\}}.

Proposición 43. Si {A} y {B} son conjuntos finitos, entonces {A\cup B} es finito y

\displaystyle  |A\cup B|+|A\cap B|=|A|+|B|.

Demostración. Supongamos que {A\cap B=\emptyset}. Sean {m=|A|} y {n=|B|}, de modo que existen {f\colon A\rightarrow I_m} y {g\colon B\rightarrow I_n} biyectivas. Podemos definir una aplicación biyectiva {h\colon A\cup B\rightarrow I_{m+n}} mediante

\displaystyle  h(x) := \begin{cases} f(x) & \text{si } x\in A,\\ m+g(x) & \text{si } x\in B. \end{cases}

Por consiguiente, {|A\cup B|=m+n=|A|+|B|}.

   En el caso general, sea {B':=B\setminus(A\cap B)}. Como {B=B'\cup(A\cap B)} y ambos conjuntos son disjuntos, la parte ya probada nos da que {|B|=|B'|+|A\cap B|}.

   Por otra parte, {A\cup B=A\cup B'} y {A\cap B'=\emptyset}. De nuevo por la parte ya probada, {|A\cup B|=|A|+|B'|}. Sumando {|A\cap B|} a ambos miembros tenemos la fórmula del enunciado. \Box

Ejercicio 8. Probar que si {A} y {B} son conjuntos finitos, entonces {A\times B} también es finito, y {|A\times B|=|A|\,|B|}.

Proposición 44. Todo conjunto (totalmente) ordenado finito no vacío tiene un máximo y un mínimo elemento.

Demostración. Supongamos, por reducción al absurdo, que existe un conjunto ordenado no vacío sin máximo elemento. Sea {n} el mínimo cardinal posible para un conjunto con tales condiciones. Esto significa que cualquier conjunto ordenado con menos de {n} elementos tiene un máximo elemento.

   Sea, pues, {A} un conjunto de {n} elementos, no vacío y sin máximo. No puede ser {n=0}, así que {n=m+1}. Tampoco puede ser {n=1}, porque entonces {A=\{a\}} y obviamente, tiene máximo. Por lo tanto, {m\ne 0}. Si {a\in A}, entonces {A\setminus\{a\}} es un conjunto ordenado no vacío con {m} elementos, luego tiene un máximo {a'}. Si {a'\ge a}, entonces {a'} es el máximo de {A}. Si {a'<a}, entonces {a} es el máximo de {A}. Igualmente se razona con los mínimos. \Box

   Si {A} es un conjunto ordenado finito, todo subconjunto también lo es, luego, de hecho, todos los subconjuntos no vacíos de {A} tienen máximo y mínimo elemento. En particular, todo elementos que o sea el máximo tiene un inmediato posterior (el mínimo de los elementos mayores que él), y todo elemento que no esa el mínimo tiene un inmediato anterior.

— 3.4. Estructura algebraicas y de orden —

Definición 45 (Ley de composición interna). Una ley de composición interna en un conjunto {A} es una aplicación

\displaystyle  *\colon A\times A\rightarrow A.

   En lugar de escribir {*(a,b)}, escribiremos {a*b}. En resumen, una ley de composición interna en {A} es cualquier forma de operar dos elementos de {A} para obtener un nuevo elementos de {A}.

   Por ejemplo, aunque hemos definido la suma y el producto de números naturales como una familia de aplicaciones {(m+)} y {(m\cdot)}, para cada {m\in\mathbb N}, es más natural reunirlas en dos únicas leyes de composición interna

\displaystyle  +\colon\mathbb N\times\mathbb N\rightarrow \mathbb N

y

\displaystyle  \cdot\colon\mathbb N\times\mathbb N\rightarrow \mathbb N.

Por definición, {m+n:=(m+)(n)} y {m\cdot n=(m\cdot)(n)}.

Definición 46 (Anillo conmutativo y unitario). Un anillo conmutativo y unitario es una terna {(A,+,\cdot)}, donde {A} es un conjunto y {+:A\times A\rightarrow A} y {\cdot:A\times A\rightarrow A} son dos leyes de composición interna en {A} que cumplen las propiedades

  1. (Asociativa) {(a+b)+c=a+(b+c)} y {(ab)c=a(bc)}.
  2. (Conmutativa) {a+b=b+a} y {ab=ba}.
  3. (Distributiva) {a(b+c)=ab+ac}.
  4. (Elemento neutro) Existen {0,1\in A} tales que {a+0=1} y {a\cdot 1=a}.
  5. (Elemento simétrico) Para cada {a\in A} existe un elemento {-a\in A} tal que {a+(-a)=0}.

   En lo sucesivo, siempre que mencionemos acerca de anillos se entenderá que son anillos conmutativos y unitarios.

   Notemos que los elementos neutros {0} y {1} son únicos. Si {0} y {0'} fueran elementos neutros para la suma, entonces {0=0+0'=0'}; similarmente con el producto. También el elemento simétrico ha de ser único, ya que si existe otro {(-a)'} que {a+(-a)=0=a+(-a)'}, entonces {-a=-a+0=-a+a+(-a)'=0+(-a)'=(-a)'}. Escribiremos {a-b} en lugar de {a+(-b)}.

   Observemos que en cualquier anillo se cumple {a\cdot 0=0}, pues {a\cdot 0=a\cdot (0+0)=a\cdot 0+a\cdot 0}, y sumando {-(a\cdot 0)} a ambos miembros, llegamos a {0=a\cdot 0}.

Ejercicio 9. Demostrar que ene cualquier anillo se cumple {(-a)b=a(-b)=-(ab)}, {(-a)(-b)=ab} y {-(a+b)=-a-b}.

Definición 47 (Ideal y congruencia). Si {A} es un anillo, un ideal de {A} es un subconjunto {I\subset A} con las propiedades

  1. {0\in I}.
  2. Si {a,b\in I}, entonces {a+b\in I}.
  3. Si {a\in I} y {b\in A}, entonces {ab\in I}.

En tal caso, definimos en {A} la relación {a\equiv b\pmod I} dada por {a-b\in I}. Diremos que {a} y {b} son congruentes módulo el ideal {I}.

Proposición 48. Sea {A} un anillo e {I} un ideal de {A}. Entonces

  1. La congruencia en {A} módulo {I} es una relación de equivalencia.
  2. Si {a\equiv a'\pmod I} y {b\equiv b'\pmod I}, entonces {a+b\equiv a'+b'\pmod I} y {ab=a'b'\pmod I}.

Demostración.

  1. Se cumple {a\equiv a\pmod I} porque {a-a=0\in I}.

       Si {a\equiv b\pmod I}, entonces {a-b\in I}, luego {(-1)(a-b)=b-a\in I}, luego {b\equiv a\pmod I}.

       Si {a\equiv b\pmod I} y {b\equiv c\pmod I}, entonces {a-b\in I} y {b-c\in I}. La suma también está en {I}, y es {a-c\in I}, luego {a\equiv c\pmod I}.

  2. Sea {a=a'+i} y {b=b'+j}, con {i,j\in I}. Entonces {a+b=b+b'+i+j}, con {i+k\in I} y {ab=a'b'+a'j+ib'+ij}, donde los tres últimos productos están en {I}, luego su suma también. Por lo tanto, tenemos que {a+b\equiv a'+b'\pmod I} y {ab\equiv a'b'\pmod I}.

\Box

Definición 49 (Cociente respecto a un ideal). Si {A} es un anillo e {I} es un ideal de {A}, diremos que {A/I} es el conjunto cociente de {A} respecto a la relación de congruencia módulo {I}. Así, con el teorema anterior, probamos que podemos definir una suma y un producto en {A/I} mediante

\displaystyle  [a]+[b]=[a+b]

y

\displaystyle  [a][b]=[ab].

   El punto crucial es que estas definiciones no depende del elemento de la clase de equivalencia con el que hacemos las operaciones, es decir, que si {[a]=[a']} y {[b]=[b']}, llegamos a la misma clase de equivalencia si evaluamos {[a+b]} que si evaluamos {[a'+b']}, e igualmente con el producto.

Definición 50 (Anillo cociente). Las operaciones de la definición anterior convierten a {A/I} en un anillo, llamado anillo cociente de {A} sobre {I}.

Ejercicio 10. Demostrar mediante razonamientos inductivos, que {\mathbb N} cumple todas las propiedades de la definición de anillo excepto la existencia de elementos simétricos.

   Al añadir un elemento simétrico a cada número natural obtenemos el anillo de los números enteros:

Definición 51. Definimos en {\mathbb N\times\mathbb N} la relación dada por

\displaystyle  (m,n)\,R\,(m',n') \quad\text{si y s\'olo si}\quad m+n'=n+m'.

   Si pudiéramos “restar” dos números naturales cualesquiera, esta relación podría escribirse {m-n=m'-n'}. Vamos así que e significa de la relación {R} es que dos pares de números están relacionados si, y sólo si, “deberían” tener la misma resta.

Ejercicio 11. Demostrar que la relación {R} es de equivalencia.

   Llamaremos conjunto de los números enteros al conjunto cociente

\displaystyle  \mathbb Z := (\mathbb N\times\mathbb N)/R.

Ejercicio 12. Demostrar que si {(m,n)\,R\,(m',n')} y {(u,v)\,R\,(u',v')}, entonces

\displaystyle  (m+u,n+v)\,R\,(m'+u',n'+v')

y

\displaystyle  (mu+nv,mv+nu)\,R\,(m'u'+n'v',m'v'+n'u'),

así como que

\displaystyle  m+v\le n+u \quad\text{si y s\'olo si}\quad m'+v'\le n'+u'.

Definición 52 (Operaciones básicas y orden en los enteros). Este último ejercicio nos permite definir en {\mathbb Z} las operaciones

\displaystyle  [(m+n)]+[(u,v)] := [(m+u,n+v)]

y

\displaystyle  [(m+n)][(u,v)] := [(mu+nv,mv+nu)],

así como la relación

\displaystyle  [(m,n)]\le [(u,v)] \quad\text{si y s\'olo si}\quad m+v\le n+u.

   La interpretación es que si imaginamos que {[(m,n)]} representa a la “resta” {m-n} y {[(u,v)]}, {u-v}, entonces su suma debe ser {m-n+u-v=(m+u)-(n+v)} y su producto, {(m-n)(u-v)=mu+nv-mv-nu=(mu+nv)-(mv+nu)}, y estas dos restas se corresponden con las clases de pares que hemos definido como suma y producto de las clases dadas. Igualmente, {m-n\le u-v} debe ser equivalente a {m+v\le n+u}.

Ejercicio 13. Demostrar que {\mathbb Z} es uno anillo con las operaciones que acabamos de definir. Los elementos neutros son {0:=[(0,0)]} y {1:=[(1,0)]}. Los elementos simétricos son {-[(m,n)]:=[(n,m)]}.

Ejercicio 14. Demostrar que la relación {\le} que hemos definido en {\mathbb Z} es una relación de orden.

   Para cada {n\in\mathbb N}, definimos los enteros {+n:=[(n,0)]} y {-n:=[(0,n)]}. Si {[(m,n)]} es un entero arbitrario, vemos que, si {m\ge n}, entonces

\displaystyle  [(m,n)]=[(m-n,0)]=+(m-n),

mientras que si {m\le n}, entonces

\displaystyle  [(m,n)]=[(0,n-m)]=-(n-n).

   Además, {+0=[(0,0)]=-0} es el elemento neutro {0\in\mathbb Z}. Por consiguiente, si definimos {\mathbb Z^+:=\{+n : n\in\mathbb N, n\ne 0\}} y {\mathbb Z^-:=\{-n : n\in\mathbb N, n\ne 0\}}, se cumple

\displaystyle  \mathbb Z=\mathbb Z^-\cup\{0\}\cup\mathbb Z^+.

   Es sencillo verificar que la aplicación {i\colon\mathbb N\rightarrow\mathbb Z} dada por {i(n):=+n} es inyectiva y cumple

\displaystyle  i(m+n)=i(m)+i(n), \qquad i(mn)=i(m)i(n)

y

\displaystyle  m\le n \quad\text{si y s\'olo si}\quad i(m)\le i(n).

   Esto quiere decir que podemos identificar cada número natural {n} con el número entero {+n}, de manera que la suma, el producto y la relación de orden entre números naturales se evalúan igual si los consideramos como naturales o como enteros. Por ello, consideraremos que {\mathbb N\subset\mathbb Z}.

   Notar que, si {n\in\mathbb N}, entonces {-n} es el elemento simétrico de {n} en {\mathbb Z}, de modo que {\mathbb Z} consta únicamente de los números naturales y de sus simétricos (teniendo en cuenta que, en el caso de {0} —y sólo en este casi, se cumple {0=-0}).

Ejercicio 15. Demostrar que {\mathbb N=\{n\in\mathbb Z : n\ge 0\}}.

   El anillo {\mathbb Z} cumple una propiedad que no exige la definición de anillo.

Proposición 53 (Los enteros no tienen divisores de cero). Si {mn=0}, entonces {m=0} o {n=0}.

Demostración. En efecto, observemos que en primer lugar esto lo cumplen los números naturales, ya que si {m\ne 0} y {n\ne 0}, entonces {m=r+1}, luego {mn=rn+n}, luego {mn\ge n>0}.

   En general, si {mn=0}, también {-mn=m(-n)=0} y {(-m)(-n)=0}, y una de estas cuatro combinaciones corresponde a números naturales, luego ha de ser {\pm m=0} o {\pm n=0}, lo cual implica {m=0} o {n=0}. \Box

Definición 54 (Anillo ordenado). Un anillo ordenado es una cuádrupla {(A,+,\cdot,\le)} que cumple la definición de anillo y la definición de conjunto (totalmente) ordenado, y además la relación de orden verifica las propiedades de compatibilidad

  1. (Compatibilidad con la suma) Si {a\le b}, entonces {a+c\le b+c}.
  2. (Compatibilidad con el producto) Si {a\le b} y {c\ge 0}, entonces {ac\le bc}.

Proposición 55. {(\mathbb Z,+,\cdot,\le)} es un anillo ordenado.

Demostración. Para probar que {(\mathbb Z,+,\cdot,\le)} es un anillo ordenado, conviene observar que si {a:=[(m,n)]} y {b:=[(u,v)]}, entonces

\displaystyle  b-a=[(u,v)]+[(n,m)]=[(n+u,m+v)]

luego {b-a\ge 0} equivale a que {m+v\le n+u}, es decir, a que {a\le b}.

   Así pues, si {a\le b}, tenemos que {b-a=b+c-(a-c)\ge 0}, luego {a+c\le b+c}. Igualmente, si {a\le b} y {c\ge 0}, tenemos que {b-a\ge0} y {c\ge0}, es decir, que ambos son números naturales, y también lo será su producto {bc-ac\ge0}, lo que equivale a {ac\le bc}. \Box

   Veamos algunas propiedades de los anillos ordenados:

  1. Si {a\le b}, entonces {-b\le -a} (pues {0=a-a\le b-a} y {-b\le-b+b-a=-a}).
  2. Si {a\ge0}, entonces {-a\le0}. (Caso particular de a.)
  3. Si {b,c\ge0}, entonces {bc\ge0} (por la compatibilidad del producto).
  4. {aa\ge0} (porque {aa=(-a)(-a)} y a una de las dos expresiones se le puede aplicar b).
  5. {1\ge0} y {-1\le0} (porque {1=1\cdot1}).
  6. Si {a\le b} y {c\le 0 }, entonces {ac\ge bc} (porque {-ac\le -bc}).

Definición 56 (Unidad e inverso en un anillo). Un elemento {a} de una anillo {A} es una unidad si existe un {a^{-1}\in A} tal que {aa^{-1}=1}. El elemento {a^{-1}} se llama inverso de {a}, y es único, pues si existe otro {a'^{-1}}, entonces {a'^{-1}=a'^{-1}\cdot1=a'^{-1}aa^{-1}=1\cdot a^{-1}=a^{-1}}.

Definición 57 (Cuerpo). Un cuerpo es un anillo en el que todo elemento distinto de {0} es una unidad.

Ejercicio 16. Demostrar que las únicas unidades de {\mathbb Z} son {\pm 1}.

   Para dotar de inverso a cada número entero construimos el cuerpo de los números racionales por un procedimiento similar al que seguimos para construir {\mathbb Z} a partir de {\mathbb N}.

Definición 58. Sea {A:=\{(m,n)\in\mathbb Z\times\mathbb Z : n\ne0\}}. Definimos en {A} la relación

\displaystyle  (m,n)\,R\,(m',n') \quad\text{si y s\'olo si}\quad mn'=nm'.

   Es sencillo mostrar que se trata de una relación de equivalencia. La clase de equivalencia de un par {(m,n)} se representa por {m/n}; diremos que es una fracción de numerador {m} y denominador {n}. De este modo, tenemos que

\displaystyle  \frac{m}{n}=\frac{m'}{n'} \quad\text{si y s\'lo si}\quad mn'=nm'.

   El conjunto cociente {\mathbb Q:=A/R} se llama conjunto de los números racionales. Definimos en {\mathbb Q} las operaciones

\displaystyle  \frac{m}{n}+\frac{u}{v}:=\frac{mv+nu}{nv}

y

\displaystyle  \frac{m}{n}\frac{u}{v}:=\frac{mu}{nv}.

   Como el denominador de una fracción no puede ser {0}, aquí estamos usando el hecho que el producto de números enteros no nulos es no nulo.

Ejercicio 17. Comprobar que estas operaciones están bien-definidas, en el sentido de que, si tomamos dos representantes distintos de cada fracción, {m/n=m'/n'} y {u/v=u'/v'}, las fracciones que obtenemos al sumar y multiplicar son la misma.

Ejercicio 18. Comprobar que {(\mathbb Q,+,\cdot)} es un cuerpo. Los elementos neutros son {0/1} y {1/1}, los simétricos son {-(m/n):=(-m)/n}, y los inversos, {(m/n)^{-1}:=n/m}.

   Observemos que de la definición de las fracciones se sigue que

\displaystyle  \frac{am}{an}=\frac{m}{n}.

En particular, para {a=-1}, esto implica que podemos cambiar el signo al numerador y denominador de una fracción, por lo que

\displaystyle  \mathbb Q=\{m/n : m\in\mathbb Z, n\in\mathbb N, n\ne0\}.

En otras palabras, no perdemos generalidad su suponemos que el denominador de una fracción es positivo.

Definición 59 (Orden en los racionales). Definimos en {\mathbb Q} la relación {\le} dada por

\displaystyle  \frac{m}{n}\le\frac{u}{v} \quad\text{si y s\'olo si}\quad mv\le nu,

donde {n,v>0}.

Ejercicio 19. Demostrar que la relación que acabamos de definir es corresponde, en el sentido de que no depende del representante de cada fracción con la que se comprueba.

Ejercicio 20. Demostrar que, con esta relación, {(\mathbb Q,+,\cdot,\le)} es un cuerpo ordenado, es decir, un cuerpo que verifica las propiedades de anillo ordenado.

   Consideramos ahora la aplicación {i\colon\mathbb Z\rightarrow\mathbb Q} dada por {i(n):=n/1}. Se comprueba sin dificultad que es inyectiva, y además cumple

\displaystyle  i(m+n)=i(m)+i(n),\qquad i(mn)=i(m)i(n)

y

\displaystyle  m\le n \quad\text{si y s\'olo si}\quad i(m)\le i(n).

   Una vez más, esto significa que podemos identificar a cada número entero con su imagen en {\mathbb Q}, de modo que las propiedades de los números enteros son las misma cuando las consideramos como números enteros o como números racionales. Así pues, consideramos que {\mathbb N\subset\mathbb Z\subset\mathbb Q}.

   Observemos que

\displaystyle  \frac{m}{n}=\frac{m}{1}\frac{1}{n}=\frac{m}{1}\left({\frac{n}{1}}\right)^{-1}=i(m)i(n)^{-1}=mn^{-1},

donde en el último paso hemos usado la identificación que acabamos de establecer. Esto significa que, podemos “olvidarnos” de que las fracciones son clases de equivalencia de pares de números enteros y considerar que {m/n=mn^{-1}}, donde el producto y el inverso del miembro derecho son las operaciones de {\mathbb Q}. Más aun, si {K} es un cuerpo arbitrario, usaremos la notación {a/b:=ab^{-1}}, para todo {a,b\in K}, {b\ne0}. En particular, en el caso de {\mathbb Q} podemos considerar fracciones con numerador y denominador fraccionario:

\displaystyle  \frac{m/n}{u/v}=\frac{m}{n}\left({\frac{u}{v}}\right)^{-1}=\frac{m}{n}\frac{v}{u}=\frac{mv}{nu}.

— 3.5. Elementos de aritmética —

   Ahora veremos algunos resultados variados sobre la aritmética de los anillos y os cuerpos en general, y de los conjuntos numéricos en particular.

   Observamos que si {A} es un anillo y {a\in A}, podemos definir una aplicación {\mathbb N\rightarrow A} mediante el teorema de recursión, estableciendo que

\displaystyle  0a:=0 \qquad\text{y}\qquad (n+1)a:=na+a.

A su vez, podemos extenderla a una aplicación {\mathbb Z\rightarrow A} mediante

\displaystyle  (-n)a:=-(na), \qquad\text{para todo } n\in\mathbb N.

   Hemos definido una aplicación para cada {a\in A}, pero podemos unirlas todas en una única aplicación {\mathbb Z\times A\rightarrow A}.

Ejercicio 21. Demostrar que

\displaystyle  \begin{array}{lll} 0a=0, & & (-1)a=-a,\\ (m+n)a=ma+na, & & (mn)a=m(na). \end{array}

   Por ejemplo, {5a=(1+1+1+1+1)a=a+a+a+a+a}. Notemos que si {A=\mathbb Z}, el producto que acabamos de definir no es sino el producto usual en {\mathbb Z}.

   Similarmente, para cada {a\in A}, podemos definir una aplicación {\mathbb N\rightarrow A} mediante {a^0:=1} y {a^{n+1}:=a^n\cdot a}. Si {a} es una unidad de {A}, podemos extender esta aplicación a otra {\mathbb Z\rightarrow A} mediante {a^{-n}:=(a^{-1})^n}. Observemos que {a^{-1}} en este sentido resulta ser {a^{-1}} en el sentido del inverso de {a}.

Ejercicio 22. Demostrar que {a^{m+n}=a^ma^n} y {(a^m)^n=a^{mn}}, donde {m,n\in\mathbb N} si {a} no es una unidad, o {m,n\in\mathbb Z} si lo es. En este último caso, tenemos también que {a^{-n}=1/a^n} y {a^m/a^n=a^{m-n}}.

   Ahora, definimos la aplicación factorial {\mathbb N\rightarrow\mathbb N} mediante

\displaystyle  0!:=1 \qquad\text{y}\qquad (n+1)!:=n!(n+1).

   Si {0\le m\le n}, definimos el número combinatorio

\displaystyle  \binom{n}{m}:=\frac{n!}{m!(n-m)!}.

Proposición 60. Sean {m\le n} números naturales.

  1. \displaystyle  \binom{n}{m}=\binom{n}{n-m}.

  2. \displaystyle  \binom{n}{0}=\binom{n}{n}=1,\qquad\binom{n}{1}=n.

  3. Si {m<n},

    \displaystyle  \binom{n}{m}+\binom{n}{m+1}=\binom{n+1}{m+1}.

  4. Los números combinatorios son números naturales.

Demostración.

  1. Como ejercicio.
  2. Como ejercicio.
  3. Hay que probar que

    \displaystyle  \frac{n!}{m!(n-m)!}+\frac{n!}{(m+1)!(n-m-1)!}=\frac{(n+1)!}{(m+1)!(n-m)!}.

    Ahora bien,

    \displaystyle \left({\frac{n!}{m!(n-m)!}+\frac{n!}{(m+1)!(n-m-1)!}}\right)(m+1)!(n-m)!

    \displaystyle  =\frac{n!(m+1)m!(n-m)!}{m!(n-m)!}+\frac{n!(m+1)!(n-m)(n-m-1)!}{(m+1)!(n-m-1)!}

    \displaystyle  =n!(m+1)+n!(n-m)=mn!+n!+nn!-mn!=(n+1)n!=(n+1)!.

  4. Usando inducción obtenemos que {\binom{n}{m}} es un número natural, pues cada combinatorio con {n+1} es suma de dos con {n}, por el punto c.

\Box

   Ahora veamos el resultado principal sobre los números combinatorios.

Teorema 61 (Binomio de Newton). Sea {A} un anillo, {n\in\mathbb N} y {a,b\in A}. Entonces

\displaystyle  (a+b)^n=\sum_{m=0}^n\binom{n}{m}a^mb^{n-m}.

   Se puede objetar que no hemos definido el signo {\sum}. Las sumas finito en un anillo {A} se definen recurrentemente. Consideramos una aplicación {a\colon I_{n+1}\rightarrow A}. Convenimos representar {a_i:=a(i)}. Por comodidad, la extendemos a una aplicación {\mathbb N\rightarrow A} tomando {a_i:=0} para {i>n}. Entonces, definimos, en virtud del teorema de recursión:

\displaystyle  \sum_{i=0}^0a_i:=a_0

y

\displaystyle  \sum_{i=0}^{r+1}a_i:=\sum_{i=0}^ra_i+a_{r+1}.

   Es usual escribir

\displaystyle  \sum_{i=0}^na_i=a_0+\dotsb+a_n,

y entonces hemos de tener presente que los puntos suspensivos son sólo un signo que hemos elegido para representar la suma finita, tan legítimo como pueda serlo la letra {\Sigma}. Todas las propiedades de las sumas finitas se demuestran rutinariamente por inducción. Similarmente pueden definirse productos finitos en un anillo, usualmente representador por

\displaystyle  \prod_{i=0}^na_i=a_0\dotsm a_n.

   Por último, mencionaremos un hecho cotidiano sobre la aritmética de los números naturales sobre el que no hemos dicho nada hasta ahora, y es la posibilidad de expresarlos con la notación decimal.

   Si definimos

\displaystyle  2:=1+1,\quad 3:=2+1,\quad 4:=3+1,\quad 5:=4+1,

\displaystyle  6:=5+1,\quad 7:=6+1,\quad 8:=7+1,\quad 9:=8+1,\quad d:=9+1,

entonces se demuestra que todo número natural no nulo {N} se expresa de forma única como

\displaystyle  N=a_nd^n+a_{n-1}d^{n-1}+\dotsb+a_2d^2+a_1d+a_0,

donde {n\in\mathbb N}, {a_i\in\{0,\dotsc,9\}} y {a_n\ne0}. Esto nos permite adoptar el convenio de referirnos a {N} como {N=\overline{a_n\dotso a_0}}, donde esto no hay que entenderlos como un producto, sino como la mera yuxtaposición de las cifras {a_i}. Como el número {d} se expresa en la forma {d=1\cdot d+0}, tenemos que {d=10}, por lo que el desarrollo anterior puede escribirse como

\displaystyle  N=a_n(10)^n+a_{n-1}(10)^{n-1}+\dotsb+a_2(10)^2+a_110+a_0.

   La elección de {d} es arbitraria. Sirve cualquier número natural {d\ge2}.

— 4. Los números reales —

— 4.1. Los números naturales —

— 4.2. Cuerpos ordenados —

— 4.3. Convergencia de sucesiones —

— 4.4. La incompletitud de {\mathbb Q}

— 4.5. La construcción de {\mathbb R}

— 4.6. Consecuencias de la completitud de {\mathbb R}

Estaba escribiendo sobre los distintos infinitos que cohabitan en nuestro universo matemático, pero decidí hacer una antesala acerca de la Teoría de conjuntos para asegurar que se conoce lo necesario para poder comprender los artículos que vienen.

Mucho de las matemáticas modernas tienen que ver con números, conjuntos y geometría. A continuación presentaremos los aspectos más elementales de la teoría de conjuntos axiomática, dejando los tópicos más avanzados para una discusión posterior.

— 1. Fundamentos —

Empezaremos exponiendo algunos axiomas para los conjuntos. Por razones “pedagógicas”, usaremos una lista con algo de axiomas extras para la teoría de conjuntos, en el sentido que algunos de los axiomas pueden ser usados para deducir otros, pero no hay un riesgo real al hacer esto. Iniciemos, así, con una descripción informal de lo que un conjunto debe ser

Definición 1. (Informal) Definimos un conjunto {A} como cualquier colección no ordenada de objetos, e.g., {\{7,6,9,8\}} es un conjunto. Si {x} es un objeto, diremos que {x} es un elemento de {A}, o {x \in A}, si {x} se encuentra en la colección; de lo contrario, diremos que {x \notin A}. Por ejemplo, {3 \in \{1,2,3,4,5\}} pero {7 \notin \{1,2,3,4,5\}}.

Vemos que esta definición es lo suficientemente intuitiva, pero no responde un número de preguntas, como cuáles colecciones de objetos son considerados conjuntos, cuáles conjuntos son iguales a otros y cómo uno define operaciones sobre conjuntos (e.g., uniones, intersecciones, etc.). Además, aún carecemos de axiomas para poder hacer operaciones con conjuntos, o con sus elementos. Obtener y definir estos axiomas y operaciones será nuestro propósito en este apartado.

Aclaremos algo: consideraremos a los conjuntos en sí mismos como un tipo de objeto.

Axioma 1 (Los conjuntos son objetos). Si {A} es un conjunto, entonces {A} también es un objeto. En particular, dados dos conjuntos {A} y {B}, es válido preguntarse si {A} es también un elemento de {B}.

Ejemplo 1. (Informal) El conjunto {\{3,\{3,4\},4\}} es un conjunto de tres elementos distintos, uno de los cuales es de hecho un conjunto de dos elementos. Sin embargo, no todos lo objetos son conjuntos; por ejemplo, será usual que no consideremos el número {3} como un conjunto, aunque podríamos decir que un número natural puede ser la cardinalidad de un conjunto (algo que veremos luego, en el apartado ¿?).

Observación 1. Existe un caso especial de la teoría de conjuntos, llamada “Teoría de conjuntos pura”, en la cual todos los objetos son conjuntos; por ejemplo, el número {0} puede ser identificado con el conjunto vacío {\emptyset = \{\}}, el número {1} puede ser identificado con {\{0\} = \{\{\}\}}, el número {2} puede ser identificado con {\{0,1\} = \{\{\}, \{\{\}\}\}}, y así sucesivamente. Las dos tipos de teorías son más o menos equivalentes para el propósito de hacer matemáticas, por lo que tomaremos un posición agnóstica respecto a si todos los objetos son conjuntos o no.

De todos los objetos que se estudian en matemáticas, algunos serán conjuntos; además, si {x} es un objeto y {A} es un conjunto, entonces {x \in A} es cierto o es falso. (Si {A} no es un conjunto, dejaremos la expresión {x \in A} como no definido; por ejemplo, la expresión {6 \in 9} no será ni verdadera ni falsa, simplemente, no tendrá sentido, ya que {9} no es un conjunto.)

Ahora, definiremos la noción de igualdad: ¿Cuándo dos conjuntos se consideran iguales? No consideraremos de importancia el orden; así, {\{7,6,9,8\}} y {\{6,8,7,9\}} son el mismo conjunto. Por otro lado, los conjuntos {\{7,6,9,8\}} y {\{7,6,9,8,1\}} son distintos, ya que el último contiene un elemento que el primero no. Por una razón similar, {\{7,6,9,8\}} y {\{7,6,9\}} son conjuntos distintos. Formalicemos esto con la definición

Definición 2 (Igualdad de conjuntos). Dos conjuntos {A} y {B} serán iguales, {A = B}, si, y sólo si, cada elemento de {A} es un elemento de {B} y viceversa. Dicho de otra manera, {A = B} si, y sólo si, todo elemento {x} de {A} pertenece también a {B}, y todo elemento {y} de {B} pertenece también a {A}.

Así, por ejemplo, {\{1,2,3,4,5\}} y {\{3,4,2,1,5\}} son el mismo conjunto, ya que contiene exactamente los mismos elementos. Además, el conjunto {\{3,3,1,5,2,4,2\}} también es igual a {\{1,2,3,4,5\}}; la repetición de {3} y {2} es irrelevante ya que eso no cambio el hecho que {2} y {3} sean elemento del conjunto.

Uno puede verificar fácilmente que la noción de igualdad es reflexiva, simétrica y transitiva (Ejercicio 1).

Ahora, volvemos a la cuestión de cuáles objetos son conjuntos y cuáles no. Empezaremos con un único conjunto, el conjunto vacío, y construiremos más conjuntos a partir del conjunto vacío mediante la aplicación de varias aplicaciones. Empezaremos postulando la existencia del conjunto vacío.

Axioma 2 (El conjunto vacío). Existe un conjunto {\emptyset}, conocido como el conjunto vacío, el cual no contiene elementos, i.e., para cada objeto {x} tenemos {x \notin \emptyset}.

El conjunto vacío también se denota {\{\}}, Notar que sólo puede haber un único conjunto vacío; si hubieran dos conjuntos {\emptyset} y {\emptyset'}, ambos vacíos, entonces, por la Definición 2, cada uno debería ser igual al otro (¿por qué?).

Si un conjunto no es igual al conjunto vacío, diremos que es no vacío. La siguiente afirmación es simple, pero vale la pena mostrarlo:

Lema 3 (Elección única). Sea {A} un conjunto no vacío. Entonces existe un objeto {x} tal que {x \in A}.

Demostración. Lo demostraremos por contradicción. Supongamos que no existe ningún objeto {x} tal que {x \in A}. Entonces, para todo los objetos {x}, tenemos {x \notin A}. Además, por el Axioma 2 tenemos {x \notin \emptyset}. Así {x \in A \iff x \in \emptyset} (ambas afirmaciones son igualmente falsas), y así {A = \emptyset} por la Definición 2, una contradicción. \Box

Observación 2. El Lema anterior asegura que dado cualquier conjunto no vacío {A}, estaos permitidos a “elegir” un elemento {x} de {A}, el cual demuestra el hecho que no es vacío. Después (en el Lema ¿?) mostraremos que dado un número finito de conjuntos no vacíos, digamos {A_1, \dotso, A_n}, es posible elegir un elemento {x_1, \dotso, x_n} de cada conjunto {A_1, \dotso, A_n}; esto se conoce como la “elección finita”. Sin embargo, para efecto de elegir elementos de un número infinito de conjuntos, necesitamos un axioma adicional, el axioma de la elección, el cuál se discutirá en la Sección ¿?.

Si el Axioma 2 fuera el único axioma que tiene la teoría de conjuntos, entonces sería muy aburrido. Ahora presentaremos axiomas adicionales para dar enriquecer los tipos de conjuntos disponibles.

Axioma 3 (Conjuntos unitarios y conjuntos pares). Si {a} es un objeto, entonces existe un conjunto {\{a\}} cuyo único elemento e {a}, i.e., para cada objeto {y}, tenemos {y \in \{a\}} si, y sólo si, {y = a}; nos referiremos a {\{a\}} como el conjunto unitario cuyo elemento es {a}. Además, si {a} y {b} son objetos, entonces existe un conjunto {\{a,b\}} cuyos únicos elementos son {a} y {b}; i.e., para cada objeto {y}, tenemos que {y \in \{a,b\}} si, y sólo si, {y = a} o {y = b}; nos referiremos a este conjunto como el conjunto par formado por {a} y {b}.

Observación 3. Así como existe únicamente un conjunto vacío, existe un único conjunto unitario por cada objeto {a}, gracias a la Definición 2 (¿por qué?). Similarmente, dado cualquier par de objetos {a} y {b}, hay un solo conjunto par formado por {a} y {b}. Adicionalmente, la Definición 2 también asegura que {\{a,b\} = \{b,a\}} (¿por qué?) y {\{a,a\} = \{a\}} (¿por qué?). Así, el axioma del conjunto unitario es de hecho redundante, siendo una consecuencia del axioma del conjunto par. Recíprocamente, el axioma del conjunto par se sigue del axioma del conjunto unitario y del axioma de la unión por pares de abajo (ver Lema 4). Uno puede preguntarse por qué no ir más allá y crear axiomas de ternas, axiomas de cuaternas, etc.; sin embargo, veremos que no es necesario una vez introduzcamos el axioma de la unión por pares de abajo.

Ejemplo 2. Ya que {\emptyset} es un conjunto (y, por lo tanto, un objeto), de modo que el conjunto unitario {\{\emptyset\}}, i.e., el conjunto cuyo único elemento es {\emptyset}, es un conjunto (y no es el mismo conjunto que {\emptyset}, {\{\emptyset\} \ne \emptyset} (¿por qué?)). Similarmente, el conjunto unitario {\{\{\emptyset\}\}} y el conjunto par {\{\emptyset, \{\emptyset\}\}} también son conjuntos. Estos tres conjuntos no son iguales entre sí (Ejercicio 2).

Como se ve en los ejemplos anteriores, ahora podemos crear unos tanto conjuntos más; sin embargo, los conjuntos que podemos crear son algo pequeños todavía (cada conjunto que podemos construir consiste de no más de dos elementos, hasta el momento). El siguiente axioma nos permite construir algunos conjuntos más grandes que los anteriores.

Axioma 4 (Unión de pares). Dados dos conjuntos {A, B}, existe un conjunto {A \cup B}, llamado unión {A \cup B} de {A} y {B}, cuyos elementos consiste de todo los todos los elementos que pertenecen a {A} o {B}, o ambos. En otras palabras, para cualquier objeto {x},

\displaystyle  x \in A \cup B \iff (x \in A \text{ o } x \in B).

Ejemplo 3. El conjunto {\{1,2\} \cup \{2,3\}} se compone aquellos elementos que, o bien se encuentran en {\{1,2\}} o en {\{2,3\}}, o en ambos; en otras palabras, los elementos de este conjunto son simplemente {1}, {2}, y {3}. Debido a esto, denotamos a este conjunto como {\{1,2\} \cup \{2,3\} = \{1,2,3\}}

Observación 4. Si {A, B, A'} son conjuntos y {A} es igual a {A'}, entonces {A \cup B} es igual a {A' \cup B} (¿por qué? Uno necesita usar el Axioma 4 y la Definición 2). Similarmente, si el conjunto {B'} es igual a {B}, entonces {A \cup B} es igual a {A \cup B'}. Así la operación de unión obedece el axioma de sustitución, siendo así bien-definida para los conjuntos.

Ahora veremos algunas propiedades básicas de la unión.

Lema 4. Si {a} y {b} son objetos, entonces {\{a,b\} = \{a\} \cup \{b\}}. Si {A, B, C} son conjuntos, entonces la operación unión es conmutativa (i.e., {A \cup B = B \cup A}) y asociativa (i.e., {(A \cup B) \cup C = A \cup (B \cup C)}). Además, tenemos {A \cup A = A \cup \emptyset = \emptyset \cup A = A}.

Demostración. Sólo demostraremos la identidad de asociatividad {(A \cup B) \cup C = A \cup (B \cup C)}, dejando el resto para el Ejercicio 3. Por la Definición 2, necesitamos mostrar que todo elemento {x} de {(A \cup B) \cup C} es un elemento de {A \cup (B \cup C)} y viceversa. Supongamos primero que {x} es un elemento de {(A \cup B) \cup C}. Por el Axioma 4, esto quiere decir que al menos uno de {x \in A \cup B} o {x \in C} es cierto. Dividamos en dos casos. Si {x \in C}, entonces por el Axioma 4, una vez más, {x \in B \cup C}, de modo que, nuevamente por el Axioma 4, tenemos {x \in A \cup (B \cup C)}. Ahora supongamos que {x \in A \cup B}, entonces, de nuevo por el Axioma 4, {x \in A} o {x \in B}. Si {x \in A} entonces {x \in A \cup (B \cup C)} por el Axioma 4, mientras que si {x \in B} entonces, aplicando consecutivamente el Axioma 4, tenemos {X \in B \cup C} y, por lo tanto, {x \in A \cup (B \cup C)}. Así, en todos los casos vemos que cada elemento de {(A \cup B) \cup C} se encuentra en {A \cup (B \cup C)}. Un argumento similar muestra que cada elemento de {A \cup (B \cup C)} se encuentra en {(A \cup B) \cup C}, de modo que {(A \cup B) \cup C = A \cup (B \cup C)}, como se deseaba. \Box

Ejercicio 1. Mostrar que la definición de igualdad en (2) es reflexiva, simétrica y transitiva.

Ejercicio 2. Usando sólo la Definición 2, el Axioma 3 y el Axioma 4, demostrar que los conjuntos {\emptyset}, {\{\emptyset\}} y {\{\emptyset, \{\emptyset\}\}} son distintos (i.e., ningún par de ellos es igual uno al otro).

Ejercicio 3. Demostrar las afirmaciones restantes en Lema 4.


Continuará…