You are currently browsing the monthly archive for octubre 2014.

Este artículo es el primero de una serie acerca de los conceptos y herramientas que se manejan en el campo de estudio conocido como Machine Learning, que es un tópico de Inteligencia Artificial, Estadística y Teoría de la Probabilidad.

— 1. Regresión por el método de mínimos cuadrados —

Una de las maneras más sencillas de obtener una función a base de datos experimentales es el método de “mínimos cuadrados”. Supongamos que necesitamos determinar experimentalmente una dependencia de la magnitud {y} en función de {x}:

\displaystyle  y = \varphi(x).

Del experimento obtenemos como resultado {n} valores de la función {y} para los valores correspondientes del argumento {x}:

\displaystyle  \begin{array}{c|cccc} \mathbf x & x_1 & x_2 & \quad\dotso\quad & x_n \\\hline \mathbf y & y_1 & y_2 & \quad\dotso\quad & y_n \end{array}

La forma de la función {y = \varphi(x)} se determina teóricamente o usando la disposición en el plano de coordenadas de los puntos correspondientes a los valores experimentales. Dependiendo de la distribución de estos puntos elegiremos la forma de la función desconocida {y = \varphi(x)}. Por ejemplo, si vemos que los puntos experimentales no se separan mucho de una recta, entonces se puede buscar la función {y = \varphi(x)} en la forma de una función lineal {y = ax + b}; si los puntos experimentales tienden a “ir hacia arriba”, entonces es natural pensar que podemos buscar la función {y = \varphi(x)} en la forman {y = ax^b}; así sucesivamente, es decir, viendo la distribución de los puntos experimentales debemos elegir una función conocida (lineal, potencial, trigonométrica, exponencial, logarítmica, etc.) que nos parezca más la adecuada para buscar la función {y = \varphi(x)}. Elegida la forma de la función {y = \varphi(x, a, b, c, \dotsc)}, tenemos que buscar los parámetros {a,b, c, \dotsc} que la integran, de moto tal que la función describa de la mejor manera el proceso examinado.

El método que tratamos ahora es el de mínimos cuadrados que consiste en lo siguiente.

Examinemos una suma de los cuadrados de las diferencias de los valores {y_i}, obtenidas de experimento, y la función {\varphi(x,a,b,c,\dotsc)} en los puntos correspondientes:

\displaystyle   S(a,b,c,\dotsc) = \sum_{i=1}^n [y_i - \varphi(x,a,b,c,\dotsc)]^2. \ \ \ \ \ (1)

Elijamos los parámetros {a,b,c,\dotsc} de manera que esta suma tenga valor mínimo:

\displaystyle S(a,b,c,\dotsc) = \sum_{i=1}^n [y_i - \varphi(x,a,b,c,\dotsc)]^2 = \min.

Así, el problema se ha reducido a la búsqueda de los valores de los parámetros {a,b,c,\dotsc}, para los cuales la función {S(a,b,c,\dotsc)} tiene un mínimo. Esto es posible por la prueba de la primera derivada, estudiada en un curso de Cálculo diferencial; así, en virtud de lo anterior, tenemos que estos valores {a,b,c,\dotsc} satisfacen el sistema de ecuaciones

\displaystyle \frac{\partial S}{\partial a} = 0, \frac{\partial S}{\partial b} = 0, \frac{\partial S}{\partial c} = 0, \dotsc,

o, en la forma desarrollada

\displaystyle   \begin{aligned} \sum_{i=1}^n [y_i - \varphi(x,a,b,c,\dotsc)]\frac{\partial \varphi(x,a,b,c,\dotsc)}{\partial a} = 0, \\ \sum_{i=1}^n [y_i - \varphi(x,a,b,c,\dotsc)]\frac{\partial \varphi(x,a,b,c,\dotsc)}{\partial b} = 0, \\ \sum_{i=1}^n [y_i - \varphi(x,a,b,c,\dotsc)]\frac{\partial \varphi(x,a,b,c,\dotsc)}{\partial c} = 0, \\ \vdots \quad\; \end{aligned} \ \ \ \ \ (2)

Notar que el número ecuaciones es igual al número de incógnitas. En cada caso concreto se investiga la cuestión sobre la existencia de la solución del sistema de ecuaciones (2) y del mínimo de la función {S(a,b,c,\dotsc)}.

Veamos algunos casos de la determinación de la función {y = \varphi(x,a,b,c,\dotsc)}.

I. Sea {y = ax + b}. Entonces, la función {S(a,b)}, en la expresión (1), tiene la forma

\displaystyle S(a,b) = \sum_{i=1}^n [y_i - (ax_i + b)]^2.

Esta es una función con dos variables, {a} y {b} ({x_i} e {y_i} son parte de los datos experimentales). Por consiguiente,

\displaystyle  \begin{aligned} \frac{\partial S}{\partial a} & = -2 \sum_{i=1}^n [y_i - (ax_i + b)]x_i = 0,\\ \frac{\partial S}{\partial b} & = -2 \sum_{i=1}^n [y_i - (ax_i + b)] = 0, \end{aligned}

es decir, el sistema de ecuaciones (2) en este caso, toma la forma

\displaystyle  \begin{aligned} &\sum_{i=1}^n y_i x_i - a \sum_{i=1}^n x_i^2 - b \sum_{i=1}^n x_i = 0,\\ &\sum_{i=1}^n y_i - a \sum_{i=1}^n x_i - bn = 0. \end{aligned}

Hemos obtenido el sistema de dos ecuaciones lineales con dos incógnitas {a} y {b}. Es fácil ver que el sistema tiene una solución determinada y la función {S(a,b)} tiene un mínimos para los valores hallados {a} y {b}. Esto se verifica fácilmente también a base de las condiciones suficientes para la existencia del mínimo. Recordemos. Sea {(x_0,y_0)} es un punto crítico de la función {f(x,y)}, es decir,

\displaystyle  \frac{\partial f(x_0,y_0)}{\partial x} = 0, \qquad \frac{\partial f(x_0,y_0)}{\partial y} = 0.

Entonces, para {x = x_0} e {y = y_0} se cumple que {f(x,y)} tiene mínimo, si

\displaystyle  \frac{\partial^2 f(x_0,y_0)}{\partial x^2} \times \frac{\partial^2 f(x_0,y_0)}{\partial y^2} - \left(\frac{\partial^2 f(x_0,y_0)}{\partial x\,\partial y}\right)^2 > 0 \;\;\text{y}\;\; \frac{\partial^2 f(x_0,y_0)}{\partial x^2} > 0.

En efecto, tenemos

\displaystyle \frac{\partial^2 S}{\partial a^2} = \sum_{i=1}^n x^2_i; \quad \frac{\partial^2 S}{\partial a\,\partial b} = \sum_{i=1}^n x_i; \quad \frac{\partial^2 S}{\partial b^2} = n.

Así,

\displaystyle  \begin{aligned} &\frac{\partial^2 S}{\partial a^2}\frac{\partial^2 S}{\partial b^2}-\left(\frac{\partial^2 S}{\partial a\,\partial b}\right)^2 = n \sum_{i=1}^n x_i^2 - \left(\sum_{i=1}^n x_i\right)^2 = \sum_{i\ne j} (x_i - x_j)^2 > 0,\\ &\frac{\partial^2 S}{\partial a^2} > 0. \end{aligned}

II. Sea la función de aproximación un trinomio de segundo grado {y = ax^2 + bx + c}. En este caso la expresión (1) tiene la forma

\displaystyle  S(a,b,c) = \sum_{i=1}^n [y_i - (ax_i^2 + bx_i + c)]^2.

El sistema de ecuaciones (2) toma la forma

\displaystyle  \begin{aligned} &\sum_{i=1}^n [y_i - (ax_i^2 + bx_i + c)]x_i^2 = 0, \\ &\sum_{i=1}^n [y_i - (ax_i^2 + bx_i + c)]x_i = 0, \\ &\sum_{i=1}^n [y_i - (ax_i^2 + bx_i + c)] = 0, \end{aligned}

o, en la forma desarrollada

\displaystyle  \begin{aligned} &\sum_{i=1}^n y_i x_i^2 - a \sum_{i=1}^n x_i^4 - b \sum_{i=1}^n x_i^3 - c \sum_{i=1}^n x_i^2 = 0, \\ &\sum_{i=1}^n y_i x_i - a \sum_{i=1}^n x_i^3 - b \sum_{i=1}^n x_i^2 - c \sum_{i=1}^n x_i = 0, \\ &\sum_{i=1}^n y_i - a \sum_{i=1}^n x_i^2 - b \sum_{i=1}^n x_i - cn = 0. \end{aligned}

Obtenemos un sistema de ecuaciones lineales para determinar las incógnitas {a,b,c}. De las condiciones del problema se deduce que el sistema tiene una solución determinada y, además, la función {S(a,b,c)} tiene un mínimo para los valores obtenidos de {a,b,c}.

Continuará…

Anuncios

Estaba escribiendo sobre los distintos infinitos que cohabitan en nuestro universo matemático, pero decidí hacer una antesala acerca de la Teoría de conjuntos para asegurar que se conoce lo necesario para poder comprender los artículos que vienen.

Mucho de las matemáticas modernas tienen que ver con números, conjuntos y geometría. A continuación presentaremos los aspectos más elementales de la teoría de conjuntos axiomática, dejando los tópicos más avanzados para una discusión posterior.

— 1. Fundamentos —

Empezaremos exponiendo algunos axiomas para los conjuntos. Por razones “pedagógicas”, usaremos una lista con algo de axiomas extras para la teoría de conjuntos, en el sentido que algunos de los axiomas pueden ser usados para deducir otros, pero no hay un riesgo real al hacer esto. Iniciemos, así, con una descripción informal de lo que un conjunto debe ser

Definición 1. (Informal) Definimos un conjunto {A} como cualquier colección no ordenada de objetos, e.g., {\{7,6,9,8\}} es un conjunto. Si {x} es un objeto, diremos que {x} es un elemento de {A}, o {x \in A}, si {x} se encuentra en la colección; de lo contrario, diremos que {x \notin A}. Por ejemplo, {3 \in \{1,2,3,4,5\}} pero {7 \notin \{1,2,3,4,5\}}.

Vemos que esta definición es lo suficientemente intuitiva, pero no responde un número de preguntas, como cuáles colecciones de objetos son considerados conjuntos, cuáles conjuntos son iguales a otros y cómo uno define operaciones sobre conjuntos (e.g., uniones, intersecciones, etc.). Además, aún carecemos de axiomas para poder hacer operaciones con conjuntos, o con sus elementos. Obtener y definir estos axiomas y operaciones será nuestro propósito en este apartado.

Aclaremos algo: consideraremos a los conjuntos en sí mismos como un tipo de objeto.

Axioma 1 (Los conjuntos son objetos). Si {A} es un conjunto, entonces {A} también es un objeto. En particular, dados dos conjuntos {A} y {B}, es válido preguntarse si {A} es también un elemento de {B}.

Ejemplo 1. (Informal) El conjunto {\{3,\{3,4\},4\}} es un conjunto de tres elementos distintos, uno de los cuales es de hecho un conjunto de dos elementos. Sin embargo, no todos lo objetos son conjuntos; por ejemplo, será usual que no consideremos el número {3} como un conjunto, aunque podríamos decir que un número natural puede ser la cardinalidad de un conjunto (algo que veremos luego, en el apartado ¿?).

Observación 1. Existe un caso especial de la teoría de conjuntos, llamada “Teoría de conjuntos pura”, en la cual todos los objetos son conjuntos; por ejemplo, el número {0} puede ser identificado con el conjunto vacío {\emptyset = \{\}}, el número {1} puede ser identificado con {\{0\} = \{\{\}\}}, el número {2} puede ser identificado con {\{0,1\} = \{\{\}, \{\{\}\}\}}, y así sucesivamente. Las dos tipos de teorías son más o menos equivalentes para el propósito de hacer matemáticas, por lo que tomaremos un posición agnóstica respecto a si todos los objetos son conjuntos o no.

De todos los objetos que se estudian en matemáticas, algunos serán conjuntos; además, si {x} es un objeto y {A} es un conjunto, entonces {x \in A} es cierto o es falso. (Si {A} no es un conjunto, dejaremos la expresión {x \in A} como no definido; por ejemplo, la expresión {6 \in 9} no será ni verdadera ni falsa, simplemente, no tendrá sentido, ya que {9} no es un conjunto.)

Ahora, definiremos la noción de igualdad: ¿Cuándo dos conjuntos se consideran iguales? No consideraremos de importancia el orden; así, {\{7,6,9,8\}} y {\{6,8,7,9\}} son el mismo conjunto. Por otro lado, los conjuntos {\{7,6,9,8\}} y {\{7,6,9,8,1\}} son distintos, ya que el último contiene un elemento que el primero no. Por una razón similar, {\{7,6,9,8\}} y {\{7,6,9\}} son conjuntos distintos. Formalicemos esto con la definición

Definición 2 (Igualdad de conjuntos). Dos conjuntos {A} y {B} serán iguales, {A = B}, si, y sólo si, cada elemento de {A} es un elemento de {B} y viceversa. Dicho de otra manera, {A = B} si, y sólo si, todo elemento {x} de {A} pertenece también a {B}, y todo elemento {y} de {B} pertenece también a {A}.

Así, por ejemplo, {\{1,2,3,4,5\}} y {\{3,4,2,1,5\}} son el mismo conjunto, ya que contiene exactamente los mismos elementos. Además, el conjunto {\{3,3,1,5,2,4,2\}} también es igual a {\{1,2,3,4,5\}}; la repetición de {3} y {2} es irrelevante ya que eso no cambio el hecho que {2} y {3} sean elemento del conjunto.

Uno puede verificar fácilmente que la noción de igualdad es reflexiva, simétrica y transitiva (Ejercicio 1).

Ahora, volvemos a la cuestión de cuáles objetos son conjuntos y cuáles no. Empezaremos con un único conjunto, el conjunto vacío, y construiremos más conjuntos a partir del conjunto vacío mediante la aplicación de varias aplicaciones. Empezaremos postulando la existencia del conjunto vacío.

Axioma 2 (El conjunto vacío). Existe un conjunto {\emptyset}, conocido como el conjunto vacío, el cual no contiene elementos, i.e., para cada objeto {x} tenemos {x \notin \emptyset}.

El conjunto vacío también se denota {\{\}}, Notar que sólo puede haber un único conjunto vacío; si hubieran dos conjuntos {\emptyset} y {\emptyset'}, ambos vacíos, entonces, por la Definición 2, cada uno debería ser igual al otro (¿por qué?).

Si un conjunto no es igual al conjunto vacío, diremos que es no vacío. La siguiente afirmación es simple, pero vale la pena mostrarlo:

Lema 3 (Elección única). Sea {A} un conjunto no vacío. Entonces existe un objeto {x} tal que {x \in A}.

Demostración. Lo demostraremos por contradicción. Supongamos que no existe ningún objeto {x} tal que {x \in A}. Entonces, para todo los objetos {x}, tenemos {x \notin A}. Además, por el Axioma 2 tenemos {x \notin \emptyset}. Así {x \in A \iff x \in \emptyset} (ambas afirmaciones son igualmente falsas), y así {A = \emptyset} por la Definición 2, una contradicción. \Box

Observación 2. El Lema anterior asegura que dado cualquier conjunto no vacío {A}, estaos permitidos a “elegir” un elemento {x} de {A}, el cual demuestra el hecho que no es vacío. Después (en el Lema ¿?) mostraremos que dado un número finito de conjuntos no vacíos, digamos {A_1, \dotso, A_n}, es posible elegir un elemento {x_1, \dotso, x_n} de cada conjunto {A_1, \dotso, A_n}; esto se conoce como la “elección finita”. Sin embargo, para efecto de elegir elementos de un número infinito de conjuntos, necesitamos un axioma adicional, el axioma de la elección, el cuál se discutirá en la Sección ¿?.

Si el Axioma 2 fuera el único axioma que tiene la teoría de conjuntos, entonces sería muy aburrido. Ahora presentaremos axiomas adicionales para dar enriquecer los tipos de conjuntos disponibles.

Axioma 3 (Conjuntos unitarios y conjuntos pares). Si {a} es un objeto, entonces existe un conjunto {\{a\}} cuyo único elemento e {a}, i.e., para cada objeto {y}, tenemos {y \in \{a\}} si, y sólo si, {y = a}; nos referiremos a {\{a\}} como el conjunto unitario cuyo elemento es {a}. Además, si {a} y {b} son objetos, entonces existe un conjunto {\{a,b\}} cuyos únicos elementos son {a} y {b}; i.e., para cada objeto {y}, tenemos que {y \in \{a,b\}} si, y sólo si, {y = a} o {y = b}; nos referiremos a este conjunto como el conjunto par formado por {a} y {b}.

Observación 3. Así como existe únicamente un conjunto vacío, existe un único conjunto unitario por cada objeto {a}, gracias a la Definición 2 (¿por qué?). Similarmente, dado cualquier par de objetos {a} y {b}, hay un solo conjunto par formado por {a} y {b}. Adicionalmente, la Definición 2 también asegura que {\{a,b\} = \{b,a\}} (¿por qué?) y {\{a,a\} = \{a\}} (¿por qué?). Así, el axioma del conjunto unitario es de hecho redundante, siendo una consecuencia del axioma del conjunto par. Recíprocamente, el axioma del conjunto par se sigue del axioma del conjunto unitario y del axioma de la unión por pares de abajo (ver Lema 4). Uno puede preguntarse por qué no ir más allá y crear axiomas de ternas, axiomas de cuaternas, etc.; sin embargo, veremos que no es necesario una vez introduzcamos el axioma de la unión por pares de abajo.

Ejemplo 2. Ya que {\emptyset} es un conjunto (y, por lo tanto, un objeto), de modo que el conjunto unitario {\{\emptyset\}}, i.e., el conjunto cuyo único elemento es {\emptyset}, es un conjunto (y no es el mismo conjunto que {\emptyset}, {\{\emptyset\} \ne \emptyset} (¿por qué?)). Similarmente, el conjunto unitario {\{\{\emptyset\}\}} y el conjunto par {\{\emptyset, \{\emptyset\}\}} también son conjuntos. Estos tres conjuntos no son iguales entre sí (Ejercicio 2).

Como se ve en los ejemplos anteriores, ahora podemos crear unos tanto conjuntos más; sin embargo, los conjuntos que podemos crear son algo pequeños todavía (cada conjunto que podemos construir consiste de no más de dos elementos, hasta el momento). El siguiente axioma nos permite construir algunos conjuntos más grandes que los anteriores.

Axioma 4 (Unión de pares). Dados dos conjuntos {A, B}, existe un conjunto {A \cup B}, llamado unión {A \cup B} de {A} y {B}, cuyos elementos consiste de todo los todos los elementos que pertenecen a {A} o {B}, o ambos. En otras palabras, para cualquier objeto {x},

\displaystyle  x \in A \cup B \iff (x \in A \text{ o } x \in B).

Ejemplo 3. El conjunto {\{1,2\} \cup \{2,3\}} se compone aquellos elementos que, o bien se encuentran en {\{1,2\}} o en {\{2,3\}}, o en ambos; en otras palabras, los elementos de este conjunto son simplemente {1}, {2}, y {3}. Debido a esto, denotamos a este conjunto como {\{1,2\} \cup \{2,3\} = \{1,2,3\}}

Observación 4. Si {A, B, A'} son conjuntos y {A} es igual a {A'}, entonces {A \cup B} es igual a {A' \cup B} (¿por qué? Uno necesita usar el Axioma 4 y la Definición 2). Similarmente, si el conjunto {B'} es igual a {B}, entonces {A \cup B} es igual a {A \cup B'}. Así la operación de unión obedece el axioma de sustitución, siendo así bien-definida para los conjuntos.

Ahora veremos algunas propiedades básicas de la unión.

Lema 4. Si {a} y {b} son objetos, entonces {\{a,b\} = \{a\} \cup \{b\}}. Si {A, B, C} son conjuntos, entonces la operación unión es conmutativa (i.e., {A \cup B = B \cup A}) y asociativa (i.e., {(A \cup B) \cup C = A \cup (B \cup C)}). Además, tenemos {A \cup A = A \cup \emptyset = \emptyset \cup A = A}.

Demostración. Sólo demostraremos la identidad de asociatividad {(A \cup B) \cup C = A \cup (B \cup C)}, dejando el resto para el Ejercicio 3. Por la Definición 2, necesitamos mostrar que todo elemento {x} de {(A \cup B) \cup C} es un elemento de {A \cup (B \cup C)} y viceversa. Supongamos primero que {x} es un elemento de {(A \cup B) \cup C}. Por el Axioma 4, esto quiere decir que al menos uno de {x \in A \cup B} o {x \in C} es cierto. Dividamos en dos casos. Si {x \in C}, entonces por el Axioma 4, una vez más, {x \in B \cup C}, de modo que, nuevamente por el Axioma 4, tenemos {x \in A \cup (B \cup C)}. Ahora supongamos que {x \in A \cup B}, entonces, de nuevo por el Axioma 4, {x \in A} o {x \in B}. Si {x \in A} entonces {x \in A \cup (B \cup C)} por el Axioma 4, mientras que si {x \in B} entonces, aplicando consecutivamente el Axioma 4, tenemos {X \in B \cup C} y, por lo tanto, {x \in A \cup (B \cup C)}. Así, en todos los casos vemos que cada elemento de {(A \cup B) \cup C} se encuentra en {A \cup (B \cup C)}. Un argumento similar muestra que cada elemento de {A \cup (B \cup C)} se encuentra en {(A \cup B) \cup C}, de modo que {(A \cup B) \cup C = A \cup (B \cup C)}, como se deseaba. \Box

Ejercicio 1. Mostrar que la definición de igualdad en (2) es reflexiva, simétrica y transitiva.

Ejercicio 2. Usando sólo la Definición 2, el Axioma 3 y el Axioma 4, demostrar que los conjuntos {\emptyset}, {\{\emptyset\}} y {\{\emptyset, \{\emptyset\}\}} son distintos (i.e., ningún par de ellos es igual uno al otro).

Ejercicio 3. Demostrar las afirmaciones restantes en Lema 4.


Continuará…

Hacer matemáticas es muy similar a hacer música: es ciencia y arte. En la música existen las escalas, patrones, “riffs”, círculos armónicos, que son las herramientas para componer. Pero también está la creatividad, lo que hace que aun cuando todos los que quieren hacer música usan esas herramientas, no se conviertan en verdaderos maestros. Análogamente, la labor del matemático es similar a la de quien explora nuevos caminos. Su objetivo es hallar nuevos entes, estructuras, para su estudio detallado mediante las herramientas existen o las que él podría desarrollar. También, hay quienes piensan que los entes matemáticos se descubren y que las herramientas matemáticas se inventan. Desde mi punto de vista —algo filosófico, cuando se maneja de manera abstracta, no existe diferencia sustancial entre entes y herramientas.

¿Se inventaron o se descubrieron los números naturales? ¿Y los enteros, racionales y reales? ¿Y el número {\pi}, {e}, {\phi}, etc.? Tal vez, la imposibilidad de reclamar alguna especie de derecho de autor de dichas herramientas en las matemáticas es lo que hace la diferencia entre que sean inventadas o descubiertas. Bajo esta óptica, mi postura es propia de quien practica las matemáticas y que no considera posible patentar sus propios descubrimientos. Pero cada lector tendrá su propia opinión, diferentes versiones o con sutilezas sobre las cuales debatir. Para esclarecer la postura que mantengo usaré una función que captó mi curiosidad desde antes que me iniciara en matemáticas, la función zeta de Riemann. Para quien quiera leer una disertación realmente prolija, puede consultar al artículo de Guilherme França y André LeClair, A theory for the zeros of Riemann {\zeta} and other L-functions.

Una serie es la generalización de la noción de suma a los términos de una sucesión infinita. Informalmente, al sumar los términos {a_1 + a_2 +a_3 + a_4 + a_5 + a_6 + a_7 + \dotsb} se obtiene el valor de la serie {\sum_{1\le n} a_n}. Un ejemplo “clásico” de series infinitas es el que aparece en el llamado problema de Basilea, ¿cuál es el valor de la siguiente serie infinita?

\displaystyle \zeta(2)=\sum_{n=1}^{\infty}\frac{1}{n^2}=\frac{1}{1^2} +\frac{1}{2^2}+\frac{1}{3^2}+\cdots,

¿Se inventó esta serie? ¿Se descubrió? Euler logró demostrarlo en 1741. El resultado que le dio fama fue

\displaystyle \zeta(2)=\sum_{n=1}^{\infty}\frac{1}{n^2}=\frac{\pi^2}{6}.

Pero, ¿por qué aparece el número {\pi} en esta serie? Es más, se podía calcular

\displaystyle \zeta(4)=\sum_{n=1}^{\infty}\frac{1}{n^4}=\frac{\pi^4}{90}

y en general el valor de cualquiera de las series {\zeta(2n)}, en función de los llamados números de Bernoulli. ¿Este método fue inventado o descubierto por Euler? ¿Hubiera sido un sinsentido tratar de patentar esta inveción?

Sin embargo, para las potencias impares de esta serie, i.e., {\zeta(2n+1)}, el método deja de funcionar. ¿Tiene sentido patentar un método para calcular estos valores de la función zeta? ¿Será inventado o descubierto? Mi punto es que, dadas ciertas estructuras matemáticas, lo que se descubre es el método para explorar sus propiedades. No obstante, el proceso puede ser tan tortuoso que podría quererse patentar la herramienta inventada en el proceso. Por ejemplo, está el caso de Grigori Perelman, quien trabajó durante ocho años para resolver la conjetura de Poincaré —aunque al final Perelman optó por una decisión sencilla sino romántica.

Posteriormente, en 1737, se descubrió el producto de Euler, que es un hecho loable

\displaystyle \zeta(z)=\sum_{n=1}^{\infty}\frac{1}{n^z}=\prod_{i=1}^{\infty}\left(1-\frac{1}{p_i^z}\right)^{-1},

donde {p_i} es el {i}-ésimo número primo ({p_1=2}, {p_2=3}, {p_3=5}, etc.). Se puede mostrar que si la variable {z} es un número complejo {z=\Re(z)+i \times \Im(z)}, con {\mbox{i}^2=-1}, las series convergen cuando {\Re(z) > 1}; además, divergen para {z=1}. Ahora, tenemos una serie infinita que describe una función {\zeta(z)} de variable compleja para {\Re(z) > 1}. Uno se preguntará si es posible extender de forma única la función {\zeta(z)} a valores con {\Re(z) < 1}. ¿Piensas que se esta extensión se descubre o que el método para obtenerla es inventada? Ya te digo, bajo lo expuesto, prefiero pensar que la extensión se descubre y el método se inventa.

La función {\eta(z)} de Dirichlet corresponde a la versión alternada de la serie, i.e.,

\displaystyle  \eta(z)=\sum_{n=1}^{\infty}\frac{(-1)^{n-1}}{n^z},

la cual converge cuando {\Re(z) > 0} y así

\displaystyle  \zeta(z)=\frac{1}{1-2^{1-z}}\,\eta(z),

y así, obtenemos una expresión que define la función {\zeta(z)} para {\Re(z) > 0}. Por lo que, nuevamente, es válido preguntar si es posible extender esta función a todo el plano complejo. Riemann probó que existe la continuación analítica única de la función {\zeta(z)} a todo el plano complejo, excepto en el polo {z = 1}. Además, descubrió —no diría inventó— que está dada por

\displaystyle  \zeta(z)=\Gamma(1-z)\,{\cal J}(z),

donde

\displaystyle  \Gamma(z)=\int_{0}^{\infty}u^{z-1}e^{-u}\,du

y

\displaystyle {\cal{J}}(z)=\frac{1}{2\pi i}\int_{\cal{C}}\frac{u^{z}}{e^{-u} - 1}\frac{du}{u},

ambas bien definidas en todo el plano complejo, para un contorno {\cal C} adecuado.

Explorar las propiedades de la función {\zeta(z)} ha sido un viaje por terra incognita emprendido por Riemann y que todavía muchos matemáticos siguen disfrutando y sufriendo. Adicionalmente, Riemann demostró la ecuación funcional

\displaystyle  \chi(z) = \chi(1-z),\qquad\chi(z) \equiv \pi^{-z/2}\,\Gamma(z/2)\zeta(z),

válida en todo el plano complejo, excepto en el polo simple {z=1}. Esta ecuación funcional es compañera de viaje de todo estudioso del universo de la función zeta de Riemann. Notar que la función gamma {\Gamma} guía hacia una generalización del factorial {n! = \Gamma(n+1)} de los números naturales hacia los números reales no negativos y complejos distintos de los enteros no positivos. Por otro lado, se puede demostrar que {\zeta(-2n) = 0} son los ceros triviales, sólo basta con sustituir {z \rightarrow 1+2n} para {n=1,2,\dotsc} en la ecuación funcional. Además, la función {\zeta(z)} no tiene ceros para {\Re(z) > 1}, luego los ceros triviales son los únicos para {\Re(z)<0}.

Obviamente, uno puede pensar en buscar cuántos ceros no triviales hay en {0 \le \Re(z) \le 1}, lo que se llama la banda crítica. Todos estos ceros son simétricos respecto a la línea crítica {\Re(z) = 1/2}. Más aún, si {\rho} es un cero complejo, también lo son {\bar\rho, 1-\rho} y {1-\bar\rho}. La excepción son los ceros en la línea crítica {\Re(z) = 1/2}, para los que {\rho} y {1-\bar\rho} coinciden. ¿Cuántos ceros hay en la línea crítica? Hardy demostró que hay infinitos. ¿Cuántos ceros hay en la banda crítica que no estén en la línea critíca? La hipótesis de Riemann afirma que ninguno. Nadie lo ha demostrado. Un millón de dólares espera a quien lo logre…

¿Las propiedades de la función zeta de Riemann se han sido inventadas o descubiertas? ¿Se inventarán los métodos necesarios para mostrar que la hipótesis de Riemann es cierta o se descubrirán? Habrá quien sienta que son parte de un descubrimiento, pero que le gustaría que fueran inventos, para así poder patentarlas.

Y tú ¿qué opinas?