Mostrando las entradas con la etiqueta Georg Cantor. Mostrar todas las entradas
Mostrando las entradas con la etiqueta Georg Cantor. Mostrar todas las entradas

8.2.16

Cómo visualizar la Hipótesis del Continuo

Una visualización de la Hipótesis del Continuo
(Basado fuertemente en una idea del filósofo Chris Freiling)

Tomemos un cuadrado... que en realidad puede ser cualquiera, pero, para facilitar la explicación, supondremos que es el cuadrado cuyos vértices son los puntos (0,0), (0,1), (1,0) y (1,1). A su vez, sobre cada punto (t, 0),con t entre 0 y 1, dibujaremos un segmento vertical de longitud 1, y en cada uno de esos segmentos pintaremos algunos puntos.
Aunque en el segmento que se muestra en el dibujo sólo hay "pintada" una cantidad finita de puntos, supondremos que, en realidad, en cada segmento vertical hemos pintado una cantidad numerable de puntos. Tenemos, entonces, el siguiente teorema:

La Hipótesis del Continuo es falsa si y sólo si, no importa cómo se decida pintar los puntos, siempre existirán números x e y (ambos entre 0 y 1) tales que los puntos (x,y) y (y,x) quedan sin pintar. En otras palabras, la Hipótesis del Continuo es equivalente a que existe una manera de pintar los puntos para la cual en toda pareja (x,y) y (y,x), al menos uno de ambos puntos queda pintado.

Vamos a demostrar este teorema.

Supongamos primero que la Hipótesis del Continuo es verdadera. Es posible, entonces, definir en el intervalo [0,1] un buen orden equivalente a $\Omega $ (para más detalles, véase "El Omegón y todo eso,.." en este mismo blog). Pintamos entonces todos los puntos (x,y) tales que es menor o igual que x según el buen orden antes indicado. Por lo tanto, sobre cada x ha quedado pintada una cantidad numerable de puntos, y siempre sucede que, de (x,y) o (y,x), al menos uno de los dos queda pintado.

Recíprocamente, supongamos que la Hipótesis del Continuo sea falsa; y que los puntos han sido pintados de alguna manera. Como la Hipótesis del Continuo es falsa, podemos definir en [0,1] un buen orden equivalente a un ordinal mayor que $\Omega $.

Pensemos ahora en todos los puntos (x,y) pintados para los cuales x es, según el buen orden mencionado, menor que $\Omega $. Como las segundas coordenadas de estos puntos forman un conjunto de cardinal $\aleph _1$ entonces existe un $y_0$ que no pertenece a él (porque estamos suponiendo que [0,1] tiene cardinal mayor que $\aleph _1$). Es decir, para todo $x < \Omega $, $(x,y_0)$ no está pintado.

Pero el conjunto de todos los $x < \Omega $ tiene cardinal $\aleph _1$ y los puntos pintados sobre $y_0$ forman un conjunto numerable. Luego, existe un $x_0 < \Omega $ tal que $(y_0,x_0)$ no está pintado. Pero, por lo dicho más arriba, $(x_0,y_0)$ tampoco está pintado. Esto finaliza la demostración del teorema.

2.12.13

Galileo y el infinito

Galileo
En su obra Diálogo sobre dos nuevas ciencias (1638) Galileo Galilei afirma que es absurdo decir que una cantidad infinita es mayor que una cantidad finita. Para entender su razonamiento, imaginemos unos escribas que, generación tras generación, se dedican a anotar los sucesivos números naturales. La pregunta es, a medida que estas personas van anotando números, ¿podemos decir que se acercan cada vez más a completar la escritura de todos los números naturales?

Una primera mirada podría decirnos que sí; después de todo, a medida que pase el tiempo los escribas irán avanzando cada vez más en la escritura. Pero un segundo razonamiento nos diría que no, que en realidad no se acercan, porque no importa cuántos números escriban, la colección de todos los que quedan por anotar es siempre infinita en acto. Para decirlo más dramáticamente, la colección de los números no anotados nunca dejará de ser infinita en acto por más que los escribas avancen en la escritura de los números. Por lo tanto, siempre están a "infinita distancia" de completar la tarea, tanto si acaban de anotar el número cien como si han alcanzado el billón.

Pero Galileo va más allá todavía, y afirma que los escribas no solamente no se acercan al infinito en acto, sino que en cierto modo se alejan de él. Su razonamiento es como sigue: entre el número 1 y el número 100 hay 10 cuadrados, es decir, entre los cien primeros números, un 10% son cuadrados. Por otra parte, entre los mil primeros números, el 3,16% son cuadrados; entre los diez mil primeros, el 1% son cuadrados, y entre los cien mil primeros, el 0,316%. Es decir, a medida que los escribas van anotando los números, el porcentaje de cuadrados va disminuyendo y en consecuencia se aleja cada vez más del 100%. Sin embargo, en el infinito en acto hay la misma cantidad de cuadrados que de naturales, por lo que —siempre hablando de lo que sucedería en el infinito en acto— el 100% de los números son cuadrados. De modo que los escribas, a medida que avanzan en su tarea, se alejan de las propiedades del infinito en acto, en lugar de acercarse a ellas.

(Este fragmento formaba parte de un libro que escribí para la editorial RBA de España, pero tuve que suprimirlo porque el libro excedía la cantidad prescripta de caracteres. En el texto puede rastrearse el origen del Problemita numérico de verano publicado en este blog en enero.)

15.10.13

Arquímedes y el infinito

Arquímedes en la bañera
Durante siglos se creyó que el libro El Método, obra de Arquímedes de Siracusa (ca. 287-212 a.C.) estaba irremediablemente perdido. Se sabía, por diversas referencias, que en este libro el autor describía los razonamientos físicos que le habían permitido conjeturar los teoremas geométricos que después demostraba con todo rigor lógico en sus otros libros. Sin embargo, el contenido exacto de la obra permaneció desconocido hasta 1906 cuando, para gran sorpresa de todos, se descubrió en Estambul una copia de la obra. Se trataba en realidad de un palimpsesto, es decir, un códice escrito en pergamino que había sido borrado, por suerte imperfectamente, y reutilizado para escribir un manuscrito diferente. Las técnicas de 1906 permitieron reconstruir una parte de la obra original, pero varios fragmentos no pudieron ser recuperados en aquel momento.

El trabajo recomenzó a principios del siglo XXI, cuando un grupo de expertos, utilizando técnicas modernas de iluminación y de análisis de imágenes, lograron avanzar en el desciframiento de El Método. Parte de lo que descubrieron estos expertos sugiere que Arquímedes trabajó explícitamente con el infinito en acto. La historia está narrada en El Código de Arquímedes, libro de R. Netz y W. Noel. Según estos expertos, para comparar el volumen de dos cuerpos, Arquímedes los suponía cortados en infinitas lonjas de ancho infinitamente pequeño y concluía que ambos volúmenes era iguales porque era posible emparejar las tajadas que formaban uno de ellos con las tajadas que formaban al otro; si estas conclusiones son correctas esto implicaría que Arquímedes trabajó con la comparación entre dos conjuntos infinitos mediante el emparejamiento de sus componentes siglos antes de que Cantor hiciera lo mismo.

14.9.13

Una cita sobre Cantor

Georg Cantor
El 16 de diciembre de 1899 muere Rudolf Cantor, de 13 años de edad, hijo menor de Georg Cantor. Georg nunca podrá recuperarse de esta terrible pérdida, que le desencadenará un grave trastorno mental a consecuencia del cual, en los años sucesivos, deberá ser hospitalizado varias veces en una clínica psiquiátrica de Halle (ciudad alemana donde vivía desde 1869). Su sobrina Alice Guttmann, que en distintos años pasó muchas semanas en casa de los Cantor, recordaría tiempo después:

Mi tío permanecía encerrado en su cuarto de estudio, enormemente grande, cuyas cuatro paredes estaban todas cubiertas de libros desde el suelo hasta el techo. Allí parecía vivir su vida, para sí mismo, aislado en sus propios planetas, desconocido para el resto de nosotros. Por más que me hubiera gustado conocerle de verdad, él nunca estaba visible. En casa de mis padres pude escuchar una y otra vez comentarios que indicaban cómo mi padre (su cuñado) tenía en muy alto el carácter de mi tío, su pureza y su bondad, y cómo le impresionaba enormemente su grandeza de espíritu. Mi padre parecía divinizar a mi tío. También se hablaba de sus ausencias periódicas, durante días, del hogar propio en Halle, el cual abandonaba repentinamente y «de su propio pie», por así decir. Luego era llevado a un hospital y más tarde volvía a casa y todo parecía volver a tomar su camino usual; hasta la próxima vez. Me hice una imagen de sus estados de ánimo sobreexcitados, exaltados, pero no querría emitir un juicio al respecto, y en realidad no podría.  

[La cita final es de: CANTOR, Georg, Fundamentos para una teoría general de conjuntos (Escritos y correspondencia selecta), edición de José Ferreirós; Barcelona, Crítica, 2006.]

26.5.13

Bolzano, Russell y el infinito

Bernard Bolzano
En su libro Paradojas del Infinito, publicado póstumamente en 1854, Bernard Bolzano propone la siguiente demostración de que existe al menos un conjunto infinito:

Bolzano comienza diciendo que la afirmación P: "Existe al menos una afirmación verdadera" es verdadera (en efecto, dada cualquier afirmación Q, o bien Q, o bien su negación, es verdadera; por lo tanto es verdad que existe alguna afirmación verdadera); a continuación deduce que cada una de las siguientes afirmaciones es verdadera:

P
P es verdadera
"P es verdadera" es verdadera
""P es verdadera" es verdadera" es verdadera
etc.

...y llega a la conclusión de que el conjunto de todas las afirmaciones verdaderas es infinito.

Por otra parte, en el capítulo 13 de su libro Introducción a la Filosofía Matemática, Bertrand Russell discute la existencia de algún conjunto infinito y concluye que esa existencia no puede ser demostrada por lo que debe ser postulada como axioma. En esa discusión Russell no hace referencia alguna a la demostración de Bolzano, que seguramente Russell conocía, aunque tal vez no consideraba válida.

24.12.11

El Omegón y todo eso... (Parte 19)

Derivados ad infinitum...

(A la parte previa, A la parte siguiente)

Como decíamos ayer... estamos trabajando solamente con subconjuntos de los números reales. Recordemos, en ese contexto, cuál es la definición (una de las posibles) del concepto de punto de acumulación: un número r es punto de acumulación de un conjunto A si existe una sucesión a(1), a(2), a(3),.... formada por elementos de A, todos diferentes entre sí, tal que el límite de a(n) es r. (El número r puede, o no, pertenecer al conjunto.)

Con esta definición en la mano, observemos el conjunto A = {0}. Si lo miramos fijamente unos segundos no tendremos otro remedio que concluir que A no tiene puntos de acumulación (porque, de hecho, es imposible siquiera encontrar una sucesión formada por elementos de A todos diferentes entre sí).

Recordemos a su vez que Cantor llamó "conjunto derivado de A" (es decir, A') al conjunto formado por todos los puntos de acumulación de A. Luego, {0}' = vacío.

¿Seremos capaces de encontrar un conjunto B tal que B' = {0}? Un tal conjunto B debería contener una sucesión que tienda a 0, a fin de que este número se transforme en punto de acumulación de B. Luego, aunque no es la única opción, podemos tomar como B al conjunto {0, 1, 1/2, 1/3, 1/4,...}. Luego B' = {0}.

Notemos que, para lograr que el derivado sea el conjunto formado por el 0 le "agregamos" al conjunto {0} una sucesión que converge a ese número.

¿Podremos encontrar un conjunto C tal que C' = {0, 1, 1/2, 1/3, 1/4,...}? Es decir, que 1, 1/2, 1/3,... sean todos puntos de acumulación de C (pregunta para el lector: ¿por qué no necesito mencionar al 0 en esta lista?). Pues bien, procedemos como antes, para obtener el conjunto C tomamos el 1 y agregamos una sucesión que converja a 1, tomamos después el 1/2 y agregamos una sucesión que converja a 1/2, etc.

El conjunto C tendrá entonces la forma siguiente: C = {0, 1, números de una sucesión que converge a 1, 1/2, números de una sucesión que converge a 1/2, 1/3, números de una sucesión que converge a 1/3,...}

De este modo, C' = {0, 1, 1/2, 1/3, 1/4,...}, C" = {0} y C''' = vacío.

Si a su vez quisiéramos hallar un conjunto D tal que D' = C tendríamos que agregarle a C una sucesión que converja a cada término de cada una de las sucesiones que agregamos en el paso anterior.

Y así, como hemos hecho más arriba, agregando sucesiones que convergen a los términos de las sucesiones que convergen a los términos de las sucesiones... Cantor logró encontrar un conjunto P tal que al calcular la secuencia P, P', P'', P''',... los sucesivos conjuntos resultantes estaban cada uno de ellos contenido en el anterior (esto no es sorprendente, siempre P^(n+1) está contenido en P^(n)), pero además tal que ninguno de los conjunto de la secuencia era vacío y tal que, en el límite (cuando el número de derivadas tendía al infinito), se obtenía el conjunto {0}.

Con toda justicia Cantor dijo que P^(infinito) = {0}. Todavía, por unos segundos, podemos imaginar que este infinito es el infinito potencial del límite (el "ocho acostado"). Pero entonces Cantor dio el paso que lo llevó a la imnortalidad: derivó otra vez. Y resulta que: (P^(infinito))' = P^(infinito + 1) = vacío. Y en consecuencia, inevitablemente, infinito + 1 no puede ser igual a infinito (porque P^(infinito + 1) no es igual a P^(infinito)).

Por supuesto, Cantor enseguida comprendió que si infinito + 1 no es igual a infinito entonces infinito + 1 no es igual a infinito + 2, ni a infinito + 3,..., infinito + infinito, etc. Estos infinitos no podían ser "potenciales", no podían ser "los del límite" (porque para el infinito del límite sí es cierto que infinito + 1 = infinito).

Tan revolucionaria era esta idea, que aun el propio Cantor, inicialmente negó la "existencia real" de estos infinitos. Durante casi diez años les negó entidad, hablaba de una "creación dialéctica de símbolos sin significado". Pero a medida que trabajaba con estos símbolos, que descubría su aritmética y su orden terminó finalmente por aceptar que había descubierto una nueva clase de números, a los que llamó números ordinales u ordinales transfinitos.

En la parte siguiente se inicia el estudio de estos números...

(A la parte previa, A la parte siguiente)

11.1.11

El Omegón y todo eso... (Parte 18)

A la parte 17 - A la parte 19

Adenda sobre los puntos de acumulación

En esta entrada quiero ampliar la explicación del papel que jugó, en el desarrollo de la teoría de los ordinales, el concepto de "punto de acumulación". Fue mencionado en capítulos anteriores, pero ahora voy a profundizar en conceptos antes mencionados un poco al pasar.

Decíamos algunos capítulos atrás que, a principios de la década de 1870, Georg Cantor comenzó a trabajar en la Universidad de Halle. Allí Eduard Heine, su director, le planteó el siguiente problema: tenemos una función periódica f(x) que hemos desarrollado en serie de Fourier, si en cada período la cantidad de puntos singulares de f(x) (es decir, los puntos de discontinuidad de f(x) o puntos donde la serie es divergente) es infinita ¿podemos asegurar entonces que esa escritura en serie de Fourier de f(x) es la única posible (o, por el contrario, podrá haber otra serie diferente que converja a la misma función)?

Recordemos que Heine ya había resuelto afirmativamente la cuestión para una cantidad finita de punto singulares, Cantor se enfrentaba ahora al "caso infinito".

Dijimos también que, pocos meses después de planteado el problema, Cantor tenía ya una primera respuesta: puede asegurarse que la escritura es única siempre y cuando los puntos singulares estén distribuidos en la recta de una manera determinada. Pero Cantor, en primera instancia, no supo encontrar una manera clara y directa de describir cuáles eran las condiciones que debía cumplir esa distribución. Después de un tiempo logró obtener esa descripción clara y simple, y para ello creó el concepto de "punto de acumulación".

¿Qué es un punto de acumulación? Voy a dar la definición que dio Cantor, que él refería específicamente al caso de los números reales (posteriormente el concepto se llevó a contextos mucho más generales). Necesitamos previamente recordar qué significa que una sucesión de números converge a un límite L.

Una sucesión a(1), a(2), a(3),... converge a L si, fijada cualquier distancia épsilon, existe un número natural n (que depende de épsilon) tal que si m > n entonces la distancia entre a(m) y L se hace menor que épsilon. Traducido a un castellano más impreciso pero tal vez menos árido: a(1), a(2), a(3),... converge a L si, tomando n suficientemente grande, todos términos de la sucesión a partir de a(n) se acercan a L tanto como se quiera.

El ejemplo clásico es la sucesión a(n) = 1/n, cuyos términos son 1, 1/2, 1/3, 1/4,... y que converge a 0.

Definición: Si P es un subconjunto de los números reales, decimos que b es punto de acumulación de P si existe una sucesión a(n) no constante y formada totalmente por elementos de P, tal que a(n) converge a b.

Por ejemplo, si P = (0,1), entonces 0 es punto de acumulación de P. Por ejemplo, una sucesión formada por elementos de P y que converge a 0 es a(n) = 1/(n + 1) (siempre tomaremos n = 1, 2, 3, 4,...). En realidad, es fácil ver que el conjunto de todos los puntos de acumulación de P es [0,1].

Ejercicio para el lector: Demuestre, a partir de la definición dada más arriba, que si P es finito entonces no tiene puntos de acumulación.

Definición: Llamaremos P', el derivado de P, al conjunto de todos los puntos de acumulación de P.

Por lo tanto, para P = (0,1), tenemos P' = [0,1].

Pasemos a otro ejemplo. Tomemos ahora P = {0, 1, 1/2, 1/3, 1/4, 1/5,...}. Es decir, P está formado por el 0 y por todos los números de la forma 1/n con n = 1, 2, 3, 4,... Es evidente que 0 es punto de acumulación de P. ¿Qué pasa con los demás números?

Veamos, el 1 no es punto de acumulación de P. Si lo fuera, debería haber otros elementos de P tan cercanos al 1 como se desee (esos elementos serían los términos de la sucesión a(n) de los que habla la definición). Pero esto no sucede, ya que no hay otros puntos de P a manos de 1/2 de distancia del 1. Es decir, en todo el intervalo (1 - 1/2, 1 + 1/2) no hay elementos de P diferentes del 1 mismo. Por lo tanto, el 1 es un punto aislado de P y no es punto de acumulación.

Lo mismo sucede con el 1/2, ya que no hay puntos de P a distancia menor que 1/6 de él. Y también sucede con el 1/3, el 1/4, etc. Todos los puntos de la forma 1/n son puntos aislados de P. Por otra parte, es fácil ver que los puntos que no pertenecen a P tampoco son puntos de acumulación. Por lo tanto, para P = {0, 1, 1/2, 1/3, 1/4, 1/5,...} vale que P' = {0}.

Por supuesto, podemos también definir el derivado del derivado e P que es (P')' = P". Y el derivado de éste: (P")' = P''', etc. A los que llamaremos derivado segundo, derivado tercero, etc.

Observemos que si P = (0,1) entonces P' = [0,1], P" = [0,1], P''' = [0,1], etc.

Por otra parte, si P = {0, 1, 1/2, 1/3, 1/4, 1/5,...}, entonces P' = {0} y P" es el conjunto vacío (el derivado de {0}, como para todo conjunto finito, es el vacío). Tenemos así que el derivado segundo de P es el conjunto vacío.

¿Será posible hallar un conjunto P tal que su derivado tercero sea el vacío (pero ninguno de los anteriores)? La respuesta es afirmativa, pero la estudiaremos en el próximo capítulo...

21.11.10

El Omegón y todo eso... (Parte 17 ¿y final?)

(A la parte 16 - A la parte 18)

El comienzo y el fin

Decíamos en el capítulo anterior que, a principios de la década de 1870, Georg Cantor llegó a Halle. Cantor comenzó a trabajar bajo la dirección de Eduard Heine quien le propuso el siguiente problema: ¿es única la descomposición en serie de Fourier de una función periódica, aun cuando ésta tenga, en cada período, una cantidad infinita de puntos singulares? (Heine había probado que la respuesta es positiva cuando la cantidad de puntos singulares es finita.)

Pocos meses después, hacia 1872, Cantor obtuvo una primera respuesta: la descomposición es única siempre y cuando los puntos singulares de la función estén distribuidos en la recta real de una determinada manera. Pero Cantor no encontró, en principio, un modo claro y preciso de exponer qué condiciones debía cumplir esa distribución.

Como un teorema no sólo debe ser demostrado, sino que esa demostración deben estar escrita de modo que sea comprensible [las demostraciones las escriben y las leen seres humanos], Cantor se dedicó al problema, esencialmente lingüístico, de hallar un modo de exponer claramente cuáles eran las hipótesis que debía cumplir el conjunto de puntos singulares para que la descomposición en serie de Fourier fuese única. Y fue en el transcurso de la resolución de ese problema que Cantor creó un concepto que más tarde haría carrera en la Matemática: el concepto de punto de acumulación.

No es necesario dar aquí una definición precisa de este concepto (en este enlace hay una muy breve explicación - en esta entrada se amplía). Baste decir que, dado un conjunto P de números reales, se puede definir (la terminología y notación son de Cantor) un conjunto $P^{\prime }$, que es llamado el conjunto derivado de P, y que contiene a todos los puntos de acumulación de P. Este conjunto $P^{\prime }$ puede ser igual a P, o puede contener a P, o puede ser el conjunto vacío, etc. Por ejemplo, si P = [0,1], entonces $P^{\prime }$ resulta ser el mismo conjunto [0,1].

Pero también podemos calcular el derivado de $P^{\prime }$, que, por supuesto, se escribe $P^{\prime \prime }$. Y el derivado del derivado del derivado, $P^{\prime \prime \prime }$, etc. En el caso de P = [0,1] todos estos derivados sucesivos siguen siendo el [0,1], pero en otros casos se obtienen conjuntos diferentes. Por ejemplo, si $P = \{ 0,1,\frac{1}{2} ,\frac{1}{3}, \frac{1}{4} ,\dots \} $ entonces $P^{\prime } = \{ 0 \} $ y $P^{\prime \prime }$ es el conjunto vacío.

Cantor observó que en algunos casos estas derivaciones sucesivas terminaban en el conjunto vacío (como en el segundo ejemplo), mientras que en otros casos esto nunca sucedía (como en el caso del [0,1]). Cantor llamó conjuntos de primer tipo a los primeros y de segundo tipo a los segundos. Y enunció su teorema así: si los puntos singulares de una función periódica forman un conjunto de primer tipo entones su escritura en serie de Fourier es única. Dado que los conjuntos finitos resultan ser de primer tipo, el resultado de Cantor incluía como caso particular al de Heine.

Pero Cantor no se quedó conforme con este resultado y siguió pensando. Observó que este en este proceso de derivadas sucesivas podía definirse una especie de "derivada infinita": el límite de $P^(n)$ (derivado n-ésimo de P) con n tendiendo al infinito. Sin embargo, hasta aquí, todavía, no estaba haciendo un uso "peligroso" del infinito, aún estaba en el terreno familiar del infinito potencial, el infinito "del límite". Sin embargo, estaba al borde de su gran descubrimiento, el cual se produjo cuando, en un momento dado, encontró un ejemplo de un conjunto $P$ tal que $P^{(\infty )}= \{ 0\} $... y por lo tanto, $(P^{(\infty )} )^\prime = P^{(\infty +1)} = \{ 0\} ^\prime $ = vacío.

¿Qué era este $\infty +1$? Ya no era el infinito potencial, el del límite, porque para el límite tanto $\infty $ como $\infty +1$ son lo mismo. Pero en este caso no era así, ya que $P^{(\infty )}$ y $P^{(\infty +1)}$ eran conjuntos diferentes. Se trataba entonces de un nuevo concepto de infinito.

Debió ser muy traumático para Cantor el encontrarse cara a cara con el por tantos siglos prohibido y temido infinito potencial. Tanto es así que tardó diez años aceptar que lo que tenía entre manos era nada más, ni nada menos, que un modo de contar más allá del infinito. Y cuando finalmente lo aceptó, en 1883, publicó un artículo titulado Fudamentos para una Teoría General de Conjuntos, donde Cantor incluye su tan citada frase: "fui llevado por la lógica de mis investigaciones a romper con tradiciones que me habían enseñado a respetar" [algunas traducciones dicen "venerar"]. En ese trabajo, además, cambió el símbolo habitual del infinito (el "ocho acostado") por la letra griega omega, para resaltar así que "su" infinito no era el del límite. En ese trabajo, además, bautizó como "ordinales" a estos nuevos "números infinito" y dio comienzo la historia que aquí hemos narrado.

Y aquí termina la historia, o quizás comienza, porque las paradojas de la teoría de Cantor llevaron a la Crisis de los Fundamentos, al Programa de Hilbert, al Teorema de Gödel, a las Máquinas de Turing, a los trabajos de Frege, al Intuicionismo de Brouwer,... Queda en la voluntad del lector el internarse en ese laberinto, un laberinto del que aquí hemos mostrado solamente la entrada y que, por suerte, no tiene salida.

¿Fin? - parece que no...

20.11.10

El Omegón y todo eso... (Parte 16)


El comienzo: Cantor y Heine

Georg Cantor nació en San Petersburgo (ex Leningrado, ex San Petersburgo) en 1845. Cuando todavía era un niño su familia se trasladó a Alemania y Cantor estudió, creció y vivió toda su vida en ese país. Más exactamente, Georg estudió Matemáticas en la Universidad de Berlín (una de las mejores del mundo para estudiar Matemáticas en aquella época) y hacia 1870 publicó sus primeras investigaciones, dirigidas por Leopold Kronecker, en el campo de la Teoría de Números.

Dicen que, aunque correctos, esos primeros trabajos no presagiaban la existencia un pensamiento particularmente creativo u original. Tanto es así que, poco tiempo después, Cantor se trasladó a la Universidad de Halle, de menor categoría que Berlín, al menos en aquella época, donde comenzó a trabajar bajo la dirección de Eduard Heine.

¿Quién era Eduard Heine? Para responder a esta pregunta, hagamos un pequeño paréntesis:

Cuando, a fines del siglo XVII, Newton y Leibniz crearon el Cálculo Diferencial, ninguno de los dos pudo dar (a pesar de que lo intentaron) una explicación lógica, convincente, clara y concreta que justificara la validez de los métodos que presentaban (tal vez porque se adelantaron a su propia época y las Matemáticas de su tiempo no estaban suficientemente maduras como para sustentar esa explicación). Durante décadas la única justificación para el uso de los métodos del Cálculo fue puramente pragmática: en la práctica, a la hora de calcular áreas o rectas tangentes, estos métodos funcionaban maravillosamente y resolvían problemas que ningún otro podía resolver.

Ahora bien, con el transcurrir del siglo XVIII los métodos del Cálculo empezaron a volverse cada vez más complejos, a la vez que (y precisamente por ese motivo) se volvían más dudosos en su validez. Por ejemplo, a mediados de ese siglo, Leonhard Euler, el mago de las sumas infinitas, dedujo la expresión de la serie que permite calcular el coseno de cualquier número mediante un razonamiento en el transcurso del cual se afirmaba que el producto de un número infinitamente grande por un número infinitamente pequeño da como resultado un número cualquiera "de tamaño finito".

A principios del siglo XIX la situación se había vuelto insostenible. Nadie sabía por qué, cuándo o cómo los métodos que se usaban en el Cálculo eran realmente válidos. D'Alembert, por ejemplo, consolaba a sus alumnos diciéndoles que si perseveraban lo suficiente tarde o temprano "la fe les llegaría".

Es así que, a lo largo del siglo XIX surge lo que posteriormente se dio en llamar el Movimiento Crítico de la Matemática, una corriente de investigaciones dirigidas a resolver el problema de los fundamentos del Cálculo. Matemáticos que formaron parte de este movimiento fueron Cauchy, Bolzano, Riemann, Weierstrass, Dedekind, Abel, ...un largo etcétera..., Heine y Cantor.

En los años previos a la llegada de Cantor a Halle, Heine había estado lidiando con el siguiente problema: ¿es única su descomposición en Serie de Fourier de una función periódica? Una función periódica representa una onda que se repite periódicamente. A principios del siglo XIX Joseph Fourier (matemático francés, ministro de Napoleón) descubrió un método que consiste en descomponer esa onda en una suma infinita (una serie) de ondas fundamentales (representadas por senos y cosenos). La pregunta de Heine era si esa descomposición es única o si, por el contrario, existirá alguna onda que admite dos o más descomposiciones diferentes.

Heine llamó "puntos singulares" de la función periódica a aquellos puntos donde la onda tiene saltos (puntos de discontinuidad de la función) o a aquellos donde la serie de Fourier da una suma infinita (es divergente) y probó que si, en cada período, hay una cantidad finita de puntos singulares entonces, en efecto, su descomposición en serie de Fourier es única.

Cuando, a principios de la década de 1870, Cantor llegó a Halle ansioso, imaginamos, por tener un problema para trabajar en él, Heine le propuso lo siguiente: que investigara si la descomposición en serie de Fourier seguía siendo única aun cuando la cantidad de puntos singulares en cada período fuera infinita. Cantor comenzó a trabajar en ese problema y pocos meses después tenía una primera respuesta...

(Continuará.)

19.11.10

El Omegón y todo eso... (Parte 15)

(A la parte 14A la parte 16)

Los ordinales, hoy (y la paradoja de Burali-Forti)

Recordemos que la mal llamada Paradoja de Burali-Forti ("mal llamada" porque en verdad fue descubierta por el mismo Cantor) surge al considerar las dos afirmaciones siguientes:

a) Todo ordinal tiene un sucesor.
b) El conjunto de todos los ordinales, que también es un ordinal, es el mayor de todos los ordinales y, por ende, no tiene sucesor.

En las afirmaciones anteriores la palabra "conjunto" se usa en el sentido que se le da en la teoría de Cantor, también llamada teoría intuitiva de conjuntos, y en la que, hablando informalmente, a cada propiedad se le asocia el conjunto de todos los objetos que cumplen esa propiedad (entendiendo la palabra "objeto" en el sentido más amplio posible).

Como decíamos en los dos capítulos anteriores, en las modernas teorías de conjuntos (todas aquellas que surgieron en las primeras décadas del siglo XX para subsanar las contradicciones de la teoría de Cantor) se hace una distinción entre "clase" y "conjunto". A cada propiedad se le asocia la clase de todos los objetos que cumplen esa propiedad y se reserva la palabra conjunto para designar a una clase que es elemento de alguna clase más grande. Las clases que no son elementos de una clase mayor se denominan clases propias. (Todas estas teorías incluyen, además, algún axioma que impide que una clase sea elemento de sí misma.)

Vimos en el capítulo anterior cómo esta simple distinción entre clases propias y conjuntos evitaba la Paradoja de Russell. Veamos ahora cómo evita la Paradoja de Burali Forti. La solución para esta paradoja resulta ser casi decepcionantemente simple y consiste en observar que, a partir de la definición de ordinal que que se da en el contexto de las modernas teorías de conjuntos, puede probarse que:

a) Todo ordinal, si es un conjunto, tiene un sucesor.
b) La clase de todos los ordinales es una clase propia y no tiene un sucesor. (De hecho, si se "calcula" el sucesor de esta clase se obtiene la clase universal, que no es un ordinal.)
c) El único ordinal que es una clase propia es la clase de todos los ordinales.

Y la paradoja, así de simple, desapareció... De este modo, sin traicionar el espíritu de la idea original de Cantor, se obtiene una teoría para los ordinales que está libre de paradojas... O, mejor dicho, que está libre de paradojas hasta donde se sabe. Porque nada impide que, quizás en este mismo momento, un Bertrand Russell del siglo XXI esté descubriendo la paradoja que tendrá a mal traer a los matemáticos del futuro...

19.8.10

El Omegón y todo eso... (Parte 14)

(A la parte 13A la parte 15)

Los ordinales, hoy (continuación)

Queremos recuperar en el contexto de la teoría de Morse-Kelley la construcción de los ordinales de Cantor, y además hacerlo de tal modo que se eviten las paradojas. La idea básica es que, mientras Cantor concebía a los ordinales como números que permitían contar "más allá del infinito", la teoría de Morse-Kelley concibe a los ordinales como conjuntos, y la relación "menor que" de Cantor se reemplaza por la relación "pertenece a". Veamos cómo se hace esto:

Como dijimos en la parte anterior, en la teoría de conjuntos de Morse-Kelley el número 0 se identifica con la clase vacía. Los axiomas de la teoría permiten probar que 0 es, de hecho, un conjunto. Por lo tanto podemos decir que 0 es el conjunto vacío. Además, 0 es el primer ordinal.

El ordinal siguiente al 0 es el 1, que se define como

1 = {0}

Puede probarse que 1 es un conjunto, el conjunto cuyo único elemento es el 0. Por lo tanto 0 pertenece a 1. Observemos también que 0 es un subconjunto de 1.

Los ordinales finitos siguientes 2, 3, 4, 5, 6,... son también todos conjuntos y se definen como:

2 = {0, 1}
3 = {0, 1, 2}
4 = {0, 1, 2, 3}
5 = {0, 1, 2, 3, 4}
6 = {0, 1, 2, 3, 4, 5}

Y así para todos los ordinales finitos. Notemos que 1 pertenece a 2 (y también pertenece a 3, 4, 5,...). También 1 = {0} es un subconjunto de 2, 3, 4, 5,...
El ordinal 2 pertenece y es subconjunto de 3, 4, 5, 6,...
El ordinal 3 pertenece y es subconjunto de 4, 5, 6, 7,...

Y así sucesivamente.
Observemos también que:

El sucesor de 0 es $0\cup \{ 0\} $ = {0} = 1.
El sucesor de 1 es $1\cup \{ 1\} $ = $\{ 0\}\cup \{ 1\}$ = {0, 1} = 2.
El sucesor de 2 es $2\cup \{ 2\} $ = $\{ 0,1\}\cup \{ 2\}$ = {0, 1, 2} = 3.
Etc.

El primer ordinal infinito, $\omega $, se define como la clase (puede probarse que, de hecho, es un conjunto) cuyos elementos son todos los ordinales finitos:

$\omega $ = {0, 1, 2, 3, 4,...}

Su sucesor es $\omega +1$ = $\omega \cup \{ \omega \} $ = {0, 1, 2, 3, 4,..., $\omega $}, donde los puntos suspensivos abarcan todos los números naturales desde 5 en adelante. Todos los ordinales finitos son elementos y subconjuntos de $\omega $, que a su vez es elemento y subconjunto de $\omega +1$.

Recordemos que una de las reglas de construcción de ordinales establecida por Cantor nos decía que a continuación de una secuencia creciente de ordinales consecutivos se "hacía aparecer" un nuevo ordinal. En la teoría de conjuntos ese nuevo ordinal es la clase cuyos elementos son todos los ordinales anteriores.

Pero ¿cómo se define el concepto de ordinal? Para comenzar definimos la noción de clase completa.

Definición: una clase x es completa si todo elemento de x es también un subconjunto de x.

Para entender esta definición debemos recordar primero que en esta teoría todos los objetos considerados son clases y que no existe la distinción habitual entre elementos individuales y clases (o conjuntos).

En segundo lugar observemos que si x = {1}, entonces 1 es elemento de x, pero 1 no es subconjunto de x, porque 1 = {0} y 0 no es elemento de x. Por lo tanto {1} no es completo. Todos los ordinales mostrados más arriba, en cambio, sí son completos.

Definición: una ordinal es una clase completa que está bien ordenada por la relación de pertenencia.

Es decir, si x es un ordinal y consideramos la relación de pertenencia, definida entre los elementos de x, entonces x resulta ser bien ordenado por esa relación. Veamos cómo esta definición nos permite ir obteniendo, uno tras otro, los sucesivos ordinales 0, 1, 2, 3,...:

Supongamos que x es un ordinal. Si x es 0 entonces está al comienzo de la secuencia. Veamos que si no es 0 entonces es mayor o igual que 1 (es decir, o es igual a 1 o el 1 es elemento de x, recordemos que aquí "menor" equivale a "pertenece").

Supongamos que x es no vacío, como es bien ordenado por la relación de pertenencia entonces tiene un mínimo. Sea y esa mínimo. Como x es completo e y es un elemento de x entonces y es un subconjunto de x.

Supongamos que y fuera no vacío, existiría en consecuencia algún z tal que z pertenece a y.

Entonces: z pertenece a x (porque pertenece a y, que es subconjunto de x), pero también pertenece a y, es decir "es menor que y", pero y el mínimo de x (no puede haber elementos menores que él). Esto es un absurdo, luego z no puede existir. Es decir, y = 0.

En resumen, si x es un ordinal no vacío entonces 0 pertenece a x. En otras palabras, x es mayor que 0 y {0} = 1 es un subconjunto de x.

Ahora bien, x podría ser el 1, o no. Si x es 1, entonces sigue al 0 en la secuencia de ordinales.

Si x no es 1 tomamos el mínimo de x - {0} y un razonamiento similar al anterior nos permitirá probar que, en ese caso, si x es mayor o igual que 2. Ahora bien, si x no es 2, un razonamiento similar nos permitirá probar que es mayor o igual que 3. Etc.

En la próxima parte veremos cómo esta definición conjuntista de los ordinales nos permite evitar la paradoja de Burali-Forti.

9.8.10

El Omegón y todo eso... (Parte 13)

(A la parte 12A la parte 14)

Los ordinales, hoy

Como decíamos ayer, la teoría de conjuntos (en particular, la teoría de los ordinales), tal como fue planteada por Georg Cantor , resultó ser inconsistente (1). Esto quedó demostrado por la existencia de la paradoja del mayor ordinal posible (la mal llamada Paradoja de Burali-Forti, discutida en el capítulo anterior) y también por la paradoja de Russell del conjunto de todos los conjuntos que no son elementos de sí mismos.

Cantor intentó solucionar estos problemas mediante un argumento filosófico-teológico según el cual existen dos niveles de infinitud: el nivel transfinito y el nivel de la infinitud absoluta. El primero, según Cantor, es el único accesible a la mente humana. Cantor aseguraba que toda su teoría de ordinales y cardinales se enmarcaba en este nivel.

Por el contrario, decía Cantor, la comprensión del nivel absoluto estaba sólo reservada a Dios y era inaccesible al ser humano. En este nivel se encontraban conceptos tales como "el conjunto de todos los conjuntos" y "el mayor de todos los ordinales". Las paradojas que se derivan de estos conceptos, siempre según Cantor, sólo son aparentes y resultan ser el fruto de nuestras propias limitaciones (2).

Esta "explicación", además, calmaba los escrúpulos religiosos de Cantor. Como ya dijimos antes, hasta el siglo XIX muchos teólogos consideraban que el infinito era un concepto esencialmente divino y que pretender comprenderlo constituía una herejía. Cantor, quien era profundamente religioso, estuvo durante mucho tiempo muy incómodo con la idea de ser un hereje. La concepción de que, después de todo, habría un parte del infinito inaccesible a la mente humana lo reconciliaba de alguna manera consigo mismo.

La verdad es que esta explicación filosófico-teológica no convenció a ningún matemático, ni siquiera a los dos más grandes defensores de Cantor, David Hilbert y Richard Dedekind, y es así como los problemas de la teoría de Cantor quedaron sin resolver durante varios años (en la década de 1920 David Hilbert todavía planteaba la comprensión del infinito como uno de los mayores desafíos para el honor de espíritu humano).

En los primeros años del siglo XX Bertrand Russell intentó una solución mediante una reformulación de las reglas del lenguaje lógico-matemático que, de ser aplicadas, se suponía, eliminarían todas las paradojas conocidas hasta ese momento. Lamentablemente, por razones demasiado extensas para explicarlas aquí, la idea de Russell falló.

La solución (al menos la solución hasta ahora aceptada) provino del enfoque axiomático y consistió específicamente en el planteo de una teoría axiomática de conjuntos. En realidad, decir "una" teoría de conjuntos es inexacto. Aunque la teoría más "popular" entre los matemáticos es la llamada teoría de Zermelo-Fraenkel, se han propuesto muchas teorías de conjuntos, no todas equivalentes entre sí.

Mi intención es desarrollar a continuación algunos de los puntos principales de la llamada teoría de conjuntos de Morse-Kelley, haciendo especial hincapié en la definición de los ordinales y en cómo se eliminan las paradojas que aparecen en la teoría de Cantor. (Al hablar de los ordinales, me basaré en la exposición que se hace en el apéndice del libro de John L. Kelley, Topología General, Eudeba, Buenos Aires, 1975.) Aunque hablaré de la teoría de Morse-Kelley, casi todo lo que diré (tal vez todo) es común a casi todas (tal vez a todas) las teorías de conjuntos existentes actualmente.

Para comenzar, digamos que todas las teorías de conjuntos actuales eliminan las paradojas (por ejemplo la de Russell o la de Burali-Forti) mediante un truco de lenguaje que (curiosamente, o no) tiene reminiscencias de la explicación filosófico-teológica de Cantor. El truco consiste esencialmente en hacer una distinción entre clases y conjuntos.

A toda propiedad (entendamos la palabra "propiedad" en su sentido intuitivo) le corresponde una clase: la clase de todos los objetos que cumplen esa propiedad. Ahora bien, antes de continuar es importante decir que en casi todas las teorías de conjuntos actuales todos los objetos de la teoría son clases. Es decir, la distinción "tradicional" entre clases y elementos no existe. Insisto, todas son clases, sólo que algunas clases son elementos de otras clases más grandes.

Por ejemplo, en la teoría de Morse-Kelley el número 0 se define como la clase vacía (que es la clase definida por la propiedad "$x\neq x$"). Observemos que 0 no se define como el cardinal de la clase vacía (como habría hecho Cantor), sino que es esa clase. 0 es un nombre para la clase vacía.

¿Qué es un conjunto? Un conjunto es un caso particular de clase. Una clase es un conjunto si pertenece a una clase más grande. Tenemos entonces que las clases se dividen en dos tipos, por una lado están los conjuntos, que son clases que son miembros (o elementos) de clases más grandes y por otro lado están las clases propias, que no son miembros de clases más grandes. (Cantor, probablemente, hubiera identificado a las primeras con "lo transfinito" y a las segundas con "lo absoluto".) Por ejemplo, la clase universal (la clase que contiene a todo, definida por la propiedad "$x = x$") es una clase propia.

Dijimos antes que a cada propiedad P le corresponde una clase C. La definición dice que:

"$x \in C$ $\Leftrightarrow $ (x cumple P y x es un conjunto)"

¿Cómo sirve esta distinción para evitar, por ejemplo, la paradoja de Russell? En la teoría intuitiva de conjuntos (nombre que actualmente se la da a la teoría de conjuntos de Cantor) a cada propiedad simplemente le corresponde un conjunto. Si a la propiedad P le correspondiera el conjunto C diríamos que:

"$x \in C$ $\Leftrightarrow $ x cumple P"

Tomemos, como hizo Russell, la propiedad "$x\not\in x$" y llamemos R al conjunto que le corresponde. Luego: $x\in R \Leftrightarrow x\not\in x$ .

La teoría intuitiva nos dice que la afirmación anterior es verdadera cualquiera sea el valor que le asignemos a x. Tomemos, por ejemplo, x = R. Tenemos así que la teoría nos dice que es verdad que: $R\in R\Leftrightarrow R\not\in R$ Pero la lógica elemental nos dice que esta afirmación es ipso facto falsa. La teoría intuitiva de conjuntos nos conduce entonces a una falsedad y es, por lo tanto, contradictoria.

Ahora bien ¿qué diría ante esta situación una teoría moderna de conjuntos? ¿Cómo elude la paradoja? Tomemos la misma propiedad de antes, "$x\not\in x$" y sea R la clase que le corresponde. La definición que da una teoría de conjuntos actual nos dice que, cualquiera sea x, vale que:

"$x\in R$ $\Leftrightarrow $ si ($x\not\in x$ y (x es un conjunto))"

Como antes, tomemos $x = R$. Es verdad entonces que: "$R\in R$ $\Leftrightarrow $ (($R\not\in R$) y (R es un conjunto))"

Y ya no hay paradoja porque esta afirmación no es contradictoria en sí misma. Más aún, del hecho de que esta afirmación es verdad se deduce que R no pertenece a sí misma y que R no es un conjunto. Es decir, R es una clase propia.

Vemos así como las modernas teorías de conjuntos evitan (mediante un truco de lenguaje) la paradoja de Russell. Veremos en la próxima cómo definen los ordinales y cómo evitan (de manera similar) la paradoja de Burali-Forti.

Notas:

(1) En su libro Comprendiendo el Infinito (Fondo de Cultura Económica, México DF, 2005), Shaughan Levine sostiene la tesis de que la teoría de Cantor era consistente y que las contradicciones que se achacan aparecen solamente si se aplica la teoría a situaciones que Cantor no contemplaba (es decir, la teoría es consistente si nos limitamos a lo que Cantor llamaba "lo transfinito"). Sin embargo, creo que Levine se equivoca. La teoría de Cantor es inconsistente. Por supuesto, si ante cada incosistencia nos limitamos a decir "ese caso no lo tomo en cuenta" entonces cualquier teoría (aun la más absurda) puede ser defendida como consistente.

(2) En 1904 Cantor le escribió una carta a Bertrand Russell usando este argumento como intento de refutación de su paradoja del conjunto de los conjuntos que no pertenecen a sí mismos. No sabemos si Russell le respondió. (La carta de Cantor está reproducida en el libro citado en la nota anterior.)

5.2.10

Paradojas del infinito (II)

Tenemos, por un lado, una recta infinita. Por otro lado tenemos una cantidad infinita de pequeños segmentos. Uno de estos segmentos mide 1/2 cm, otro mide 1/4 cm, otro 1/8 cm. y así sucesivamente. Aunque la cantidad de segmentos es infinita, la suma total de sus longitudes es apenas 1 cm.

Si distribuyéramos los segmentos a lo largo de la recta, la longitud total que cubrirían sería de apenas 1 cm. (o menos todavía, si los segmentos se superponen). La intuición nos dice que, no importa cómo coloquemos los segmentos, inevitablemente quedarán grandes porciones de la recta sin cubrir. Después de todo, estaríamos cubriendo apenas 1 cm. de una recta de longitud infinita.

Imaginemos que hemos colocado, de alguna forma, los infinitos segmentos sobre la recta. Tomemos ahora otro segmento de, digamos, 1 mm. de longitud. Éste será nuestro segmento de prueba.

Si al colocar el segmento de prueba sobre la recta, éste toca a alguno de los infinitos segmentos que colocamos primero, entonces sonará una alarma. Por "tocar" entendemos que haya una parte en común (que no se reduzca a un solo punto) entre alguno de los segmentos iniciales y el segmento de prueba.

La intuición nos dice que, no importa cómo hayamos colocado los segmentos iniciales (que abarcan solamente 1 cm. en una recta de longitud infinita), habrá muchas formas de colocar el segmento de prueba sin que suene la alarma.

Sin embargo... existe una manera de ubicar los segmentos iniciales de tal modo que, no importa cómo se coloque el segmento de prueba, la alarma siempre suene. Es decir, con segmentos que suman en total apenas 1 cm. de longitud es posible cubrir casi totalmente una recta de longitud infinita. Más exactamente, es posible cubrirla de tal modo que no haya en ella ni siquiera una parte de 1 mm. de longitud que quede sin ser tocada por al menos un segmento. Más aún, lo mismo sucedería si en lugar de un segmento de prueba de 1 mm. de longitud hubiéramos elegido uno de 0,000000001 mm., o cualquier otra longitud aún menor (siempre que no fuera cero).

El modo de lograr este prodigo es el siguiente. Es sabido que el conjunto de los números racionales es numerable, es decir, es posible establecer una correspondencia uno-a-uno entre el conjunto de los números racionales y el conjunto formado por 0, 1, 2, 3, 4,... Fijemos una tal correspondencia y llamemos q0 al número racional que se corresponde con el 0, q1 al que se corresponde con el 1, y así sucesivamente. (Es interesante observar que esta correspondencia puede definirse explícitamente, por lo que podríamos decir concretamente quién es q0, quién es q1, etc.)

Transformemos a la recta que teníamos al principio en una recta "numérica". Para ello marquemos dos puntos a 1 cm. de distancia entre sí, a uno de ellos asignémosle el número 0 y al otro, el número 1. De la manera usual quedan asignados todos los números racionales.

Pasemos ahora a ubicar los segmentos:

El segmento de longitud 1/2 cm. debe ser colocado cubriendo el intervalo [q0 - 1/4, q0 + 1/4].
El de longitud 1/4 cm. debe ser colocado cubriendo el intervalo [q1 - 1/8, q1 + 1/8].
El de longitud 1/8 cm. debe ser colocado cubriendo el intervalo [q2 - 1/16, q2 + 1/16].
Y así sucesivamente.

No es difícil probar que esta distribución cumple las condiciones indicadas antes: la suma total de los segmentos es 1 cm., pero no hay ninguna parte de longitud 1 mm. (o menor) que quede sin ser tocada por al menos un segmento. Para demostrar esto último, imaginemos que colocamos nuestro segmento de prueba de modo que coincida con el intervalo [a, b]. Ese intervalo (no importa su longitud, siempre que no sea nula) contiene al menos un número racional qn tal que b > qn > a. Por lo tanto, el segmento de prueba se toca con el segmento centrado en qn.

27.1.10

Paradojas del infinito (I)

Decimos que una propiedad define a un número si esa propiedad es satisfecha solamente por ese número y por ningún otro objeto matemático (observemos, dicho sea de paso, que acabo de definir el concepto de definición).

Para evitar ambigüedades, admitiremos solamente definiciones que usen las letras del alfabeto castellano, más los dígitos del 0 al 9 y los símbolos de puntuación usuales. Debe entenderse, por otra parte, que estamos hablando de números reales y no sólo de enteros o racionales.

Algunos ejemplos:

"Es el cociente entre la longitud de una circunferencia y su diámetro" define al númeroi Pi
"Es el número ocho quintos" define al número 8/5.
"Es el resultado de sumar 2 más 3" define al número 5.

Diremos que un número es definible si existe alguna propiedad que lo define. Los ejemplos que acabamos de ver nos dicen que Pi y 8/5 son números definibles. En realidad todos los números racionales son definibles, aunque también son definibles algunos irracionales, como el ya mencionado Pi. También son definibles, por ejemplo, el número e, la raíz cuadrada de dos y el número de oro.

Incluyamos en este concepto a todas las definiciones concebibles, pasadas, presentes o futuras. Es decir, definible será cualquier número que alguna vez haya sido definido (mediante una definición traducible al alfabeto castellano) o que pudiera llegar a ser definido en algún momento del futuro (no importa si esa definición alguna vez es escrita realmente, basta con que sea expresable en potencia).

Llamaremos inefables a los números no definibles. Es decir, son inefables aquellos números que nunca han sido definidos y que nunca, ni siquiera en teoría, podrían llegar a ser definidos en cualquier época o lugar. La pregunta es ¿existen números inefables? La respuesta es que sí existen, veamos por qué.

Hace ya más de cien años Georg Cantor demostró que el conjunto de los números reales es no numerable. Es decir, es imposible establecer una correspondencia uno-a-uno entre ese conjunto y el conjunto de los números naturales (que es el formado por los números 0, 1, 2, 3,...). Al conjunto de los números reales corresponde un orden de infinitud superior al del conjunto de los números naturales.

Ahora bien, puede probarse sin dificultad que el conjunto de todas las definiciones posibles es numerable. El orden de infinitud de este conjunto es el mismo que el del conjunto de los números naturales.

Por lo tanto, en un sentido bien definido, hay más números reales que definiciones posibles y en consecuencia es imposible que a todo número real le corresponda una definición (pasada, presente o futura). Hemos probado así que existen números inefables (de hecho, que existen infinitos números inefables).

¿Por ejemplo...? No hay ejemplos. Por su propia naturaleza, es imposible señalar un número inefable en concreto. Todo número que seamos capaces de mencionar es, inevitablemente, definible. Hemos probado así la existencia de un conjunto infinito de números de los cuales somos (y seremos por siempre) incapaces de señalar ni siquiera un ejemplo.

Pero sí podemos probar propiedades de estos números inefables. Por ejemplo la siguiente:

Propiedad: la suma de un número inefable más un número definible es un número inefable.

Demostración: Sea x un número inefable cualquiera y sea q un número definible cualquiera. Tenemos que probar que z = x + q es inefable.

Supongamos, por el absurdo, que z fuera definible. Entonces, dado que x = z - q, entonces x sería definible porque se lo podría definir como "Es el resultado de restar el número que cumple que (cópiese aquí la definición de z) menos el número que cumple que (cópiese aquí la definición de q)". Esto contradice la suposición de que x es inefable. Por lo tanto z también es inefable. Q.E.D.

Ahora bien, ¿qué queremos decir en una demostración cuando decimos "sea x un número inefable cualquiera"? ¿Qué quiere decir "cualquiera"?

Suele entenderse que el uso de la palabra "cualquiera" indica que lo que se está haciendo es un "razonamiento genérico", un razonamiento que puede repetirse en cada caso particular. Como si dijéramos "reemplace x por cualquier número inefable y verá que todo lo que se dice después es cierto".

Pero... ¿Cómo puede aceptarse en este caso una tal interpretación si es imposible (y será por siempre imposible) tomar ni siquiera un ejemplo particular? ¿Es válida la demostración de la propiedad? ¿Tiene sentido el concepto de número inefable, a pesar de que la Teoría de Conjuntos nos permite demostrar que existen infinitos de tales números? Preguntas que quedan planteadas para quien quiera reflexionar sobre ellas.

Nota: Como se acota en el primer comentario, en efecto las definiciones deben ser de longitud finita. En principio no me pareció necesario aclararlo, ya que se sobreentiende que las definiciones son textos escritos (y leídos) por humanos y todos los textos escritos (y leídos) por humanos tienen, inevitablemente, una longitud finita.

Nótese que "Es el número 0,333...", que tiene una longitud finita (ya que abarca exactamente 18 símbolos, sin contar el acento y los espacios) no es una definición, a menos que se aclare qué significan los puntos suspensivos.

3.1.10

Adenda a Pregúntenzen

Con esta entrada quiero cerrar el círculo que comenzó con Pregúntenzen, y siguió con Sherlock Holmes y Alef-uno y su Adenda. Recuerdo las cinco preguntas-zen del comienzo:

0. ¿Los hexágonos de cinco lados son polígonos regulares?
1. ¿Las sirenas son mamíferos o peces?
2. ¿Sherlock Holmes es inglés?
3. ¿Viajó alguna vez Harry Potter a China?
4. ¿Papá Noel (o Santa Claus) usa un traje rojo?

La pregunta cero refiere a la cuestión de la consistencia lógica, a la que aludí en la Adenda: un concepto lógicamente inconsistente no es aceptable en la "matemática ficcional".

De Shelock Holmes y Harry Potter (preguntas 2 y 3) ya he hablado extensamente. Acerca de la pregunta 1, la relaciono con esta cuestión ¿es el 0 un número natural?

La pregunta 4 se relaciona el hecho de que, puesto que en la matemática ficcional la verdad depende del consenso entre seres humanos mortales, entonces sus verdades no tienen un carácter universal e inmutable, sino que cambian con el tiempo.

¿Usa Papá Noel un traje rojo (esencialmente rojo)? La respuesta es que originalmente no era así. En sus inicios, el traje de Papá Noel era blanco, pero a principios del siglo XX la Coca Cola se apropió del peronaje para su publicidad y como el logo de la Coca Cola es rojo, entonces vistió de ese color a Papá Noel. Hoy en día el traje es rojo, pero no siempre fue así, de la misma manera en que hubo un día en que el Axioma de Elección era "falso", pero hoy día es "verdadero".

Cierro con una última pregunta: ¿Sherlock Holmes es inglés, o era inglés?

1.1.10

Adenda a Shelock Holmes y Alef-uno

Se llama Hipótesis del Continuo a la conjetura (formulada por Georg Cantor a fines del siglo XIX) que dice que Alef-uno = 2^(Alef-cero).

En sendos trabajos publicados respectivamente en 1940 y 1962 Kurt Gödel y Paul Cohen demostraron que la Hipótesis del Continuo (en adelante, HC) es indecidible en la Teoría de Conjuntos. Es decir, si tomamos los axiomas de la Teoría de Conjuntos no es posible demostrar a partir de ellos que HC sea verdadera, ni tampoco es posible demostrar que sea falsa.

"Sin embargo", escribió Gödel, "los axiomas de la Teoría de Conjuntos describen una realidad objetiva en la que HC es, o bien verdadera, o bien falsa". Según este punto de vista, la indecidibilidad de HC sólo habla de la limitación de los axiomas elegidos. Haría falta agregar algún axioma nuevo a la teoría, alguna afirmación "verdadera" que sirva de nuevo axioma y que permita determinar si, en la realidad objetiva de los conjuntos, HC es verdadera o es falsa. (Cohen, de hecho, creía que era falsa.)

En la entrada titulada Shelock Holmes y Alef-uno me permití el atrevimiento de disentir con esa opinión de Gödel. Quiero ahora ampliar un poco mi explicación.

Vuelvo a una pregunta que hice en una entrada anterior: ¿Estuvo Harry Potter (el personaje de ficción) alguna vez en China? La respuesta es que no se sabe. A partir de los "axiomas" de Harry Potter (léase, los textos escritos por J. K. Rowling) la afirmación "Harry Potter estuvo en China" es indecidible (de la misma forma que HC es indecidible para la Teoría de Conjuntos).

Pero no hay una realidad objetiva en la que "Harry Potter estuvo en China" sea una afirmación verdadera o falsa. Harry Potter existe en una realidad ficcional creada por J. K. Rowling. Para determinar si Harry Potter estuvo, o no, en China necesitamos un nuevo axioma, un nuevo texto (oral o escrito) generado por Rowling que nos permita decidir esa cuestión.

¿Por qué el texto debe estar generado por Rowling? No sólo porque ella es la creadora del personaje, sino porque es reconocida por todos aquellos en cuyas mentes existe Harry Potter como la autoridad máxima en la vida del personaje. La verdad o falsedad sobre Harry Potter nace del consenso de los lectores de sus historias, quienes reconocen a Rowling como la referncia principal en esas cuestiones.

¿Estuvo Sherlock Holmes en China? La situación es la misma que con Harry Potter, con la diferencia de que Conan Doyle (el creador de Holmes) ya no vive, por lo que no tenemos una referencia máxima que pueda zanjar estas cuestiones de un modo que sea unánimemente aceptado. El consenso acerca de si Holmes estuvo, o no, alguna vez en China debería lograrse por un largo y difícil acuerdo entre todos aquellos en cuyas mentes vive Holmes.

Mi tesis es que algo similar a Holmes y Harry Potter ocurre con la Teoría de Conjuntos (y con otras ramas de la Matemática). La Teoría de Conjuntos, contrariamente a lo que opinaba Gödel, no describe una realidad objetiva, sino una realidad ficcional creada inicialmente por Georg Cantor (y que luego tuvo que ser modificada). Alef-uno, como Holmes, sólo "vive" en la mente de los matemáticos (diría, en la mente de los matemáticos interesados en la Teoría de Conjuntos).

(Dicho sea de paso, no hay una sola Teoría de Conjuntos, en general se le da ese nombre a la Teoría de Zermelo-Fraenkel, pero hay otras teorías de conjuntos no equivalentes a ella. Así que ¿cómo puede hablarse de una realidad objetiva?)

Imaginemos que los principales astrónomos, cosmólogos y físicos del mundo se reunieran y decretaran que el Universo no se está expandiendo. Que, de hecho, es una esfera fija de unos cuantos miles de kilómetros de diámetro con la Tierra en el centro. A pesar de eso, allá afuera, el Universo se seguiría expandiéndose alegremenre, indiferente a lo que esos astrónomos y físícos dijeran de él.

A principios del siglo XX, en la Teoría de Conjuntos, se produjo una controversia acerca de si se debía aceptar, o no, el Axioma de Elección. Nunca hubo, que yo sepa, un cónclave de matemáticos para resolver la cuestión, pero a la larga el Axioma de Elección fue aceptado y hoy en día se lo usa sin problemas en todas las demostraciones donde cuadre usarlo.

¿Qué pruebas empíricas respaldaron al Axioma de Elección? Respuesta: ninguna. No podía haber pruebas empíricas porque el Axioma de Elección, por su propia naturaleza, carece de todo correlato físico. Fue aceptado porque el consenso de los especialistas (los lectores en cuyas mentes vive la Teoría de Conjuntos) finalmente convino en aceptarlo (por razones de conveniencia o por lo que fuere, pero no por razones objetivas externas a la teoría).

Otro tanto sucede con HC. Es posible, e incluso es probable, que algún día no muy lejano se incorpore un nuevo axioma a la Teoría de Conjuntos que permita demostrar o refutar HC. ¿Qué es lo que hace que un axioma sea aceptado como "verdadero"? De la misma manera que con el Axioma de Elección, la aceptación sólo podrá surgir del consenso de los especialistas, de la misma manera que cualquier nueva verdad sobre Sherlock Holmes deberá pasar por el tamiz del consenso de sus lectores. (En el caso de la Teoría de Conjutnos, debe darse el requisito técnico de que el nuevo axioma sea comsistente con los axiomas ya existentes, pero el consenso de los especialistas es el primer requisito.)

La llamada Conjetura de Goldbach, , en adelante CG, es la conjetura (formulada por Christian Goldbach a mediados del siglo XVIII) que dice que todo número par mayor que 2 es suma de dos números primos. Hasta el día de hoy no ha sido demostrada ni refutada. Supongamos que se probara que CG es indecidible con respecto a los Axiomas de Peano (los axiomas estándar de la Aritmética). ¿Diríamos también que su verdad o falsedad vive solamente en el consenso de los especialistas? En este caso no, ya que CG sí se refiere a una realidad objetiva.

Supongamos que tengamos n piedritas. Que n sea par, quiere decir que se las puede dividir en dos grupos iguales. Que una cantidad de piedritas sea un número primo quuere decir que con ellas no se puede armar un rectángulo (salvo el trivial que consiste en una única línea de piedras). Expresa en términos de piedras, la conjetura dice que si tenemos más de dos piedritas y podemos distribuirlas en dos grupos iguales, entonces podemos también distribuirlas en dos grupos que tienen ambos una cantidad prima de piedras.

O bien esa división en dos grupos primos de piedras puede hacerse siempre, o bien no se puede hacerse siempre. CG es, en un sentido objetivo, verdadera o falsa, independientemente de que nuestros axiomas permitan, o no, demostrarla.

De modo que existe, por un lado, una "matemática ficcional" (o "ideal", o una "matemática shelockiana") en la que la verdad o la falsedad de sus afirmaciones nace solamente del consenso de los espacialistas (y de la consistencia lógica). Y, por otro lado, existe una "matemática objetiva" (o "real") que sí tiene un correlato objetivo, en el que "verdad" o "falsedad" tienen un sentido claro, preciso e independiente del consenso de los especialista. ¿Dónde trazaríamos la línea divisoria entre una y otra? ¿Acaso existirá tal línea? Por ahora, hasta ahí llegan mis reflexiones.

22.12.09

Sherlock Holmes y Alef-uno

Llamo (la denominación es puramente personal) pregunta-zen a una pregunta que tiene como propósito motivar la reflexión, una pregunta en la que no importa la respuesta en sí sino el proceo que lleva hasta esa respuesta, o las líneas colaterales de razonamiento que ese proceso genera (de hecho, dar una respuesta definitiva mata el objetivo de la pregunta).

Las preguntas de la entrada anterior tenían ese caráter de preguntas-zen. Su tema, en líneas generales, era ¿podemos atribuir propiedades a un objeto que no existe?

Por ejemplo, no existen hexágonos de cinco lados. Más aún, no puede existir, porque el concepto de "hexágono de cinco lados" es contradictorio en sí mismo. ¿Tenemos derecho a decir, entonces, que un hexágono de cinco lados es un polígono irregular? ¿Tenemos derecho a hablar de él, a atribuirle cualquier característica -aparte de la de ser contradictorio y no existir-?

Por su parte, Shelock Holmes tampoco existe, al menos en el sentido de que los relatos de Conan Doyle no describen hechos ni personas que hayan existido en la realidad. Sin embargo, todos sabemos que Holmes era inglés (o británico, si se quiere) y que, por lo tanto, la afirmación "Shelock Holmes nació en Alemania" es falsa.

Decir que "Un hexágono de cinco lados es un polígono irregular", más que falso es un sinsentido, porque habla de un objeto inexistente. Pero "Shelock Holmes nació en Alemania" es falsa y nadie diría que es un sinsentido, aunque Holmes tampoco exista.

O, podemos decir, que Holmes sí existe, no como ser humano real, sino como personaje de ficción, o como ser que "habita" en el imaginario popular (de la misma forma que Papá Noel o Harry Potter -hablo del personaje de J. Rowling, no del actor-).

Sherlock Holmes, de Baker Street, de W. S. Baring-Gould, es una "biografía" de Holmes, basada en los relatos de Conan Doyle. En algún momento el autor dice que "se puede demostrar" que tal o cual aventura de Holmes comenzó un viernes y que terminó el domingo siguiente (basado en que Watson afirma que la noche en que terminó esa aventura fueron a tal teatro a escuchar un concierto y que en esos años, en ese teatro, sólo había conciertos los domiengos, etc.).

Hay aquí una clara analogía con la Matemática. Los relatos de Conan Doyle son los "axiomas" de Holmes, a partir de los cuales podemos deducir ciertos "teoremas". De la misma forma los relatos de Rowling son los "axiomas" de Harry Potter. ¿Estuvo alguna vez Harry Potter en China? Los axiomas no permiten demostrarlo ni refutarlo. Para los axiomas de Harry Potter, es una afirmación indecidible.

En su famosa conferencia de París, de 1900, David Hilbert decía que si la definición de un objeto matemático no es contradictoria en sí misma, entonces ese objeto existe. Salgamos un centímetro de la Matemática: la frase Hilbert nos permite asegurar que, en efecto, Holmes, sin duda, existe.

¿Existe Alef-uno (el primer cardinal no numerable)? Cuando Hilbert enunció la frase que antes cité tenía en mente principalmente la Teoría de los Transfinitos de Cantor (teoría cuya validez estaba en entredicho por aquellos años). Si la definición de Alef-uno no es contradictoria, diría Hilbert en 1900 (un par de décadas después quizás lo habría pensado un poco más), entonces podemos afirmar que Alef-uno existe y que es perfectamente válido atribuirle propiedades.

Gödel fue aún más allá y años más tarde escribió que la Teoría de Conjuntos (en partircular, la Teoría de los Transfinitos) describe una realidad objetiva (independiente de la mente humana), acerca de la cual cada afirmación es, o bien verdadera, o bien falsa. La existencia de afirmaciones indecidibles se debe, dice Gödel, solamente a una limitación de los métodos de demostración, es decir, a una limitación del conocimiento humano.

Pero (si se me permite el atrevimiento) creo que Gödel se equivocaba en ese punto. Mi tesis (que algún día tal vez escribiré realmente en forma de tesis) es que Alef-uno existe tanto como existe Sherlock Holmes (o Harry Potter). Ambos tienen el mismo nivel de existencia, y por las mismas razones. Cantor creó Alef-uno de la misma manera que Conan Doyle creó a Sherlock Holmes, y así como hay axiomas de la Teoría de Conjuntos, también hay, como ya vimos, "axiomas" de Holmes. Y así como Harry Potter no vive en una realidad objetiva, de la misma manera la Teoría de los Transfinitos tampoco describe una realidad objetiva.

Más de una vez he dicho en mis clases o en charlas que la Matemática, más que una ciencia, es un arte (1). Agrego ahora: es una arte muy parecido a la literatura.

Nota:

(1) Esta afirmación suele ser rechazada por el público (alguna vez, incluso, violentamente). Probablemente el rechazo se deba a que hay quienes sienten que, al decir que es un arte, estoy menospreciando a la Matemática. En realidad la estoy enalteciendo, ya que en lo personal considero que el arte, en cuanto fruto del espíritu humano, es superior a la ciencia. Ciertamente me gusta la idea de pensar a la Matemática como hermanada con la poesía.

20.6.09

Un poco de historia

La ciudad alemana de Königsberg [1] fue testigo de varios importantes nacimientos. Allí, en 1724, nació el célebre filósofo Emmanuel Kant y fue allí también donde nació, en 1862, el brillante matemático David Hilbert. A mediados del siglo XVIII nació en Königsberg un famoso problema matemático (que habla de siete puentes que cruzan un río que atraviesa la ciudad [2Añadir imagen]) en el curso cuya resolución Leonhard Euler fundó un nuevo campo de la matemática: la teoría de grafos.

Y fue también en Königsberg donde vio por primera vez la luz el famoso Teorema de Gödel. Sucedió el 7 de septiembre de 1930 durante un congreso sobre fundamentos de la matemática, es decir, durante una reunión en la que los especialistas discutían qué es la matemática, cuál es su objeto de estudio y cuáles son sus métodos. Desde hacía más de dos décadas se venía desarrollando una ácida controversia acerca de esas cuestiones, una discusión en la que sus protagonistas sostenían posiciones aparentemente irreconciliables. En la década previa a 1930 esas posiciones irreconciliables reconocían dos claros representantes: en un rincón el ya mencionado David Hilbert, fundador de la llamada Escuela Formalista y en el otro, L.E.J. Brouwer, creador de la llamada Escuela Intuicionista.

A pesar de tanta controversia, aquél septiembre de 1930 parecía lleno de buenos augurios. En la sesión final del congreso Arend Heyting (uno de los principales discípulos de Brouwer) afirmó que la “guerra” entre los formalistas y los intuicionistas podía darse por terminada, pues si el programa propuesto por Hilbert para la matemática lograba completarse con éxito entonces los intuicionistas aceptarían gustosamente las ideas de Hilbert. En otras palabras, los intuicionistas presentaban una rendición en toda regla por lo que la larga controversia parecía llegar a su fin.

Sin embargo, en medio de tan optimistas manifestaciones un joven matemático austriaco pidió la palabra. Tímidamente este joven anunció que acababa de demostrar un teorema (que sería publicado unos meses más tarde) en el que demostraba que el programa de Hilbert, el programa formalista que todos, amigos y enemigos, acababan de aceptar gustosamente, era completamente irrealizable. Ese joven era Kurt Gödel y el teorema que estaba anunciando era, por supuesto, el hoy famoso Teorema de Incompletitud de Gödel.

¿Cómo se llegó a esa escena de 1930? ¿Por qué apenas a principios del siglo XX, después de más de dos mil quinientos años de trabajo matemático, se planteó la necesidad de definir el objeto y los métodos de esa ciencia? Para entender las respuestas a estas preguntas, así como el enunciado del Teorema de Gödel, debemos remontarnos algunos años hacia atrás en el tiempo, a la década de 1870, a la ciudad de Halle, en Alemania, lugar y tiempo en el que Georg Cantor (1845–1918) revolucionó la forma de entender el infinito.

Desde Aristóteles se entendía, tanto en filosofía como en matemática, que el infinito era inalcanzable. Por ejemplo, sabemos que hay infinitos números naturales: 0, 1, 2, 3, 4, 5,... pero según la forma de pensar de Aristóteles, la infinitud de los números significa solamente que si nos proponen cualquier número natural siempre existirá uno mayor. La imposibilidad de alcanzar el infinito implica que no hay ningún lugar (concreto o abstracto) en el que estén reunidos al mismo tiempo todos los números naturales. El infinito no existe en acto, sólo en potencia, decía Aristóteles, y en consecuencia sería un error hablar de los números como de una totalidad acabada y completa. Esta visión del infinito dominó la matemática y la filosofía a los largo de los siglos.

En 1872 Georg Cantor (nacido en San Petersburgo, aunque vivió casi toda su vida en Halle, Alemania) trabajaba en un problema relativamente menor de análisis matemático. Cantor buscaba demostrar una propiedad relativa a cierto tipo de funciones y en el transcurso de ese trabajo se encontró ante la necesidad de expresar de un modo claro y concreto algunas condiciones muy complejas, las cuales debían cumplirse para que valieran las conclusiones a las que Cantor quería llegar [4].

Se trataba en principio de un problema de lenguaje y para resolverlo Cantor inventó un nuevo concepto, el de conjunto derivado. Sin entrar en detalles, basta decir que definió un mecanismo por el cual a partir de un conjunto P de puntos se puede obtener un nuevo conjunto P’, llamado el derivado de P. A partir de P’ se obtiene a su vez un nuevo derivado P”. Y luego el derivado de P”, que es P(3), y luego P(4), P(5), etc.

Pero Cantor observó que no había motivo para detenerse y que era perfectamente posible definir P(infinito). Más aún observó también que era posible aplicar el mismo mecanismo a P(infinito) obteniendo así P(infinito + 1, P(infinito + 2), P(infinito + 3).... Es decir no sólo era posible llegar al infinito sino que inclusive era posible ir más allá de él [5].

Esta nueva forma de ver el infinito, totalmente opuesta a la que había impuesto Aristóteles, habilitó la idea de ver a los conjuntos infinitos como totalidades acabadas y completas; es decir, permitió crear la teoría de conjuntos. En los años posteriores a 1880 Cantor inició el proyecto de refundar toda la matemática sobre la base de esta teoría. Todos los demás conceptos matemáticos se definían a partir de la noción de conjunto. Así por ejemplo para Cantor el número 0 se definía como la cantidad de elementos del conjunto vacío, el número 1 sería la cantidad de elementos del conjunto formado solamente por el 0, y así sucesivamente. Todas las operaciones numéricas se definían desde las operaciones entre conjuntos.

Por la misma época Richard Dedekind (amigo y colega de Cantor) desarrolló ideas similares. Sin embargo, quien llevó más lejos la idea de fundar la matemática sobre bases conjuntistas fue Gottlob Frege quien a lo largo de casi veinte años elaboró una obra monumental en la que construyó con todo detalle un lenguaje para hablar de los conjuntos (y que es la base del actual lenguaje formal de la lógica) y a su vez, usó los conjuntos como base de la construcción de toda la matemática.

En junio de 1902 Frege acababa de enviar a la imprenta el segundo tomo de la obra fundamental de su vida cuando recibió una carta del por entonces muy joven filósofo y matemático Bertrand Russell. En esta carta Russell, que había leído el primer tomo de la obra de Frege (publicado en 1893), le señalaba un error en la misma base de su sistema.

Para Frege un conjunto es la reunión en un todo de los objetos (reales o imaginarios) que cumplen una determinada propiedad en común. Por ejemplo, la propiedad de “ser un caballo blanco” corresponde, obviamente, al conjunto formado por todos los caballos blancos. Pues bien de esta definición de la noción de conjunto Russell extrajo una contradicción [6], por lo tanto la misma noción de conjunto era contradictoria.

Frege admitió inmediatamente el error y agregó una nota adicional a su obra en la que admitía humildemente que todo el sistema por él concebido dejaba de tener validez pues se había derrumbado desde su misma base.

Ahora bien, por ese entonces la teoría de conjuntos se había transformado en una herramienta básica de la matemática y las nociones conjuntistas estaban en los cimientos de muchos nuevos desarrollos, especialmente en análisis matemático. El descubrimiento de Russell significó entonces una verdadera crisis en toda la matemática, pues si algo tan simple y natural como la noción de conjunto era contradictoria ¿cómo podía asegurarse la corrección de conceptos más complejos? Es precisamente a causa de esta crisis que a principios del siglo XX se planteó la necesidad de revisar los fundamentos de la matemática.

Ante la crisis provocada por el descubrimiento de Russell hubo inicialmente dos reacciones. Por una parte, el propio Bertrand Russell propuso rescatar el programa de Frege introduciendo en él las modificaciones que fueran necesarias para evitar todas las contradicciones posibles. Este programa fue extensamente expuesto en la obra Principia Matemática, que Russell escribió junto a Alfred Whitehead y cuyo primer tomo se publicó en 1910.

Otra reacción, contemporánea de la anterior, fue encabezada por el matemático holandés L.E.J. Brouwer. Según Brouwer era imposible evitar las contradicciones en la teoría de conjuntos y cualquier intento de reparar el sistema de Frege estaba condenado al fracaso, pues todas las contradicciones nacían simplemente de la introducción del infinito en acto. Brouwer proponía descartar la teoría de Cantor y retornar a una matemática finitista en la que el infinito, tal como quería Aristóteles, fuera inalcanzable.

Más aún, Brouwer sostenía que sólo puede decirse que un objeto matemático existe si se puede dar una receta (una serie finita de instrucciones, es decir un algoritmo) que permita construirlo en una cantidad finita de pasos a partir de los números naturales.

Un ejemplo de algoritmo:
Paso 1: asígnese al número x el valor 2.
Paso 2: asígnese a x un nuevo valor, el que resulta de promediar el valor actual de x con el valor de 2/x (2 dividido por x).
Paso 3: repítase el paso anterior 10 veces más.

Cuantas más veces se aplique el paso 3, más se acercará el valor de x al de la raíz cuadrada de 2. El algoritmo, entonces, permite construir aproximaciones sucesivas de ese número.

Brouwer decía también que sólo tiene sentido definir una propiedad si al mismo tiempo se da un método algorítmico para verificar en una cantidad finita de pasos si un objeto cumple o no esa propiedad.

Hacia 1920 el programa de Russell comenzó a desmoronarse, especialmente a causa de ciertos axiomas que éste se vio obligado a incluir, pero cuya validez resultaba ser especialmente dudosa. A causa de ello, la escuela de Brouwer comenzó a dominar el pensamiento matemático y como consecuencia la teoría de Cantor comenzó a estar en peligro de ser eliminada. Fue entonces cuando entró en escena David Hilbert.

Hilbert fue desde siempre amigo y defensor de Cantor y bajo el lema “del paraíso que Cantor creó para nosotros nadie podrá expulsarnos” decidió contrarrestar las ideas de Brouwer. Además de gran matemático, Hilbert era un gran político y por eso decidió crear una filosofía de la matemática que diera cabida al infinito en acto pero que al mismo tiempo pudiera ser aceptada por los intuicionistas, es decir por Brouwer y sus seguidores.

Los intuicionistas, dijimos, exigían que todo objeto matemático fuese construido mediante un algoritmo y que toda propiedad fuera verificada asimismo algorítmicamente. La idea central de Hilbert fue llevar esta exigencia algorítmica, de los objetos y sus propiedades, a los razonamientos.

Para Hilbert toda teoría matemática debía fundarse en axiomas, que son afirmaciones que se aceptarían como verdaderas. Todas las demás verdades de la teoría se deducirían de los axiomas mediante razonamientos o demostraciones. Estos razonamientos debían ser finitistas al estilo intuicionista, es decir, debía existir un algoritmo (una receta) que, en una cantidad finita de pasos, permitiera determinar si un razonamiento es válido o no. En palabras modernas, debería ser posible programar una computadora de tal modo que fuera capaz de decidir si un razonamiento es correcto o no.

Los axiomas podían hablar del infinito en acto, de totalidades infinitas acabadas y completas, siempre que los razonamientos para deducir otras verdades a partir de ellos fueran finitistas y siempre que, además, por esos mismos razonamientos finitstas se pudiera demostrar que no habría paradojas o contradicciones.

El Programa de Hilbert se proponía entonces refundar la matemática bajo estas especificaciones. Y tan afortunada fue la idea de Hilbert que, como ya dijimos, en 1930 los intuicionistas finalmente “se rindieron” y aceptaron su programa. Pero en 1930 fue también cuando Gödel demostró que el Programa de Hilbert era irrealizable al probar (y ése es el enunciado del Teorema de Incompletitud) que los métodos finitistas que Hilbert proponía son incapaces de demostrar todas las verdades matemáticas. En aquel dramático septiembre de 1930 el Teorema de Gödel marcó un punto crucial en la historia de la lógica matemática. Sus consecuencias han sido llevadas, no siempre justificadamente, a la filosofía, la sociología y otras ramas del saber muy alejadas de su ámbito original.

Notas:

[1] La ciudad de Königsberg ya no es alemana, ni se llama Königsberg, en la actualidad la ciudad es rusa y se llama Kaliningrado.

[2] El río se llama Pregel y en él, cuenta la historia, hay dos islas y siete puentes: un puente conecta las dos islas entre sí, dos puentes más conectan a la isla menor con cada una de las dos orillas del río, otros dos puentes conectan a la isla mayor con una de las orillas del río y los últimos dos conectan a la isla mayor con la otra orilla del río. El problema pide hallar un camino que recorra los siete puentes de Königsberg, una vez cada uno sin repetir. Leonhard Euer demostró que esa tarea es irrealizable.

[3] Había también argumentos teológicos para sostener esta idea, según estos argumentos el infinito es un concepto solamente accesible para Dios e inalcanzable para la mente finita de los humanos.

[4] El problema en el que trabajaba Cantor está bien descripto en Ferreirós y Grattan-Guiness. En último dice en su libro que el problema en el que trabajaba Cantor era muy relevante, aquí nos permitimos disentir respetuosamente con esa opinión pues entendemos que hay varias razones para afirmar que el problema era menor, es probable que al dar su opinión Grattan-Guiness se deje llevar por su admiración hacia Georg Cantor.

[5] “Fui llevado por la lógica de mis investigaciones a romper con tradiciones que había aprendido a venerar”, escribió Cantor en 1883.

[6] Observemos que el conjunto de todos los conjuntos es un miembro de sí mismo (pues al ser él mismo un conjunto es miembro del conjunto de todos los conjuntos). La contradicción, conocida como la Paradoja de Russell, surge al considerar los conjuntos que no se tienen a sí mismos entre sus propios miembros. Razonando a partir de estos objetos Russell llega a la conclusión de que la noción de conjunto que usa Frege (que es una elaboración más precisa de la que usan Cantor y Dedekind) es contradictoria.

3.10.08

El Omegón y todo eso... (Parte 12)

(A la parte 11A la parte 13)

La (mal llamada) Paradoja de Burali–Forti

En las últimas entradas hemos venido desarrollando la teoría de los ordinales tal como Cantor la concibió (y tal como él mismo la expuso, principalmente en sendos artículos publicados en 1883, 1895 y 1897 respectivamente). Vamos a ver ahora que la teoría de Cantor es inconsistente, es decir, que las definiciones y resultados que hemos venido exponiendo conducen a una contradicción lógica.

Hemos dicho que a todo conjunto bien ordenado le corresponde un ordinal. Ahora bien, el conjunto de todos los ordinales es bien ordenado y por lo tanto le corresponde también un ordinal, llamémoslo $\alpha $.

Sea ahora $\beta $ un ordinal cualquiera. Como S($\beta $) es un subconjunto del conjunto de todos los ordinales entonces $\alpha $ es mayor que el ordinal de S($\beta $). Pero a su vez el ordinal de S($\beta $) es, según hemos demostrado, el mismo $\beta $ y entonces $\beta <\alpha $. Como $\beta $ era un ordinal cualquiera, hemos probado que $\alpha $ es mayor que cualquier otro ordinal y en particular, $\alpha $ es mayor que $\alpha +1$.

Pero al mismo tiempo $\alpha $ es menor que $\alpha +1$ (porque todo ordinal es menor que su sucesor). Esto es imposible pues hemos probado que no puede suceder que $\gamma <\delta $ y $\delta <\gamma $ al mismo tiempo (donde $\gamma $ y $\delta $ son ordinales cualesquiera). Tenemos aquí la contradicción, es decir, la teoría de los ordinales, tal como la hemos venido desarrollando, es inconsistente.

Esta contradicción aparece en el listado de paradojas de la Lógica y la Teoría de Conjuntos que Bertrand Russell expone en los primeros capítulos de Principia Matemática (libro escrito por Bertrand Russell y Alfred Whitehead a principios del siglo XX). En esa recopilación Russell le atribuye el descubrimiento de la paradoja a Césare Burali-Forti y es así que desde entonces es conocida como la Paradoja de Burali-Forti.

La atribución de Russell, sin embargo, no es exacta. Es verdad que en 1897 el matemático italiano Césare Burali-Forti publicó un artículo en el que consideraba el ordinal del conjunto de todos los ordinales y llegaba a la conclusión de que este ordinal tenía que ser al mismo tiempo mayor y menor que su sucesor. Pero Burali-Forti no deducía de ello que la teoría de Cantor era contradictoria. Su conclusión era que Cantor se equivocaba al afirmar (tal como había hecho en 1895) que, dados dos ordinales, siempre sucedía que uno de ellos era mayor que el otro. Según Burali-Forti debían de existir pares de ordinales que no fueran comparables entre sí.

Más aún, Burali-Forti usa en su artículo una definición errónea del concepto de conjunto bien ordenado. Tal vez él mismo se dio cuenta posteriormente de este error, o tal vez alguien más se lo hizo notar, pero el caso es que meses después de su artículo original el propio Burali-Forti publicó un anexo en el que reconocía su error y agregaba que si se tomara la definición correcta de conjunto bien ordenado entonces la contradicción tal vez desapareciera. De modo que no parece correcta la afirmación de que Burali-Forti halló una contradicción en la teoría de Cantor.

Ahora bien, sí hubo quien halló esa contradicción, y que además la halló antes que Burali-Forti: el primero en descubrir la Paradoja de Burali-Forti fue nada menos que el propio Georg Cantor, quien la expuso en varias cartas intercambiadas con Richard Dedekind y David Hilbert en el año 1895.

Hay que decir antes que nada que Cantor no sintió preocupación al descubrir la paradoja, muy por el contrario, puede decirse que sintió alegría. Veamos por qué:

Como ya dijimos alguna vez, a lo largo de casi toda la historia del pensamiento humano (al menos desde Aristóteles y hasta fines del siglo XIX) la idea de que fuera posible concebir o estudiar el infinito fue unánimemente rechazada. Una razón no menor para este rechazo era de orden teológico: el hombre es un ser finito que sólo puede conocer la finitud y el conocimiento de la infinitud está reservado exclusivamente a Dios. Pretender que el hombre es capaz de conocer el infinito era considerado una herejía. Ahora bien, Cantor era un hombre profundamente religioso y esta idea pesaba en su ánimo al desarrollar la teoría de los conjuntos infinitos.

El descubrimiento de la paradoja del ordinal del conjunto de todos los ordinales hizo que Cantor se reconciliara con esa visión teológica. Según él lo entendía, el descubrimiento de la paradoja indicaba que al considerar el ordinal de todos los ordinales se llegaba a una parte de la teoría que estaba reservada a Dios y que la paradoja era una consecuencia del hecho de que nuestra mente finita no podía aprehender esa parte de la teoría.

Cantor tenía la idea de que su teoría de conjuntos tenía tres niveles o jerarquías: por una parte estarían los conjuntos finitos; en segundo lugar estarían los conjuntos transfinitos, algo así como conjuntos infinitos de menor cuantía, accesibles al entendimiento humano. Por último estarían los absolutos (o El Absoluto), formado por conjuntos infinitos “más grandes” (como el conjunto de todos los ordinales o el conjunto de todos los conjuntos) cuyo conocimiento estaría reservado a Dios y que serían inaccesibles a la mente humana, por este motivo, cuando queremos razonar acerca de ellos se nos aparecen como inconsistentes. De esta forma Cantor reconcilia su teoría con la objeción teológica, pues aún habría conceptos reservados a Dios.

En 1895, en su correspondencia con Dedekind y Hilbert, Cantor habla de “conjuntos consistentes” y “conjuntos inconsistentes”. Una serie de individuos forma un conjunto inconsistente si estos individuos no pueden reunirse en una totalidad, pues si se considera el conjunto formado por todos ellos se llega a una contradicción (tal el caso, por supuesto, del conjunto de todos los ordinales). Cantor llega incluso a demostrar el siguiente “teorema”: si A es coordinable con B y A es inconsistente entonces B también es inconsistente.

¿Es válido ese enunciado? ¿Es correcto razonar sobre conjuntos cuya definición dice que al razonar sobre ellos se llega a una contradicción? ¿Es válida una definición así? Aunque el libro del que he leído las cartas de Cantor (véase la nota bibliográfica más abajo) no reproduce las respuestas de Hilbert ni de Dedekind, queda claro de lo que Cantor escribe que ninguno de los otros dos encontraban plausible la idea de los “conjuntos inconsistentes”. Hay que decir que en realidad esta idea de Cantor nunca fue aceptada y que la Teoría de Conjuntos tuvo que se modificada para eliminar la paradoja de Burali-Forti (y otras halladas después, como la Paradoja de Russell). La solución finalmente aceptada (al menos hasta ahora) es el resultado del trabajo de muchos matemáticos (E. Zermelo, A. Fraenkel entre otros) y será el tema de la entrada siguiente.

Notas históricas:

1) Muy probablemente ya en 1883 Cantor tenía al menos alguna intuición acerca de la paradoja del ordinal de todos los ordinales. En su artículo de ese año Cantor da una primera definición constructiva del concepto de ordinal. Los ordinales, según Cantor, se crearían según dos reglas de formación (una: cada ordinal tiene un sucesor, y dos: toda sucesión de ordinales tiene uno que es más grande que todos ellos). Pero a esas dos reglas le agrega una tercera, una regla de limitación, cuyo enunciado no es muy claro (y que nunca es usada en el artículo). Según esta tercera regla en algunos casos no sería posible crear un nuevo ordinal a partir de otros dados previamente. Probablemente Cantor ya sabía (o intuía) que surgirían problemas al considerar ordinales de conjuntos “muy grandes”.

2) En 1897 Gottlob Frege estaba en plena tarea de fundar la Aritmética en la Teoría de Conjuntos. Cuenta la historia que en el Primer Congreso Internacional de Matemáticas celebrado en Suiza en ese año Hilbert le contó a Frege acerca de la (después conocida como) Paradoja de Burali-Forti. Frege, que le criticaba a Cantor la imprecisión del lenguaje que usaba, consideró que un lenguaje más preciso haría que la paradoja desapareciera por sí misma. Cinco años más tarde Russell le escribía a Frege una carta en la que le comunicaba la hoy conocida como Paradoja de Russell. Después de leer esta carta Frege consideró que todo su trabajo de años se había derrumbado por completo desde su misma base. De haberle prestado más atención a Hilbert, tal vez Frege se habría ahorrado cinco años de trabajo.

Notas bibliográficas:

1) El artículo original de Burali-Forti junto con la aclaración posterior así como la carta de Russell a Frege y la respuesta de éste aparecen reproducidos en el libro de Jean van HEIJENOORT (Compilador), “From Frege to Gödel. (A source book in mathematical logic, 1879 – 1931)”, Harvard University Press, 1977.

2) El artículo original del Cantor de 1883 y parte de la correspondencia de Cantor con Dedekind y Hilbert puede verse en el libro “Fundamentos para una Teoría General de Conjuntos. Escritos y correspondencia selecta”, compilado José Ferreirós, Crítica, 2006.

3) Los artículos de Cantor de 1895 y 1897 están reproducidos en “Contributions to the founding of the theory of transfinite numbers”, Dover Publications Inc., Nueva York, 1955.

(A la parte 11A la parte 13)