Desde que ChatGPT (Generative Pre-trained Transformer) de la compañía Open-AI irrumpió en 2022, los cimientos de la educación, al menos como la conocemos, han temblado. Frecuentemente, oigo de colegas que la labor del profesor tiene los días contados, puesto que los estudiantes ya tienen prácticamente todas sus tareas resueltas. 

Para entender un poco del contexto, a este tipo de inteligencia artificial se le conoce como Large language Models (LLM). Estos LLM utilizan redes neuronales, un modelo computacional que “aprende” de ejemplos. Los ejemplos se codifican (por ejemplo, una imagen se codifica en una matriz de píxeles) y se alimentan en lotes o en secuencia al computador. 

La red neuronal a su vez ajusta unos parámetros propios de forma tal que se minimice un “error”. Dicho error es la diferencia entre lo que es la realidad (ej. una imagen que sabemos con certeza que es un perro) y lo que predice la red (que puede o no ser un perro).  Adicionalmente, la red neuronal puede dar una probabilidad de acierto. 

Por ejemplo, la red podría predecir con un 90% de probabilidad que una imagen que no ha visto es un perro, con un 8% que es un lobo y con un 2% que es un zorro. Los LLM hacen algo similar: los datos de entrenamiento o “corpus” del LLM provienen de muchas fuentes. 

La que utiliza ChatGPT proviene de Common Crawl, una plataforma que mantiene un repositorio público de datos que pueden usarse libremente. Common Crawl usa datos de textos, páginas web y metadatos. En el caso de ChatGPT 4, el número de datos de entrenamiento está en el orden de los trillones.  

ChatGPT recibe como datos de entrada las preguntas de los usuarios y mediante dicha red neuronal “predice” la respuesta a las preguntas de los usuarios. Como la respuesta es probabilística, es posible regenerar tantas veces la respuesta como se requiera. Obviamente, las probabilidades dependen del aprendizaje que haya tenido el algoritmo. 

Por ejemplo: le pedí a ChatGPT que completara la frase “agua que no has de beber…” y que me diera una lista de los mejores tres ciclistas de la historia. Corrí varias veces el algoritmo con ambas preguntas.

En el primer caso, la respuesta fue siempre la misma: “déjala correr”; en el segundo caso las respuestas variaron: Merckx siempre estuvo en la lista (y de primero), pero los nombres de Induráin, Armstrong (¿?), Hinault y Coppi aparecían en diferentes órdenes.

Un modelo de estos es tan bueno como los datos con que se entrene. Y aquí yacen sus principales limitaciones: por ejemplo, solo un 15% de las personas que alimentan la enciclopedia electrónica Wikipedia son mujeres, el 60% de los artículos de Reddit son escritos por personas de raza blanca y menores de 30 años (Sánchez-García & Gesser, 2022). 

Pero volvamos al asunto de este artículo que es el futuro de la educación: ChatGPT puede generar en segundos textos como respuesta a muchas tareas escolares y universitarias. Por ejemplo, puede pedírsele “Escriba una sinopsis sobre Cien Años de Soledad”, y puede hacerse de forma que parezca escrita por un estudiante de secundaria, agregando el texto “hecha por un estudiante colombiano de 12 años”. 

¿Y qué tal algo de álgebra de secundaria? Le pregunté a ChatGPT: “factoriza a+b al cuadrado”.  

La respuesta fue: “La factorización de la expresión (a + b)^2 se puede hacer aplicando la fórmula para el cuadrado de un binomio:(a + b)^2 = a^2 + 2ab + b^2. Entonces, la factorización de (a + b)^2 es: a^2 + 2ab + b^2”. Esta respuesta es obviamente correcta.

O puede escribir la respuesta a una tarea de programación de computadores: “Escribe el código en el lenguaje Python para ordenar una lista de personas en orden alfabético”.

Entonces este “monstruo” ha creado un desafío enorme para la educación: ¿van a desaparecer los colegios y universidades?, ¿a qué irían los niños a los colegios? ¿Simplemente a socializar y jugar con sus compañeros? En mi opinión, no hay que temerles a estas herramientas. Algo similar pasó con la calculadora y el computador. 

Lo que sí es cierto es que la educación basada en transmisión de conocimiento tiene que cambiar. ¿Para qué necesitamos sabernos las capitales de todos los países del mundo? ¿O los nombres de todos los presidentes del país del siglo XX?  Este tipo de conocimiento desarrolla pocas capacidades en los estudiantes, más allá de ser un ejercicio de memorización. 

Es cierto que uno tiene que recordar ciertos datos y saber ciertas cosas, por ejemplo, uno no puede crear conciencia de país y sentimientos patrióticos si no conoce algo de su historia. Pero en lugar de tener que recodar que Simón Bolívar nació un 24 de julio de 1883 en Caracas, Venezuela, podríamos generar discusiones sobre el contexto de la independencia en América, aun con niños. 

En educación sabemos que, la mayoría de las veces, es más importante hacer buenas preguntas que saber las respuestas.

Para mí las posibilidades que se abren son infinitas, y si utilizamos bien estas herramientas podremos generar unas estrategias de aprendizaje muy interesantes. Por ejemplo, dejar que los estudiantes hagan preguntas y que, a la luz de las respuestas del LLM, se evalúe al estudiante. Por ejemplo, preguntarle a los LLM sobre los errores de Bolívar en la campaña libertadora y elaborar sobre ello. 

He aquí uno de los ítems de la respuesta de ChatGPT a esta pregunta:

“Conflictos políticos internos: Bolívar también enfrentó desafíos en términos de mantener la cohesión política en los territorios liberados. Hubo tensiones y conflictos internos en las nuevas naciones, lo que a veces debilitó la estabilidad de la región.”

Sobre esto, le pedí más información. He aquí un fragmento de la respuesta:

“Conflictos ideológicos: dentro de los movimientos independentistas, surgieron diferentes visiones ideológicas y políticas. Bolívar, por ejemplo, promovió la idea de una república centralizada, mientras que otros líderes, como Francisco de Paula Santander, abogaban por un modelo federal con mayor autonomía regional. Estos desacuerdos llevaron a conflictos políticos internos y divisiones.”

Y aquí hay infinidad de posibilidades: el profesor podría ahora pedir que el estudiante profundice sobre el modelo federal y el central en la época de Bolívar, o que haga una presentación sobre los conflictos internos. Y esto es más enriquecedor.

Además, como dice un colega mío, podemos dejar de lado ese “aprendizaje industrial” donde todos deben aprender lo mismo y al mismo tiempo sin tener en cuenta las particularidades de cada persona. Esto es un gran avance.

Es profesor asociado de la Universidad de la Sabana. Se doctoró en ingeniería industrial en Lehigh University. Sus áreas de interés son las políticas públicas de abastecimiento alimentario, el futuro de las tiendas de barrio, y el rol de las nuevas tecnologías (industria 4.0, inteligencia artificial,...