La explosión de la inteligencia artificial a la mano

La explosión de la inteligencia artificial a la mano
IAlsv.jpg

En 2022 las herramientas de inteligencia artificial (IA) accesibles para las personas tuvieron un salto cuántico que anticipa avances aún más impresionantes este año.

Desde aplicaciones que convierten fotos en diseños artísticos hasta un chat que puede escribir una columna para un medio de comunicación. “La IA es la capacidad de las máquinas para usar algoritmos, aprender de los datos y utilizar lo aprendido en la toma de decisiones tal y como lo haría un ser humano”, se lee en el libro Inteligencia Artificial: 101 cosas que debes saber hoy sobre nuestro futuro (2018) del autor Lasse Rouhiainen, experto en inteligencia artificial.

La idea de que un sistema pueda tomar decisiones, aprender y razonar, sin intervención humana, se viene discutiendo desde la década de 1950. Pero solo hasta hace unos años ha saltado de la teoría a áreas comerciales (como en los chatbot), pero también en los celulares inteligentes con el reconocimiento de voz de Siri o de Google.

En 2022 el término ganó mayor difusión gracias a aplicaciones y programas de inteligencia artificial accesibles a cualquier persona con una conexión de internet. Aplicaciones que pueden hacer cosas impresionantes. Por eso terminaron siendo replicadas en redes sociales. Incluyendo en Colombia artistas famosos y el alcalde Daniel Quintero, entre otros.

Sin embargo, se trata de una revolución tecnológica que, sin entrar a la discusión filosófica de la singularidad tecnológica, sobre qué pasará cuando las máquinas adquieran conciencia e inteligencia similar a la humana, tiene ya implicaciones. 

¿Pueden seguir siendo los ensayos mecanismos de evaluación académica, cuando ya hay un robot que los hace de cero y puede entregarlos en segundos? ¿Quién debe ser el responsable si un robot produce una respuesta que induce a alguien a hacerse daño? ¿Qué valor se le puede dar al arte que crean las máquinas? ¿Deben las redacciones de periodistas empezar a usar robots para los trabajos de redacción más básicos?

Mientras se zanjan esas discusiones, acá cuatro herramientas populares que dejó el 2022 para que las personas interactúen con los últimos avances en Inteligencia Artificial. 

ChatGPT: hable con un robot y hasta construya un artículo

Este programa permite a cualquier persona chatear en tiempo real y recibir respuestas bien estructuradas sobre diversos temas. Fue lanzada el 30 de noviembre de 2022, y cinco días después ya tenía un millón de usuarios.

Para usarlo solo hay que ir a su página web, crear una cuenta y empezar a preguntarle cosas.

La siguiente definición está construida con las respuestas que dio el mismo ChatGPT.

Chat GPT es un modelo de lenguaje grande entrenado por OpenAI, empresa de investigación en inteligencia artificial (IA) fundada en 2015 por un grupo de inversores y empresarios, entre ellos Elon Musk.

Un modelo de lenguaje es un tipo de modelo de inteligencia artificial que se entrena para realizar tareas relacionadas con el lenguaje, como el procesamiento del lenguaje natural o la traducción de idiomas. Los modelos de lenguaje se basan en el aprendizaje automático y se entrenan usando grandes cantidades de datos.

Chat GPT es un programa de ordenador diseñado para ayudar a las personas a hacer preguntas y proporcionar respuestas precisas y útiles a través del uso del lenguaje natural sobre una amplia variedad de temas, desde conceptos científicos y matemáticos hasta temas culturales y de actualidad.


Como lo mostró Andrés Caro en su columna para La Silla, el sistema es capaz de generar artículos sobre temas como la paz, los derechos humanos e incluso escribir un poema sobre los riesgos de ese chat para Colombia. Lo mismo han mostrado usuarios en Twitter:

Para probar otra función, La Silla Vacía le pidió al Chat que le pusiera títulos a algunos artículos introduciendo solo la introducción. Estas fueron sus respuestas:

También se le pidió que contara un chiste sobre periodismo, uno sobre política y otro sobre Colombia y aunque lo logra ese tipo de ejercicios muestran sus talentos aún limitados: 

Chiste periodista CHATGPT.PNG
Chiste política CHATGPT.PNG
Chiste Colombia CHATGPT.PNG

OpenAI dice que entre las capacidades de ChatGPT está la de declinar requerimientos inapropiados, de recordar lo que el usuario dijo en la conversación y permitir que el usuario haga correcciones de seguimiento. Y entre sus limitaciones están: generar información incorrecta, producir instrucciones dañinas o contenido sesgado y tener conocimiento limitado del mundo y eventos después del 2021.

Al preguntarle a ChatGPT por sus riesgos, los enlistó: generación de contenido peligroso o inapropiado, propagación de información falsa, estrés o carga adicional para los trabajadores y desplazamiento de empleos.

La aplicación, además, ya ha presentado errores.

Es por esta razón, argumentó Jeff Dean, jefe de inteligencia artificial de Google, que aún la compañía daba pasos conservadores en esa dirección ya que tenían más que perder a nivel reputacional. De todas formas, su director, Sundar Pichai, dijo que tenía “mucho” planeado para 2023 y que puede ser un “punto de inflexión” en el uso de Inteligencia Artificial para conversaciones y búsquedas.

Para competirle, existe el buscador You.com, que ya incorpora herramientas de inteligencia artificial que permiten generar texto, código e imágenes.

En todo caso, Google ya tendría desarrollado su propio modelo de lenguaje: LaMDA, pero no ha salido al público. Este analiza 137 mil millones de parámetros para saber qué respuesta dar. En junio un empleado dijo que la plataforma tendría conciencia propia, pero Google desmintió esas afirmaciones y despidió al empleado. Eso propició más el debate sobre los sentimientos o conciencia que pueden llegar a tener estos modelos.

“Ninguno de estos sistemas tiene comprensión semántica. No entienden la conversación. Son como loros digitales. Somos nosotros quienes le damos el sentido al texto”, le dijo a El País Ramón López de Mántaras, director del Instituto de Investigación de Inteligencia Artificial (IIIA), adscrito al Ministerio de Ciencia de España.

ChatGPT lo reconoce cuando se le pregunta: “No tengo conciencia propia. Soy capaz de procesar y responder a preguntas y comandos de manera automatizada, pero no tengo la capacidad de tener experiencias, sentimientos o percepciones de manera autónoma”.

Dall·E-2: produzca imágenes con un texto

Es un sistema de inteligencia artificial publicado en enero de 2022 también por la empresa OpenAI. Permite crear imágenes a partir de una corta descripción en texto. Es una versión mejorada de Dall·E, lanzada en enero de 2021. 

La explosión de la inteligencia artificial a la mano
Periodista VanGogh.jpg

Resultado de: “Periodista trabajando en su oficina, al estilo Van Gogh”.

En esta actualización, la empresa dice que perfeccionó la resolución de las imágenes, mejoró su comprensión y le agregó funciones de edición. También, dice OpenAI, limitó la habilidad de este sistema de generar imágenes violentas, de odio o para adultos.

Según la misma empresa, Dall·E-2 “fue creada entrenando una red neuronal - técnica de inteligencia artificial que intenta replicar el funcionamiento del cerebro- con imágenes y sus descripciones en texto”. Con IA permite que haga relaciones entre distintos objetos y pueda generar una sola imagen a partir de diferentes características. 

La explosión de la inteligencia artificial a la mano
Astronauta.jpg

Resultado de: “Un astronauta con traje rosado en un barco que se hunde”.

La plataforma solo estaba disponible en principio para “un número limitado de usuarios confiables”, luego añadieron una versión beta en julio de 2022 y finalmente quedó abierta al público en septiembre.

Para usarla solo debe ingresar a esta página, crear una cuenta y luego introducir una descripción de la imagen que quiere generar. Dall·E-2 le generará cuatro versiones de su descripción. Luego, podrá seleccionar una y que le muestre variaciones y hasta podrá modificar partes específicas de la imagen. 

La explosión de la inteligencia artificial a la mano
ElefantesIA.jpg

Resultados para: “Un elefante en medio de la nieve montando un monopatín en estilo 3D”.

Hay múltiples plataformas que también generan imágenes a partir de texto, como Geniverse, Hotpot, DreamStudio, Deep AI y Starrayai. También Google, con Imagen y Parti, pero las ha mantenido fuera del público por el momento. Lo mismo pasa con Nuwa Infinity, de Microsoft, que incluso podría convertir imágenes en video.

Lensa: cree ilustraciones a partir de fotos

Lensa es la última herramienta popular en redes sociales. Es una aplicación disponible en iPhone y Android de edición de fotos. La aplicación fue creada en 2018 por Prisma Labs, pero ganó popularidad en las últimas semanas con su función de “avatares mágicos”. Esta permite subir entre 10 y 20 fotos y al cabo de 20 minutos devuelve 55 retratos artísticos.

La usamos con 10 fotos del presidente Gustavo Petro y estos fueron algunos de los resultados:

Petro4AI.jpg
Petro3AI.jpg
Petro2AI.jpg
Petro1AI.jpg

Varios famosos como el cantante Sebastián Yatra y políticos como el alcalde de Medellín, Daniel Quintero, y la alcaldesa de la ciudad de México también han usado esta aplicación.

Los usuarios pueden descargar gratuitamente la aplicación en el celular. Sin embargo, la función de “avateres mágicos” no lo es. Cada paquete de 55 imágenes cuesta 19.500 pesos.

La aplicación opera bajo el modelo de open source de Difusión Estable (Stable Diffusion en inglés), que se entrena con millones de imágenes en internet y con las fotos que suben los usuarios para generar los avatares.

Por el uso de ese modelo la aplicación ha recibido críticas por parte de artistas que denuncian un uso no consentido ni remunerado de sus obras para beneficio de la aplicación. Para la última versión del modelo de Difusión Estable, según MIT Technology Review, “los artistas podrán seleccionar qué obras desean excluir de los datos de capacitación”.

En materia de privacidad, la aplicación aclara: “las fotos serán borradas inmediatamente de nuestros servidores luego de que los avatares estén listos”. 

De todas formas, y con el consentimiento del usuario, utiliza otro tipo de información personal para mejorar la experiencia de la aplicación. Y, además, comparte esta información (como la información del celular y detalles de compras en la aplicación) “con fines promocionales y de marketing a nuestros socios publicitarios (por ejemplo: AppsFlyer y Meta)”, se lee en su política de privacidad.

Esta no es la única aplicación que usa imágenes para convertirlas en diseños creativos. NewProfilePic, lanzada en abril de 2022, convierte una foto en una caricatura o imagen artística. 

Las de TikTok: cree su avatar de anime con una imagen

En Tiktok también se han viralizado funciones que utilizan inteligencia artificial.

Una de estas fue estrenada en agosto y hoy ya ha sido usada en más de 16 millones de videos. Se llama AI Greenscreen (en español Pantalla verde con inteligencia artificial). A partir de una pequeña frase que el usuario escribe, el filtro entrega una imagen. Sin embargo, la función no es tan avanzada como Dall·E-2, sino que produce imágenes abstractas. 

Otra función es AI ART, y permite subir una imágen o tomarse una foto y luego la transforma en una pintura. Esta función ya ha sido usada en 13 millones de videos. Hicimos un ejemplo con una foto del equipo de La Silla Vacía.

La explosión de la inteligencia artificial a la mano
WhatsApp Image 2022-12-20 at 11.33.12 AM.jpeg

La otra función, más popular que la anterior, se llama AI Manga. Ha sido usada en 80 millones de videos. La usamos con fotos de algunos políticos:

La explosión de la inteligencia artificial a la mano
IA Anime LSV.jpeg

Para usar esta herramienta solo debe instalar TikTok y buscar entre los filtros disponibles “AI ART” o “AI Manga”. Luego subir o tomarse una foto y esperar unos segundos. 

Compartir