La inteligencia artificial generativa como interfaz universal
Actualidad Inteligencia artificial 18/04/23 Esteban Knöbl 4 min de lectura
Pareciera que estamos yendo hacia un futuro en el que mucho de lo que hacemos ⏤tanto dentro como fuera de un entorno digital⏤ se hará a través de conversaciones con una inteligencia artificial.
La inteligencia artificial (IA) es una de las tecnologías más disruptivas y prometedoras de la actualidad. Algo que parecía reservado para el futuro, pero que recientemente ha dado un salto cuyo impacto en nuestras vidas aún no llegamos a comprender del todo.
No es que antes no hubiera IA en nuestro día a día. Todo lo contrario: la inteligencia artificial está presente desde hace ya muchos años en muchas aplicaciones y aparatos que usamos a diario, como el GPS, las redes sociales o los servicios de streaming. FaceApp, la aplicación que fue furor en el 2019, también aplicaba inteligencia artificial para mostrarte cómo podría verse tu cara de viejo. Y la lista sigue.
Sin embargo, ChatGPT lo cambió todo. Su lanzamiento como beta pública en noviembre del 2022 en seguida generó gran interés y admiración por su capacidad para producir respuestas coherentes, fluidas y divertidas a cualquier tipo de consulta o comentario. De hecho, se convirtió en la aplicación de más rápido crecimiento de la historia, alcanzando los cien millones de usuarios en tan solo dos meses.
Cómo funciona la inteligencia artificial generativa
Dentro del campo de la IA, existe una rama que se enfoca en la generación de contenido original a partir de datos existentes: la inteligencia artificial generativa (IAG). La IAG utiliza algoritmos y redes neuronales avanzadas para aprender de un enorme conjunto de datos y luego generar contenido nuevo y único, en forma de imágenes, video, música o texto, prácticamente sin intervención humana. Hoy en día, el ejemplo más conocido de esta tecnología es precisamente ChatGPT.
Pero, ¿cómo funciona realmente?
La inteligencia artificial generativa se basa en métodos de aprendizaje automático profundo o deep learning. Su funcionamiento pasa por recopilar información sobre determinados elementos que después servirán a la máquina para generar otras ideas.
Para crear estos contenidos, la IAG utiliza lo que se conoce como redes neuronales generativas antagónicas, un sistema que parte de dos redes neuronales artificiales para generar nuevos datos similares a los existentes. Una de las redes, llamada "generador", crea datos sintéticos que se parecen a los datos de entrenamiento, mientras que la otra red, llamada "discriminador", evalúa los datos generados y decide si son lo suficientemente similares a los datos reales.
Durante el entrenamiento, el generador ajusta su salida para engañar al discriminador, mientras que el discriminador se entrena para identificar los datos falsos del generador. Este proceso se repite muchas veces hasta que el generador es capaz de crear datos que son indistinguibles de los datos reales.
ChatGPT y otros sistemas como Midjourney se basan en este sistema para crear contenido preciso y, a la vez, original. Sin embargo, como ya hemos visto durante los últimos meses, los modelos basados en IAG también pueden generar contenido falso, algo que comúnmente se conoce como “alucinación”. En ese sentido, la minimización de estos errores es uno de los objetivos más importantes y urgentes de las compañías que lideran la investigación y el desarrollo de los sistemas de IAG.
Una interfaz universal
Sin dudas, la inteligencia artificial generativa tiene un enorme potencial para aplicarse en diversos campos y sectores. De hecho, a pesar de tratarse de una tecnología con mucho desarrollo por delante, cada vez más empresas la utilizan para sus negocios. Pero su potencial va mucho más allá que la generación a demanda de textos, videos o imágenes.
La IAG se está convirtiendo en una interfaz universal que los usuarios pueden usar para interactuar en lenguaje natural con cualquier tipo de sistema, poniendo a disposición de mucha más gente un sinnúmero de capacidades y herramientas que, de otro modo, resultarían difíciles de abordar debido a su complejidad.
Por poner un ejemplo: nuestro partner HubSpot anunció recientemente dos nuevos desarrollos: ChatSpot.ai y Content Assistant. El primero es un chatbot basado en ChatGPT que se integra al CRM de HubSpot para simplificar enormemente los flujos de trabajo, permitiendo a los usuarios usar el sistema a través de lenguaje natural. Es decir, que en breve será posible pedirle a la plataforma (a través de un mensaje de texto o de voz) que realice cualquiera de las acciones que habitualmente haríamos navegando a través del sistema, como agregar un contacto, crear un workflow, o hacer una búsqueda de palabras clave.
Algo similar está haciendo Microsoft con Copilot en Dynamics y Office (entre otros), conectando el potencial de ChatGPT con las capacidades de sus productos. Copilot combina el poder de los modelos de lenguaje basados en IAG con los datos en Microsoft Graph (que contiene calendarios, correos electrónicos, chats, documentos, reuniones y más) y las aplicaciones para hacer que las palabras sean "la herramienta de productividad más poderosa del planeta".
Muchas otras compañías están haciendo lo mismo. Y no falta mucho para que los asistentes digitales como Google Assistant, Siri o Alexa se vuelvan realmente competentes gracias a la IAG.
Es difícil saber con exactitud hasta dónde avanzará todo esto. Pero pareciera que estamos yendo hacia un futuro en el que mucho de lo que hacemos ⏤tanto dentro como fuera de un entorno digital⏤ se hará a través de conversaciones con una inteligencia artificial.
Ello traerá muchos desafíos, sobre todo en el ámbito laboral. Aunque, probablemente, más que dejarnos a todos sin trabajo, lo que hará es poner la vara más alta a la hora de hacer un producto o prestar un servicio de calidad. De ahí surgirán nuevas oportunidades que habrá que saber capitalizar.
Por lo pronto, una de las mejores cosas que las empresas pueden hacer es involucrarse de lleno en este mundo, y capacitar a su gente para que puedan extraer el máximo valor de esta tecnología. Los usuarios tenemos que tratar de entender lo mejor posible qué posibilidades reales ofrece y qué limitaciones tiene.
También es indispensable hacerse algunas preguntas: ¿cuáles son los riesgos del camino que estamos transitando, y qué se está haciendo para mitigarlos? ¿Quiénes son los dueños de esta tecnología y por qué? ¿Cómo se regula? ¿Es posible crear un producto como ChatGPT que no sea privado? ¿Tiene sentido?
Las respuestas posibles son muchas y dan lugar a mucho debate. Pero en ese ir y venir, creo, nos vamos preparando mejor para lo que nos espera.