Introducción
La Inteligencia Artificial (IA) generativa es un tipo de IA que es capaz de crear contenido nuevo (imágenes, texto, audio, video) de acuerdo a las indicaciones solicitadas por el usuario. Puede ser de ayuda para aumentar la creatividad, productividad y conocimiento.
En este artículo, se describirá información sobre la IA generativa, incluidos los siguientes temas:
Inicios del concepto IA
¿Pueden las máquinas pensar? Esta fue una pregunta que el matemático Alan Turing se hizo en la década de 1950. Los artículos de Turing en relación a la “Maquinaria e Inteligencia Informática” se consideran pioneros en la IA e intentan responder la incógnita sobre si las computadoras son capaces de pensar y actuar como un ser humano. De eso se trata una IA, de resolver problemas comunes al igual que las personas.
De acuerdo con el sitio web de Google Cloud, la inteligencia artificial Generativa (IAG) hace referencia al uso de la IA que se encarga de crear ideas y contenidos nuevos, imágenes, música, audio e incluso videos.
Este tipo de inteligencia artificial utiliza grandes modelos de IA que pueden trabajar en varias labores y llevar a cabo tareas preconfiguradas. Son capaces de imitar la inteligencia humana en tareas informáticas no tradicionales, como el reconocimiento de imágenes, el procesamiento de lenguaje natural y las traducciones instantáneas de un idioma a otro.
Si bien Turing y sus predecesores comenzaron a investigar las IA ya en el siglo XX con resultados trascendentales, no fue hasta la llegada de ChatGPT cuando el tema cobró una relevancia tal que generó sentimientos y sensaciones de lo más variadas en todo el mundo. ChatGPT es una aplicación de ChatBot desarrollado por OpenAI en 2022 que utiliza un modelo de lenguaje ajustado con técnicas de aprendizaje para responder toda clase de preguntas y pedidos.
Qué es la IA generativa y cómo funciona
Como toda inteligencia artificial, ésta funciona mediante un procedimiento llamado Machine Learning, un modelo de aprendizaje que se entrena con la incorporación de grandes cantidades de datos en su sistema operativo. Con esta información, la IA es capaz de procesar y poner en común esos datos para resolver toda clase de tareas que le soliciten.
Desde una perspectiva matemática, los modelos de Machine Learning funcionan como ecuaciones, asignando numéricamente datos conocidos y desconocidos a las variables X e Y. En lugar de imágenes, la IA reconoce píxeles, vibraciones, patrones de color y formas; las interrelaciona con otros datos para generar una variable de la misma.
Luego de comprender esta definición general, el funcionamiento de las IAG puede clasificarse en dos modelos distintos, los cuales la empresa de servicios de computación Amazon Web Services clasifica de la siguiente forma:
Modelos Básicos
Los Modelos Fundacionales (FM, por sus siglas en inglés) están entrenados en un amplio espectro de datos generados por personas, siendo capaces de responder toda clase de tareas generales. Relacionando patrones aprendidos, la IA es capaz de predecir el siguiente elemento dentro de una secuencia indefinida.
Con la generación de imágenes, el modelo analiza sus datos y crea una versión de ella más nítida y definida. Del mismo modo ocurre con textos escritos, donde el modelo predice la siguiente palabra de una cadena de texto en función de las palabras anteriores y su contexto. Esta última herramienta puede observarse entre las funciones de un documento de Google Docs.
Modelos de Lenguaje de Gran Tamaño
Por su parte, el Modelo de Lenguaje de Gran Tamaño (LLM, por sus siglas en inglés) son modelos de generación de contenido pre entrenado, como es el caso de la aplicación de OpenAI. Los LLM se centran en tareas basadas en el lenguaje, como el resumen, la generación de texto, la clasificación, la conversación abierta y la extracción de información.
Lo que diferencia a esta clase de IAG de otras es su capacidad para realizar múltiples tareas, dado que contienen tantos parámetros de aprendizajes que le permite aprender conceptos avanzados de cualquier materia: desde documentos de matemática hasta filosofía. En el caso de ChatGPT, la IA obtiene sus parámetros de internet para aplicarlos en una amplia gama de contextos.