Londres, equipo de periodismo visual BBC, 18/07/2023.- En los últimos seis meses, los chatbots, como ChatGPT, y los generadores de imagen, como Midjourney, se han convertido rápidamente en un fenómeno cultural.
Pero la inteligencia
artificial (IA) o los modelos de aprendizaje automatizado (machine-learning)
existen ya desde hace un tiempo.
En esta guía para
principiantes iremos más allá de los chatbots para observar diferentes tipos de
IA y ver cómo ya forma parte de nuestras vidas.
¿Cómo aprende la IA?
La clave de todo aprendizaje
automatizado es un proceso llamado entrenamiento, en el que se alimenta a un
programa informático con una gran cantidad de datos -a veces con etiquetas que
explican qué son esos datos- y una serie de instrucciones.
La orden puede ser algo así
como: "busca todas las imágenes que contengan caras" o
"clasifica estos sonidos".
El programa buscará entonces
patrones en los datos que se le han proporcionado para cumplir con la tarea que
se le pidió.
Es posible que necesite alguna
ayuda en el camino -como "eso no es una cara" o "esos dos
sonidos son diferentes"- pero lo que el programa aprende de los datos y
las pistas que recibe se convierte en el modelo de IA, y el material de
entrenamiento acaba definiendo sus habilidades.
Una forma de ver cómo este
proceso de entrenamiento podría crear diferentes tipos de IA es pensar en
diferentes animales.
A lo largo de millones de
años, el entorno natural ha hecho que los animales desarrollen habilidades
específicas. De manera similar, los millones de ciclos que una IA completa
durante su entrenamiento de datos determinarán la forma en que se desarrolla y
conducirán a modelos de IA especializados.
Entonces, ¿qué ejemplos hay
sobre cómo hemos entrenado a los distintos modelos de IA para desarrollar
diferentes habilidades?
¿Qué son los chatbots?
Piensa en un chatbot como si
fuera un loro. Es un imitador y puede repetir palabras que ha escuchado con
cierta comprensión de su contexto, pero sin un sentido completo de su
significado.
Los chatbots hacen lo mismo
-aunque a un nivel más sofisticado- y están a punto de cambiar nuestra relación
con la palabra escrita.
Pero, ¿cómo saben escribir
estos chatbots?
Son un tipo de IA conocido
como Grandes modelos de lenguaje (LLM, por sus siglas en inglés) y son
entrenados con grandes volúmenes de texto.
Un LLM es capaz de considerar
no solo las palabras individuales, sino oraciones completas y comparar el uso
de las palabras y las frases en un pasaje con otros ejemplos de sus datos de
entrenamiento.
Usando estos miles de millones
de comparaciones entre palabras y oraciones es capaz de leer una pregunta y
generar una respuesta, como el texto predictivo en tu teléfono, pero a una
escala enorme.
Lo increíble sobre los LLM es
que pueden aprender las reglas de la gramática y averiguar el significado de
palabras por sí mismos, sin asistencia humana.
¿Puedo hablar con una IA?
Si has usado Alexa, Siri o
cualquier otro tipo de sistema de reconocimiento de voz, entonces has estado
utilizando la IA.
Imagina un conejo con sus
grandes orejas, adaptadas para captar pequeñas variaciones de sonido.
La IA registra los sonidos
cuando hablas, elimina el ruido de fondo, separa tus palabras en unidades
fonéticas -los sonidos individuales que forman una palabra hablada- y luego los
compara con una biblioteca de sonidos del idioma.
Tus palabras se convierten
entonces en texto, en el que los errores de escucha pueden corregirse antes de
que se dé una respuesta.
Este tipo de inteligencia
artificial se conoce como procesamiento natural del lenguaje.
Es la tecnología que se aplica
cuando dices "sí" para confirmar una transacción bancaria, o cuando
le pides a tu celular que te diga qué tiempo va a hacer en los próximos días en
la ciudad a la que vas a viajar.
¿Puede la IA comprender imágenes?
¿Alguna vez tu celular ha
reunido tus fotos y las ha puesto en carpetas con nombres como "en la
playa" o "de fiesta"?
Entonces has estado utilizando
IA sin darte cuenta. Un algoritmo de IA descubre patrones en tus fotos y las
agrupa para ti.
Estos programas han sido
entrenados a base de revisar pilas de imágenes, todas etiquetadas con una
simple descripción.
Si a una IA de reconocimiento
de imágenes le proporcionas suficientes imágenes con la etiqueta
"bicicleta", con el tiempo comenzará a entender cómo es una bicicleta
y en qué forma es distinta de un barco o un automóvil.
A veces, la IA está entrenada
para descubrir pequeñas diferencias en imágenes similares.
Así es como funciona el
reconocimiento facial, encontrando una relación sutil entre las características
de tu rostro que lo hacen distinto y único cuando se compara con cualquier otro
rostro del planeta.
El mismo tipo de algoritmo ha
sido entrenado con escaneos médicos para identificar tumores malignos y es
capaz de revisar miles de escaneos en el tiempo que le llevaría a un médico
tomar una decisión sobre uno solo.
¿Cómo crea la IA nuevas
imágenes?
Recientemente, el
reconocimiento de imágenes se ha adaptado a modelos de IA que han aprendido el
poder camaleónico de manipular patrones y colores.
Estas IA de generación de
imagen pueden convertir los patrones visuales que recogen de millones de
fotografías y dibujos en imágenes completamente nuevas.
Puedes pedirle a la IA que
cree una imagen fotográfica de algo que nunca ha ocurrido, por ejemplo, la foto
de una persona caminando sobre la superficie de Marte.
O puedes dirigir de forma
creativa el estilo de la imagen: "haz un retrato del entrenador de la
selección inglesa de fútbol, pintado al estilo de Picasso".
Las últimas IA inician el
proceso de generar esta nueva imagen con una colección de píxeles coloreados de
forma aleatoria.
Se fija en los puntos aleatorios
en busca de algún indicio de un patrón que haya aprendido durante el
entrenamiento, patrones que le sirven para crear diferentes objetos.
Estos patrones se mejoran
lentamente agregando más capas de puntos, conservando los puntos que
desarrollan el patrón y descartando otros, hasta que al final emerge una imagen
semejante a la que se le pide.
Si la IA desarrolla de manera
simultánea patrones como "superficie de Marte",
"astronauta" y "caminar", es capaz de producir una nueva
imagen.
Como la nueva imagen se
construye a partir de capas de píxeles al azar, el resultado es algo que nunca
había existido, pero que se sigue basando en los miles de millones de patrones
que la IA ha aprendido con las imágenes originales con las que se le entrenó.
Esto implica un desafío en
asuntos relacionados con los derechos de autor y la ética de que una IA genere
obras de arte a partir del duro trabajo de artistas, diseñadores y fotógrafos
reales.
¿Y los vehículos autónomos?
Los vehículos autónomos han
sido parte de la conversación sobre IA desde hace décadas, y la ciencia ficción
ha conseguido fijarlos en la imaginación popular.
La IA autónoma se conoce como
conducción autónoma. Los vehículos con esta tecnología están equipados con
cámaras, radar y láseres de medición de distancias.
Piensa en una libélula, con
visión de 360 grados y sensores en las alas que le ayudan a maniobrar y a hacer
ajustes constantes durante el vuelo.
De forma similar, el modelo de
IA utiliza los datos de sus sensores para identificar objetos y determinar si
se mueven y, de ser así, qué tipo de objeto en movimiento es: otro vehículo,
una bicicleta, un peatón.
Miles y miles de horas de
entrenamiento para entender cómo se conduce han permitido a la IA ser capaz de
tomar decisiones y actuar en el mundo real para conducir el vehículo y evitar
choques.
Los algoritmos predictivos
pueden haber tenido problemas durante muchos años para lidiar con la naturaleza
a veces impredecible de los conductores humanos, pero los vehículos autónomos
ahora han recopilado millones de kilómetros de datos en carreteras reales. En
San Francisco ya hay usuarios que pagan por ser transportados en un vehículo
autónomo.
La conducción autónoma es
también un claro ejemplo de cómo las nuevas tecnologías deben superar algo más
que obstáculos técnicos.
La legislación de los
gobiernos y las regulaciones de seguridad, junto con la profunda sensación de
ansiedad sobre lo que ocurre cuando le entregas el control a las máquinas, son
aún obstáculos potenciales para un futuro completamente automatizado en
nuestras carreteras.
¿Qué sabe la IA sobre mí?
Algunas IA simplemente manejan
números, recogiéndolos y combinándolos para crear un enjambre de información,
cuyos productos pueden ser extremadamente valiosos.
Es posible que ya existan
varios perfiles de tus acciones financieras y sociales, particularmente en
internet, que podrían ser usados para hacer predicciones sobre tu
comportamiento.
Tu tarjeta de fidelización del
supermercado rastrea tus hábitos y gustos a través de tu compra semanal. Las
agencias de crédito rastrean cuánto tienes en el banco y cuánto debes de tus
tarjetas de crédito.
Netflix y Amazon llevan un
registro de cuántas horas de contenido viste anoche. Tus cuentas de redes
sociales saben cuántos videos comentaste hoy.
Y no eres tú solo, estos
números existen para todo el mundo, lo que permite a los modelos de IA
revisarlos y buscar tendencias sociales.
Estos modelos ya están dando
forma a tu vida, desde ayudar a decidir si te van a dar un préstamo o una
hipoteca a influir en tus decisiones de compra mostrándote determinados
anuncios publicitarios.
¿La IA podrá hacer todo?
¿Sería posible combinar
algunas de estas habilidades en un único modelo híbrido de IA?
Eso es exactamente lo que hace
uno de los avances más recientes en IA.
Se llama IA multimodal, y
permite que un modelo observe diferentes tipos de datos, como imágenes, texto,
audio o video, y descubra nuevos patrones entre ellos.
Este enfoque multimodal fue
una de las razones del gran salto en capacidad entre ChatGPT3.5, que solo fue
entrenado con texto, y ChatGPT4, que fue entrenado también con imágenes.
La idea de un modelo de IA
único capaz de procesar cualquier tipo de información y, por lo tanto, llevar a
cabo cualquier tarea, desde traducir idiomas a diseñar nuevos medicamentos, se
conoce como inteligencia artificial general (IAG).
Para algunos, es el objetivo
último de toda investigación en inteligencia artificial; para otros, es el
camino para todas esas distopías de ciencia ficción en la que desatamos una
inteligencia tan incomprensible que ya no somos capaces de controlarla.
¿Cómo se entrena a la IA?
Hasta hace poco, el proceso
clave en el entrenamiento de la mayoría de las IA se conocía como
"aprendizaje supervisado".
Los humanos ponían etiquetas a
grandes paquetes de datos de entrenamiento y se le pedía a la IA que buscara patrones
en los datos.
Se le pedía entonces a la IA
que aplicara esos patrones a nuevos datos y que reportara sobre su precisión.
¿Qué es el aprendizaje
profundo?
La mayoría de los avances más
recientes en IA han sido posibles gracias al aprendizaje profundo (deep
learning).
Explicado de forma sencilla,
es cuando el uso de algoritmos complejos y grandes conjuntos de datos hacen que
la IA pueda aprender sin ningún tipo de guía humana.
ChatGPT es el ejemplo más conocido.
La cantidad de texto que hay
en internet y en libros digitalizados es tan grande que, a lo largo de muchos
meses, ChatGPT pudo aprender a combinar palabras de manera elocuente por sí
mismo.
Imagina que tienes una gran
pila de libros en un idioma extranjero, quizás algunos de ellos con imágenes.
Con el tiempo podrías
descubrir que la misma palabra aparecía en una página cuando había un dibujo o
una foto de un árbol, y otra palabra cuando había una foto de una casa.
Y verías que a menudo había
una palabra cerca de esas palabras que podría significar "un" o
quizás "el ", y así sucesivamente.
Este es el modelo de
aprendizaje profundo, también conocido como aprendizaje sin supervisión.
Se basa en enormes cantidades
de poder computacional que permite a la IA memorizar enormes cantidades de
palabras, solas, en grupos, en oraciones y en páginas, y luego leer y comparar
cómo se utilizan una y otra vez en una fracción de segundo.
Los rápidos avances logrados
por los modelos de aprendizaje profundo en el último año han impulsado la nueva
ola de entusiasmo y preocupación sobre el potencial de la inteligencia
artificial.
Las promesas y advertencias de
la ciencia ficción parecen haberse acercado sin hacer ruido y nos encontramos
con que ya estamos viviendo en un mundo donde la IA está empezando a revelar
sus extrañas habilidades inhumanas.
0 Comentarios