Las tres formas en que aprende la IA

Las máquinas pueden aprender de tres maneras diferentes, y las tres son bastante parecidas a como aprendeis vosotros en el instituto o en la vida.

Aprendizaje Supervisado

Con profesor que os corrige

Le dais al modelo ejemplos con la respuesta correcta, y el aprende a predecir respuestas nuevas. Es exactamente como cuando un profesor os pone un examen, os lo corrige, y al ver vuestros errores aprendeis para el siguiente.

Ejemplos reales

--Gmail clasificando emails en spam o no spam (le ensenaron con millones de emails ya clasificados)

--Predecir cuanto costara un piso segun el barrio, tamano y habitaciones

--El movil reconociendo si una foto es un gato o un perro

Es como estudiar con el solucionario: haceis ejercicios, mirais la respuesta correcta, y asi aprendeis. Cuantos mas ejercicios haceis, mejor se os dan los nuevos.

Aprendizaje No Supervisado

Sin profesor, buscandose la vida

El modelo recibe datos SIN respuestas correctas. Nadie le dice que tiene que buscar: el solo encuentra patrones y grupos. Es como si os dieran un monton de canciones mezcladas y vosotros tuvierais que organizarlas en generos sin que nadie os dijera cuales son.

Ejemplos reales

--Spotify agrupando canciones que suenan parecido para crear playlists como Discover Weekly

--Netflix organizando peliculas en categorias segun lo que ven usuarios similares a vosotros

--Un banco detectando transacciones raras que podrian ser un fraude

Es como organizar vuestra habitacion sin que nadie os diga como. Juntais la ropa con la ropa, los libros con los libros... encontrais vuestro propio sistema.

Aprendizaje por Refuerzo

Probando y aprendiendo de los errores

El modelo aprende haciendo cosas y recibiendo recompensas o penalizaciones, como en un videojuego. Al principio lo hace fatal, pero tras miles de intentos se vuelve un crack.

Ejemplos reales

--Una IA que aprende a jugar a Fortnite: al principio muere al instante, pero tras millones de partidas domina el juego

--Robots que aprenden a caminar solos, cayendose y levantandose una y otra vez

--ChatGPT uso esta tecnica (RLHF) para aprender a dar mejores respuestas segun el feedback de humanos

Es como aprender a montar en bici: os cais, os levantais, probais otra vez, y al final os sale. Nadie os dio un manual, aprendisteis a base de intentarlo.

Idea clave

La IA aprende de tres formas: con profesor (supervisado, como estudiar con solucionario), sin profesor (no supervisado, como organizar tu habitacion tu solo) y por prueba y error (refuerzo, como aprender a montar en bici). La mayoria de la IA que usais a diario combina varias de estas tecnicas.