IBM SkillsBuild/Clasificacion de texto

Clasificacion de Texto

La IA puede aprender a organizar textos en categorias automaticamente, igual que vosotros organizais las cosas en carpetas o separais la ropa limpia de la sucia. Solo que la IA lo hace leyendo palabras en vez de mirando.

¿Como funciona?

Imaginad que recibis cientos de correos al dia. ¿Como decidis cuales son importantes, cuales son publicidad y cuales son basura? Vuestro cerebro lo hace automaticamente fijandose en las palabras. Si veis "Has ganado un premio" enseguida sabeis que es spam. La IA aprende a hacer lo mismo: analiza patrones en las palabras de miles de correos ya clasificados y aprende a clasificar los nuevos sola.

Ejemplo: el filtro de spam de Gmail

Gmail clasifica vuestros correos automaticamente usando IA. Fijaos en como separa los emails en categorias:

Importante
  • Resultados de tu examen de Matematicas
  • Reunion de padres el viernes a las 17:00
Promociones
  • 50% de descuento en zapatillas Nike!
  • Nueva coleccion de verano en Zara
Spam (basura)
  • Has ganado un iPhone 27! Haz clic aqui
  • Principe nigeriano quiere compartir herencia contigo

¿Como decide la IA la categoria? Con probabilidades

La IA no "sabe" que es spam. Lo que hace es calcular la probabilidadde que un correo sea de cada categoria y elige la mas alta. Es como apostar: "estoy un 88% segura de que esto es publicidad".

"50% de descuento solo hoy!"

Importante
5%
Promocion
88%
Spam
7%

Resultado: la IA clasifica este email como Promocion (88% de probabilidad). No esta 100% segura, pero 88% es bastante.

Tambien funciona con noticias, tweets y resenas

El mismo truco funciona para clasificar cualquier texto. Por ejemplo, la IA puede leer un titular y saber de que tema trata:

"El Real Madrid gano la Champions League"

Deportes94% de confianza

"El PIB crecio un 2.3% este trimestre"

Economia89% de confianza

"Apple presento su nuevo chip M5"

Tecnologia91% de confianza

"Nueva vacuna reduce contagios un 80%"

Salud87% de confianza

Probad esto

Abrid vuestra bandeja de Gmail y mirad la carpeta de Spam. ¿Que palabras se repiten? Vereis muchos "gratis", "premio", "clic aqui", "urgente"... La IA ha aprendido que esas palabras suelen estar en correos basura. Tambien podeis marcar un correo como "No es spam" y asi ayudais a la IA a aprender mejor.

Idea clave

La clasificacion de texto es la capacidad de la IA para organizar textos en categorias (spam, noticias, sentimientos...) analizando patrones en las palabras. Funciona calculando probabilidades, no "entendiendo" de verdad.