¿Qué es?

Un LLM es un tipo de modelo de IA que sobresale en entender y generar lenguaje humano. Son entrenados con vastas cantidades de datos textuales, lo que les permite aprender patrones, estructura e incluso matices en el lenguaje. Estos modelos típicamente constan de muchos millones de parámetros.

La mayoría de los LLMs actualmente están construidos sobre laArquitectura Transformer—una arquitectura de aprendizaje profundo basada en el Algoritmo de “Atención”

¿Qué tarea/objetivo tiene?

Predecir el siguiente Token, dada una secuencia de tokens previos.