Un LLM es un modelo de inteligencia artificial entrenado con enormes cantidades de texto para predecir y generar lenguaje de forma coherente. Su funcionamiento se basa en la arquitectura Transformer, que le permite analizar las relaciones entre palabras dentro de un contexto y anticipar cuál es la continuación más probable de una secuencia. El adjetivo «grande» (large) hace referencia tanto al volumen de datos de entrenamiento como al número de parámetros, que pueden contarse por miles de millones.
Su importancia radica en que constituyen la base de los asistentes conversacionales actuales, como ChatGPT, Gemini o Claude. Más allá de la conversación, se emplean para tareas muy diversas:
- Redacción y resumen de textos.
- Traducción entre idiomas.
- Generación y depuración de código.
Conviene recordar un matiz práctico: un LLM no «entiende» en sentido humano ni consulta una base de datos de verdades, sino que genera texto estadísticamente plausible. Por eso puede producir alucinaciones, es decir, afirmaciones falsas expresadas con total seguridad, algo que obliga a verificar siempre la información sensible.