LLM (Large Language Model)

También: LLM · modelo de lenguaje grande · gran modelo de lenguaje · modelo de lenguaje

Modelo de lenguaje grande, la base de los chatbots actuales

1 min de lectura

Un LLM es un modelo de inteligencia artificial entrenado con enormes cantidades de texto para predecir y generar lenguaje de forma coherente. Su funcionamiento se basa en la arquitectura Transformer, que le permite analizar las relaciones entre palabras dentro de un contexto y anticipar cuál es la continuación más probable de una secuencia. El adjetivo «grande» (large) hace referencia tanto al volumen de datos de entrenamiento como al número de parámetros, que pueden contarse por miles de millones.

Su importancia radica en que constituyen la base de los asistentes conversacionales actuales, como ChatGPT, Gemini o Claude. Más allá de la conversación, se emplean para tareas muy diversas:

Redacción y resumen de textos.
Traducción entre idiomas.
Generación y depuración de código.

Conviene recordar un matiz práctico: un LLM no «entiende» en sentido humano ni consulta una base de datos de verdades, sino que genera texto estadísticamente plausible. Por eso puede producir alucinaciones, es decir, afirmaciones falsas expresadas con total seguridad, algo que obliga a verificar siempre la información sensible.

LLM (Large Language Model)

Términos relacionados

Context Window

Transformer

Frontier Models

Small Language Models (SLM)

Tokenization

Generative AI