La generación aumentada por recuperación es una técnica que combina un modelo de lenguaje con un sistema de búsqueda de información externa. En lugar de depender solo del conocimiento aprendido durante el entrenamiento, el modelo consulta una base de datos, documentos o índices vectoriales en tiempo real y utiliza esa información recuperada para construir su respuesta.
El proceso suele seguir tres pasos:
- Recuperación: se buscan los fragmentos más relevantes para la consulta del usuario.
- Aumento: esos fragmentos se añaden al contexto que recibe el modelo.
- Generación: el modelo produce una respuesta basada en ese material.
Su importancia radica en que reduce las alucinaciones y permite trabajar con datos actualizados o privados sin necesidad de reentrenar el modelo. Es especialmente útil en asistentes corporativos, donde la respuesta debe basarse en documentación interna concreta. Un matiz práctico: la calidad final depende tanto del modelo como de la fase de recuperación, por lo que un índice mal construido degrada los resultados aunque el modelo sea excelente.