RAG: impulsando la próxima generación de IA

Jorge A. Hernández    15 junio, 2025

¿Recuerda cuando las plataformas de inteligencia artificial, los grandes LLM (Large Language Model), no podían responder temas de actualidad? La solución a este problema llegó con la Generación Aumentada por Recuperación (RAG). ¿En qué consiste y por qué es tan importante?

En 2020, la prestigiosa conferencia académica NeurIPS (Conference on Neural Information Processing Systems), sirvió como escenario para la presentación de un trabajo titulado «Retrieval Augmented Generation for Knowledge Intensive NLP Tasks«. Este estudio, liderado por investigadores de Facebook AI Research (ahora Meta AI), University College London y New York University, silenciosamente, cambiaría al mundo.

Casi cuatro años después de su presentación, el RAG se convertiría en un estándar de mercado, adoptado por gigantes como Meta, AWS, Google, Microsoft, Oracle y OpenAI, entre otros. ¿Cómo lo lograron? La respuesta sencilla es que esta tecnología sirvió para resolver uno de los principales problemas de la inteligencia artificial generativa.

En términos simples, antes de la llegada de la arquitectura RAG (Retrieval-Augmented Generation), los modelos de lenguaje grandes (LLM) operaban utilizando únicamente la información y el conocimiento que habían adquirido durante su entrenamiento, que era un conjunto gigantesco pero estático de datos.

En otras palabras, antes de la llegada del RAG, los LLM más famosos del mercado como ChatGPT, Gemini o Claude, no tenían acceso a información nueva, ni a bases de datos internas o externas. Por lo tanto, no podían responder preguntas sobre eventos recientes, datos privados o conocimientos fuera de su material de entrenamiento.

Origen y tecnología del RAG

Aunque actualmente RAG es un estándar que crece cada día, al punto de mover más de 1.200 millones de dólares en 2024 y más de 11 mil millones de dólares para 2030, según proyecciones de Grand View Research, esta iniciativa no fue acogida de inmediato. Tuvo que competir con otros enfoques tecnológicos, como el uso de «bases de conocimiento externas», así como con el ajuste fino (fine-tuning) de modelos tradicionales.

Sin embargo, a finales de 2023 y durante 2024, la adopción de RAG creció exponencialmente. Al punto que, en una encuesta realizada por Exa Enterprise AI, el 50% de los encuestados afirmaron que sus organizaciones usaban RAG, resaltando además que cuanto mayor es la tasa de utilización de IA generativa dentro de una empresa, mayor es su interés por la RAG.

¿Cómo funciona el RAG?

El RAG introduce un componente intermediario de recuperación de información entre la consulta del usuario y la respuesta del LLM. El flujo de trabajo de RAG se puede desglosar sistemáticamente en tres etapas principales: Recuperación, Aumento y Generación.

La etapa inicial de recuperación implica que un sistema, generalmente impulsado por búsqueda semántica, identifica y obtiene los documentos, pasajes o «fragmentos» de información más relevantes de una fuente de conocimiento externa. Estas fuentes pueden incluir diversas formas de datos estructurados y no estructurados.

Una vez que se recupera la información relevante, esta se combina con el conocimiento preexistente del LLM para construir un prompt enriquecido, más informativo y contextualmente fundamentado. Esta etapa a menudo emplea técnicas de ingeniería de prompts para comunicar eficazmente el contexto.

El prompt “aumentado” sirve para mitigar el riesgo de generar información incorrecta o fabricada (alucinaciones). Finalmente, se llega al paso de generación, donde el LLM entrega una respuesta a la consulta del usuario. Esta respuesta resultante es significativamente más precisa, relevante y contextualmente informada de lo que un LLM podría producir basándose únicamente en su conocimiento interno.

  • Si quieres saber cómo desde Movistar Empresas te podemos ayudar a impulsar la transformación de tu negocio y a hacerlo de manera sostenible ingresa aquí.

Foto de Freepik

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *