RAG | Enciclopedia WikiGEO

Definición

La generación aumentada por recuperación (RAG) es una técnica que permite a los modelos de lenguaje (LLMs) recuperar e incorporar nueva información desde fuentes de datos externas ^[2]. Este método complementa los datos de entrenamiento preexistentes del modelo, permitiendo el acceso a información actualizada o específica de un dominio que no estaba presente durante su fase de entrenamiento inicial ^[2].

Cómo funciona

El proceso RAG combina un modelo de lenguaje (memoria paramétrica) con un mecanismo de acceso a una memoria externa no paramétrica ^[4]. Cuando un usuario realiza una consulta, el sistema utiliza un recuperador neuronal para buscar pasajes relevantes en bases de datos, documentos o fuentes web ^[2]^[4]. Estos fragmentos recuperados se proporcionan al LLM como contexto adicional, permitiendo que la respuesta generada se base en hechos verificables y fuentes autorizadas en lugar de depender exclusivamente de la probabilidad estadística de sus parámetros internos ^[2].

Relevancia para GEO

En el contexto de la Generative Engine Optimization (GEO), el RAG es fundamental porque determina cómo los motores generativos seleccionan y sintetizan la información de la web ^[1]^[5]. Al optimizar el contenido para que sea fácilmente recuperable y relevante para los sistemas de búsqueda basados en IA, los creadores pueden mejorar su visibilidad en las respuestas generadas ^[1].

Ejemplos

Un ejemplo común es el uso de RAG en chatbots corporativos que acceden a documentación interna para responder consultas de empleados, evitando alucinaciones sobre políticas inexistentes ^[2]. En motores de búsqueda, el RAG permite que el sistema consulte índices de páginas web en tiempo real para responder preguntas sobre eventos actuales, asegurando que la respuesta sea precisa y contenga enlaces a las fuentes originales para su verificación ^[2].

Referencias

AcadémicoAggarwal et al., GEO: Generative Engine Optimization (KDD 2024)https://arxiv.org/abs/2311.09735
EnciclopediaWikipedia, Retrieval-augmented generation (2024)https://en.wikipedia.org/wiki/Retrieval-augmented_generation
AcadémicoLewis et al., Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks (NeurIPS 2020)https://arxiv.org/abs/2005.11401
EnciclopediaWikipedia, Generative engine optimization (2025)https://en.wikipedia.org/wiki/Generative_engine_optimization

Definición

Cómo funciona

Relevancia para GEO

Ejemplos

Referencias

Artículos relacionados