Corpus de datos
Un corpus de datos es el conjunto de documentos, archivos o información estructurada que un sistema de búsqueda o un modelo de lenguaje utiliza como base de conocimiento para realizar procesos de grounding. En el contexto de la búsqueda generativa, el corpus actúa como la fuente de verdad autorizada de la que el sistema extrae información para responder a las consultas de los usuarios. La calidad, actualidad y relevancia del corpus son determinantes para la precisión de las respuestas generadas. Para los profesionales del GEO, el objetivo es asegurar que su contenido forme parte del corpus indexado por los motores de búsqueda y que sea fácilmente recuperable mediante consultas semánticas. La integración efectiva de un sitio web en el corpus de un motor es el primer paso para lograr visibilidad en las respuestas generadas por IA. Términos relacionados: Recuperación de información, Grounding, Indexación.