arXiv:2601.10215
Chunkings
Topo-RAG
Recuperación consciente de la topología para documentos híbridos texto–tabla.
Este trabajo presenta Topo-RAG, un marco que desafía la suposición de que “todo es texto”. Proponemos una arquitectura dual que respeta la topología de los datos: enrutamos la narrativa fluida a través de recuperadores densos tradicionales, mientras que las estructuras tabulares son procesadas por un mecanismo de Cell-Aware Late Interaction, preservando sus relaciones espaciales. Evaluado en SEC-25, un corpus sintético empresarial que imita la complejidad del mundo real, Topo-RAG demuestra una mejora del 18.4 % en nDCG@10 en consultas híbridas frente a los enfoques de linealización estándar. No se trata solo de buscar mejor; se trata de entender la forma de la información.
arXiv:2601.15476
Performance
Fiabilidad por diseño: una medición cuantitativa del riesgo de fabricación en LLMs.
Un análisis comparativo de la IA Generativa vs. Consultiva en el dominio jurídico y sus lecciones para cualquier corpus de conocimiento.
Los LLMs pueden automatizar tareas jurídicas, pero las "alucinaciones" (hechos o citas inexistentes) son inaceptables en dominios de alto rigor. Cuantificamos este riesgo comparando generación generalista, IA consultiva con RAG básico y RAG consultivo avanzado con un pipeline optimizado. Definimos dos métricas: tasa de citas falsas (FCR) y tasa de hechos fabricados (FFR). En un benchmark jurídico propio, vemos que la generaciín pura falla (FCR > 30%). El RAG básico reduce el error en >100x pero deja misgrounding. El RAG avanzado (fine-tuning de embeddings, re-ranking con cross-encoders y auto-corrección) baja la fabricación a <0.2%.
arXiv:2601.08851
Embeddings
Más contexto no es mejor.
Paradoja de la dilución vectorial en RAG corporativos.
Técnicas recientes de "Contextualized Chunking" inyectan resúmenes para mejorar el contexto en RAG, pero introducen una "dilución vectorial" que opaca el contenido local. Evaluando distintos ratios de inyección, demostramos una curva en "U invertida": una inyección moderada mejora el "Recall" (+18%), pero superar un umbral crítico (CIR > 0.4) reduce la precisión en un 22% para consultas específicas. Proponemos un marco teórico para calcular el ratio óptimo de inyección.
arXiv:2510.12830
Compliance
Gobernanza y trazabilidad "a prueba de AI Act" para casos de uso legales.
Un marco técnico-jurídico, métricas forenses y evidencias auditables.
Este artículo presenta un marco integral de gobernanza para sistemas de IA en el sector legal, diseñado para garantizar el cumplimiento verificable del Reglamento de IA de la UE (AI Act). El marco integra una cartografía normativa de la ley a controles técnicos, una arquitectura forense para sistemas RAG/LLM y un sistema de evaluación con métricas ponderadas por el riesgo jurídico. Como principal contribución, se presenta rag-forense, una implementación de código abierto del marco, acompañada de un protocolo experimental para demostrar la conformidad.
arXiv:2509.09467
Alucinaciones
Inteligencia Artificial jurídica y el desafío de la veracidad.
Análisis de alucinaciones, optimización de RAG y principios para una integración responsable.
Este informe técnico analiza el desafío de las "alucinaciones" (información falsa) en los LLMs aplicados al derecho. Se examinan sus causas, manifestaciones y la efectividad de la estrategia de mitigación RAG, exponiendo sus limitaciones y proponiendo optimizaciones holísticas. Se exploran las implicaciones éticas y regulatorias, enfatizando la supervisión humana como un rol insustituible. El documento concluye que la solución no reside en mejorar incrementalmente los modelos generativos, sino en adoptar un paradigma de IA "consultiva" que priorice la veracidad y la trazabilidad, actuando como una herramienta para amplificar, y no sustituir, el juicio profesional.
Reranking
¿El reranking es todo lo que necesitas?
Análisis comparativo de recuperación en dos etapas vs. ajuste fino de embeddings en sistemas RAG con pocos datos.
La implementación de sistemas de Generación Aumentada por Recuperación (RAG) en dominios corporativos especializados se enfrenta persistentemente al problema del Arranque en frío (Cold Start): la existencia de vastos corpus documentales pero una carencia crítica de pares de entrenamiento etiquetados (N < 500). Este estudio presenta un experimento controlado que evalúa la eficacia de dos estrategias de adaptación de dominio contrapuestas: el Ajuste Fino Few-Shot de modelos bi-encoder (e.g., text-embedding-3-large) frente a una arquitectura de Recuperación en Dos Etapas (Búsqueda Híbrida + Reranking con Cross-Encoder).
Research Q1 2026
Previsto marzo'26
RAGes
Mejores prácticas para la generación aumentada por recuperación (RAG) en español