3 posts
Endava redujo el análisis de requisitos de semanas a horas con Codex. La verdadera historia no son los agentes—es la ingeniería de flujos de trabajo que la mayoría de equipos omiten.
Los LLMs de difusión estilo Nemotron reducen el tiempo de decodificación, pero la latencia del agente vive en la recuperación y las llamadas de herramientas. Aquí está lo que realmente cambia en producción.
El recall de los benchmarks miente. Aquí está cómo diagnosticamos la calidad de recuperación en sistemas RAG de producción antes de que los usuarios comiencen a enviar tickets a las 2am.