Rediseñando la Evaluación como Sistema Efectivo


Reimaginar la evaluación en tiempos de cambio: De la fatiga metodológica a la arquitectura del impacto

Bajada

La evaluación no enfrenta solo un problema de métodos. En un mundo más interdependiente, incierto y disputado, su desafío central es rediseñarse como sistema: más conectada con políticas y planificación, más colaborativa, más capaz de integrar enfoques transversales, más abierta a redistribuir poder y más sostenida por instituciones que cuidan, aprenden y usan evidencia.

La evaluación atraviesa una paradoja incómoda: nunca hemos tenido tantas herramientas, datos y metodologías, y sin embargo su influencia real en decisiones públicas sigue siendo limitada. El problema ya no es técnico. Es más profundo: es una crisis de diseño, de relevancia y de sentido.

Durante décadas, el campo se apoyó en un paradigma tecnocrático basado en medición, estandarización y rendición de cuentas. Ese modelo produjo avances importantes, pero hoy muestra límites evidentes: ritualización, fragmentación, baja utilización y desconexión con los procesos reales de decisión (Dahler-Larsen, 2012; Bamberger et al., 2019). Al mismo tiempo, los problemas públicos son cada vez más complejos, interdependientes y políticamente disputados, lo que ha reabierto el debate sobre el papel real de la evaluación en la toma de decisiones (OECD, 2023).

Sin embargo, como se ha argumentado recientemente, la evaluación sigue operando en muchos contextos como si el mundo fuera lineal, sectorial y estable (Rodríguez-Ariza, 2025a).

Por eso, el giro que hoy necesitamos no consiste en mejorar la evaluación como práctica aislada, sino en reimaginarla como sistema.

A lo largo de este artículo se desarrollan seis ideas conectadas:

(1) el problema es de diseño, no de métodos;

(2) la colaboración es infraestructura, no valor;

(3) la evaluación sigue siendo sectorial en un mundo interdependiente;

(4) evaluar hoy implica redistribuir poder;

(5) sin cuidado no hay sistema sostenible;

(6) el cambio real es pasar del individuo al sistema.

En conjunto, estas ideas apuntan a una tesis clara:

la evaluación solo será relevante si se convierte en una arquitectura institucional de aprendizaje, decisión y transformación, conectada con políticas, planificación y enfoques cross-sectoriales.

1. El verdadero problema no es metodológico: es sistémico

El debate evaluativo sigue atrapado en dicotomías conocidas: cualitativo frente a cuantitativo, experimental frente a adaptativo, rigor frente a uso. Pero estas discusiones, aunque relevantes, son insuficientes.

La evidencia acumulada muestra algo más incómodo:

la evaluación falla menos por falta de métodos que por cómo está insertada en sistemas de poder, incentivos y uso (Patton, 2018; Sanderson, 2002).

Hoy vemos tres fallos estructurales que se repiten:

  • evaluaciones técnicamente sólidas que no influyen en decisiones;
  • procesos diseñados para rendir cuentas, pero no para aprender;
  • evidencia abundante con baja tracción política.

Este patrón ha sido descrito como una “eficacia sin relevancia”, donde la calidad técnica no se traduce en impacto real (Rodríguez-Ariza, 2025a).

Aquí aparece un punto crítico:

la relevancia no se construye al final del proceso evaluativo, sino en el diseño de los sistemas y de los planes de evaluación vinculados a estrategias públicas.

Cuando la evaluación no está conectada desde el inicio con prioridades estratégicas, ciclos de decisión y preguntas políticas reales, su uso será inevitablemente marginal (OECD, 2023).

2. La colaboración no es un ideal: es una condición de funcionamiento

Uno de los consensos más repetidos en el campo es que la evaluación debe ser colaborativa. Pero los sistemas complejos no colaboran por buena voluntad: colaboran cuando están diseñados para hacerlo (Ostrom, 1990; Axelrod, 1984).

Cuando no se diseña, aparecen patrones conocidos:

  • competencia institucional,
  • incentivos individuales,
  • asimetrías de poder,
  • fragmentación organizacional.

Como se ha documentado en análisis recientes sobre colaboración en sistemas complejos, estos patrones no son excepciones, sino resultados esperables de sistemas mal diseñados (Rodríguez-Ariza, 2025c).

Por eso, integrar colaboración en evaluación implica rediseñar todo el ciclo:

  • planes de evaluación alineados con políticas;
  • ToR co-construidos;
  • producción distribuida de evidencia;
  • interpretación deliberativa;
  • uso institucional compartido.

Pero esto exige pasar de la retórica a la mecánica.

La colaboración efectiva descansa en:

  • objetivos compartidos entre sectores,
  • incentivos colectivos,
  • datos abiertos e interoperables,
  • comunidades de práctica reales,
  • liderazgo que facilita, no controla.

Dicho de forma directa:

menos folclore colaborativo, más diseño institucional de la colaboración.

3. El gran punto ciego: seguimos evaluando sectores en problemas sistémicos

Los sistemas de evaluación no han internalizado suficientemente una realidad básica:

los problemas públicos ya no son sectoriales.

Pobreza, desigualdad, cambio climático o bienestar infantil son fenómenos interdependientes. Sin embargo, seguimos evaluando:

  • programas aislados,
  • indicadores fragmentados,
  • resultados desconectados.

Esto entra en tensión con el avance de enfoques transversales (género, equidad, participación), que han mostrado que las desigualdades son interseccionales (Kabeer, 1999).

El problema, como se ha señalado, no es la falta de enfoques, sino su fragmentación operativa (Rodríguez-Ariza, 2025a).

Para la evaluación, esto implica:

  • en el análisis: pasar a enfoques interseccionales;
  • en el diseño: integrar transversalidad desde el inicio;
  • en la ejecución: romper silos institucionales;
  • en las recomendaciones: actuar sobre sistemas;
  • en los planes: diseñar portafolios evaluativos coherentes.

El salto necesario es claro: de la transversalidad como checklist a la interseccionalidad como lógica de diseño evaluativo.

4. Evaluar hoy exige redistribuir poder

Vivimos en una transición estructural. Las instituciones pierden legitimidad y emergen nuevas formas de conocimiento.

En este contexto, la evaluación no puede limitarse a auditar.

Debe acompañar procesos de transformación.

Esto implica:

  • pasar a sistemas distribuidos de evaluación;
  • reconocer pluralidad de saberes;
  • entender la evaluación como deliberación pública.

Como se ha argumentado en trabajos recientes sobre cooperación y evaluación, esto supone abandonar la lógica de control centralizado y avanzar hacia modelos más distribuidos y situados (Rodríguez-Ariza, 2025b).

Aquí la inteligencia artificial actúa como acelerador: puede mejorar capacidades, pero también reforzar desigualdades si no se gobierna adecuadamente (Crawford, 2021).

5. Sin cuidado no hay sistema sostenible

Los sistemas evaluativos operan hoy en contextos de fatiga institucional:

  • sobrecarga,
  • presión por resultados,
  • pérdida de sentido.

Esta “fatiga del sistema” ha sido identificada como un obstáculo estructural para la transformación en cooperación y evaluación (Rodríguez-Ariza, 2025d).

En este contexto, pedir “mejor evaluación” sin rediseñar condiciones es ilusorio.

El cuidado no es un lujo.

Es una infraestructura de sostenibilidad institucional (Puig de la Bellacasa, 2017).

Sin cuidado, la evaluación se vuelve extractiva: produce información, pero no genera transformación.

6. El cambio real: del individuo al sistema

Durante años, el campo ha invertido en formación. Pero la evidencia es clara: no hay sistemas fuertes sin institucionalización (OECD, 2023; UNDP, 2021).

El problema de fondo —como se ha señalado— es confundir desarrollo de capacidades con formación (Rodríguez-Ariza, 2025f).

Los sistemas evaluativos requieren:

  • marcos normativos,
  • recursos estables,
  • demanda política,
  • ecosistemas institucionales,
  • capacidades organizacionales.

En América Latina, la evidencia muestra que el factor decisivo no es técnico, sino institucional: gobernanza y uso de la evidencia (Salas et al., 2022).

Por eso, el cambio es claro: de formar evaluadores a construir sistemas evaluativos.

Conclusión: lo que realmente está en juego

Si volvemos sobre estos seis puntos, emerge una lectura más profunda.

No estamos ante un problema técnico, sino institucional y político:

  • no faltan métodos; falta diseño;
  • no falta colaboración; falta arquitectura;
  • no faltan enfoques; falta integración;
  • no falta evidencia; falta poder distribuido;
  • no falta capacidad; falta sistema;
  • no falta producción; falta uso.

La evaluación no está fallando por debilidad.

Está fallando por desalineación con el mundo en el que opera.

Reimaginarla implica dejar de pensarla como función y empezar a diseñarla como sistema.

Porque, al final, el problema no es que hagamos pocas evaluaciones.

El problema es que no están diseñadas para importar.

Preguntas para abrir el debate

  • ¿Estamos diseñando evaluaciones… o sistemas de evaluación?
  • ¿Qué incentivos hacen racional no colaborar?
  • ¿Cómo integrar lo cross-sectorial sin fragmentar más?
  • ¿Qué implica redistribuir poder en evaluación?
  • ¿Quién usa la evaluación… y quién debería usarla?

Referencias 

Axelrod, R. (1984). The evolution of cooperation. Basic Books.

Bamberger, M., Vaessen, J., & Raimondo, E. (2019). Dealing with complexity in development evaluation. SAGE.

Crawford, K. (2021). Atlas of AI. Yale University Press.

Dahler-Larsen, P. (2012). The evaluation society. Stanford University Press.

Kabeer, N. (1999). Resources, agency, achievements. Development and Change, 30(3), 435–464.

OECD. (2023). Evaluation insights: Strengthening the use of evidence. OECD Publishing.

Ostrom, E. (1990). Governing the commons. Cambridge University Press.

Patton, M. Q. (2018). Principles-focused evaluation. Guilford Press.

Puig de la Bellacasa, M. (2017). Matters of care. University of Minnesota Press.

Rodríguez-Ariza, C. (2025a). Reimaginando la evaluación en tiempos de cambio. https://triplead.blog/2025/06/23/reimaginando-la-evaluacion-en-tiempos-de-cambio/

Rodríguez-Ariza, C. (2025b). Repensar la ayuda: de la liminalidad… https://triplead.blog/2025/11/20/repensar-la-ayuda-de-la-liminalidad-cansada-a-la-metamorfosis-con-menos-recursos/

Rodríguez-Ariza, C. (2025c). Colaboración: claves y barreras… https://triplead.blog/2025/12/15/colaboracion-claves-y-barreras-en-sistemas-complejos/

Rodríguez-Ariza, C. (2025d). La cooperación cansada… https://triplead.blog/2025/10/26/la-cooperacion-cansada-y-el-deseo-de-mundo/

Rodríguez-Ariza, C. (2025e). Colaborar o morir… https://triplead.blog/2025/09/27/colaborar-o-morir-de-powerpointismo/

Rodríguez-Ariza, C. (2025f). De los cursos a los sistemas (NECD) https://triplead.blog/2025/09/18/de-los-cursos-a-los-sistemas-el-futuro-del-desarrollo-de-capacidades-en-evaluacion-necd/

Salas, N., et al. (2022). Sistemas nacionales de evaluación en América Latina.

Sanderson, I. (2002). Evaluation and policy learning. Public Administration, 80(1).

UNDP. (2021). Evaluation guidelines. United Nations Development Programme.

Repensar la ayuda: de la liminalidad cansada a la metamorfosis con menos recursos


La cooperación internacional atraviesa un punto de inflexión histórico. No es simplemente que falten recursos; se resquebraja el modelo mismo de relación que ha sostenido la arquitectura de la ayuda durante décadas. La serie Repensar la ayuda ha mostrado cómo esta crisis es simultáneamente estructural, cultural, subjetiva y tecnológica, y cómo el sector se encuentra en un umbral en el que nada puede seguir igual. Este artículo sintetiza sus principales aportes para proponer un marco nuevo: una cooperación sin centro, distribuida, cuidadosa y plural.

1. Un diagnóstico ineludible: colapso del centro

La crisis financiera de la cooperación no es solo un asunto presupuestario. Es un síntoma de una crisis profunda de legitimidad y propósito. (Rodríguez-Ariza 2025d; 2025c)

Sigue leyendo

Diseños y Métodos para la Evaluación de Impacto: un viaje necesario hacia la diversidad metodológica


En el vagón central de nuestro Tren de Libros de Evaluación sube hoy una publicación que va a ser una referencia para quienes trabajamos entre proyectos, políticas públicas y el desafío de comprender sus efectos reales. Se trata de Diseños y Métodos para la Evaluación de Impacto, un texto escrito con la claridad, el rigor y la calidez intelectual que caracterizan a un querido colega y amigo, Pablo Rodríguez Bilella. Una obra que, más allá de revisar métodos, recupera algo esencial: la evaluación como un acto de aprendizaje, responsabilidad y honestidad intelectual.

A continuación, te propongo un recorrido estructurado por doce ejes de análisis que permiten apreciar la riqueza, actualidad y pertinencia del libro.

1. Resumen general del libro y su objetivo principal

El texto plantea una visión amplia y matizada sobre qué es realmente una evaluación de impacto, alejándose de la rigidez que ha dominado ciertos debates en las últimas dos décadas. El objetivo central es ampliar el marco de comprensión: una evaluación de impacto no es sinónimo de ensayos aleatorizados, sino de cualquier aproximación sistemática y empírica orientada a comprender los efectos —esperados y no esperados— de una intervención.

Sigue leyendo

 Hacer más con menos, sin perder el sur


Seguimos con nuestra serie «Repensar la ayuda» y en este caso también con el Tren de Libros de EvaluaciónMOPAN Brief on Multilateral Effectiveness: Doing Better With Less

En nuestro Tren de Libros de Evaluación hacemos parada en un documento clave para el momento actual del multilateralismo: “Doing Better With Less: Unlocking Efficiency in the UN”, primer thematic brief de la serie Multilateral Effectiveness in a Shifting Landscape de MOPAN (2025). El informe nace en plena UN80 —la agenda de reformas del Secretario General para un sistema más ágil y efectivo— y propone algo tan simple como exigente: mejorar la eficiencia sin sacrificar la efectividad. (MOPAN)

1) Resumen general y objetivo principal

El brief sintetiza evidencias de 15 evaluaciones recientes de agencias de la ONU y multilaterales para responder a una pregunta práctica: ¿Cómo “hacer mejor con menos” sin vaciar las funciones esenciales de supervisión, aprendizaje y calidad? La respuesta de MOPAN es nítida: la eficiencia solo es valiosa si protege y potencia la efectividad. El contexto no es menor: presiones presupuestarias y propuestas de reducción del 15–20% en puestos de alto grado en la Secretaría y otras entidades, en línea con la agenda UN80. (MOPAN)

Sigue leyendo

Coordinación basada en área: ¿moda pasajera o giro necesario?


Contexto

Desde 2022, la conversación sobre cómo coordinamos respuestas complejas ha virado hacia modelos basados en territorio y no solo en sectores. Informes recientes muestran que, ante crisis más urbanas, prolongadas y politizadas, mecanismos subnacionales y arreglos “no estándar” ganan peso —en parte por el impulso a la localización y al nexo HDP—, aunque sin reemplazar al sistema de clusters (ICVA, 2024; ALNAP, 2022; OCHA, 2025). La coordinación basada en área (ABC) surge aquí como una manera de integrar servicios y actores en una unidad geográfica concreta (FS Cluster, 2023).

Enfoque

La ABC define un área (barrio, distrito, asentamiento) como punto de entrada para el análisis, la planificación y la coordinación, articulando múltiples sectores y actores locales—autoridades, OSC, empresas de servicios— bajo una visión común. La guía del FS Cluster resume su valor: permite respuestas multisectoriales, participativas y ancladas en capacidades y gobernanza locales; suele coexistir con clusters y su aplicación es altamente contextual (FS Cluster, 2023). Evidencia comparada sugiere que un modelo híbrido (sectorial + basado en área) mejora ajuste contextual y coherencia operativa (Kemoklidze, 2022; ICVA, 2024).

Sigue leyendo

La cooperación cansada y el deseo de mundo: hacia una política del cuidado lúcido


Seguimos con nuestra serie «Repensar la ayuda»

El mundo de la cooperación internacional atraviesa una crisis silenciosa.

No solo de recursos o legitimidad, sino de sentido.

En su intento por salvar al mundo, corre el riesgo de perder la capacidad de sentirlo.

Byung-Chul Han, ese observador fino de los malestares contemporáneos, diagnostica que vivimos en una “sociedad del rendimiento” donde el sujeto “se explota a sí mismo creyendo realizarse” (La sociedad del cansancio, 2010).

El cooperante de hoy es su ejemplo perfecto: motivado, comprometido, exhausto.

Su ética es impecable, su cuerpo está roto.

Pero el análisis de Han ofrece capas más profundas que aún no hemos explorado en la reflexión sobre cooperación: la pérdida de la negatividad, la obesidad comunicativa y el infierno de lo igual.

Sigue leyendo

Evaluar en movimiento: Michael Quinn Patton y la revolución de la Evaluación durante el desarrollo


1. Resumen general del libro y su objetivo principal

El libro de Michael Quinn Patton, «Developmental Evaluation: Applying Complexity Concepts to Enhance Innovation and Use» (2011), que lo hemos traducido siempre en este blog por:  Evaluación durante el desarrollo (EDD): aplicar conceptos de complejidad para potenciar la innovación y el uso”, representa una de las obras más influyentes en la evolución contemporánea de la evaluación.

Su objetivo principal es ofrecer un marco conceptual y práctico para evaluar iniciativas en contextos de alta incertidumbre, innovación o cambio continuo, donde los modelos de intervención no están cerrados.

Patton parte de una observación sencilla pero revolucionaria: los modelos clásicos de evaluación —formativa (para mejorar) y sumativa (para juzgar resultados)— no sirven bien en entornos de innovación. Cuando un programa aún está “en construcción”, la evaluación debe estar presente durante su desarrollo, no al margen ni al final.

La EDD, por tanto, se convierte en una herramienta de aprendizaje y adaptación que acompaña la innovación mientras sucede. Es la evaluación que viaja dentro del tren, no la que espera en la estación final para levantar acta.

Sigue leyendo

Grounded Theory (teoría fundamentada): Un Viaje Desde la Observación


La Habana olía a café quemado y a humedad de mercado viejo. Pablo y yo acabábamos de terminar un taller sobre evaluación, y yo, todavía medio perdido entre Power points y teorías, me había escabullido por un laberinto de puestos donde vendían artesanía: imanes y cuadros de distintos tamaños que mostraban coches de los años 50 o los bares emblemáticos —La Bodeguita del Medio, El Floridita, Sloppy Joe’s—, o la figura del Che mirando al infinito. También había collares de semillas y santos de yeso que parecían vigilarte mientras regateabas.

Pablo apareció con cara de inspector que acaba de perder a su principal testigo.

—Te has perdido otra vez —me dijo, con esa mezcla de enfado y resignación de quien ya ha asumido que su compañero de taller se guía más por el instinto que por el mapa.

Yo, fascinado por el espectáculo del mercado, le solté:

—Pero mira cómo me cuentan las cosas, Pablo. Esto vale más que una conferencia.

Y ahí, entre el ruido, el sudor y el olor a coche antiguo que aún cree que puede ganarle la carrera al tiempo, me habló por primera vez de la Grounded Theory, o teoría fundamentada. Lo dijo como quien confiesa un viejo amor metodológico: apasionado, pero desencantado.

Sigue leyendo

El día que los sistemas me explicaron su oscuro secreto


Basado en:

  • Five core concepts for understanding systems, Andrei Savu, 16 septiembre 2025 👉 link
  • Four core concepts for expanding a systems view to system dynamics, Andrei Savu, 16 septiembre 2025 👉 link

Introducción: La llamada a medianoche

Estás tranquilo, viendo una serie mediocre en Netflix, cuando suena el móvil. No es tu ex, ni Hacienda, ni el primo que siempre pide dinero. Es el Sistema. Así, en mayúsculas. Te llama para decirte que llevas toda la vida metido en él, que no tienes escapatoria y que además no lo entiendes nada.

Y claro, te entra la paranoia. Porque resulta que el sistema no es un Excel con casillas bonitas, sino un bicho raro que mezcla fronteras invisibles, bucles que se retroalimentan y dinámicas que hacen que la cerveza de la nevera desaparezca más rápido de lo que la repones.

Bienvenido a la novela negra de tu vida: los cinco conceptos para entender sistemas (propósito, frontera, feedback, palancas y emergencia) y sus cuatro secuaces dinámicos (stocks, flujos, retrasos y patrones de comportamiento). Y todo firmado por Andrei Savu, un tipo serio que escribe en inglés lo que yo te voy a contar como si fuera un thriller con resaca.

Sigue leyendo

Survival or Renewal: PowerPointism or Metamorphosis ?


The inspiring piece Survival or Renewal?  (September 2025) makes a bold case: the UN cannot limit itself to technical or cosmetic reforms, as those only prolong inertia. To survive in a world of overlapping crises, it needs nothing less than a cultural and political metamorphosis. The metaphor is vivid: like a caterpillar that dissolves before becoming a butterfly, the system must allow new “imaginal cells” to emerge—building a different model rather than yet another patch on the bureaucracy.

Core ideas and originality

Without a radical shift of model—anchored in collaboration, distributed power, shared purpose, and internal renewal—the system risks remaining trapped in “bureaucratic survival” and losing its relevance.

The paper highlights four bold shifts:

Sigue leyendo