Evaluación y visualización de datos

Visualización de datos

Esta vez toca hablar de la visualización de datos, aprovecho la publicación que hice con Rafa Monterde (el creador de la Evaluateca): Estrategias cualitativas de evaluación en la Cooperación para el Desarrollo: viejos debates y nuevos retos (Rodríguez Ariza & Monterde, 2014) en la que dedicamos un apartado a la Evaluación y la visualización de datos.

Visualización de datos

Y por qué no decirlo, este es un submundo dentro del mundo de la evaluación, en la que tenemos a grandes figuras. Entre todas las estrellas de la visualización empecemos por Sara Vaca. En su página web Visual Brains muestra parte de su creatividad. Una pena que no dedique más de su arte a su lengua materna i

Visualización sobre lo que es y no es evaluación

Visualización sobre sistemas rígidos o flexibles

Visualización sobre el grado de participación en el proceso evaluativo

También podemos citar a Stephanie Evergreen y Ann K Emery como pioneras desde la American Evaluation Association de todo lo relativo a visualización de datos.

Checklist de la visualización de datos

Stephanie es una referencia en visualización, ha publicado recientemente el libro Presenting Data Effectively y podemos encontrar más en su página web Evergreen Data

Ann Emery también publica sus visualizaciones en su página AnnkEmery, muy creativa, accesible y comprende el castellano (i), la conocí a través de EvalCentral (cuando todavía existía EvalCentral claro, gracias Chris Lysy por darnos y quitarnos esa oportunidad como un visionario y dios de la visualización que eres).

La visualización de datos es cada vez más una competencia clave para los evaluadores. La evaluación cualitativa está incorporando rápidamente una gran variedad de técnicas y herramientas de visualización de datos. Aunque parezca nuevo, esta temática ha sido de interés para el campo de la evaluación durante una década y media. Una buena muestra de ello podemos encontrarla en la publicación de 2013 de dos títulos monográficos de la revista de la Asociación Americana de Evaluación ”New Directions for Evaluation” (Dos números de New Directions of Evaluations se dedican a Data Visualization (Números 139 y 140, otoño e invierno de 2013) y la reciente creación de un Grupo de Interés (2013) sobre la visualización de datos en este colectivo, referencia internacional de las redes profesionales de evaluación.

Revista de la AEA sobre Visualización de Datos

Dado este interés y los continuos avances tanto en software de visualización, potencia de procesamiento y capacidad de almacenamiento, la visualización de datos se ha convertido en un potencial valor añadido para la comunidad de evaluación que permite mejorar la forma en que diseña, analiza y comunica la información.

La visualización de datos es el proceso de representación gráfica de los datos con el fin de identificar tendencias y patrones que de otra manera serían confusos o difíciles de analizar. La visualización de datos sirve para varios propósitos, desde la previa comprensión de los datos disponibles hasta su análisis y muy especialmente la comunicación a un una amplia gama de grupos de interés.

La elección de qué tipo de gráfica o visualización utilizar depende en gran medida de la naturaleza de las variables que se tenga: variables relacionales, comparativas, basadas en el tiempo, etc. Según Kosara (2007 en Azzam et al (2013)), La visualización de datos puede ser definida según tres criterios:

1) Es un proceso que se apoya indistintamente en datos cualitativos o cuantitativos

2) Los resultados son una imagen representativa de los datos en bruto

3) La representación es entendible por las destinatarios

El producto final es compatible con la exploración, el examen, y la comunicación de los datos. Aunque estos criterios pueden parecer evidentes, en la práctica se necesita una consideración cuidadosa y su aplicación sistemática para alcanzarlos.

El primer criterio, basado en datos cualitativos o cuantitativos, es el más sencillo de lograr, porque durante una evaluación a menudo reunimos varias formas de datos que pueden potencialmente ser visualizados. Se mantiene el criterio amplio de datos porque los datos cuantitativos y cualitativos pueden tomar muchas características y atributos. Los datos cuantitativos pueden incluir elementos de coordenadas geográficas, la codificación cuantificada, diversas características demográficas, y otra serie de valores en base numérica. Los datos cualitativos también pueden tomar la forma de entrevistas transcritas, conversaciones grabadas, imágenes, vídeo, o dibujos a partir de eventos, procesos y resultados. Cada uno de estos tipos de datos requiere de enfoques únicos y métodos de visualización para optimizar el conocimiento que contienen.

El segundo criterio es un recordatorio para examinar los datos con cuidado, de forma que podamos asegurar que la amplitud y el alcance de la visualización no omite información importante, no sobrerepresenta ciertos datos, y que la visualización refleja con precisión la información contenida en los mismos. Tener este conocimiento en mente durante todo el proceso de desarrollo de la visualización puede ayudar a priorizar los elementos de diseño de visualización, de manera que su mensaje refleje lo que en realidad está en los datos. Este criterio es también un recordatorio importante para poder trazar una anipulación intencionada de la visualización que puede dar lugar a malentendidos.

Finalmente, en relación a la legibilidad, que ayuda en la exploración, el examen, y la comunicación, pueden utilizarse varios métodos, que varían en alcance y propósito. Todos requieren que el evaluador considere la audiencia para elaborar una visualización que debe ser atractiva y clarificadora. Lograr este objetivo es importante para convertir los datos en conocimiento.

Usos Actuales de Visualización de Datos en Evaluación

Las etapas iniciales del diseño de una evaluación, tienen que ver con la comprensión y obtención de puntos de vista sobre el objeto evaluado, su historia, las actividades, las partes interesadas y, en general el contexto en el cual opera el programa. Cuando se recopila esta información se pueden utilizar técnicas de visualización cualitativas, tales como el registro gráfico (una forma flexible de desarrollo de la teoría del programa, contando la historia del programa, de dónde viene, dónde está y a dónde va) o modelos conceptuales interactivos (permiten al evaluador crear múltiples niveles para comprender la intervención desde lo más general a lo más detallado), para obtener información de una manera visual interactiva que fomenta la discusión entre las partes interesadas (Azzam, Evergreen, Germuth, & Kistler, 2013, pág. 14).

Por otra parte, el diseño de las herramientas visuales de recolección de datos y el uso de métodos de recopilación que faciliten la visualización contribuyen significativamente a mejorar la calidad de la información que recopilamos.

Las consideraciones de diseño gráfico con aspectos como la posición, el espacio en blanco, simetría, influyen en la recopilación de datos en las encuesta. Elementos importantes en las encuestas son, por ejemplo:

(a) el espaciamiento desigual entre las opciones de respuesta hacía que se destacase de los demás;

(b) los grandes cuadros de texto para respuestas abiertas que conducen a respuestas más largas y generaron más temas durante el análisis.

Utilización de visualización en encuestas

Con frecuencia, la información recopilada en la evaluación a partir de muchas fuentes (Fuentes como encuestas, entrevistas, grupos de discusión, bases de datos, imágenes, videos…), se reduce a un solo valor numérico, tal como una puntuación media, o a fragmentos de frases que se utilizan para transmitir conclusiones acerca de la efectividad de un programa. Durante la etapa de análisis de la evaluación se necesita tener acceso a los detalles visuales, conectar diferentes tipos de información, identificar las desviaciones interesantes y patrones, y explorar la información desde múltiples perspectivas o niveles. Haciendo esto se mejora la trazabilidad y coherencia de los datos, incluyendo sus fortalezas y limitaciones, y permite que el evaluador detectar valores atípicos que pueden advertir de inconsistencias en cómo se introdujeron o apuntar a efectos inesperados del programa en un situaciones particulares.

Sin embargo, la función más extendida de la visualización es, sin duda, la comunicación, donde la juega un papel crítico en la difusión de los resultados de la evaluación. Por medio de la visualización de datos podemos involucrar a los participantes del programa aumentando así también su capacidad de entender los datos y participar en el proceso de evaluación. Mapas colaborativos, modelos lógicos y representaciones gráficas pueden facilitar la comprensión de los resultados y sus implicaciones al describir las actividades de un programa de una manera concisa y clara.

Las visualizaciones interactivas bien diseñadas para información y participación de la comunidad ayudan a que los interesados respondan a preguntas y ayuden a la definición de las variables y la interpretación de los resultados.

Además de la tradicional presentación de informes, donde la visualización de datos es de forma narrativa, están empezando a surgir nuevos métodos, como la infografía o los comics. Aquí podemos citar también Chirs Lysy y su freshspectrum

Comic de Chris Lysy

Otro ejemplo, los nuevos enfoques han llevado a la visualización de diagramas de bucle causal como una forma de representar la retroalimentación en los sistemas complejos.

Bucles causales para comprender un sistema agrario complejo

Tendencias futuras

El desarrollo de la visualización de datos ha experimentado un crecimiento exponencial en los últimos años. Esto se debe por un lado al aumento del interés e influencia de las tecnologías de la información sobre nuestras vidas y cultura, y por otro a la mayor disponibilidad de fuentes en línea para datos y visualización, así como en parte debido también a una mayor interactividad que ha surgido a través de la generalización de dispositivos táctiles. Como afirman Azzam y otros (op. cit.) “Esto continuará y la tendencia será hacia la participación activa de las partes interesadas en el proceso de visualización y la necesidad de que los evaluadores de facilitar ese compromiso. Probablemente las partes interesadas se irán acostumbrando a interpretar, crear e interactuar con las visualizaciones de datos”.

En el futuro, tendrán mayor relevancia las visualizaciones que tengan en cuenta múltiples puntos de vista sobre las intervenciones. Los avances en las aplicaciones de software de visualización están disponibles para el uso público y a menudo sin costo financiero. Por ejemplo, programas como ManyEyes, Tableau Public, y Gapminder ahora proporcionan servicios basados en web que permiten a los usuarios subir datos para visualizaciones personalizadas. Estas tendencias, cuando sean adoptadas por los actores implicados, es posible que obligue a ser más transparentes acerca de los datos que recolectamos, al aumentar la demanda y la validación de datos en bruto. Esta predicción acerca de la transparencia ya se está convirtiendo en una realidad en Estados Unidos, donde se ha financiado y establecido data.gov, cuyo objetivo es crear un repositorio global de datos que se puede acceder, descargar, y se analiza por cualquier ciudadano preocupado interesado en temas que van desde la salud hasta la política ambiental.

La interactividad es también parte de esta tendencia, y va a aumentar su importancia futura. Si las visualizaciones de datos están diseñados para llamar la atención, el software debe hacer uso de métodos para mantener esa atención. La capacidad de profundizar en los datos y personalizar la información parece ser el siguiente paso en la visualización de datos (capacidad de “estar a un clic de ver que los datos desagregados o desglosados”). Algunos programas de software como Tableau, Spotfire, y JMP de SAS, por ejemplo, ya lo permiten. Sin embargo, la curva de aprendizaje para la manipulación de los nuevos programas de software pueden ser muy altas y costosas. Las herramientas tendrán que encontrar un equilibrio entre la familiaridad (homogeneidad) y capacidad de personalización (heterogeneidad).

Desafíos

Los evaluadores y los usuarios finales de las visualizaciones de datos también deberían tener en cuenta lo que la visualización de datos no puede hacer. Existen varias limitaciones o precauciones a tener en cuenta:

1) La primera limitación se refiere a cuestiones relacionadas con la causalidad. Uno de los principales propósitos de la visualización de datos es ilustrar las relaciones causales. Sin embargo, las visualizaciones pueden engañarnos y llevarnos a pensar que existen relaciones causales cuando en realidad no es así. Si ver es creer, visualizar datos puede perpetuar errores o falacias a partir de estadísticas cuestionables, tales como correlaciones engañosas.

2) El segundo reto es la fiabilidad de los datos y la información. La base de cualquier visualización son los datos utilizados como base y punto de partida. Si los datos contienen valores perdidos o muestras no representativas, entonces es responsabilidad del evaluador reconocer claramente esas limitaciones a través de la utilización de notas u otros indicadores para evitar confundir a las partes interesadas. Aunque los informes narrativos pueden integrar más fácilmente advertencias, explicaciones de los niveles de confianza, y declaraciones de los niveles de significación, tal declaración de incertidumbre no es tan fácil que se dé en una visualización de datos.

3) El tercer reto está relacionado con la introducción de las visualizaciones nuevas o poco conocidas por los interesados. La mayoría de los implicados en las evaluaciones tienen poca familiaridad o habilidad con el diseño gráfico y el arte. La tecnología ha hecho la visualización más accesible para las personas sin profunda formación en arte o diseño gráfico. Sin embargo, los evaluadores han de considerar si es necesario capacitar a los directamente interesados en la interpretación de la visualización para evitar malas interpretaciones.

4) La cuarta limitación la comprensión de la conexión entre la visualización y el propósito / pregunta de evaluación.

Las evaluaciones a menudo contienen múltiples fuentes de datos y análisis, sin embargo, no todos los análisis requieren una visualización. En la selección de visualizaciones a crear, el evaluador debe tener en cuenta las principales preguntas de la evaluación y diseñar visualizaciones que puedan aportar algo y apoyar claramente la respuesta a esas preguntas. Es importante destacar la información más importante en las visualizaciones a fin de no oscurecer los resultados más relevantes de la evaluación (Azzam et al, 2013; op.cit)

Pues hasta aquí no más. Pronto será la Conferencia de la Asociación Americana de Evaluación que probablemente tocará muchos aspectos de la visualización de datos, ya que esta vez toca el tema «Evaluation+Design». Mis mejores deseos a Sara, Ann, Stephanie, Chris y todos los apasionados de la evaluación que allá se reunirán. Que la fuerza de la visualización de datos os acompañe i

Cartel de la Conferencia Anual 2016 de la Asociación Americana de Evaluación

REFERENCIAS CITADAS

Azzam, T., Evergreen, S., Germuth, A. A., & Kistler, S. J. (2013). Data visualization and evaluation. En S. Evergreen, Azzam, Data visualization, part 1. New Directions for Evaluation, 139, 7–32.

Rodríguez Ariza, C. & Monterde, R, (2014) Estrategias cualitativas de evaluación en la Cooperación para el Desarrollo: viejos debates y nuevos retos. Serie CECOD de Documentos de Trabajo del Centro de Estudios de Cooperación al Desarrollo, Número 29

"TripleAD": Aprendiendo a Aprender para el Desarrollo

Blog sobre la evaluación, el aprendizaje y la gestión del conocimiento en el sector del desarrollo y la ayuda internacional (a título personal)

Evaluación y visualización de datos

Un pensamiento en “Evaluación y visualización de datos”

Deja un comentario Cancelar la respuesta

Comparte esto:

Un pensamiento en “Evaluación y visualización de datos”

Deja un comentario Cancelar la respuesta