Estamos acostumbrados a explicar con datos todo tipo de fenómenos cuantificables: el clima, las finanzas, el marketing, la economía, el rendimiento deportivo, etc. Sin embargo, no es habitual intentar explicar un texto a través de números. Parecen casi conceptos antagónicos, y en cierto modo así es. ¿Cómo capturar las sutilezas de un texto con la frialdad de los números?

Como es época de elecciones, hemos querido hacer una prueba. En los medios se publican constantemente los resultados de las encuestas electorales, e incluso se intentan predecir los resultados. Parece que lo único importante es saber quién va a ganar. Mucha gente apela al “voto útil”, es decir, votar al partido que creemos que va a ganar, o que va a tener influencia. Por ello las encuestas y las predicciones electorales son tan importantes.

¿Pero qué dice cada partido político? ¿Nos leemos sus programas? La respuesta habitual es que no lo hacemos. Como mucho, vemos los debates electorales, alguna entrevista, leemos la propaganda electoral, comentamos con amigos y familiares, y decidimos.

Para ayudar a generar debate sobre los programas electorales de cada partido, hemos planteado la siguiente visualización de datos. Con una única imagen, hemos resumido las 500 páginas de contenido de los programas electorales de los principales partidos que se presentan a las elecciones catalanas del 21D.

Hemos aprovechado los datos que publicó Daniel Rodriguez en este tweet sobre el tema. Básicamente, Daniel contó el número de veces que se mencionaban una serie de conceptos en los programas electorales de cada partido.

La técnica de visualización escogida ha sido el heatmap, muy útil para representar una variable según una serie de categorías (en este caso, las palabras y los partidos). La visualización está en catalán pero con la explicación que hemos dado creo que se entiende. Si queréis la versión interactiva, con más opciones de análisis, podéis consultarla aquí, pero recomendamos hacerlo como mínimo con una tablet.

programes polítics eleccions 21D generalitat catalunyaPor supuesto, no es posible reducir un texto a la frecuencia de aparición de una serie de conceptos. Por ejemplo, como nos dijo por twitter  Emília Rovira, mencionar más un tema no significa que el partido le de más importancia, y viceversa. Así mismo, los programas políticos tienen extensiones muy diferentes: como nos dice Ismael Peña-López en twitter, el PP tiene un programa de 18 páginas, y el PSC de 148 páginas. Nosotros hemos ponderado los datos, de manera que son independientes de la extensión del programa. Pero es cierto que comparar un programa muy corto con otro muy largo puede ser erroneo de entrada.

A pesar de estos problemas, creemos que la visualización es un buen punto de partida para generar interés sobre el tema. Quizá a partir de la visualización de datos, alguien intentará profundizar más sobre el tema. Si esto sucede, ya nos daremos por satisfechos.

Esta visualización tuvo muy buenos resultados en twitter: 130 retweets y 125 favoritos, que generaron más de 50,000 impresiones del tweet. Es un ejemplo de cómo gracias a la visualización de datos podemos generar interés sobre un tema a través de las redes sociales.