Datavisualisation : méthodes et outils pratiques

30/07/2014

Quelles sont les méthodes de conception de la représentation visuelle de données ? Quels outils utiliser ? Pour quels types de graphiques et dans quels contextes ? Suivez le guide.

Data Visualisation Nathan YauLa visualisation de données constitue « l’un des meilleurs moyens d’explorer et de comprendre un large ensemble de données », indique Nathan Yau, en guise d’introduction à « Data visualisation. De l’extraction de données à leur représentation graphique », publié chez Eyrolles en 2013. Longtemps vouée à la représentation de faits quantitatifs, la visualisation de données est devenue aujourd’hui un outil à part entière, voire un support de communication d’idées. Partant de ce constat, l’auteur, qui conçoit et crée des graphiques pour la société FlowingData, propose un manuel complet en matière de storytelling. « La meilleure visualisation des données, indépendamment de son format et de sa présentation, indique-t-il, est celle qui permet de voir ce que les données ont à dire », cela étant entendu qu’une donnée constitue, en soi, un élément de représentation du monde réel. Elle implique un travail de recherche et de vérification des faits, mais aussi sur des compétences graphiques. Car avant de commencer à travailler sur la visualisation, il s’agit de collecter les données et d’y détecter/corriger leurs éventuelles anomalies.

Choix des outils de visualisation et mini-tutoriels

L’ouvrage consiste en une succession de présentations, assorties de travaux pratiques destinés à acquérir les bases nécessaires à la construction de visualisations : récupération (web scraping) et structuration de données d’un site web à l’aide du langage de programmation Python, choix des dispositifs de visualisation, création de graphiques avec le logiciel R, utilisation d’ActionScript dans Flash ou de la bibliothèque Javascript D3, … De nombreux outils (open source ou non, semi-automatiques ou non) sont passés en revue, mini-tutoriels et de nombreuses illustrations à l’appui.

Les chapitres suivants sont thématiques : visualisation des modèles temporels (données qui évoluent avec le temps), visualisation des proportions (graphiques en couches, arborescence de rectangles,…), visualisation des relations entre les données (nuages de points, graphiques en bulles, diagrammes à tiges et à feuilles, histogrammes,…), identification des différences (comparaisons entre variables, cartes chaudes, recherches d’observations aberrantes,…), et visualisation des relations spatiales (cartographie et outils de géocodage).

« Lorsque vous visualisez les données, vous visualisez ce qui se passe autour de vous et dans le monde. »

Le dernier chapitre est consacré à la conception d’une datavisualisation efficace : prendre le temps de découvrir les données, préparer le public (avec l’importance de la contextualisation) ou traduire visuellement les données via le décodage. « La conception (…) permet de rendre les graphiques lisibles, compréhensibles et utilisables », estime Nathan Yau. Qui conclut : «  Même si l’on représente les données sous forme de graphiques depuis des années, ce n’est qu’au cours des toutes dernières décennies que les chercheurs se sont intéressés à ce qui fonctionnait et à ce qui ne fonctionnait pas (…) Lorsque vous visualisez les données, vous visualisez ce qui se passe autour de vous et dans le monde. Vous pouvez voir ce qui se passe à un micro niveau avec les individus ou à une échelle plus large en couvrant l’univers. »

L.D.

Nathan Yau. « Data visualisation. De l’extraction de données à leur représentation graphique », Eyrolles, 2013.

Mots-clés: | |