X

Petite histoire de la visualisation de données

17 novembre 2014

La visualisation de données est une discipline qui s’est développée dans le domaine des statistiques dès le dix-huitième siècle. A l’époque, les théories statistiques et des probabilités par les mathématiciens Bayes et Laplace amorcent la résolution des problèmes dans la recherche de données [65]. L’apparition puis la généralisation des technologies informatiques, au cours des vingtième et vingt-et-unième siècle lui donneront un nouvel essor. Parallèlement, la représentation en arbres et la cartographie connaîtront également de multiples évolutions.

Cette section s’appuie notamment sur les travaux de Ptak [46], Rogers [84], Guilain [35], Sachs [47], Friendly [68] et Fijalkow [93].

 

Arbre des sciencesLes racines de la représentation d’images mentales remontent à l’Antiquité : les Grecs avaient élaboré un système complexe de représentations mentales comme outils de mémoire et les Egyptiens cartographiaient les étoiles [35]. Au Moyen-Âge, l’image comme ”substitut du langage” se retrouve dans les vitraux et dans les manuscrits, où les enluminures servaient de points de repère dans le déroulement des textes. Certains manuscrits proposaient déjà une forme de ”réalité augmentée” : les pointeurs représentés dans les marges seraient les ancêtres des pointeurs informatiques (flèche et main). D’autres annotations faisant référence à certaines sections du manuscrit se rapportent aux concepts actuels de navigation et d’hyperliens [33].

De Nicolas Oresme à Jacques Bertin

En 1370, le français Nicolas Oresme représente sous une forme graphique le rapport entre deux variables et préfigure les premiers graphiques en barres. En 1765, le britannique Joseph Priestley réalise la première ligne du temps historique. En 1786, William Playfair met au point trois types de conception graphique : la série statistique sous forme de courbes, le graphique en barres et le graphique à secteurs. Les premières cartes teintées (choroplèthes ) sont élaborées par le français Charles Dupin en 1826. Trois ans plus tard, le français André-Michel Guerry crée le premier histogramme et pratique la visualisation de statistiques comparées. En 1830, Armand Joseph a l’idée d’une représentation par des points et des cercles.

La britannique Florence Nightingale, pionnière de l’usage des statistiques dans le domaine de la santé, utilise, en 1857, des histogrammes circulaires pour illustrer les causes de mortalité de l’hôpital qu’elle gère. En 1868, Emille Levasseur travaille sur les premiers cartogrammes (statistiques figuratives). La première pyramide des âges est signée par l’économiste américain Francis Walker en 1874. En 1889, le français Joseph Minard réalise la carte des pertes napoléoniennes lors de la campagne de Russie.

minardLes diagrammes en arc sont mis au point en 1964, par l’américain Thomas Seaty. En 1977, John Tukey invente le diagramme en boîte (aussi appelé « boîte à moustache ») dans le domaine de la représentation graphique de données statistiques. C’est au cours des années 1970 que s’impose la théorie de la sémiologie graphique (cartes, diagrammes et réseaux) pensée par Jacques Bertin en 1967 ; et que l’informatisation a pour conséquence l’abandon de techniques manuelles (usage de carton et de dominos) [79].

Faire émerger de nouveaux concepts

Depuis les années 1980, les représentations de données connaissent d’importants développements avec l’apparition de tableurs qui permettent de générer des graphiques de manière automatique à partir de données préalablement encodées. Bonin souligne qu’à cette époque également, ”les traitements statistiques et mathématiques (analyses factorielles, hiérarchiques et autres) prennent une place prépondérante, moins subjectifs, plus scientifiques” [79]. Pour Bonin, ”le développement rapide de l’outil-ordinateur et de l’informatisation (…) stoppe l’utilisation des traitements graphiques et nuit au développement de la sémiologie graphique”. Tout au long des années 2000, on assiste à une démocratisation des outils de production de visualisations. Les visualisations de données ne sont plus l’apanage des domaines des statistiques des mathématiques ou de l’économie. La multiplication d’outils gratuits et prêts à l’emploi favorisent, depuis les années 2000, l’accès à leur création. Les visualisations sont devenues interactives. Le volume de données disponibles en ligne et de données ouvertes (open data) donnent lieu à l’apparition de nombreuses applications, journalistiques ou non, axées sur leur représentation.

La visualisation de données permet non seulement une meilleure représentation du monde, elle fait aussi émerger de nouveaux concepts ou des informations difficilement observables autrement. La visualisation de données constitue aujourd’hui l’un des outils les plus utilisés dans le contexte du journalisme computationnel en général, et du datajounalisme en particulier. Ce qui peut aussi s’expliquer par l’accessibilité d’outils en ligne, gratuits et simples d’utilisation, qui permettent de produire un graphique en quelques secondes (à condition d’avoir bien préparé ses données préalablement). Mais les outils de visualisation de données disponibles en ligne ne proposent pas autre chose que les représentations graphiques développées dans le domaine statistique au cours du dix-neuvième siècle (points, barres, lignes…), constate Manovich [52].

Un outil de mémorisation des connaissancestitrearbre

La représentation de données sous forme d’arbres constitue, au Moyen-Âge, un outil de mémorisation et de visualisation des connaissances. L’exploitation de la symbolique de l’arbre (symbole religieux et sacré) remonte également à l’Antiquité, et elle a traversé l’histoire de l’humanité et des cultures. Graphiquement chargés à leur naissance, les arbres de la connaissance se sont peu à peu dépouillés pour devenir des formes abstraites et épurées [56].

Avec le développement de la génération (algorithmique) de graphiques par ordinateurs, les arbres ont favorisé de nouvelles méthodes de conception et de développement. ”Comme n’importe quelle carte, une visualisation est toujours une interprétation, un point de vue unique pour comprendre le système”, relève Manuel Lima, soulignant la puissance et l’impact de cet outil de visualisation. Lima indique que les usages de l’arbre en tant qu’outil de communication se retrouvent dans une variété de domaines : religieux, généalogique, scientifique, biologique. . . Aujourd’hui, ils servent notamment à schématiser des bases de données et des systèmes informatiques [57] en proposant des structures hiérarchiques claires et simplifiées [16].

CartographieCette dernière approche historique est basée sur les travaux de Fernand Joly [31], Anne Le Fur [13], Palsky [34] et du site web Le Cartographe.

Les origines de la cartographie remontent elles aussi à l’Antiquité mais celle-ci ne deviendra un instrument de connaissance qu’au quinzième siècle. Les premiers croquis cartographiques ont pour objectif la conservation de la mémoire des lieux et des itinéraires. Ils sont gravés sur des tablettes d’argile.

On doit la première carte du monde connu au philosophe, mathématicien, poète et astronome grec Eratosthène de Cyrène (entre 276-194 A.J.-C.). En l’an 150, l’astronome et astrologue grec Claude Ptolémée réalise une carte du monde tel qu’il est connu à l’époque. Cette carte servira longtemps de référence. Les empereurs romains établissent des cartes, qui consistent en des itinéraires routiers de l’empire à l’usage des armées. Au Moyen-Âge, la représentation du monde est en forme de T (« Carte en T ») : la terre est circulaire et est symboliquement partagée en trois, évoquant la trinité catholique. Ces cartes sont appelées Mapa Mundi. Les cartes marines apparaissent au quinzième siècle. Dès le dix-septième siècle, les nécessités de la guerre et de l’administration exigent des cartes détaillées et à plus grande échelle. La carte de Cassini (ou carte de l’Académie) est la plus ancienne carte topographique de France (fin du dix-huitième siècle). A la même époque, la projection de Lambert – du nom du mathématicien mulhousien Johann Heinrich Lambert – propose un système de projection conforme (les méridiens sont des droites et les parallèles, des arcs de cercle).

Avec l’émergence de la cartographie statistique, se développent de nouvelles formes de représentations. Les cartes servent à visualiser des données (liées aux populations) sur un territoire déterminé. La première carte démographique apparaît en Prusse en 1828. La première carte statistique moderne – sur l’instruction populaire en France – est présentée deux ans plus tôt, en France, par Charles Dupin.

De 1845 à 1870, l’ingénieur français Charles Joseph Minard réalise une série de cartes figuratives dans lesquelles il s’essaie à l’adaptation de nombreux procédés graphiques. Les codes de la cartographie statistiques quantitative comprennent les cartes choroplèthes (cartes thématiques sur lesquelles les régions apparaissent en couleur), les cartes par points, les cartes isoplèthes (zones séparées par des lignes et points) et les cartogrammes.

La première carte climatique est présentée en 1817 par le naturaliste allemand Alexander von Humboldt. Il utilise des courbes isothermes pour indiquer les variations de température. Autre révolution du dix- neuvième siècle : la courbe en cloche du mathématicien allemand Carl Friedrich Gauss, est appliquée aux cartes – la terre y apparaît comme un ellipsoïde aplati aux pôles.

Un outil d’exploration des hypothèses et des données

La profession de cartographe apparaît dans ce contexte. La discipline, qui relève à la fois de la science de la géographie et du design graphique, a connu de nombreuses évolutions au cours du siècle suivant, en particulier depuis que les outils informatiques se la sont appropriée (logiciels de traitement de données et de dessin, cartographie automatique dès les années 1970). La cartographie assistée par ordinateur doit, selon Joly [31], être considérée ”comme un maillon d’une chaîne continue d’opérations qui, partant d’une récolte de données, se poursuit par un

traitement statistique ou mathématique (. . . ) et aboutit à la visualisation et/ou à la mémorisation sous forme cartographique des résultats obtenus” Avec l’introduction de l’informatique, constate Le Fur [13], ”la carte n’est plus un but mais un outil d’exploration des hypothèses et des données”.

Le résultat d’une série de choix

Le datajournalisme fait régulièrement appel aux cartes dans le cadre de représentations statistiques et/ou de mashups cartographiques (par exemple, la visualisation des délits dans une ville données ou celle de résultats de scrutins électoraux [30]. Mais il ne suffit pas de disposer d’un outil informatique et de matériel statistique territorialisé ”pour réaliser des cartes et procéder à une exploration interactive de n’importe quel territoire”, relève Anne Le Fur  [13]. ”Ce serait réduire la compétence des cartographes à une question de moyens techniques. Or la carte demeure une création où les compétences, le savoir-faire et l’imagination de l’auteur sont à l’œuvre.” Pour Le Fur, la carte ”est la représentation d’un espace. C’est la transcription dans une image de phénomènes localisés et des relations qui se développent entre ces phénomènes.” Et elle n’est pas neutre : ”elle résulte d’une série de choix et souvent exprime un point de vue”. Pour Joly, une bonne carte demande peu d’efforts pour être comprise rapidement [31].

(L.D.)


Références

[13] Le Fur Anne. « Pratiques de la cartographie ». Géographie. Armand Colin, 2007.

[16] Schneiderman Ben. « The eye have it. a task by data type taxonomy for information visualization ». Visual languages, 15(7) :336–343, juillet 1996.

[30] C. Eyrolles, J. Gray, L. Bounegru, L. Chambers, and N. Kayser-Bril. « Guide du datajournalisme : Collecter, analyser et visualiser les données ». Eyrolles, 2013.

[31] Joly Fernand. « La cartographie ». Que sais-je? Presses universitaires de France, 1999.

[33] Kaplan Frédéric. « L’origine médiévale de l’hyperlien, des pointeurs et des smileys ». Sitepersonnel, avril2013. (En ligne, page consultée le 28/06/2014). http://fkaplan.wordpress.com/2013/04/19/lorigine- medievale-de-lhyperlien-des-pointeurs-et-des-smileys/

[34] Palsky Gilles. « La cartographie statistique de la population au xixe siècle ». Espace, populations, sociétés, 9(3) :451–458, 1991

[35] Guilain Yann. « Infodesign: Le management visuel de l’information à l’heure du Big Data ». Actu’ gestion. Ellipses Marketing, 2013.

[46] Ptak John. « History of dots (circle subcategory) : Circles in gra- phical displays of quantitative data ». The Science Book Store, décembre 2009. (En ligne, page consultée le 29/06/2014). http://thesciencebookstore.com/2009/12/jf-ptak-science- books-llc-post-889-i-like-bumping-circles-as-modes-of- graphically-conveying-quantitative-datait-is-mor/.

[47] Sachs Jonathan. « 1786/1801 : William playfair, statistical graphics, and the meaning of an event ». Britain, Representation and Nineteenth-Century History. Ed. Dino Franco Felluga. Extension of Romanticism and Victorianism on the Net, non déterminé.

[52] Manovich Lev. « Media visualization : Visual techniques for exploring large media collections ». Media Visualization. Visual Arts Department, University of California, San Diego, pages 1–21, 2011.

[56] Lima Manuel. « Visual Complexity : Mapping Patterns of Information ». Princeton Architectural Press, 2013.

[57] Shneiderman Manuel, Lima Ben. « The Book of Trees : Visualizing Branches of Knowledge ». Princeton Architectural Press. Princeton Architectural Press, 2014.

[68] Friendly Michael. « Handbook of data visualization ». Springer Berlin Heidelberg, pages 15–56, 2018.

[79] Bonin Serge. « Le développement de la graphique de 1967 à 1997 ». Colloque « 3o ans de sémiologie graphique ». 1997. (En ligne, consulté le 24/06/2014). http://cybergeo.revues.org/490

[84] Rogers Simon. Facts are Sacred : Text only ebook. Faber & Faber, 2013.

[93] Fijalkow Yankel. « Interrogations locales et échanges internationaux : les facteurs d’émergence de la mesure scientifique de l’encombrement des ménages parisiens ». Annales de démographie historique, 2(114) :137–190, 2007.

# #