Dans un déluge de données

6 mars 2016

Datanomics« Datanomics. Les nouveaux business models des données » (FYP, 2015) entreprend une plongée dans le monde des données, partout présentes et dont l’utilisation « est au cœur des stratégies des grandes entreprises ». Cet essai est co-rédigé par  Simon Chignard et Louis-David Benyayer. Il s’appuie sur les expériences des auteurs – le premier est data editor de la mission Etalab, service du Premier ministre français en charge de l’ouverture des données, le second est membre du réseau d’experts de la mission Etalab et chercheur en stratégie.

Chaque jour, écrivent-ils, nous produisons 2,5 trillions d’octets de données et 90% des données dans le monde ont été créées au cours des deux dernières années. Cette croissance exponentielle du volume de données produites s’explique pour trois raisons : des avancées technologiques, qui ont notamment pour effets de réduire les coûts de stockage ; une demande en progression émanant tant d’acteurs privés que publics ; et une production volumineuse de données structurées (entre autres via les réseaux sociaux mais pas seulement). Ces données nourrissent des algorithmes « de plus en plus puissants et opaques » dans une variété de secteurs dominés par des plateformes telles que Google, Amazon, Airbnb. Si les données sont toujours le fruit d’une construction, notent les auteurs, celle-ci n’est pas exempte de tout biais. Par ailleurs, lorsque les données sont massives, les phénomènes de causalité et de corrélation deviennent beaucoup plus difficiles à identifier.

Valeur de données et productions automatisée

Que valent les données ? Il n’existe aucune réponse univoque à cette question, expliquent Chignard et Benyayer car il s’agit avant tout d’une question de perception. Le travail, la rareté et l’utilité constituent les trois fondements classiques de la valeur. L’abondance et la multiplicité des modes de production des données les remettraient en cause. Pour les auteurs, la valeur des données serait d’abord une question d’usages. Les données se vendent, s’achètent, deviennent librement accessibles. Elles sont source de nombreuses opportunités pour améliorer des systèmes d’information existants, pour servir de base à la prise de décisions stratégiques ou encore pour mener des politiques d’hyper-individualisation. « Algorithmisées », elles donnent lieu à des productions automatisées, notamment dans les entreprises de contenu. Avec ce que l’on appelle les « robots journalistes », le secteur de la presse n’échappe pas à ce phénomène. Les données sont aussi un terrain d’affrontement entre les acteurs (principalement américains) qui brassent le plus de données.

Une approche complexe et pluridisciplinaire

Mais les données sont aussi politiques, soulignent les auteurs. Dans l’avant-dernier chapitre, Chignard et Benyayer en expliquent les raisons liées à leur mode de production (quelles sont les données produites et pour quelles raisons ?), leur utilisation, et la redéfinition des frontières en redistribuant les rôles entre acteurs publics et privés. Le phénomène des villes intelligentes (smart cities) illustre ce propos. L’open data y est également brièvement examiné, dans un discours résolument positiviste (transparence et valeur ajoutée). Le dernier chapitre embraie sur des considérations ciblant tous azimuts : de considérations légales (propriété intellectuelle, droits d’auteur, données à caractère personnel), à économiques en passant par « la prison algorithmique », l’intelligence artificielle et la place des humains dans une société de plus en plus automatisée. De quoi démontrer la complexité du monde des données où l’agir est conditionné par des questions juridiques, économiques, techniques, politiques, sociales et démocratiques.

# #