Journalisme structuré : de l’information aux données

12/11/2017

Pouvant encore être considéré comme conceptuel à ce stade de son développement, le journalisme structuré présente néanmoins un fort potentiel en termes de collecte d’informations et d’enrichissement sémantique. La locution se rapporte à « une pensée journalistique convertie en bits et en informations pouvant être combinés à l’infini.

 

Certains ont parlé du « journalisme légo » ou de « journalisme atomisé » pour le caractériser. Caswell & Dörr (2017) définissent le journalisme structuré comme une pratique qui « met l’accent sur les technologies et les flux de travail pour capturer et publier les connaissances journalistiques en tant que données structurées« . Il diffère du datajournalisme, qui désigne la pratique de l’analyse de données pour découvrir des histoires, dans le sens où il transforme des informations en données pouvant être répétées de différentes manières. Le chemin s’opère donc ici en sens inverse d’un processus « data-to-text » où des données sont converties en informations.

Datajournalism versus Structured Journalism

S’inspirant des principes inhérents au management de l’information, l’information traitée par le journaliste est stockée dans une base de données, permettant aux utilisateurs d’explorer le contenu à travers de nouveaux récits ou des visualisations. Il permet de ne pas livrer une histoire unique, utilisant les mises à jour de l’information qu’il combine avec des mises à jour précédentes.  Ce faisant, il permet de décliner le récit d’information en fonction de la plateforme de diffusion, assurant ainsi une réutilisation multiple et variée de l’information. En ce sens, « il conteste la suprématie de la forme narrative et non interactive qui, malgré une explosion de l’innovation numérique, reste le principal élément du journalisme« .

 

Source : https://topdrawersausage.net/2013/07/07/storylines-vs-object-oriented-news/

Un manifeste pour le journalisme structuré

Une petite poignée de médias se sont lancés dans ce type d’expérience, notamment aux États-Unis où The Washington Post a utilisé la technique d’un texte annoté permettant de l’enrichir via l’affichage d’informations de contexte, de graphiques et d’archives. La carte des homicides à Chigaco, développée en 2015, par Adrian Holovaty ainsi que son projet EveryBlock sont également considérés comme deux émanations du journalisme structuré. Ce qui démontre que la ligne de démarcation avec le journalisme de données n’est pas aussi clairement établie.

L’application mobile Circa News, lancée en 2012, était également considérée comme un objet du journalisme structuré. Elle proposait la consultation d’informations non seulement en fonction des préférences des utilisateurs mais aussi des mises à jour de ces informations, soit du breaking news personnalisé. Ici, nous ne sommes pas loin des algorithmes de priorisation et des filtres d’inclusion et d’exclusion décrits par Diakopoulos. L’application n’a pas convaincu, en dépit de levées de fonds portant sur plus de dix millions de dollars. Elle fera aveu d’échec en 2015.

Le 7 juillet 2015, le BBC News Lab publiait un manifeste pour le journalisme structuré. Considérant que l’activité du journaliste est celle de collecter et de traiter des informations, le texte constate qu’il existe une « foule de connaissance créées lors des phases de collecte de l’information« . Ces connaissances peuvent enrichir l’information et, partant, faciliter le travail des journalistes. La mise en relation entre les ressources est ici envisagée sur le mode d’un réseau au sein duquel les ressources s’interconnectent. « Nous croyons que le journalisme structuré rendra la BBC News plus intelligente, plus efficace et plus engageante. Nous croyons que le journalisme structuré nous permettra à tous de s’engager avec le monde de manière à reconnaître sa véritable complexité », conclut le texte.

Dans cet exemple, la logique envisagée se calque sur celle des linked data du web sémantique. Cette même logique pilote Structured Stories, conçue en 2014, une plateforme en ligne permettant de générer des récits relevant du journalisme structuré, à partir d’une bibliothèque d’abstractions d’événements journalistiques. Différents éléments multimédia sont attachés à chaque événement, rassemblés ensuite dans des structures narratives plus vastes et dont les caractéristiques récursives, fractales et d’organisation en réseau « cherchent à correspondre avec l’expérience cognitive du récit chez l’homme ». Les récits publiés forment un « réseau narratif » dont la trame repose sur une série d’assemblages (Caswell & alli 2015).

« Plus qu’un simple assemblage »

Malgré les potentiels du journalisme structuré, en ce compris le multilinguisme, Caswell & Dörr (2017) soulignent qu’un récit cohérent nécessite « plus qu’un simple assemblage d’une liste temporaire d’événements« . Les chercheurs définissent trois caractéristiques permettant l’organisation d’un récit journalistique structuré : les événements doivent être utilisés indépendamment des récits et faciliter le développement de « réseaux narratifs », les événements doivent disposer d’une valeur permettant d’indiquer leur importance relative dans le récit, les événements devraient être organisés de manière à faciliter une exploration sémantique des détails du récit. Dans Structured Stories, une technologie de génération de textes en langue naturelle est utilisée dans le processus d’automatisation des récits, via des abstractions (graphes de connaissances) qui les standardisent.

La proportion d’informations susceptible d’être automatisée à l’aide de ces techniques reste toutefois limitée : un premier défi porte sur les compétences rédactionnelles de l’auteur devant s’inscrire dans la logique de « fragments » et de « modèles » ; un second challenge porte sur la disponibilité des événements structurés et des données susceptibles de nourrir les récits. Cela nécessite également une « définition précise de la nature de l’information journalistique (en reconnaissant) la distinction entre la description statique et l’histoire dynamique« .


Références

Caswell, D., & Dörr, K. (2017). Automated Journalism 2.0: Event-driven narratives: From simple descriptions to real stories. Journalism Practice, 1-20.

Caswell, D., Russell, F. et Adair, B. (2015). Editorial aspects of reporting into structured narratives. In Proceedings of the 2015 Computation+ Journalism Symposium.

Mots-clés: | |