Test : Articoolo, un plugin WordPress de génération automatique de textes

22 septembre 2016

Les acteurs de la génération automatique de textes ne s’intéressent pas qu’au seul domaine du journalisme, mais aussi (et surtout) au monde des entreprises. La start-up israélienne Articoolo, elle, entend répondre à une demande croissante en contenus originaux en ciblant les secteurs du marketing et de la publicité. Ici, pas de données en entrée, uniquement des mots-clés à partir desquels le logiciel – en version béta – va construire un texte en anglais de maximum 500 mots. Selon les informations publiées sur son site, le système consiste en un algorithme qui crée du contenu original de grande qualité,  dont l’objectif est de “simuler un vrai auteur humain” en fonctionnant “comme le cerveau humain“, et en utilisant les processus de génération de textes (GAT / NLG) et d’intelligence artificielle. Les contenus générés ne sont pas proposés gratuitement mais les tarifs semblent alléchants : un abonnement mensuel pour 250 articles coûte 99 dollars ; sans abonnement et pour le même tarif, le volume est « réduit » à 100 articles.

Le processus de génération prend à peine une poignée de minutes. Pratiquement, l’utilisateur rentre de deux à cinq mots-clés, choisit la longueur du texte et opte soit sur un texte présentant « une meilleure lisibilité » ou « contenu unique ». Autre originalité d’Articoolo : proposer un plugin de génération automatique de textes pour WordPress. L’accessibilité de l’outil rend les expériences possibles, alors on s’est jeté à l’eau pour un test grandeur nature.

1) Sur le site Articoolo

La page d’accueil du site invite d’emblée au test avec une ligne de formulaire dans lequel entrer des mots-clés. Premier essai avec « robot journalism ». Message d’erreur : “We cannot create an article for the given keywords, please try to rephrase your input”. Deuxième tentative avec la combinaison “Journalism Technology” et là c’est parti, le système entame son processus. Un écran noir en surimpression invite à patienter en suivant plusieurs étapes : extraction du sentiment et des mots-clés, rédaction de l’article, recherche d’erreurs de grammaire, proofreading. Trois minutes plus tard, le texte est généré. Seulement, impossible de se faire une idée : au moins 80% du texte apparaît flouté. Il faut passer à la caisse pour pouvoir en prendre connaissance. Que peut-on lire ? “Photojournalism is a kind of journalism that depends upon pictures to tell a narrative – It’s the image that expresses the news”. Jusque là, tout va bien. Et puis on tombe sur “This make us conscious of the company and its statuts”, qui ne semble déjà plus entrer dans le cadre du sujet. Un sujet que l’on aurait attendu plus axé sur la technologie et moins sur le photojournalisme, qui ne figurait pas dans la requête.

2) Via le plugin WordPress

Plugin WP Articoolo

On ne se décourage pas et on tente l’expérience, cette fois, avec le plugin WordPress Articoolo, accessible depuis le répertoire des plugins de WordPress. Trois essais sont permis. Donc on recommence avec « Journalism Technology », en choisissant l’option relative à l’originalité du contenu et, cette fois, le texte généré s’affiche au complet. Il reste deux crédits. Côté originalité, on retrouve exactement le début du texte généré dans le cadre du premier test mais c’est la seule occurrence commune. Le texte généré est ensuite soumis au calcul du score de lisibilité Flesh-Kincaid via la boîte à outils développée ici : http://ohmybox.info/linguistics/fr/  Le texte obtient un score de 31.92 : selon la logique de ce calcul, indépendant de la langue, plus le score est élevé (avec un maximum de 100), plus le texte est lisible. Le grade Flesh-Kincaid (12.39) indique que le texte s’adresse à des individus ayant bénéficié d’une éducation supérieure.

Test suivant : la réécriture d’un texte. Puisque l’option est proposée, le texte généré repasse à a moulinette du système. Sur la forme, petit souci ici : « They’ren’t Usually for ».  Le score Flesh-Kincaid est cette fois de 37.48 avec un grade de 11.69. Puisque l’on bénéficie de deux textes comparables, on va maintenant s’intéresser à la distance entre les deux textes en mesurant la distance de Levenshtein (ou distance d’édition) qui mesure la similarité entre deux chaînes de caractère. La distance de 627 indique que les textes ne sont pas très éloignés l’un de l’autre. Le pourcentage de caractères semblables (taux de similarité) est de 74.97%.

Le troisième test a pour objet de générer un texte sur les mêmes mots-clés mais, cette fois, en privilégiant la lisibilité sur l’originalité du contenu. Surprise : “We cannot create an article for the given keywords, please try to rephrase your input”. On se contentera de la combinaison “Journalism Digital”. A nouveau, le photojournalisme constitue le thème central de la génération. Le texte, qui privilégie la lisibilité, fait moins bien que les deux précédents : 28.79 (score Flesh-Kincaid) et 14.15 (grade Flesh-Kincaid).

La règle est de ne pas tirer de conclusions générales sur des tests menés à aussi petite échelle. Mais l’expérience donne quelques indications à propos de la qualité des contenus proposés (sujet, traitement), tout en s’interrogeant sur la pertinence de ne se baser que sur des mots clés, soumis à l’interprétation du logiciel (dont on ignore tout des ressources dans lesquelles il va puiser). Pour autant, le seul argument du SEO est-il suffisant pour convaincre dans la durée ?


Test 1. Mots-clés : Journalism Technology

Photojournalism is a kind of journalism that depends upon pictures to tell a narrative. It is not traditional photography as the images taken are mostly or wholly related to a news narrative or event. They’ren’t generally for amusement or gratitude, but more for conveyance of the news event. These pictures have to be relevant to society, educational and ought to be able to communicate what’s happening in the world. The pictures also needs to possess an objective quality. It is incredibly critical that the photograph is pertinent to the circumstance of the narrative being reported. Photojournalism is an essential aspect to the news media.

This makes paper reading and news reporting much better as now you can associate the news to real life scenes and comprehend completely what it should be like to be in that real place at that actual time. This applies specifically for individuals who aren’t overly fond of reading the paper or watching the news. It’s the images that express the news. Quite often photojournalists have to risk their lives to bring news in order that people can be kept advised about what’s going on. Through pictures they take, they’re able to provide information regarding events which have happened in the world.

This makes us more conscious of the company and its status. Technology has significantly changed the face of photojournalism. Today, news can travel the whole world in only a few minutes. With the advent of videophones, internet and fantastic publishing technology, photojournalism became extremely popular. This is the cause that photojournalists have the liability of bring in photographs which are objective. The drawback of technological progress is that now people can manipulate pictures. Codes of ethics have been put up for handling such problems. Photojournalism, as a career, is a significant job and requires attention and respect.


Test 2. Texte reformulé

Photojournalism is a type of journalism that is determined by photographs to tell a story. It isn’t conventional photography as the pictures taken are mainly or entirely related to event or a news story. They’ren’t Usually for enjoyment or appreciation, but more for conveyance of the new events. These images have to be related to society, ought and educational to be capable to convey what is happening in the world. The photos also needs to possess a target quality. It’s very vital that the picture is relevant to the position of the story being reported. Photojournalism is a vital facet to the news media.

This makes newspaper reading and news coverage considerably better as now you can relate the news to real life scenes and understand fully what it should be like to be in that real area at that time that is genuine. This uses particularly for people who are not too fond of watching the news or reading the newspaper. It is the pictures that express the news. Fairly frequently photojournalists must risk their lives to bring new to ensure that individuals can be kept advised about what is going on. Through photos they take, they are capable to supply advice regarding events that have occurred in the world.

This makes us more aware of its status and the company. Technology has somewhat changed the face of photojournalism. News can travel the entire world in only several minutes, now. With the arrival of web, videophones and excellent publishing technology, photojournalism became incredibly popular. This can be the reason that photojournalists have the obligation of bring in pictures that are objective. The drawback of technological improvement is that today individuals can control photos. Codes of ethics were set up for managing such issues. Photojournalism, as a profession, is a job that is significant and demands regard and focus.


Test 3. Accent sur la lisibilité plutôt que sur l’originalité

The individuals who take up photo journalism are people who look for news. Basically they’re distinct breed of people who’re inquisitive and have become attentive and always look out to get news under unusual or surprising scenarios. The most notable attribute of a good photo journalist’s is his or her anticipation of an event, which he\/she have a gut feeling or sense something extraordinary may happen. This is evident among the journalist photographers who’re present at the scene or happening. The photo journalists posses eye for details capturing the very intriguing activity news. The photo reporter utilize the photo pictures economically to depict the real news or the report of any special news event.

Put simply, photo journalism became a thrilling profession for those who look for challenge and excitement. The picture journalist has the eye for an eye-catching news photo. It is the spontaneous, alert head and sharp eye which gives the picture journalist the edge in selecting the visual image which will tell the news most efficiently. In photo journalism taking pictures at the right moment is essential. If you need to become the photo journalist, you must not only have the eye to get detail and additionally must be daring enough to get in to the centre of the activity regardless of the camera equipment you possess.

If you’re a brand new to photo journalism, depending upon the conditions, originally the compact camera can be adequate rather than a Digital SLR. The advantage of compact camera could it be may be concealed and handily used if in an extremely sensitive or an undercover scenario where the photographers individual safety are at a hazard. There are limits to using digicam for photojournalism. The lens and zooming capacity won’t help the photographer to take pictures at distance from the subject.

Put simply, you need to go nearer to the topic if you need any clear photos. The reaction time of compact digital camera is really slow, as a result unstable or fast action situations where the correspondent have to move quickly, the digicam might not be capable to seize the seen owing to slow reaction. The primary reason is the zoom and sensors that are electronically operated requires a couple of seconds to get activated. Essentially, the primary downside of compact digital camera is its slowness in capturing pictures. When when compared to the DSLR cameras that has the auto and car manuals, most picture journalists would agree that digicam is really slow.

# # #