"Choisissez votre journaliste" - Doit-on avoir peur des médias synthétiques ?

Cette semaine, le média Kuwait News a fait le buzz en annonçant sa potentielle présentatrice générée par intelligence artificielle et qui pourrait tenir un bulletin quotidien sur Twitter. Même s'il ne s'agit bien sûr pas des premières expériences en la matière (en Asie, on met depuis longtemps des présentateurs virtuels à l'antenne), depuis l’avènement de ChatGPT et la multiplication des fonctionnalités offertes par l’IA générative, plusieurs médias synthétiques entièrement créés par des intelligences artificielles sont apparus dans le paysage de l’information. Voici un bilan au mois d’avril 2023.

Par Myriam Hammad, MediaLab de l'Information 

"Ceci n'est pas une présentatrice"

Les présentatrices et présentateurs synthétiques : ton avatar en IA

Les présentateurs générés par des avatars en IA étaient déjà présents sur Instagram à travers des flashs d’information générés sous forme de réels. C’est par exemple un usage depuis quelques mois maintenant, répétés en particulier par le magazine Antidote

La génération de ces avatars est permise par plusieurs technologies : du text-to-voice, du text-to-video, ou du text-to-audio. Mais parfois aussi, avec la combinaison des trois et la proposition du choix d’un avatar, comme ce que propose la startup synthesia.io.

Les vidéos générées sur synthesia peuvent être le fait de paramètres pré-remplis qu'il suffit de cocher, ou bien, être plus personnalisables. D’abord en opérant une sélection parmi plus de 125 avatars, ou en générant soi-même le sien. Pour le “construire”, il suffit de s’enregistrer sur un fond vert avec un script fourni par la société durant une quinzaine de minutes. Des conseils sous formats vidéos sont donnés pour pouvoir réaliser les enregistrements humains dans les meilleures conditions et pour que la version IA en soit la plus fidèle possible. L’on peut en retrouver toutes les astuces ici. Les voix peuvent également être choisies dans 125 langues disponibles mais sont tout aussi personnalisables. Concernant les abonnements, synthesia propose une première offre à 26 dollars/mois pour 10 vidéos. La création de son propre avatar IA revient à 1000 dollars par avatar. 

Les sites internets et newsletters générés par IA : véritable information ?

Mais d’autres médias synthétiques ont également vu le jour. Ces derniers se présentent comme des médias libérés de tout biais existant, créés pour montrer l’information “réelle”. Ces discours peuvent paraître à première vue contre-intuitifs - l’intelligence artificielle et le contenu présent sur internet n’étant pas non plus dénué de biais humains. Chaque source étant par définition le produit d’une agence, d’un média, d’un journaliste - eux-mêmes marqués par leurs propres lignes éditoriales et contraintes.

Prenons l’exemple de NewsGPT. NewsGPT est un site internet et une newsletter qui rapportent des brèves d’information sur l’actualité américaine et mondiale. Le contenu se génère automatiquement selon des sources et des images rencontrées par l’algorithme au cours de la journée (bonjour la propriété intellectuelle). Les sources en question ne sont pas rendues transparentes. Le GPT d'OpenAI - le large modèle de langage (LLM) qui alimente le chatbot viral ChatGPT d'OpenAI - n'est d'ailleurs même pas capable de partager ses sources, n'étant pas construit avec cet objectif. 

NewsGPT a été lancé au début de l’année 2023 et présente sur sa bannière la mention suivante : 

Soit un pitch reposant sur une information "réelle et non biaisée". Mais cette mention semble entrer quelque peu en contradiction avec les termes et conditions de NewsGPT : 

Cet article (le numéro 5 donc) nous éclaire sur la façon dont le contenu n’est pas vérifié : il n’est pas revu régulièrement, il n’existe pas de vérification indépendante de ce qui est publié. Les créateurs ne supportent pas les opinions qui pourraient être émises et ne pourraient être tenus pour des défauts ou des inexactitudes présents dans les articles. L’on a donc ici, encore un peu de difficulté à savoir comment le contenu généré par IA pourrait permettre de lutter contre la désinformation, sans aucune intervention humaine. Les précautions prises témoignent par ailleurs d’un existant qui n’est pas tout à fait abouti. Mais la promesse affichée, partagée sur Twitter en faisant découvrir NewsGPT est celle-ci : 

Cependant, force est de constater qu’il existe encore assez peu d’abonnés à cette initiative.

Un autre site a récemment attiré l’attention des commentateurs : celui de Generative Press. Le site d’information se présente également comme un site de brèves d’information, parfois plus originales car elles sont rédigées par quatre "personnalités" différentes (générées par IA) de journalistes.

Les informations sont produites à partir “d'informations populaires, de tweets des journalistes et de citoyens vérifiés”. Il n’existe ni équipe éditoriale, ni information humaine. Les derniers articles de Generative Press remontent à janvier 2023. Le site a été lancé par deux ingénieurs, qui reconnaissent eux-mêmes qu’il s’agit plus d’un site conçu à des fins de divertissement, qu’à un vrai site d’information :

Eto News est aussi un média synthétique qui a été crée pour s’orienter vers de l’actualité politique. Il est hébergé sur Substack et se présente comme “ un service sélectionnant trois à cinq organes d'information de l'ensemble du spectre politique et résumant leurs articles de manière impartiale et factuelle à l'aide du tableau de partialité des médias. Pour ce faire, nous utilisons eto, un outil développé par ChatGPT. Notre objectif est de fournir aux lecteurs des informations factuelles, afin qu'ils puissent se forger leur propre opinion, à l'abri de l'influence des programmes politiques ou des médias à sensation. Avez-vous remarqué des erreurs ou des biais dans notre travail ? N'hésitez pas à nous faire part de vos commentaires par courrier électronique !” On observe pour Eto News une différence avec ceux mentionnés précédemment : les articles mentionnent leurs sources directes, et il existe la possibilité de contacter une équipe humaine en cas d’erreur mentionnée dans les articles.

Enfin, Artifact, présenté au début du mois de mars 2023 par les créateurs d'Instagram, a ajouté cette semaine une nouvelle fonctionnalité : la possibilité pour les utilisateurs de se créer un profil et de pouvoir commenter les articles lus. Certains appellent d’ailleurs à des développements, qui peuvent laisser sceptiques sur le rapport à l’information de chaque citoyen. Les schémas parfois enfermant des algorithmes lorsqu’il s’agit de recommandations (musicales ou de streaming) semblent peu souhaitables au cadre de l’information - qui nécessite toujours une analyse critique propre à chacun. 

L'humain dans la boucle est indispensable

La présentation de ces différents médias synthétiques interpelle a minima sur deux aspects avant de parler des droits d'auteur : la créativité et la neutralité journalistique. Sur ce dernier point, les expériences de rédaction ayant utilisé l’IA pour générer du contenu sans vérification humaine, ont vite montré leurs limites. C’est l’expérience notamment du CNET, qui avait dû mettre en pause les articles générés par de l’intelligence artificielle, après que de “flagrantes coquilles” et un manque de transparence aient été mis en lumière. 

Buzzfeed continue de poster des articles dont le contenu a été généré par IA : un assistant créatif par IA a été lancé. Mais les articles concernent principalement des destinations de voyage. A se demander si utiliser l’IA ne mériterait pas autrement, une réflexion pour évoluer vers de nouveaux formats au lieu d'essayer de copier (mal) l'existant.

La neutralité est une notion depuis longtemps débattue. La façon dont chaque journaliste souhaite exercer son métier et le cadre dans lequel il le fait et auquel il est tenu s'éloignent de plus en plus l'un de l'autre.

Quant à la créativité, comme le soulignait récemment Sigal Samuel, journaliste chez Vox, les IA génératives “ utilisent le passé pour construire l'avenir “. Ne générer du contenu que par ce biais conduirait invariablement à une forme d’homogénéisation du monde - une intuition partagée par Raphaël Millière, expert en philosophie de l'IA à l'université de Columbia. D’autant que les articles les plus lus, seraient ceux qui pourraient être les plus mis en avant, selon les algorithmes établis par les géants et renforcer encore plus la bulle de filtre. Une perspective, qui ne peut qu’inviter les rédactions, les journalistes et les créateurs à se saisir de ces nouveaux outils, à en fixer les contours et leurs utilisations et à en tirer de nouveaux usages pour le futur.