
"Ce que nous voulons qu'il dise, c'est 'doubler les bénéfices' au lieu de 'une augmentation significative'."Photo : David M. Russell/HBO
Tout d’abord, il faut dire que le cousin Greg a fait le travail.Successionle sixième épisode de "Vivre+", dépend d'une présentation de la Journée des investisseurs présentant le nouveau concept immobilier éponyme Waystar Royco, qui est alternativement une expérience de bateau de croisière débarqué ou un camp de prisonniers pour personnes âgées selon à qui vous demandez. Quoi qu’il en soit, l’ensemble du discours est tenu en otage par l’empressement de Kendall à changer le discours de valeur autour du conglomérat médiatique structurellement en déclin.
Alimenté par le délire technologique (avec un grand côté de chagrin), Kendall pousse l'équipe financière à gonfler les projections de revenus, apporte un clin d'œil à la vie éternelle dans l'histoire du produit et engage Greg pour faire pression sur un technicien de scène pour qu'il manipule une vidéo de Logan. Roy, vu pour la première fois au début de l'épisode, pour faire dire au défunt patriarche quelque chose qui conforte les prévisions folles de Kendall. « Ce que nous voulons qu'il dise, c'est 'doubler les bénéfices' au lieu de 'une augmentation significative' », explique Greg. Le technicien hésite, ne sachant pas s'il a la capacité d'accomplir la tâche. « Putain, fais en sorte que cela se produise », répond Greg d'une manière d'intimidation distinctement Greg Hirschian. Et c’est ce que fait le technicien.
Nous avons déjà vu où les envolées scéniques de Kendall l'ont mené auparavant (voir "L aux OG»,la fête d'anniversaire "tous les bangers tout le temps"), mais miraculeusement ça marche ici. La présentation s'avère être un succès : le cours de l'action de Waystar Royco s'envole, la rendant peut-être trop chère à l'achat pour GoJo, et cela est dû en grande partie à la vidéo falsifiée qui donne une patine de légitimité à l'action de Kendall.prise de vue sur la lune.
Est-ce un acte de fraude d'entreprise ? Presque certainement. Mais voici la plus grande question qui suscite le débat dans le VautourSuccessionSlack : Ce clip vidéo était-il un faux ou simplement le produit d’un montage habile ? (Nous mettons de côté l'explication évidente selon laquelle leSuccessionL'équipe a probablement filmé Brian Cox disant les répliques falsifiées, car quel est l'intérêt d'en rester là ?) Pour trouver une réponse, nous avons montré le clip à Sam Gregory, le directeur exécutif deTémoin, une organisation internationale à but non lucratif dédiée à soutenir la documentation vidéo des violations des droits de l'homme. Au cours des cinq dernières années, Gregory a également dirigé une initiative appelée « Préparez-vous, pas de panique» qui vise à aider le grand public à mieux se préparer à un avenir médiatique généré par l’IA –qui est déjà à peu près là.
"La façon dont cette vidéo est filmée est en fait assez bien réglée pour faire du deep fake", observe Grégory, qui ne regarde pas.Succession(mais dit qu'il le fera maintenant). "Parce que c'est statique, c'est de face sur un fond neutre, et nous parlons d'un individu qui dispose probablement de nombreuses vidéos d'eux."
Cependant, même s'il est plausible que le clip soit un faux, Gregory n'en est pas certain. "Il peut s'agir simplement d'un montage conventionnel adouci par un saut de montage, à condition que les mots réels soient déjà prononcés ailleurs dans la vidéo", dit-il, notant que de tels outils sont facilement disponibles dans des logiciels de montage tels qu'Adobe Premiere. "Certes, tous ces outils s'appuient sur l'apprentissage automatique de l'IA sous une forme ou une autre, mais c'est l'explication la plus banale."
Pour évaluer correctement le clip, il faut d’abord comprendre la réalité selon laquelle il existe plusieurs manières différentes et croisées de commettre du deep-fake. La méthode dont on parle le plus est peut-être ce qu'on appelle un « échange de visage », qui a fait son apparition dans le public il n'y a pas si longtemps avecla célèbre vidéo deep-fake de Tom Cruise. Mais il s’agit également de la technique la plus compliquée à exécuter, car sa production nécessite une quantité importante de matériel source et de temps de traitement, ainsi que la nécessité d’un véritable imitateur pour « exécuter » la scène, après quoi des outils d’IA sont utilisés pour greffer le face prévue sur l’imitateur.
Ce n'est évidemment pas ce qui se passe dans le clip de l'Investor Day, qui semble conserver en grande partie la vidéo existante de Logan Roy qui a été établie en haut de l'épisode. Même si la série a tenté un échange de visage, l'équipe de scène n'a pas eu beaucoup de temps pour y parvenir. Après tout, il a à peine réussi à construire la maison Living+ sur scène !
Si le clip est effectivement un faux, il s’agirait plus probablement du produit de ce qu’on appelle un « doublage lip-sync ». C'est à ce moment-là que quelqu'un utilise des outils d'IA générative pour faire bouger les lèvres sur une piste audio, qui pourrait soit être les vrais mots de quelqu'un ajoutés ailleurs - dans ce cas, il faudrait que Logan dise "doubler les gains" dans un autre contexte - ou demandez à un imitateur de prononcer les mots et de diffuser cet enregistrement sur un certain nombre de supports largement disponibles.technologie de clonage vocal. Selon Gregory, la falsification audio est devenue beaucoup plus facile de nos jours et, plus important encore, avec des outils tels que ElevenLabs ou Microsoft.VALLÉE, vous n'avez même pas besoin d'autant de données brutes provenant de la voix de la personne à partir de laquelle vous essayez de créer de nouveaux mots et de nouvelles phrases.
Que le clip falsifié soit une coupe conventionnelle ou un véritable deep fake, une chose que Gregory souligne comme étant cruciale pour son efficacité a à voir avec la façon dont il est présenté. "Le succès d'une vidéo manipulée dépend aussi de la question de la plausibilité", dit-il. « Est-ce qu’on s’attend à ce que les gens essaient de faire des trous dans la revendication ? » Dans ce cas, Fake Logan affirmant que Living+ « doublera les revenus » sera-t-il soumis à un examen plus approfondi ? D’une part, le clip est si éphémère dans la présentation que la plupart des investisseurs pourraient ne pas le deviner ou ressentir d’éventuelles plongées dans l’étrange vallée. D’un autre côté, si l’affirmation était largement diffusée, un investisseur sceptique pourrait accorder une attention particulière au clip et potentiellement repérer des indices de manipulation.
Pour le plaisir, j'ai également demandé à Gregory d'évaluer le message vidéo que Roman reçoit à la fin de l'épisode, dans lequel la voix de Logan est trafiquée pour dire : « Je veux faire ce que je pense être une annonce assez historique. Je suis convaincu que Roman Roy a une micro-bite et se trompe toujours. Personnellement, je pensais qu'il s'agissait d'un exemple plus clair de montage conventionnel. Le message semble plus saccadé, et j'ai pensé que ce ne serait pas trop difficile de bricoler Logan en disantmicrobite. Mon collègue Christopher Bonanos, par exemple, a souligné quemicroaurait pu être retiré dema confiance,rode beaucoup de choses, et vous volez probablement unqueuede quelque chose commedicter. Bien sûr, nous n'entendons jamais Logan direma confianceoudicterdans l'enregistrement qui nous a été présenté au début de l'épisode, bien qu'unpourraitexpliquez-le en disant qu'on ne nous a montré qu'un extrait d'une session d'enregistrement brute plus longue.
Mais l'appréciation du message vidéo par Gregory est apparue plus rapidement et avec plus de certitude que le clip de présentation aux investisseurs… dans le sens oùceest définitivement considéré comme un deep fake. "Le clonage audio, très certainement, puis la synchronisation labiale", a-t-il déterminé. "Cela ressemble plus clairement à quelqu'un qui a manipulé sa voix pour dire quelque chose qu'il n'a jamais dit à l'origine."
Le message vidéo de Roman m’a semblé être un morceau de futurisme moralement intéressant. Utiliser une technologie deep-fake pour manipuler le cours des actions d'une entreprise est assez simple en termes de violations juridiques et éthiques, mais ce qui est curieux à propos du message vidéo, c'est comment il sert, en fin de compte, d'outil à Roman, notoirement retardé émotionnellement, pour faciliter son chagrin.
Que pense Gregory de cette application de la technologie ? « Habituellement, les contrefaçons de résurrection sont plus politiques », dit-il. "Quelqu'un ressuscite un journaliste assassiné pour critiquer l'État, qui est émotionnellement puissant." Cela dit, l’utilisation de technologies deep-fake à des fins de deuil n’est pas sans précédent. Grégory se souvientun article récentà propos d'un service mortuaire en Chine qui utilise l'IA générative pour fournir aux personnes en deuil un avatar de leurs proches décédés qui peut leur répondre : « C'est un domaine que certaines personnes s'intéressent définitivement. » Il est peut-être temps pour Roman de démarrer son jet privé fatigué pour un voyage en Chine.