IA Voix Off et Audiovisuel : Pourquoi l’humain reste la seule énergie durable ?

Image représentant le sujet de l'article sur l'IA la Voix Off et l'Humain

Le débat sur l’Intelligence Artificielle dans l’audiovisuel (IA Voix Off, IA Cinéma, IA Métiers de la post production) ressemble de plus en plus à une foire d’empoigne qu’à une vraie réflexion éthique, morale et nuancée d’un sujet de société. Vous me direz, la nuance aujourd’hui…

D’un côté, les technophiles exaltés. Comme certains comédiens qui ont pignon sur rue et qui s’enthousiasment pour le clonage vocal. Ceux-là qui ne voient dans le progrès qu’une réduction des coûts et une extension de leur propre image, voix et royalties à travers le monde dans toutes les langues. Ils pensent réellement à s’y méprendre que : « si si, ça sera bien ma voix qui sera dans toutes les langues. »

Ah bon ? Ça ne sera pas passé à la moulinette des algorithmes ? Aux inflexions adaptées pour des sonorités différentes en sortie ? Différentes car inhérentes aux particularités de la langue et de la musicalité naturelle de celle-ci ?

Ça serait vraiment comme si c’était toi qui parlait dans cette langue ? Ah bon ? Mince alors !

Tu peux nous le montrer ? Et bien non puisque tu ne parles pas cette langue… Donc ça ne sera jamais vraiment toi. Ça sera un « toi » avatarisé. Algorithmé. Numérisé. Cloné. Mais déshumanisé.

De l’autre côté, des voix off connues qui, tout en montrant les prouesses du deepfake vocal, tentent de rassurer en plaçant l’humain comme « chef d’orchestre ».

Et oui, vous comprenez, ce qui compte au final c’est que ça soit « ma voix » qui fasse tous ces personnages. Le reste ? La production IA sans expertise, sans professionnels qu’on aurait payés pour faire un travail propre ou sans même les vrais acteurs qu’on aurait pu payer ? Oh et bien quoi ? On s’en fiche non ?

Bah non, on s’en fiche pas. Sinon ce n’est pas… c’est quoi le mot ? Correct ? Oui, je pense que le mot c’est au minimum « correct ».

On ne peut pas, à l’inverse de ce comédien qui veut supprimer le « doublage », supprimer toute l’industrie cinématographique ou graphique tout court. Ça serait jouer au même jeu mais à l’envers.

Elle est où la logique ? Il est où l’honneur ? Et surtout, elle est où notre humanité ?

L’IA : Un mirage numérique face à la réalité physique

Mais en plus, au milieu de ce vacarme, on oublie l’essentiel : la réalité physique de notre monde.

Entre les vendeurs de formations « miracles » qui en profitent eux aussi pour nous fourguer leur formation bancale sur « comment faire avec l’IA » (sous prétexte qu’ils ont commencé à s’y intéresser trois mois avant tout le monde) et les stars qui rêvent d’immortalité numérique, il est temps de remettre l’église au milieu du village.

L’IA n’est pas une fin en soi, c’est une machine. Et comme toute machine, elle a un coût que notre égo nous empêche parfois de voir.

Le mur énergétique de 2030 : La fin du « toujours plus » de calculs ?

Je voulais très vite commencer par ce sujet qui ne revient pas assez dans les débats alors qu’il est tout simplement central.

On nous présente l’IA comme une entité éthérée, presque magique, dans le sens où elle est omnipotente, toujours plus puissante, intelligente, précise et perfectionnée sans parler assez de ses gros défauts.

De fait, on nous fait croire par ces omissions que l’IA est une vertu dont il faut forcément adopter l’inexorable marche et s’accrocher à son développement sans poser plus de questions que « pour ou contre ». C’est faux.

L’IA est surtout une industrie lourde. Selon plusieurs rapports d’experts, nous fonçons droit vers un « mur énergétique » à l’horizon 2030.

La puissance de calcul nécessaire pour entraîner les modèles de type Sora (vidéo) ou les GPT-5 augmente de manière exponentielle, bien plus vite que notre capacité à produire de l’énergie décarbonée.

« Il n’y a pas d’énergie propre, il n’y a que de l’énergie moins sale. Le numérique consomme aujourd’hui 10% de l’électricité mondiale. » — Jean-Marc Jancovici

D’ici 2030, la demande électrique des centres de données pourrait doubler. Est-il raisonnable de brûler des mégawatts pour générer des vidéos de chats qui font du skate ou pour cloner la voix d’un acteur qui pourrait simplement se déplacer en studio ? La question n’est plus seulement technique, elle est prioritaire.

L’IA : Une consommation d’eau et d’énergie au service de la vacuité ?

L’IA est une assoiffée. On estime qu’une simple conversation de 20 questions avec ChatGPT « consomme » environ 500 ml d’eau pour le refroidissement des serveurs.

Rien que d’y penser, je ne peux m’empêcher de penser à mes propres conversations avec l’IA. Et vous, vous y pensez aux vôtres ? Est-ce qu’on y pense vraiment assez ? 

Si l’on passe de la simple ligne de texte à la génération d’images ou de vidéos, les chiffres s’affolent.

Pour produire une vidéo publicitaire de quelques secondes ou une scène de film via l’IA, on ne parle plus de millilitres, mais de litres d’eau et de kilowattheures. Selon plusieurs estimations techniques, la génération d’une seule image haute définition par IA consomme autant d’énergie que la recharge complète d’un smartphone.

Pour une vidéo ? Multipliez cela par 24 images par seconde. Puis, par autant de minutes que constituent une énième vidéo faite pour « l’effet wahou ».

Vous savez, ces vidéos qui servent d’exemple sur Internet et surtout sur LinkedIn pour prouver que : « Wahou ! Vous voyez ? Le futur est là ! Je le savais ! Ah ah ! On est foutus ! Enfin vous êtes foutus ! Enfin, euh, je sais plus… »

Réalité technique pour obtenir quelque chose de « propre »

Mais le vrai coût caché réside dans le processus professionnel : pour obtenir un résultat « acceptable » pour une diffusion, un créateur doit souvent effectuer 10, 50, parfois 100 « passes » ou itérations (les fameux prompts). À chaque essai infructueux, les serveurs tournent à plein régime.

Pour une scène de 10 secondes, on peut rapidement atteindre la consommation électrique nécessaire pour éclairer une maison entière pendant une semaine.

Le paradoxe de la retouche : Souvent, l’IA produit des erreurs (artéfacts) que l’on tente de corriger par… encore plus d’IA.

Ce cycle de calcul permanent, ajouté aux retouches humaines finales sur des machines surpuissantes, crée une empreinte carbone colossale pour un gain de temps qui, au final, s’avère bien mince par rapport à un tournage traditionnel ou à une prestation humaine directe.

L’IA consomme beaucoup d’énergie, parfois pour de vrais bénéfices (recherche, médecine, santé) et parfois pour n’importe quoi (trends internet, bêtises, fakes news, désinformation…)

Là aussi, selon moi, avec une énergie qui coûtera de plus en plus cher, l’IA ne sera peut-être pas si accessible. Il faudra légiférer. Pour moi, revenir à l’humain, qui consomme moins d’énergie pour faire la « chose artistique », sera de mise contrairement aux prédictions.

Et même sans parler de « consommer moins » pour ceux qui me rétorqueront que « non un tournage classique consomme beaucoup plus », encore une fois chacun son calcul.

Entre faire tourner des serveurs à plein régime pour quelques milliardaires en bout de chaîne ou faire tourner des techniciens, techniciennes, acteurs, actrices, accessoiristes, etc : mon choix est fait.

IA Voix Off : Quand l’expertise ne s’invente pas

Beaucoup de néophytes s’extasient devant un lip-sync ou une voix synthétique parce qu’ils ne connaissent pas les rouages de notre industrie. Ils voient le résultat, pas la médiocrité du détail.

Ceux qui travaillent réellement avec ces outils le savent : obtenir un résultat professionnel avec l’IA est chronophage, complexe et souvent frustrant.

Le résultat peut être aussi très satisfaisant. Mais encore une fois : à quel prix écologique ? Et ensuite, à quel prix « artistique » ? Car oui, on peut obtenir des « produits » spectaculaires.

Parfois, on peut être sidéré par la perception d’un rendu fini qui aurait été impossible à atteindre en seulement quelques clics et quelques euros avant. Oui mais peut-être que tout le « truc » est là.

Ce que vous obtenez ici n’est peut-être qu’une illusion. Un géant… de papier. Ou plutôt de « numérique » sans aucune âme. Juste l’illusion de votre âme.

Oui le résultat a été conduit par vous. Oui vous avez donné vos instructions, méticuleuses, précises et peut-être « imaginatives ». Mais ce ne sont pas vos petites mains qui ont façonné le résultat. Ce ne sont pas vos années d’expériences qui ont été à la conduite des outils concrets pour graver dans l’image et le son les résultats obtenus. Non.

Ce qui a été à l’œuvre c’est une IA qui a su faire correspondre à vos desiderata sa propre base de données, ses propres mécanismes logiques, sa propre connaissance des « process » à amener pour réaliser les tâches nécessaires à la réalisation de vos instructions.

La perte d’authenticité dans les rouages

Toutes ces étapes sont des choses qui vous échappent à plus ou moins grande échelle, en fonction de la précision de votre prompt et de votre expertise. Mais dans tous les cas, vous y perdez une partie de votre authenticité dans les rouages.

Ça se voit et ça se sent de plus en plus. Trend après trend. Exemple après exemple. Les vidéos, les sons se ressemblent, s’uniformisent, tombent à plat.

Je demeure même convaincu qu’au tout départ, nous étions plus estomaqués par la faisabilité de tels produits qu’au produit lui-même. Ce qui est ballo pour une vidéo publicitaire pour présenter un produit.

Et maintenant, les « effets wahous » sont devenus tristement attendus et prévisibles. Ah oui, ça sera toujours plus beau, lisse, bien fait. Mais bon sang comme ça en devient banal !

Pour faire le parallèle avec le domaine de la voix : faire appel à un comédien voix off professionnel, c’est s’offrir une direction artistique en temps réel, une intention fine, et une garantie éthique.

C’est choisir la rapidité du talent face à la lourdeur du prompt. L’IA peut être un outil sporadique (pour une maquette, un nettoyage de son), mais elle ne peut constituer le produit fini sans perdre l’âme de l’œuvre.

Et en plus, avec le travail donné à l’IA, vous y perdez la relation humaine. Quand on y pense… des fois qu’on oublie pas de penser… que c’est triste ! 

Sortir de l’égoïsme technologique ou artistique: Pour une réponse collégiale entre IA, Voix Off, Industries

Il est fascinant (et déplorable) de voir comment chacun tire la couverture à soi.

  • Certains acteurs célèbres se réjouissent du clonage parce qu’ils y voient une rente éternelle, oubliant qu’ils scient la branche sur laquelle leurs successeurs devraient monter.
  • Certains technophiles pensent seulement à cette manne financière (facile) qu’ils vont pouvoir vendre à des clients avec leurs outils IA. Ou leur manière de les utiliser « un peu mieux » que des non-technophiles.

Personne ne pense au désastre humain, écologique, éthique, moral derrière.

Et personne ne pense aux conséquences de tels choix de société.

Pas plus que d’autres n’ont l’air de se soucier de la dégringolade du QI pour celles et ceux qui délèguent un peu trop leurs tâches à l’IA (notamment les étudiants).

Personne encore ne se soucie de l’abrutissante uniformisation des contenus, des textes, des images, des sons.

Quant au vol des ressources indispensables à l’IA pour cloner, répéter, singer l’art des vrais artistes… C’est bien entendu un problème dont se soucient les concernés. Mais c’est aussi presque devenu banal pour beaucoup. Personne réellement pour s’insurger, surtout tant qu’on peut continuer à générer de « l’effet wahou ». 

Personne. J’exagère volontairement. Est-ce que j’exagère de beaucoup ? En tout cas, je constate que trop peu en parlent ou que les algorithmes des réseaux ne portent pas assez leur voix ! 

Comme l’affirme Aurélien Barrau, astrophysicien et philosophe :

« Le remplacement de l’altérité par des algorithmes n’est pas un progrès, c’est un effondrement de la diversité sensible. »

Nous avons besoin d’une réponse équilibrée :

  • Non technophobe : Utilisons l’IA là où elle assiste l’humain sans le nier. Là où elle consomme raisonnablement pour des choses utiles sans tout détruire sur son passage.

  • Non humanophobe : Arrêtons de considérer le coût d’un humain comme une variable d’ajustement à supprimer.

  • Responsable : Refusons que l’alpha et l’oméga de notre stratégie soit dictée par les investissements de la Silicon Valley.

Conclusion : L’art est, par définition, humain

Si la technologie ne joue pas pour l’être humain, elle n’a aucun sens. Investir des milliards dans une technologie pour qu’elle finisse par nous rendre obsolètes tout en asséchant nos nappes phréatiques est une absurdité métaphysique.

Remettons l’église au milieu du village : le talent ne se clone pas, il se vit. L’émotion d’une voix, avec ses fêlures et son imprévisibilité, restera toujours plus puissante qu’une suite statistique de pixels ou d’ondes sonores.

Soyons des experts conscients, des créateurs mesurés, et rappelons que le futur de la voix off et du cinéma comme de toute forme d’art, ne se trouve pas dans un serveur refroidi au milieu du désert, mais dans la rencontre entre les sensibilités humaines.

Vous en pensez quoi vous ? On redevient humains un peu ? 

———————–

Si vous cherchez un humain qui parle encore dans un micro pour vous amener authenticité, vraies émotions ressenties et professionnalisme, je suis votre voix off homme en tout cas ! 

S’abonner
Notification pour
guest
0 Commentaires
Le plus ancien
Le plus récent Le plus populaire
Commentaires en ligne
Afficher tous les commentaires
Mes réseaux
  • S’ouvre dans un nouvel onglet
  • S’ouvre dans un nouvel onglet
  • S’ouvre dans un nouvel onglet
  • S’ouvre dans un nouvel onglet
Partagez facilement cet article sur vos réseaux !