L’IA générative permet d’automatiser et d’autonomiser la production synthétique d’images en mouvement réalistes, indépendamment de tout enregistrement direct d’un mouvement physique[note]Cet article discute les résultats de la phase I du projet « IA générative et vidéo : le corps hackeur » financé par la HES-SO Programme Initiatives stratégiques (Projets IA). La phase II financée par HES-SO Domaine design et arts visuels (RCDAV) est actuellement en cours.[/note]. Cette capacité, qui a conduit notamment à populariser l’expression de « deep fake » dans les médias, semble rendre inutiles le corps et l’espace dans la production vidéo et cinématographique, en même temps qu’elle rend potentiellement inutile l’usage d’outils de captation, y compris numériques. La logique technique de l’image vidéo générée par l’IA conduit à l’hypothèse d’un cinéma sans acteur·ice humain·ne suscitant, outre des questions portant sur le nouveau régime de représentation que cette logique semble introduire, de l’inquiétude et même des mouvements sociaux dans l’industrie du cinéma[note]Pour une étude de l’impact de l’IA sur l’industrie du cinéma, voir par exemple : CNC, « Quel impact de l’IA sur les filières du cinéma, de l’audiovisuel et du jeu vidéo ? », 9 avril 2024, https://www.cnc.fr/professionnels/etudes-et-rapports/etudes-prospectives/quel-impact-de-lia-sur-les-filieres-du-cinema-de-laudiovisuel-et-du-jeu-video_2144677. Les médias généralistes relaient largement ces débats, cf. Christophe Pinol, « L’IA au cinéma : “Insulte à la vie même” ou coup de pouce à la créativité ? », Le Temps, 12 avril 2025, https://www.letemps.ch/culture/ecrans/l-ia-au-cinema-insulte-a-la-vie-meme-ou-coup-de-pouce-a-la-creativite[/note].
La vidéo générative conforterait-elle le grand récit de l’obsolescence de l’humain, telle que l’analysait le philosophe Günther Anders à propos du rapport des humains à la technique moderne ?[note]Günther Anders, L’Obsolescence de l’homme. Sur l’âme à l’époque de la deuxième révolution industrielle [1956], trad. Christophe David, Paris, Éditions de l’Encyclopédie des nuisances, 2002, p. 37.[/note] Si une forme de « honte prométhéenne » envahit l’humain devant la perfection de ses propres productions techniques, et si l’IA humilie déjà son créateur dans bien des domaines de compétence, nous approchons-nous du temps où les humains n’auront plus besoin de leur corps ni de leur visage pour créer leur propre image, car de ces corps et visages trop humains ils en auraient désormais honte ? Pourquoi l’image devrait-elle réfléchir nos visages si imparfaits et si improprement expressifs, quand un algorithme pourrait créer le visage idéal dont un récit a besoin, l’expression juste et la plus vraisemblable car fondée sur l’archive des expressions de toute une civilisation dont les traces nourrissent les datasets ? Pourquoi demander encore à un·e acteur·ice de se mouvoir de telle ou telle façon, alors que l’imperfection de sa réponse pourrait être contournée par un prompt bien calibré ? Sans parler bien entendu des formidables gains de productivité que représentent, pour les industries créatives, l’automatisation de la production d’images, l’IA générative constituant une nouvelle étape dans la mécanisation du travail industriel et la réduction du coût du facteur humain dans l’équation productiviste du capitalisme[note]Juan Sebastián Carbonell, Un taylorisme augmenté. Critique de l’intelligence artificielle, Paris, Éditions Amsterdam, 2025.[/note].
La désindexation de l’image de l’humain en mouvement vis-à-vis de la réalité factuelle d’un mouvement physique, telle qu’elle est produite par la vidéo générative, déborde le contexte jusque-là relativement limité des effets spéciaux et des images de synthèse non génératives, pour devenir potentiellement le paradigme dominant de l’image en mouvement. Sur les réseaux sociaux, la vidéo générative est probablement appelée à occuper une place croissante dans le rapport des individus à leur image et à celle de l’altérité, à l’expression de leurs affects et de leurs désirs. Dans le film AfrAId (Chris Weitz, États-Unis, 2024), les data permettent à un père décédé d’entrer en dialogue avec sa fille à partir de l’écran de sa télévision, l’appelant, lui faisant signe, lui souriant à nouveau, et cherchant à répondre à ses inquiétudes. Ce fantôme synthétique hyperréaliste « incarne » la puissance vidéogénétique d’une intelligence artificielle générative transhumaine, au sens où elle permet de produire le mouvement de l’image d’un corps que celui-ci, dans les conditions matérielles et spatiales de sa vie, n’a jamais accompli. Moyen d’une vie après la mort, cette situation fictive renvoie à la biographie d’une figure humaine mais peut aussi bien indiquer un nouveau temps dans l’histoire de l’image en mouvement, voire un basculement ontologique dans le rapport de la représentation à la réalité de la vie et de l’espace physique. Ce basculement consiste aussi en une transformation de paradigme représentationnel. L’image s’autonomise de la logique de la représentation entendue comme mise en présence d’une réalité absente dont l’image est la trace, pour aller vers une image dont la nature est fondamentalement statistique. L’image en mouvement est désormais de nature numérique non plus seulement au niveau du médium de l’image (digitale vs analogique) mais aussi au niveau de la réalité dont elle est l’image, constituée de données numériques organisées algorithmiquement.
L’enjeu de la vidéo générative dépasse donc le cadre des discussions qui se limitent à la considérer comme un outil technique puissant susceptible de remplacer l’humain dans ses différents rôles de création. Pour cela, l’IA générative n’est pas, selon nous, à laisser dans le tunnel temporel et téléologique d’un progrès technique dans lequel les humains devraient ou bien s’engouffrer pour ne pas disparaître (et trouver au bout du tunnel la lumière éventuelle d’une heureuse transhumanité), ou bien s’éloigner pour ne pas courir à leur perte inexorable. À distance de cette alternative stérile qui conforte la dramatisation de la puissance de la Silicon Valley, la recherche que nous conduisons à partir de l’art ne vise pas à être enrôlée dans les entreprises de promotion du potentiel créatif de l’IA générative, ni à entretenir sous aucune forme « l’art comme prétexte » dont parle l’artiste Hito Steyerl[note]“At present, art (or creative labour) seems to be used as a pretext to provide meaning or purpose to the top-down implementation of GenAI tools and their inclusion in all sorts of digital soft- and hardware.” Hito Steyerl, Medium Hot. Images in the Age of Heat, London, Verso, 2025, p. 5.[/note]. Il s’agit plutôt de produire des « technophanies » pour reprendre le mot du philosophe Gilbert Simondon[note]Gilbert Simondon, « Psychosociologie de la technicité » [1960-1961], dans Sur la technique, Paris, Presses universitaires de France, 2014, p. 31.[/note], autrement dit faire apparaître, rendre visible, le fonctionnement technique et sa logique propre, inscrite dans des structures matérielles et sociales, mais qui souvent opèrent dans un idéal de transparence donnant à voir les productions et non les processus, le rendement et non la performance de la machine elle-même.
Sylvie Boisseau & Frank Westermeyer, Journal of a Self Improvement, 2026, 14'20, 4K vidéo (capture d’écran)
Mais que voulons-nous faire apparaître ? Quelle « technophanie » nous intéresse précisément ici ? Nous souhaitons rendre visible et sensible dans l’image l’espace paradoxal et critique d’entités visuelles (générées par l’IA et capables d’interagir avec des humains) qui ne sont pas ancrées dans un rapport génétique au corps et à l’espace et qui n’ont pour milieu nourricier que celui des data. Quel espace paradoxal peut-il se déployer dans l’image, où se rencontre ainsi l’altérité générative et sa logique automate ? Il s’agit pour nous de prendre acte de l’existence d’un nouveau régime représentationnel tout en lui déniant le monopole de la représentation, en réfléchissant à la sorte d’écosystème représentationnel hybride traversé par l’IA générative, dans lequel, au fond, nous sommes tous·tes appelé·es à évoluer. Pour ce faire, nous nous servons du personnage f créé 1997 par le duo d’artistes Sylvie Boisseau et Frank Westermeyer, qui constitue une figure expérimentale dont le propre est d’activer les espaces relationnels et sociaux, mais aussi physiques et visuels, d’une façon qui donne à voir les dynamiques de projection (relationnelle, psychiques, imaginaires, etc.) depuis ce point f ou vers ce point f, sans pour autant jamais entrer dans le détail d’une intériorité, d’un sujet trop psychologiquement, biographiquement et personnellement déterminé. Bien sûr, f présente des caractères genrés, raciaux et socioculturels, mais qui opèrent comme des données objectives qui façonnent son espace social et son comportement, plus que comme la matrice d’une véritable personnalité. Généralement le vide ou le silence de f permet en négatif de rendre visible le fonctionnement des contextes dans lesquels il évolue, y compris par rapport à ces paramètres identitaires.
La manière qu’a f de rendre visible des effets de position à partir de sa présence dans différentes situations, s’est trouvé analysable dans les termes de l’anthropologie philosophique du philosophe Helmuth Plessner. Celui-ci a développé une théorie de la « positionnalité » des êtres vivants qui définit le propre de l’humain dans une certaine façon d’avoir un corps dans l’espace, à savoir un corps excentré de lui-même qui le destine à vivre à travers une dynamique constante de projection (d’où le concept central, pour Plessner, de « positionnalité excentrique » de l’humain)[note]Helmuth Plessner, Les degrés de l’organique et l’Homme. Introduction à l’anthropologie philosophique [1928], trad. Pierre Osmo, Paris, Gallimard, 2017.[/note]. C’est cette dimension spatiale et projective que nous souhaitons mettre à l’épreuve dans le contexte de la vidéo générative, afin d’articuler à la fois la question de la mutation du champ vidéographique, et le questionnement anthropologique lié à l’avènement de l’intelligence artificielle : en quoi la positionnalité constitutive de l’humain est-elle affectée par des agents non humains intelligents mais qui ne sont pas « ancrés »[note]La question du « grounding » de l’IA est une limite à son développement selon le chercheur Yann Le Cun, longtemps au service de Meta. L’idée d’une IA qui serait capable de disposer d’un « modèle de monde » ne reposant pas seulement sur le langage textuel et fonctionnant de façon plus située, représenterait une étape décisive de son futur développement. Voir David Larousserie et Alexandre Piquard, « Yann Le Cun : “Pourquoi je quitte Meta pour créer ma start-up d’IA” », Le Monde, 16 janvier 2026, https://www.lemonde.fr/economie/article/2026/01/16/yann-le-cun-pourquoi-je-quitte-meta-pour-creer-ma-start-up-d-ia_6662500_3234.html. Cela signifie que nos façons de « situer » nos intelligences, nos savoirs et nos expériences constituera un enjeu politique et même cosmologique important, qui confère notamment une nouvelle résonnance à l’appel aux « savoirs situés » de Donna Haraway (Savoirs situés, trad. Marin Schaffner, Paris, Wild Project, coll. « Petite bibliothèque d’écologie populaire », 2026).[/note] dans une forme de positionnalité ? Comment faire apparaître cette situation et voir ce que devient l’humain f lorsqu’il entre dans l’espace où ses capacités de projection imaginaires et psychiques autant que physiques et sociales sont transformées par les effets de l’IA générative ?
Il nous a semblé nécessaire pour répondre à ces questions de prendre en compte sans les séparer deux aspects des technologies concernées, à savoir d’un côté la lecture (à travers la « vision machine ») des images, comportements, émotions, leur identification et leur analyse par l’IA, et de l’autre côté les mécanismes de génération de textes, d’images et de son. Dans le processus de création vidéo, le cœur de notre approche consiste à lier ces deux composantes et donc à appréhender l’IA comme une entité dotée de capacité de reconnaissance, d’appréciation et de réponse. Cette entité, différente de nous, représente une altérité qui nous décentre, jusqu’à apparaître, ainsi que l’envisage le philosophe Frédéric Neyrat, comme un alien, au sens d’une intelligence non humaine produisant un effet de « rencontre » que la science-fiction a souvent attribué à la découverte de formes d’existences extra-terrestres[note]Frédéric Neyrat, Traumachine. Intelligence artificielle et techno-fascisme, Paris, MF, 2025.[/note]. Sortir l’IA de la pauvreté philosophique dans laquelle elle est souvent laissée, où cette technologie reste inféodée à la fonction d’imitation de l’humain, y compris quand la conséquence de son excellence en la matière reviendrait à remplacer l’humain sinon à le supprimer. Ainsi nous aurions à entrer en interaction et à rencontrer les entités de l’IA générative comme nous pourrions rencontrer des intelligences radicalement autres, et les faire fonctionner en direction de leur altérité, afin de mieux penser le propre de l’humain dans son rapport à cette altérité.
La série de vidéos issues de nos expérimentations, intitulée Journal of a Self Improvement[note]Sylvie Boisseau & Frank Westermeyer, Journal of a Self Improvement, 2026, 14:20, 4K vidéo.[/note], a pour objectif de faire sentir ces nouveaux espaces de possibilité de projection et de jeu qui naissent de l’interaction avec l’IA, en orientant ironiquement le titre vers l’idée de self help book ou d’expérience de développement personnel, restituée à travers la chronique de quelques étapes essentielles. Cette série est composée de quatre courtes vidéos qui se développent autour d’une situation dans laquelle la figure f, agent humain de l’action, est confronté à des agents filmiques non humains, générés par l’IA. Reprenant des logiques de combinaisons entre captation de jeu d’acteur·ice et insertion d’éléments réalisés avec des techniques d’animation de formes dessinées ou virtuelles, ces vidéos sont de nature hybride mais poussent l’ambiguïté de la situation jusqu’à atténuer sinon brouiller la différence entre éléments filmés et éléments génératifs. Très rapidement, il apparaît que l’effet réaliste de cette tendance à créer l’incertitude quant à la nature « fake » ou « real » de l’image vidéo n’est pas l’objectif de ces pièces. Au contraire, les déformations, imperfections, incohérences et hallucinations de l’image générative sont laissées apparentes afin de donner à voir le principe de fonctionnement de ce régime d’images en mouvement issu de la rédaction de prompts. Que se passe-t-il pour f quand il est engagé dans des échanges avec des avatars ou lorsqu’il est observé par eux ? Quel rapport peut-il entretenir à son propre avatar ? Quel type de « positionnalité » de f peut-on capturer dans ces situations ?
Transition 3.0
Des quatre vidéos réunies dans Journal of a Self Improvement, la première, intitulée Transition 3.0, s’inspire des expérimentations vidéographiques de l’artiste Peter Campus dans Three Transitions (1979). Cette référence permet d’inscrire l’IA générative dans l’histoire de l’art vidéo en reprenant, mais en les traduisant, les questions qui, à la fin des années 1970, occupaient en partie les artistes, à savoir les questions portant sur la nature du médium de l’image électronique, avant donc le développement du multimédia numérique. Dans les vidéos de Campus, l’artiste « creuse » dans l’image pour explorer une sorte de réalité feuilletée et composée comme en boucles récursives ou de feedback, grâce à des effets d’incrustation et de manipulation du signal électronique qui permet par exemple de supprimer une couleur pour faire apparaître une autre image dans le « trou » d’une première image. On voit par exemple l’artiste, de dos, déchirer un panneau de papier qui apparaît paradoxalement comme étant son propre dos (la main qui passe au travers de la paroi de papier devant lui apparaît en même temps dans son dos, comme si son corps était de papier). L’image vidéo rend ici compatibles des dimensions spatiales et matérielles incompatibles dans la réalité physique. La capacité à donner à voir des espaces impossibles est d’une grande simplicité pour l’IA générative, il suffit de décrire cet espace suffisamment bien pour le voir apparaître performativement (l’intérêt visuel de l’image générée ou la valeur esthétique de cette ekphrasis performative est ensuite une toute autre question…). Le « médium » de la vidéo générative qui, au fond, ne diffère que par des aspects techniques secondaires d’une IA produisant du son ou du texte, a comme spécificité le rapport à la performativité du langage dans le prompt. Voilà pourquoi les expérimentations de Transition 3.0 jouent sur ces nouvelles relations texte-image au niveau de la lecture artificielle de l’image et au niveau du prompt. Quel nouvel espace se déploie alors ?
Sylvie Boisseau & Frank Westermeyer, Journal of a Self Improvement, 2026, 14'20, 4K vidéo (capture d’écran)
Pour l’observer, les artistes ont pris le parti de montrer comment l’IA pouvait générer une nouvelle figure de f répondant à son désir d’amélioration de soi. Il nous a semblé intéressant de pousser la logique narcissique des usages fréquents de la vidéo sur les réseaux sociaux, nouveau canal essentiel de diffusion des contenus vidéographiques, en montrant comment l’IA « répond » à la frustration d’un individu en mal de reconnaissance. F pose ainsi cette question gênante à un assistant IA, à partir de sa condition statistique de privilégié mais de sa condition esthétique très peu trendy : « comment un homme de 50 ans peut-il avoir du succès sur Instagram ? » En réponse à cette question intime et ridicule se déploie l’expertise incontestée de l’IA en matière de conformisme social et culturel, l’IA suggérant immédiatement une liste illimitée de propositions qui résonnent comme le chant des sirènes, sur un groove de RnB. Il en découle une réponse littérale de f qui semble incorporer naturellement les mutations bienveillantes suggérées par l’IA. Épanoui, f réalise effectivement des photos de lui-même avec un sourire de contentement, signe d’un accomplissement en cours - « j’y suis », semble-t-il confirmer -, la vidéo générative complétant la photographie de f pour le projeter dans le modèle de réussite calculé par l’IA. Ce faisant, la vidéo générative, avec sa fluidité métamorphique caractéristique, fait passer f par des « transitions » monstrueuses et des espaces impossibles. Dans le même temps, les images sont submergées par les vagues de mots égrenés à une vitesse inaudible, et produit par la lecture automatique des images. F, pris au pied de la lettre de ses prompts, perd toute consistance positionnelle et se laisse « calculer » et « probabiliser » par l’IA.
PsychoanalAIse
Dans cette seconde étape f est engagé dans une voie régressive qui pourrait paraître psychopathologique mais se révèle l’expression d’un inconscient, ou d’une anamnèse de type psychanalytique. Tout se passe comme si f, après l’expérience d’accomplissement assisté par l’IA, décidait d’explorer sa généalogie psychologique, retournant au bac à sable, nom par ailleurs donné aux expériences de programmation informatique lorsque, par exemple, une application est testée et modifiée indépendamment de l’ensemble du système dans lequel elle est appelée à être implémentée, afin de ne pas faire courir de risque à l’ensemble. Cette logique de sandbox opère du point de vue de la figure de f de façon paradoxale : son espace de jeu est analysé et pris au sérieux, de façon littérale, par l’agent filmique artificiel qui, à travers une figure de femme attentive qui observe et réagit expressivement aux gestes, paroles et expressions faciales de f, s’apparente à une mère ou à une psychothérapeute tour à tour amusée, charmée, préoccupée, inquiète ou alertée. L’IA générative fonctionne alors, dans l’espace de l’image où f apparaît, comme l’interprétation des besoins identifiés par une vision artificielle reconnaissant les émotions de f, matérialisée par un petit œil de caméra fixé sur la carte d’un circuit informatique. Des instances de soin, de protection, de contrôle ou de coercition sont générées dans l’image, comme une intervention d’urgence qui ne laisse aucune place à la complexité de l’expression des affects. Une psychanalyse menée par l’IA aurait ainsi comme effet de traduire la complexité et la lenteur de la généalogie psychique en une générativité instantanée, prenant au mot, et au prompt, la moindre expression susceptible d’être reconnue.
Sylvie Boisseau & Frank Westermeyer, Journal of a Self Improvement, 2026, 14'20, 4K vidéo (capture d’écran)
Sylvie Boisseau & Frank Westermeyer, Journal of a Self Improvement, 2026, 14'20, 4K vidéo (capture d’écran)
D’un point de vue formel, la cohabitation entre les images filmées et les images générées s’organise ici autour du champ-contrechamp, avant de s’hybrider davantage par la suite. Dans le champ se trouve f à genou dans le bac à sable, débordant de créativité et, dans le contrechamp, se trouve cette figure bienveillante, protectrice et observatrice, penchée vers lui et qui semble être le pendant féminin de f. Le personnage expérimental f annonce ce qu’il fait dans le bac à sable, ce qu’il modèle, de façon très affirmative et assertive : « je te construis un château… Non, je te construis un pont ! ». Le décalage entre l’affirmation et la réalité des pauvres constructions de f dans le bac à sable met en évidence la faiblesse du pouvoir assertif de f. En parallèle, au fur et mesure que f lance ses diverses affirmations, le contrechamp se remplit d’objets qui font écho aux intentions de f. Ses désirs se matérialisent, non pas dans le bac à sable où ses modelages restent informes et instables, mais dans l’espace représenté autour, autrement dit dans l’ensemble de l’écosystème visuel où agit l’IA. C’est donc un autre système, médié par la figure de l’observatrice, qui fait exister les désirs de f, et non les gestes qu’il accomplit avec ses mains dans la matière meuble, et dont les intentions exprimées ne passent pas le cap de l’annonce, contrairement à l’efficacité performative de cette intention dès lors qu’elle est branchée sur le système du langage promptique.
Sylvie Boisseau & Frank Westermeyer, Journal of a Self Improvement, 2026, 14'20, 4K vidéo (capture d’écran)
Cependant, on réalise très vite que l’image générée ne tient pas beaucoup plus dans le temps que les formes de sable approximatives façonnées par f. De l’instabilité et de la précarité s’y manifeste. En quête d’approbation du côté du contrechamp, changeant dans ses objectifs et très instable dans ses humeurs, f se trouve à la frontière des champs de l’image vidéo, entre champ filmé et contrechamp généré, sans réelle solution ni réel secours. Ce qu’offre l’image générative en contrechamp est une réponse orientée User Experience qui prétend s’adapter à l’utilisateur·ice en captant en permanence chacune de ses émotions. Au final, l’espace matériel instable où évolue f dans les limites de ce bac à sable régressif et low tech, semble manifester l’espace du possible plus fortement que dans le contrechamp. Au regard du caractère illimité de l’imagination créative déclarée par f, les traductions par l’IA générative semblent rétrécir cruellement l’étendue des options, en fournissant des représentations stéréotypées des objets annoncés et fournissant des solutions autoritaires aux émotions détectées sur le visage de f.
Sylvie Boisseau & Frank Westermeyer, Journal of a Self Improvement, 2026, 14'20, 4K vidéo (capture d’écran)
Lifebot Escape
Dans son parcours de développement personnel, f passe une nouvelle étape en comprenant qu’il lui est possible d’échapper au regard à la fois bienveillant et oppressif de la vision artificielle. Laissant au premier plan une image de lui-même qui se révèle être son propre avatar, f n’est plus soumis à l’analyse, aux conseils, aux diagnostics et aux propositions de plusieurs avatars dont un qui, dans l’autre moitié d’écran d’un split screen, apparaît plein de sollicitude envers l’avatar de f. Ce dernier a manifestement ici pour raison d’être la défense d’une absence d’activité qui paraît inquiéter tous les agents artificiels, et en particulier le dynamique avatar à la fois coach et représentant commercial. Celui-ci, à la différence des figures d’analystes représentées par les autres avatars incrustés dans des vignettes en haut de l’écran, est doté d’un langage dont la performativité « promptique » génère automatiquement dans la vidéo l’image de ce qu’il dit et conseille. Comme dans l’étape précédente, l’efficacité générative du langage qui montre immédiatement ce qui est énoncé, face à une figure de f ou de son avatar qui ne s’en trouve pas affecté, produit un effet de puissance assertive mais aussi de dépense inutile, face à l’impassibilité de l’avatar de f.
Sylvie Boisseau & Frank Westermeyer, Journal of a Self Improvement, 2026, 14'20, 4K vidéo (capture d’écran)
Sylvie Boisseau & Frank Westermeyer, Journal of a Self Improvement, 2026, 14'20, 4K vidéo (capture d’écran)
Cette sorte d’apraxie volontaire défendue par l’avatar de f est aussi celle de f lui-même qui, à demi caché dans l’entrouverture d’une porte au second plan, apparaît dans l’image à partir d’un moment, en retrait, comme surveillant le comportement automatisé de son propre avatar. Pendant l’échange bot-to-bot qui protège f de l’injonction à répondre au bien qu’on dit vouloir lui faire, il attend et guette le moment où, peut-être, il pourra sortir de la pièce où il s’est retiré. L’omniprésence dans les vignettes en haut de l’écran d’avatars dotés d’une expertise en matière de reconnaissance des émotions et d’analyse psychologique, qui décrivent le visage impassible de l’avatar de f, laisse penser que cette vision contrôlante ou « monitorante » est susceptible de ne jamais cesser. Mais deux points d’échappée possible apparaissent malgré tout : le premier est l’obstination apraxique de l’avatar de f qui constitue un point de résistance. Bien qu’il soit un avatar (le sigle de sa production D-ID est visible à l’écran), son obstination à répondre toujours à peu près de la même façon négative et polie et qui s’apparente à une sorte de fixation, suscite une réelle empathie avec le spectateur. L’autre point d’échappée est un point de fuite dans l’espace : là où f se retire, l’espace physique derrière l’image-écran de son avatar au premier plan. Ce point est important, car il ouvre dans l’image un champ positionnel hybride particulier pour la figure humaine.
Sylvie Boisseau & Frank Westermeyer, Journal of a Self Improvement, 2026, 14'20, 4K vidéo (capture d’écran)
L’AtaraxIA
L’espace hybride dans lequel f parvenait à trouver du répit face à l’emprise du monitoring génératif de sa vie, s’ouvre d’une façon nouvelle dans la dernière étape de son parcours. Le « self improvement » aboutit ici à une forme de sagesse ataraxique, comme dans la tradition grecque antique ou dans certaines pensées asiatiques. La frénésie des désirs et des intentions s’apaise, et les tourments de la volonté de f sont, comme dans la philosophie d’Arthur Schopenhauer, sublimés dans une représentation, en l’occurrence une représentation de lui-même à travers son avatar qui, lui aussi, a évolué. Il est impassible comme dans Lifebot Escape, mais n’a plus besoin de la négativité de la résistance, il est entré dans un état méditatif, une forme de sagesse artificielle presque auratique qui déjoue les mécanismes de l’intelligence computationnelle à l’œuvre dans le regard toujours attentif des avatars-moniteurs. L’avatar de f n’a plus besoin d’argumenter, il n’a même plus besoin de répondre, son langage a été métamorphosé, constitué de sons déclinant les variations d’un « huh » gutural marquant une sorte d’acquiescement phatique faisant écho sans vraiment y répondre aux analyses psychologiques de l’avatar observateur.
Comme dans la vidéo précédente, l’espace dans l’image est hybride. La scène se déroule dans une cuisine ouverte. Le personnage de f est dans l’arrière-plan mais n’a plus besoin de se cacher comme il le faisait dans la vidéo Lifebot escape. L’espace partagé par l’agent humain et les agents artificiels est devenu un milieu apaisé. F s’adonne de façon presque méditative ou désabusée à une occupation ménagère, celle de récupérer de l’eau qui s’est raréfiée, ou d’observer le dysfonctionnement d’un système d’écoulement, symbole de l’arrêt d’un flux. Arrêt d’un flux vital qui plonge f en dépression, ou arrêt d’un flux de datas qui redonne à f l’autonomie nécessaire pour se livrer aux tâches y compris les plus improductives et contemplatives ? Entre l’asthénie diagnostiquée par l’experte et la sérénité de son avatar, f paraît avoir ouvert un nouvel espace polarisé par deux rapports à l’intelligence artificielle.
Conclusion
L'objectif de notre projet est d’explorer le nouveau régime d’image vidéographique instauré par les technologies d’IA générative. Afin de sortir des termes du débat les plus courants où l’IA est présentée de façon spectaculaire comme promesse révolutionnaire et menace anthropologique (question d’une obsolescence de l’humain y compris dans le domaine créatif et artistique), nous avons choisi d’expérimenter, dans l’image même, la situation de la rencontre de l’humain et de l’IA générative.
En interrogeant conjointement deux capacités fondamentales des applications d'IA, d’une part la capacité d'interpréter le langage, de lire les images et de déchiffrer les émotions humaines et, d'autre part, la génération de textes, d’énoncés linguistiques, d'images et de vidéos d'apparence réaliste, nous avons voulu montrer dans de courtes situations expérimentales comment ces nouvelles entités perçoivent et s'expriment. Comment vivre humainement avec des entités génératives autonomes ? L'hybridation de l'espace vidéographique et les mises en situation des interactions dans l’espace avatarisé nous permettent de questionner, avec ironie, le partage de l’espace avec ces entités, la distribution de l’attention et les jeux de statut social et de contrôle. Les technologies de vidéo générative deviennent donc des moyens pour questionner le rapport de l’humain à l’IA, en permettant de rendre sensible et visible cette rencontre, et d’y déployer des scénarios possibles, qui mettent en situation des enjeux philosophiques, anthropologiques et esthétiques et constituent des alternatives aux récits technocentriques dominants. À travers la méthodologie qui consiste à utiliser la figure du personnage f, nous mettons à l’épreuve l’hypothèse d’une condition d’autonomie de l’humain qui, face à un certain pouvoir algorithmique, réside d’une part dans une forme de corporéité et de spatialité échappant au calcul, et d’autre part dans un rapport à l’IA abordée non pas comme imitation de l’humain mais comme altérité radicale, intelligence autre utilisée certes majoritairement comme technologie de contrôle mais qui peut aussi, comme l’avatar de f, devenir une entité insondable et improductive, en coupant toute communication[note]C’est également la proposition de Frédéric Neyrat dans Traumachine, op. cit., p. 183.[/note]. Dans cette rencontre, dans les deux cas, du côté de l’humain et de sa positionnalité propre qui fait de lui un être absconditus[note]Helmuth Plessner, "Homo absconditus", trad. Pierre Osmo, Le Débat, vol. 180, n° 3, 2014, p. 112-121.[/note], comme du côté de l’IA dans son incommunicabilité, il s’agit d’échapper à la transparence exigée par les big datas qui nourrit le projet de monitoring des existences et le flux continu des injonctions idéologiques et comportementales qui en découle.