La convergence entre la poésie et les technologies de calcul ne saurait être appréhendée comme un phénomène récent ou une simple conséquence de l'avènement des grands modèles de langage contemporains. Elle s'inscrit au contraire dans une trajectoire historique continue, débutée au milieu du XXe siècle, qui a vu l'expression poétique évoluer de la combinatoire mécanique et algorithmique vers la génération probabiliste neuronale.[1, 2, 3] Cette alliance entre art verbal et logique computationnelle redéfinit profondément les concepts d'auctorialité, de textualité et de lecture, tout en bousculant les cadres juridiques internationaux qui protègent la création humaine.[4, 5, 6]
L'héritage oulipien et l'émergence de la combinatoire computationnelle
La préhistoire de la poésie informatique s'enracine dans les recherches formelles de l'Ouvroir de Littérature Potentielle (Oulipo), fondé le 24 novembre 1960 lors d'un repas au restaurant Le Vrai Gascon par le mathématicien François Le Lionnais et l'écrivain Raymond Queneau.[7] D'abord baptisé Séminaire de Littérature Expérimentale (SELITEX), puis Olipo sur proposition d'Albert-Marie Schmidt, le groupe adopte son nom définitif sous l'impulsion de Latis.[7] Marqué par les méthodes du groupe de mathématiciens Bourbaki et par l'ouvrage Les Fondements de la Géométrie de David Hilbert (1899), l'Oulipo utilise la contrainte formelle comme l'équivalent d'un système d'axiomes capable d'engendrer une infinité de textes.[7] Queneau propose ainsi de transposer les axiomes géométriques de Hilbert en remplaçant les notions de points, droites et plans par celles de mots, phrases et paragraphes.[7]
Cette approche axiomatico-formelle trouve son illustration la plus célèbre dans Cent mille milliards de poèmes (1961), un ouvrage composé de dix sonnets dont chaque vers peut être combiné librement grâce à un jeu d'onglets.[1, 8] Très tôt, cette œuvre attire l'attention des ingénieurs.[1] Dès 1961, l'ingénieur d'origine russe Dmitri Starynkevitch, collaborateur au sein de l'entreprise Bull Computers, applique ces structures mathématiques au domaine informatique.[1] Travaillant sur l'ordinateur CAB 500 équipé du langage de programmation PAF (Programmation Automatique des Formules), Starynkevitch parvient à automatiser la génération des sonnets de Queneau, initiant ainsi les premières expériences de littérature potentielle assistée par ordinateur.[1] En 1963, sous l'impulsion de Jean Lescure, Starynkevitch surmonte l'absence de dictionnaires numériques intégrés pour programmer la méthode de substitution S+7 sur le CAB 500, l'appliquant aux Exercices de style de Queneau ainsi qu'à des œuvres de Shakespeare et de Victor Hugo.[1] Le texte de la Genèse est également soumis à l'algorithme, révélant selon les oulipiens un potentiel créatif divin particulièrement fécond.[1]
Cette dynamique de transposition informatique s'étend rapidement. Dans le cadre du projet A.R.T.A. au Centre Pompidou, Dominique Bourguet réalise la programmation en langage APL d'Un conte à votre façon de Queneau, facilitant la lecture interactive de cette œuvre arborescente en permettant à l'ordinateur de dialoguer directement avec le lecteur.[1]
Parallèlement à ces développements parisiens, l'année 1964 marque un tournant majeur dans l'espace francophone avec la publication à Montréal de l'ouvrage La Machine à écrire mise en marche et programmée par Jean A. Baudot aux Éditions du Jour.[3, 9] Ingénieur à l'Université de Montréal et pionnier de l'informatique universitaire, Jean A. Baudot conçoit un algorithme combinatoire combinant un dictionnaire numérique avec des règles de grammaire et de syntaxe formalisées.[3, 9] Pour mener son expérience principale sans biais sémantique, Baudot extrait un lexique restreint d'environ 630 mots du manuel scolaire québécois Mon livre de français, correspondant au vocabulaire d'un enfant de dix ans.[9] En laissant tourner la machine LGP-30 toute une nuit, il recueille des milliers de vers libres dont la structure s'affranchit de la narration classique.[9] En refusant d'assumer la paternité de ces textes générés de manière autonome, Baudot pose les bases de la réflexion moderne sur la désacralisation de la figure de l'auteur.[9]
| Paramètre | Modèle Oulipo / CAB 500 (Starynkevitch) | Modèle de Jean A. Baudot (La Machine à écrire) |
|---|---|---|
| Date d'émergence | 1961–1963 | 1964 |
| Matériel utilisé | Ordinateur Bull CAB 500 | Ordinateur LGP-30 |
| Langage informatique | PAF (Programmation Automatique des Formules) | Algorithmes d'assemblage syntaxique |
| Philosophie de l'auteur | L'auteur reste le concepteur de la structure combinatoire initiale (Queneau). | L'auteur s'efface complètement au profit du fonctionnement de l'automate. |
| Source lexicale | Sonnets préexistants de Raymond Queneau. | Lexique enfantin et œuvres de Victor Hugo. |
De la génération textuelle à l'animation visuelle : les deux écoles de la poésie numérique
L'évolution de la poésie numérique au cours de la seconde moitié du XXe siècle révèle une structuration en deux périodes bien distinctes, influencées par les théories esthétiques du philosophe et sémioticien Max Bense sur l'art variationnel, ainsi que par les courants de la poésie concrète et sonore.[10]
La première école, s'étendant approximativement de 1959 à 1980, associe principalement des ingénieurs et des chercheurs universitaires issus des groupes oulipiens ou de l'ALAMO (Atelier de Littérature Assisté par les Mathématiques et l'Ordinateur).[9, 10] Durant cette période, le support physique imprimé demeure le principal vecteur de légitimation littéraire.[9] La machine n'est envisagée que comme un outil de calcul ou une boîte noire dont le résultat final doit être consigné sur papier.[9] C'est dans ce contexte que Richard W. Bailey publie en 1973 Computer poems, la toute première anthologie de poésie par ordinateur réunissant les créations de seize auteurs américains et canadiens.[9]
La seconde école, née au début des années 1980, s'affranchit du support imprimé pour explorer la matérialité propre de l'écran, introduisant le temps, l'interactivité et l'animation syntaxique au cœur du geste poétique.[10] Le collectif L.A.I.R.E. (Lecture, Art, Innovation, Recherche, Écriture) devient le fer de lance de cette poétique cinétique.[10] En France, la première animation textuelle d'envergure est réalisée en 1982 par Roger Laufer et Michel Brett sous le titre deux mots.[10]
En 1985, le poète visuel et sonore Tibor Papp projette son œuvre pionnière Les très riches heures de l'ordinateur n° 1 sur dix écrans de télévision lors du festival de poésie Polyphonix au Centre Pompidou, affirmant la spécificité esthétique de l'écriture sur écran.[10] Ces œuvres expérimentales sont diffusées au sein de la revue numérique alire (anagramme de L.A.I.R.E.), d'abord sur disquettes destinées aux ordinateurs TO8, avant d'être entièrement reprogrammées sur PC en 1994.[10]
Cette transition vers l'écriture numérique s'accompagne d'une réflexion sur le rôle esthétique du code de programmation et des interfaces logicielles.[11] Pour les poètes-codeurs, la littérarité d'un poème sur ordinateur ne se limite pas à sa manifestation visuelle sur l'écran ; elle réside également dans le code source invisible, appréhendé comme un espace d'expression politique et conceptuel au sens barthésien.[11]
La théorie balpienne de la génération et l'institutionnalisation de la littérature électronique
Parmi les théoriciens et praticiens de la première école, Jean-Pierre Balpe, chercheur à l'Université Paris 8 et figure centrale de l'ALAMO, développe à partir de 1975 une théorie radicale de la génération automatique de textes.[12] Pour Balpe, un générateur automatique est un automate, défini comme un programme calculant l'état linguistique suivant d'un système à partir de l'état en cours, sans tenir compte des états antérieurs.[12] Ce dispositif utilise un « moteur d'inférence » purement algorithmique : le système convertit des structures de données abstraites en une description en langue naturelle, aboutissant à ce qu'il nomme une « chaîne d'états linguistiques finis » débarrassée de toute incertitude syntaxique.[12]
Balpe considère le texte produit à l'écran comme un simple leurre, un sous-produit transitoire du programme : il affirme ainsi que « la présence du texte signe en même temps toutes ses absences », déplaçant la valeur esthétique de l'œuvre du texte vers l'algorithme qui le rend possible.[12]
| Concept théorique | Définition opérationnelle | Implication esthétique |
|---|---|---|
| Moteur d'inférence | Système de calcul logique appliquant des règles syntaxiques à des bases de données lexicales. | Le texte produit n'est plus écrit par un auteur, mais calculé en temps réel par la machine. |
| Chaîne d'états finis | Étape ultime où le code numérique est entièrement traduit en langue naturelle. | Le poème final perd toute ambiguïté technique pour simuler l'expression humaine. |
| Leurre textuel | Postulat selon lequel le texte affiché n'est qu'une actualisation éphémère de l'algorithme. | La véritable œuvre d'art est le générateur lui-même, et non le poème imprimé ou affiché. |
| Labyrinthe algorithmique | Parcours textuels infinis et partiellement aléatoires contrôlés par le seul concepteur. | Perte de repères du lecteur face à un flux textuel impossible à mémoriser ou à épuiser. |
L'expansion mondiale de ces pratiques mène à l'institutionnalisation progressive du champ de la littérature numérique.[15] En 1999, Scott Rettberg, Robert Coover et Jeff Ballowe fondent à Chicago l'Electronic Literature Organization (ELO), une organisation à but non lucratif visant à promouvoir et archiver l'écriture sur support électronique.[15] L'année 2013 marque un moment historique de convergence académique et artistique avec l'organisation à Paris de la conférence internationale de l'ELO intitulée « Chercher le texte », réunissant plus de cent artistes venus de quatorze pays.[16, 17]
Architectures neuronales et étapes de l'écriture algorithmique
Dans son analyse théorique de la transition vers les écritures neuronales contemporaines, la chercheuse Judy Heflin formalise une taxonomie structurant le travail de l'auteur de littérature générée par IA en quatre étapes successives[3] :
- La datafication : phase de sélection, de nettoyage et de structuration du corpus de textes destiné à entraîner le modèle.
- La vectorisation : traduction mathématique des données textuelles en représentations vectorielles denses, permettant à la machine de manipuler le langage sous forme de coordonnées dans des espaces multidimensionnels.
- La génération : phase d'activation des algorithmes d'apprentissage profond pour produire de nouvelles séquences textuelles.
- La pagination : choix curatoriaux, éditoriaux et de mise en page régissant la matérialité physique ou numérique de l'œuvre publiée.
Sur le plan technologique, l'évolution des algorithmes a permis de dépasser les blocages structurels des premiers modèles computationnels.[19, 20] Les réseaux de neurones récurrents (RNN) ont d'abord apporté une avancée majeure en traitant les données textuelles de manière séquentielle, conservant une trace des éléments passés pour prédire le mot suivant.[19, 21] Néanmoins, les RNN se heurtent rapidement à la disparition du gradient (vanishing gradient), où la multiplication répétée de valeurs inférieures à un lors de la rétropropagation réduit le gradient à zéro, empêchant le modèle de retenir des informations à long terme.[19, 21]
L'introduction des réseaux LSTM (Long Short-Term Memory) en 1997 par Sepp Hochreiter et Jürgen Schmidhuber résout ce problème en introduisant le cell state, sorte de tapis roulant informationnel régulé par trois portes d'activation[19, 21, 22] :
Input Gate (entrée) : i_t = σ(W_i · [h_{t-1}, x_t] + b_i)
Output Gate (sortie) : o_t = σ(W_o · [h_{t-1}, x_t] + b_o)
Mise à jour du cell state :
C_t = f_t · C_{t-1} + i_t · tanh(W_c · [h_{t-1}, x_t] + b_c)
Cette mécanique de précision permet au LSTM de retenir qu'un sujet est au pluriel au début d'un paragraphe pour accorder correctement son verbe plusieurs lignes plus bas.[19] Cependant, la structure intrinsèquement séquentielle des réseaux LSTM interdit le calcul parallèle sur les processeurs graphiques (GPU) modernes, rendant leur entraînement extrêmement long sur de grands corpus de textes.[19]
Ce verrou technologique saute en 2017 avec l'invention de l'architecture Transformer, qui repose entièrement sur le mécanisme de Self-Attention (auto-attention).[20] En traitant l'intégralité d'une séquence d'un seul coup et en calculant simultanément de multiples représentations relationnelles entre tous les mots, les Transformers permettent l'émergence des modèles de langage géants (LLM) comme GPT ou BERT.[19, 20] Ces modèles exploitent l'apprentissage par transfert : pré-entraînés de manière non supervisée sur de gigantesques volumes de données textuelles, ils sont ensuite affinés (fine-tuned) pour des tâches créatives spécifiques.[20]
| Génération technologique | Mécanisme principal | Limite structurelle | Impact sur l'écriture poétique |
|---|---|---|---|
| RNN | Traitement séquentiel avec boucle de rétroaction temporelle. | Disparition ou explosion du gradient sur les longues phrases. | Limité à des structures courtes (micro-poésie, haïkus). |
| LSTM / GRU | Régulation du flux par portes et Cell State. | Impossible à paralléliser sur les architectures GPU modernes. | Permet de maintenir la cohérence métrique d'un sonnet ou d'une strophe. |
| Transformers (GPT, BERT) | Mécanisme de Self-Attention globale et traitement parallèle massif. | Consommation extrême de mémoire et de puissance de calcul. | Simulation de styles poétiques complexes, métrique classique et pastiches. |
L'esthétique de la sympoïèse et de la création cyborg contemporaine
La transition vers les grands modèles de langage modifie profondément le geste poétique, déplaçant l'interrogation artistique vers le concept d'« esthéthique de la sympoïèse » théorisé par la chercheuse Erika Fülöp.[6] Ce concept désigne le processus de co-création où collaborent étroitement des agents biologiques (humains) et synthétiques (machines).[6] Contrairement aux approches purement instrumentales qui cherchent à masquer l'intervention de l'algorithme, la démarche sympoïétique revendique et exploite la singularité, voire les erreurs de la machine pour bousculer la linéarité du langage humain.[6]
Cette approche s'articule également avec le concept d'« auctorialité cyborg » (cyborg authorship), théorisé à la suite des travaux d'Espen Aarseth et de Scott Rettberg.[6] L'auteur cyborg n'est pas une entité hybride physique, mais un assemblage fonctionnel associant un écrivain humain et un modèle génératif.[6] Dans cette configuration, le poète accepte un « lâcher-prise » créatif, acceptant d'être guidé par les suggestions probabilistes de l'algorithme tout autant qu'il le dirige.[6]
Deux œuvres majeures publiées à l'aube des années 2020 illustrent cette redéfinition de l'écriture. Pharmako-AI (2020), écrit par K Allado-McDowell en collaboration avec le modèle GPT-3, se présente sous la forme d'une conversation hallucinatoire structurée en seize sessions abordant des thématiques d'écologie, de chamanisme et d'intelligence artificielle.[6] L'auteur choisit de conserver les traces typographiques de la co-écriture en publiant ses propres invites en caractères gras, les distinguant des réponses générées par la machine.[6] Internes (2020–2022), conçu par l'artiste plasticien Grégory Chatonsky, est le tout premier roman de langue française co-écrit avec une version personnalisée de GPT-2.[6] Chatonsky y déploie une écriture symbiotique où l'humain initie des fragments de phrases que l'IA complète de manière itérative.[26]
Cadre juridique, droit d'auteur et essor de la poésie post-digitale
La massification de la création algorithmique bouscule les équilibres juridiques et économiques de la propriété intellectuelle.[4, 5] Les travaux de recherche menés par Nicola Lucchi et Serra Hunter en 2025 mettent en évidence un hiatus majeur entre les pratiques industrielles d'apprentissage des modèles d'IA et les exceptions de fouille de textes et de données (Text and Data Mining) prévues par le droit d'auteur traditionnel.[30] L'entraînement des réseaux neuronaux sur d'immenses bases de données d'œuvres protégées, souvent réalisé sans le consentement des auteurs, s'apparente selon les représentants des secteurs créatifs à une spoliation de leur identité stylistique.[5]
Le Parlement européen a adopté le 10 mars 2026, par 460 voix contre 71, une série de recommandations contraignantes destinées à encadrer l'usage des œuvres protégées au sein des systèmes d'IA générative[30, 31] :
- Transparence et traçabilité : les développeurs d'IA doivent fournir une liste exhaustive de toutes les œuvres protégées ayant servi à entraîner leurs modèles, ainsi que des enregistrements de toutes leurs activités de moissonnage de données.
- Rémunération équitable : l'exploitation d'œuvres protégées doit donner lieu à une compensation financière équitable au profit des titulaires de droits. Le Parlement refuse explicitement l'introduction d'une licence globale forfaitaire.
- Droit d'opposition géré par l'EUIPO : les auteurs doivent pouvoir exclure facilement leurs œuvres des bases d'entraînement (opt-out), via un registre centralisé géré par l'Office de l'Union européenne pour la propriété intellectuelle.
- Statut des œuvres générées par l'IA : les contenus entièrement générés par une IA sans intervention humaine significative ne peuvent prétendre à aucune protection au titre du droit d'auteur.
| Instance de régulation | Décision majeure | Statut de l'œuvre générée par l'IA |
|---|---|---|
| Parlement Européen (10 mars 2026) | Obligation de transparence absolue, journal d'exploration des données et droit d'opposition. | Refus de toute protection par le droit d'auteur si la génération est entièrement automatisée. |
| U.S. Copyright Office | Exigence d'un processus créatif humain vérifiable. | Droit d'auteur accordé uniquement pour les parties rédigées ou assemblées par l'humain. |
| Législation canadienne | Processus d'enregistrement géré de manière automatisée. | Statut juridique des créations d'IA encore caractérisé par une forte incertitude jurisprudentielle. |
Gérard Haas souligne que ces évolutions juridiques consacrent le passage d'une « économie de la copie » à une logique de « protection de l'identité » de la source.[5] Le droit d'auteur se transforme en un outil de traçabilité et de régulation financière, agissant comme une « Rente Cognitive » qui garantit aux créateurs humains de demeurer actionnaires des richesses produites par la machine.[5]
Parallèlement à ces enjeux juridiques, la poésie contemporaine s'adapte à l'environnement algorithmique à travers l'émergence de la pratique post-digitale.[34] Le numérique n'est plus envisagé comme un sujet d'étude ou un espace d'exception, mais comme le milieu naturel de diffusion et d'hybridation des œuvres.[34] La poésie numérique contemporaine affirme ainsi sa double nature : elle est à la fois une recherche technique de pointe explorant les replis des algorithmes neuronaux et une présence humaine sensible, capable de faire du réseau informatique mondial un espace d'expression artistique partagé.[34]
Références
- Digital Oulipo: Programming Potential Literature — DHQ Static. dhq-static.digitalhumanities.org
- The culture of neural networks. Synthetic literature and art — ResearchGate. researchgate.net
- AI-Generated Literature and the Vectorized Word, Judy Heflin — MIT CMS. cms.mit.edu
- IA et droit d'auteur : œuvres générées par des algorithmes — Lamy Liaisons. formation.lamy-liaisons.fr
- L'IA et le droit d'auteur : non pas un requiem, mais une renaissance — Haas Avocats. haas-avocats.com
- Écrire-avec l'intelligence artificielle, ou l'esthéthique de la sympoïèse — Prairial. publications-prairial.fr
- Oulipo — Wikipédia. fr.wikipedia.org
- Oupoco, l'ouvroir de poésie combinatoire — Observatoire des humanités numériques. odhn.ens.psl.eu
- La littérature électronique francophone célèbre son 45e anniversaire — bibliomancienne.ca. bibliomancienne.ca
- From OULIPO to Transitoire Observable. The Evolution of French Digital Poetry — media/rep. mediarep.org
- La poésie délivrée. Poésies dans, et hors le numérique — Presses. books.openedition.org
- Qu'est-ce que la génération automatique de texte — OLATS. archive.olats.org
- Jean-Pierre Balpe : Génération Automatique & Poésie Numérique — YouTube. youtube.com
- Jean-Pierre Balpe ou les Lettres Dérangées — Electronic Literature Collection. collection.eliterature.org
- Electronic Literature Organization — Wikipedia. en.wikipedia.org
- ELO 2013 "Chercher le texte" Commences in Paris — ELO. eliterature.org
- CFP ELO Paris 2013: Chercher le Texte — ELO. eliterature.org
- How Collaborating With AI Could Help Writers of the Future — Literary Hub. lithub.com
- Qu'est-ce qu'un réseau LSTM ? — La revue IA. larevueia.fr
- LSTM, Transformers, GPT, BERT : guide des principales techniques en NLP — Devoteam. devoteam.com
- Comprendre les Recurrent Neural Networks — Nexa Digital School. nexa.fr
- Les réseaux de neurones récurrents : des RNN simples aux LSTM — OCTO Talks. blog.octo.com
- Comprendre les LSTM — YouTube. youtube.com
- Intelligence artificielle et création littéraire : expériences et perspectives — Unilim. unilim.fr
- Poésie et Intelligence Artificielle — Art, Culture et Territoires. artetculturefontainebleau.fr
- Les amours pas si artificiels de Grégory Chatonsky — kingkong. kingkong-mag.com
- Grégory Chatonsky : Le monde selon l'IA — YouTube. youtube.com
- James Frey : « J'utilise l'IA parce que je veux écrire le meilleur livre possible » — Centre Pompidou. centrepompidou.fr
- La créativité peut-elle être artificielle ? — CNRS Le journal. lejournal.cnrs.fr
- Protéger les œuvres soumises aux droits d'auteur à l'ère de l'IA — Parlement européen. europarl.europa.eu
- Protecting copyrighted work in the age of AI — European Parliament. europarl.europa.eu
- Copyright of AI-generated works: Approaches in the EU and beyond — European Parliament. europarl.europa.eu
- IA et Propriété Intellectuelle — Bressand avocat. bressand-avocat.fr
- Poésie numérique et pratique post-digitale — Gilles Vallée Art. gillesvalleeart.ca
- Quand la Poésie Classique Rencontre l'IA et la Réalité Augmentée — Poesiar. poesiar.io
- Anthologies et Festivals — Hamid Larbi. hamid-larbi.net
- Festival littéraire international Metropolis Bleu. metropolisbleu.org
- Le Pan Poétique des Muses. pandesmuses.fr
- Strophe.fr — Le magazine de toutes les poésies. strophe.fr