Par leur conception même, les LLM qui organisent la langue utilisée par l'intelligence artificielle générative sont multilingues. Ils créent des liens en s'affranchissant des langues, pour peu qu'on aille les chercher sur ce terrain-là. Ainsi, banque renvoie à bank qui renvoie à berge qui renvoie à rivière. Il existe donc dans l'espace multidimensionnel des LLM un chemin de banque à rivière, qui passe par la bank et la berge.
Si l'on se met à explorer les modèles de langage, on se prend à explorer des chemins surprenants. Ce qui vaut pour les faux-amis (qui sont le cauchemar des lycéens confrontés aux langues étrangères), cela vaut également pour les mots intraduisibles. Ceux qui ne renvoient à aucun mot précis dans une autre langue.
Ces mots sont nombreux, et l'on en trouve dans toutes les langues : ils disent une conception du monde différente selon la langue qu'on utilise. C'est la connue saudade portugaise, ou abbiocco en italien, ou tsundoku en japonais. On les compte par centaines.
Et si l'exploration des LLM nous offrait là l'occasion d'une balade poétique ? En partant d'un mot intraduisible et en cherchant les mots les plus proches en français. Ainsi pour tsundoku, les mots les plus proches, pour Claude Sonnet 4.6, seraient ? Il répond : « L'absence du mot crée une constellation de fragments : pile, désir, promesse, abandon, poussière, qui ensemble approchent tsundoku sans jamais l'atteindre. »
C'est une réponse « interprétée », explique Claude : « Je ne peux pas mesurer directement les distances vectorielles : je n'ai pas accès à mon propre espace d'embedding en temps réel. Ce que je fais, c'est raisonner sur cet espace à partir de ce que je sais de ma façon de traiter le langage. »
Mais c'est un début qui suffit à mon exploration. À partir de ces mots intraduisibles, il est possible de créer des poèmes qui « tournent » autour d'un creux dans l'espace multidimensionnel de la langue française, comme autant de tangentes qui finissent par dessiner la forme qu'elles évitent. On a une base à partir de laquelle écrire.
J'ai choisi le mot wabi-sabi pour aller plus loin. Et la carte mentale du vocabulaire français à partir du mot japonais permet de se lancer.
Demandons à Claude (Opus 4.8) de générer trois haïkus à partir de cette représentation.
Le bol est fêlé
l'or coule dans la blessure
patine du temps
Mur nu et pauvre
l'ombre passe et s'efface
rien ne reste là
Le jardin vieillit
j'accepte cette usure
douceur de la fin
Je n'ai apporté aucune retouche aux trois haïkus. Et Claude pourrait poursuivre la démonstration. L'exploration des univers multidimensionnels révélés par les intelligences artificielles génératives nous ouvre des portes. Et elles ne diraient rien ? Elles disent à propos du langage des choses auxquelles elles nous donnent pour la première fois accès de cette façon.