J'ai posé la question à Claude : qu'est-ce que le contraire d'un corbeau, dans l'espace du LLM ?
La réponse m'a surpris par sa complexité. Pas une réponse. Trois.
Dans l'espace des embeddings, le contraire d'un corbeau n'est pas une colombe. Le vecteur « corbeau » porte du noir, du vol, du cri, de la mort, du prestige ambigu. Son opposé directionnel cumulerait les antipodes de ces traits : quelque chose de souterrain, de silencieux, de clair, peut-être minéral. Pas un seul mot. Une région. L'agneau, peut-être. La perle. Le ver luisant.
Dans l'espace de la fable, le corbeau est autre chose. Il est statique, silencieux avant d'être sollicité, détenteur d'une chose qu'il va perdre. Son inverse serait un être qui se déplace, qui parle sans qu'on le lui demande, qui n'a rien à perdre. Ce qui ressemble fort au Renard lui-même. L'inverse du Corbeau est déjà dans le texte. C'est son antagoniste.
Troisième réponse, plus étrange. Dans l'espace des probabilités de génération, le corbeau est un token très ancré : il active des co-occurrences fortes et prévisibles. Son inverse serait un token flottant, sans isotopie dominante, qui dérive vers des contextes incompatibles sans résistance. Quelque chose comme chose, ou ça. Pas un animal contraire. Une entité sans gravité sémantique.
Et Claude a ajouté quelque chose qui m'a arrêté : dans ce troisième espace, le contraire du corbeau, c'est précisément ce qu'on avait mis comme sujet de l'ombre. Ce on indéfini qui traversait le texte sans s'installer nulle part.
J'ai donc posé la question suivante. Ne risque-t-on pas que le on soit l'inverse de tout être ?
Oui, m'a répondu Claude. C'est le problème exact.
Le on est un inverseur trop universel. Il efface le sujet grammatical, mais n'importe lequel. Il aurait fait le même travail contre un renard, un agneau ou une reine. Ce n'est pas l'inverse du corbeau : c'est l'inverse de la désignation elle-même. La phrase nominale aurait été plus juste, et plus difficile à tenir. Elle oblige à une syntaxe réellement différente, pas seulement à un pronom substitué. Le on imite l'effacement du sujet sans le produire vraiment. Sur cet axe-là, l'ombre avait un peu triché.
Le mot corbeau n'est pas une description. C'est une convocation. Et ce qu'il convoque, c'est une archive, la superposition de couches déposées par des siècles de textes, toutes disponibles simultanément dans l'espace latent que le mot active.
Poe d'abord. The Raven, publié en 1845, est probablement le poème en langue anglaise le plus massivement présent dans les corpus d'entraînement des grands modèles. Ce corbeau-là parle. Il dit Nevermore et rien d'autre, mais avec une répétition hypnotique qui transforme un mot vide en sentence définitive. Il ne décrit pas. Il juge. Il est une voix du destin.
La Fontaine suit de près. Maître corbeau, sur un arbre perché : il n'y a sans doute pas un adulte francophone qui n'ait cette ouverture quelque part dans sa mémoire. Dans cette fable, le corbeau n'est pas simplement un oiseau. Il est la vanité punie, le naïf trompé par la flatterie. Il porte une leçon morale. Il est une démonstration.
Odin, ensuite. Dans la mythologie nordique, Hugin et Munin, pensée et mémoire, parcourent le monde chaque jour et reviennent rapporter à Odin ce qu'ils ont vu. Les corbeaux sont les yeux du dieu. Cette dimension est moins immédiatement consciente, mais elle est là, dans les corpus. Elle explique pourquoi l'IA tend à faire du corbeau un être de sagesse obscure, un observateur ancien, un témoin qui sait.
Et puis il y a la lettre de corbeau, expression qui ouvre une branche presque contradictoire : le corbeau comme délateur anonyme, celui qui écrit pour dénoncer sans signer. La France de l'Occupation a produit des millions de lettres de ce type. Dans ce registre, le mot porte une laideur morale précise : la lâcheté de la haine sans signature.
Ces quatre systèmes coexistent dans l'espace latent que le mot active. Ils ne s'annulent pas. Ils se superposent, avec des poids différents selon le contexte, mais tous disponibles, tous prêts à infléchir la direction que prend la réponse. Ce qui disparaît sous cette accumulation, c'est le corbeau réel. Corvus corax, l'un des êtres vivants les plus fascinants que nous connaissions, est presque inaccessible via le mot seul.
Il y a une expression pour ce phénomène : l'écrasement du réel par le symbolique. Certains mots ont accumulé tellement de représentations culturelles que leur dénotation est devenue presque inaccessible. Le corbeau est l'un de ces mots. La mer en est un autre. La forêt. La frontière. Ces mots ne se contentent pas de décrire. Ils portent un poids plus lourd qu'eux-mêmes.
J'ai aussi cherché l'inverse de corbeau dans une base plus restreinte, pour bien comprendre ce qui se passe.
Imaginez que chaque mot a une adresse dans une ville immense, mais une ville en 384 dimensions, pas en deux. Difficile à visualiser, alors simplifions : disons que c'est une grande sphère, et chaque mot est un point sur sa surface.
Pour explorer ça, on a construit un outil qui tourne entièrement dans le navigateur, sans serveur, sans connexion, en s'appuyant sur un modèle open source appelé MiniLM. C'est un modèle compact, multilingue, entraîné à reconnaître les paraphrases : il sait que « je suis fatigué » et « j'ai besoin de dormir » veulent dire la même chose. À partir de ça, il a appris à placer les mots proches par le sens à des adresses proches sur la sphère. Corbeau se retrouve voisin de plume, de noir, de croasser. Samsung se retrouve voisin de Galaxy, de smartphone, de écran.
Quand on demande l'opposé de corbeau, le programme prend son adresse et cherche le point exactement à l'autre bout de la sphère. Ce point antipodal existe, mais il n'a aucune raison sémantique d'exister : MiniLM n'a jamais appris ce que signifie « le contraire d'un mot ». Il a seulement appris à rapprocher les mots similaires.
Alors qu'est-ce qu'on trouve à l'autre bout de corbeau ? Pas « lumière » ou « blancheur » comme on pourrait l'espérer. On trouve le mot dont l'adresse est, par pure géométrie, la plus proche du point antipodal. Et ce mot, c'est samsung.
Pourquoi samsung ? Parce que corbeau vient d'un univers de textes très particulier : la littérature française, les fables de La Fontaine, la nature, le symbolisme poétique. Samsung vient d'un univers totalement différent : les notices techniques, les forums d'électronique grand public, les comparatifs de smartphones en coréen, en anglais, en japonais. Ces deux mots n'ont jamais été vus ensemble dans aucun contexte. Leurs adresses sont donc à l'opposé l'une de l'autre, pas parce qu'ils sont contraires, mais parce qu'ils n'ont strictement rien en commun.
J'ai également cherché la phrase la plus éloignée de la fable entière. J'ai développé un petit programme qui me permet d'explorer MiniLM, une base de 15 490 phrases, réparties dans un espace à 384 dimensions. Et la phrase antipodale du Corbeau et le Renard, celle qui se situe le plus près du point opposé de la fable dans l'espace de MiniLM, est :
L'épreuve fut au programme des premiers Jeux olympiques en 1896 et n'est disputée par les femmes qu'à partir des Jeux de Sydney en 2000.
Une phrase avec un éloignement de 100%.
Ce travail directement sur le contenu de MiniLM exclut toute trace de hasard : on calcule effectivement des distances vectorielles. Ce qui ouvre des perspectives : il est théoriquement possible à l'auteur de produire son propre MiniLM pour s'adonner à des exercices de littérature combinatoire dans des espaces multidimensionnels.