Sur la Composition des Idées

Admetttons qu'il y ait des idées simples (par exemple : « une bière ») et des idées composées (par exemple : « je bois une bière »). Nous faisons déjà là une belle hypothèse, car après tout on ne voit pas pourquoi « une bière » serait simple (quand je me figure une bière, je me figure en même temps toutes sortes de choses, même si elles ne me sont pas toutes également présentes à l'esprit).



Cependant, on pourra convenir, au moins dans un premier temps, que « je bois une bière » est plus complexe que « une bière » tout court, et en quelque sorte, la contient. (Mais la contient-elle vraiment ? Il se pourrait qu'elle n'en contienne que l'aspect qui l'intéresse...)


Et d'autre part, même si nous avons toutes sortes de choses en nous quand nous pensons « une bière » (par exemple, le goût, la couleur, l'endroit où en boire, etc.), ces choses sont tellement liées entr'elles, et tellement peu susceptibles de se séparer les unes des autres pour s'agréger plutôt à d'autres nœuds, que l'on dira bien volontiers que ce complexe d'idées a un caractère d'unité —— au moins par raccourci, et en attendant de trouver mieux.


Donc, nous posons qu'il y a des idées simples, et des idées composées. Les idées composées sont faites d'idées plus simples, et les intègrent à un degré supérieur. Par exemple, de cette idée-ci : « je bois (quelque chose) » et de cette autre-là : « une bière », je compose l'idée « je bois une bière ».


Comment s'opère cette combinaison dans notre esprit ? La question est d'autant plus ardue que :

  1. cette manière de poser les idées comme simples et composées reste une hypothèse qui pourrait ne pas être avérée, ou bien trop simple;
  2. nous ne savons pas comment est représentée une seule idée tout court (simple ou complexe);
  3. nous n'avons pas mentionné la temporalité du processus mental.


Concernant ce dernier point, nous allons faire également une hypothèse simplificatrice, et ce sera la suivante : qu'on peut faire abstraction de ce que deux idées ont lieu en deux intervalles de temps pas strictement égaux. Car, à supposer qu'un dixième de seconde sépare ma pensée de « une bière » de celle de « je bois (quelque chose) », je peux quand même supposer (c'est vraisemblable) que ce qui demeure de la première idée est dans un état tel qu'il peut encore se lier à la seconde.


Si besoin est, je peux ne considérer de l'idée la plus ancienne que ce qu'elle a gardé d'efficace au bout de ce dixième de seconde. J'escompte qu'elle ne s'est pas trop dégradée dans l'intervalle, qu'il n'a pas trop fallu l'enrichir non plus... Et si je me trompe, je fais le pari que l'erreur n'est pas énorme, et qu'entretemps j'aurai acquis les connaissances qu'il me faut pour la rectifier.


Nous faisons donc abstraction du temps (temporairement) et venons à considérer des complexes d'idées simples destinés à faire des idées composées.


Maintenant, demandons-nous par quel biais chacune de ces idées coprésentes peut se voir liée aux autres. Admettons que chaque idée est liée à celles qui lui sont les plus voisines (cela est certain), mais peut-être aussi aux plus éloignées, soit immédiatement, soit par la médiation des idées qui font le lien.



En tout cas, si nous posons que les idées sont liées suivant un certain ordre, on doit s'attendre à ce qu'elles manifestent à chacun de leurs échelon une certaine directionnalité. « Je veux ce que je peux » n'est pas « je peux ce que je veux », et, pour cette raison, si j'ai « je veux (quelque chose) » et « je peux (quelque chose) » coprésents à mon mental, il faut bien que l'un des deux au moins indique qu'il recourt à l'autre en son sens, mais n'est pas recouru par lui en le sien.


En posant V = « je veux (quelque chose) », et P = « je peux (quelque chose) », on voit donc que « je veux ce que je peux » et « je peux ce que je veux » sont essentiellement la donnée de V appliquée à P, et la donnée de P appliquée à V. Et nous voyons que cette application n'est pas commutative. Comme d'autre part, l'essentiel de l'idée composée réside dans cette application, et que l'idée est cette application dont on fait abstraction de tout ce qui ne nous sert pas, on peut dire que ces deux idées se basent essentiellement, l'une sur <b>(x)</b> P, l'autre sur <b>(x)</b> V.


Ceci est le cas général. « Je bois une bière » peut être dit l'application de « je bois (quelque chose) » à « une bière ». En ce sens, on aurait D = « je bois (quelque chose) » et B = « une bière », l'idée composite se ramenant à être une sorte de <b>(x)</b> B.


Si l'on va par là, une idée composite correspondant à ce qui serait oralisé comme une phrase complexe, par exemple « Longtemps je me suis couché de bonne heure... » pourra être écrite comme un certain produit d'idées simples, mises dans un certain ordre.


Mais la difficulté apparaît alors de savoir quelle structure on doit donner à ces produits. Admettons que « je » = J, que « se coucher de bonne heure » = C. On peut donc dire que « je me couche de bonne heure » est en quelque sorte <b>(x)</b> J, si nous conservons le même patron que celui adopté à l'occasion des deux précédents exemples.


Mais il faut aussi rendre compte du temps passé ([passé composé]), et du fait que cela a duré « longtemps ». Notant P et L ces deux autres idées simples, nous voici confrontés au problème inextricable de déterminer si ce que nous pensons est plutôt <b>(x)</b> P <b>(x)</b> C <b>(x)</b> J, ou bien si ce n'est pas plutôt <b>(x)</b> L <b>(x)</b> C <b>(x)</b> J, ou, voire!, tout autre chose encore...


Et la raison de ce problème, c'est qu'en posant des multiplications, c'est-à-dire en considérant un produit de type <b>(x)</b> Y, nous considérons essentiellement des structures arborescentes, puisque <b>(x)</b> Y, au fond, c'est :

X --------> Y


Si nous ne savons que faire de ces idées simples que sont L = « longtemps,... » et P = [passé composé], c'est parce que dans ce schéma-ci :

[Je] <---------- [se coucher de bonne heure]

nous ne voyons guère à quel nœud du graphe nous devrions attacher [Longtemps], ni le [passé composé]... —— plutôt à [Je] ? plutôt à [se coucher de bonne heure] ?


Les deux se défendent, et nous aurions même pu être plus pervers, en isolant [de bonne heure] de son verbe-support, de sorte que [se coucher de bonne heure] serait en fait une idée complexe, constituée des deux composants « se coucher (mais quand ?) » et « (faire quelque chose) de bonne heure ».


Le fait que, pour chaque découpage syntaxique en forme d'arbre que le grammairien peut imaginer, existe au moins une langue humaine qui pose naturellement la syntaxe de la phrase précisément suivant l'arbre en question démontre de toute évidence que l'arbre que nous choisirions suivant telle théorie n'est pas moins arbitraire que les autres arbres candidats...


Et cependant, dans le même temps que nous nous faisons cette remarque déprimante, nous constatons une chose importante : c'est que, quelque soit l'endroit où l'on accroche L = « longtemps », P = [passé composé] et H = « de bonne heure », la structure <b>(x)</b> J (= « je me couche »), agrémentée de ces trois compléments comme un porte-manteau qu'on coifferait de vêtements de-ci de-là, un peu au hasard, ne laisse aucun doute quant à sa signification.


Ainsi, que l'on pose :

        <------- [de bonne heure]
  [je] <-- [se coucher] <-- [longtemps] <-- [passé composé]

ou...

      <------- [longtemps]
[je] <-- [se coucher] <- [de bonne heure] <- [passé composé]

ou encore une autre combinaison, la sémantique ne varie pas.


Autrement dit, les idées simples commutent (<b>(x)</b> P est comme <b>(x)</b> L).


Et, puisque les idées commutent, il n'y a pas de sens, du point de vue du linguiste, de vouloir écrire <b>(x)</b> P plutôt que <b>(x)</b> L. Nous sommes en train de dire que la valeur X = <b>(x)</b> P est identique à la valeur Y = <b>(x)</b> L. Dans ces cas-là, le mathématicien note que P et L entretiennent entr'eux une certaine relation (et aussi quant à l'opération <b>(x)</b> ), et il note <b>(W)</b> P la valeur commune X = Y.


L'opération <b>(W)</b>  est donc commutative (par définition), et elle représente le fait de considérer deux idées simples « simultanément », et sans considération de comment l'une enchaîne l'autre. C'est l'opération <b>(x)</b> lorsque ses arguments ont le bonheur de commuter.


L'opération <b>(W)</b>  est d'un usage bien plus fréquent qu'on ne pense. Reconsidérons le premier exemple que nous avons pris : « je bois une bière ». En posant D = « je bois (quelque chose) », et B = « une bière », il apparaît clairement que le fait de « mettre ensemble » B et D ne peut donner que « je bois une bière »(@). On ne peut rien obtenir d'autre de B et D mis ensemble. Donc, quand nous notions <b>(x)</b> B quelques lignes auparavant, c'était en fait par pédantisme que nous posions D comme étant l'opérateur, et B la donnée. En vérité, nous aurions tout aussi bien pu écrire <b>(x)</b> D, cela n'aurait laissé aucun doute quant à ce que nous signifiions.


Penser « je bois une bière » à partir de D = « je bois (quelque chose) » et de B = « une bière », c'est donc penser <b>(x)</b> B aussi bien que <b>(x)</b> D, c'est donc, d'après notre définition de l'opération <b>(W)</b> , penser <b>(W)</b> B.


Poser l'opération <b>(x)</b>  ici revient à dire que, en présence des deux sites [je bois (quelque chose)] et [une bière] qui seraient activés dans notre cerveau, le mental n'a pas besoin qu'on lui précise qui est lié à quoi, si ce sont là les deux seuls sites activés coprésents à l'esprit. Car, c'est <b>(W)</b> B = B <b>(W)</b> D donc <b>(x)</b> B qui s'impose.


Et tout d'un coup, réaliser cela nous libère. Car, admettons qu'on ait une grosse idée complexe à avoir en tête, la kyrielle de liens directionnels qui unissent telles idées simples à telles autres est d'un tel enchevêtrement que, si nous ne devions pas prendre en compte les simplifications que les <b>(W)</b> représentent essentiellement, nous nous retrouverions à gérer en permanence des arborescences touffues, et à nous dépêtrer dans les affres des grammaires génératives, c'est-à-dire, à faire du calcul algorithmique en permanence, y compris quand ce n'est pas nécessaire.


Nous voyons de ce fait que le schème présidant aux idées complexes, et à leur constituance, pourrait bien être beaucoup plus simple que l'idée qu'on s'en est faite jusqu'à présent. —— Continuons sur cette voie, et nous allons voir que la façon dont un esprit pourrait fonctionner n'a rien de miraculeux.


Nous allons admettre que notre esprit (j'entends par là : l'esprit artificiel que nous nous acharnons à construire) est basé sur un agencement matériel dont il émerge. Ce substrat matériel, ce sera un ensemble de N cellules, qui peuvent être soit dans un état 0 appelé fondamental (et qui représente l'état de « repos »), soit dans un des k états excités qui représentent l'activité de la cellule.


Nous poserons qu'une idée simple est ce qui est exprimé par le substrat lorsque p cellules de ce substrat (p cellules prises parmi les N) se trouvent dans un état différent de 0.


Pour fixer les idées, nous dirons qu'une idée simple isolée, c'est donc (N-p) cellules au fondamental, et p cellules qui sont chacune dans un des k états excités. Et nous prenons p comme une constante, c'est-à-dire que c'est le même p pour toutes les idées simples possibles (cette dernière hypothèse sert à simplifier les calculs, et ne nuit pas au raisonnement dans son principe).


Soit A une idée simple, nous notons A' l'état mental correspondant, —— à savoir le fait que les p cellules associées à A soient dans les états spécifiques exprimant cet A.


Si A' et B' sont deux états mentaux ne mobilisant pas les mêmes p cellules (i.e. les deux sous-ensembles de p cellules parmi N sont disjoints), alors on peut considérer l'état C' résultant de la superposition de A' et B', c'est-à-dire, l'état où chaque cellule vaut son état excité de A' si elle est dans A', son état excité de B' si elle est dans B', et l'état fondamental (repos) si elle n'est ni dans A' ni dans B'.


Qu'on réfléchisse bien à la question, on y verra que l'état C' représente l'idée composite <b>(x)</b> B, ou <b>(x)</b> A, indifféremment.


L'idée qu'il représente, en effet, contient bien tout ce que A contient, aussi bien que tout ce que contient B. N'étant pas sensible à l'ordre dans lequel A et B sont donnés, puisqu'il les considère du même œil, il ne peut pas vouloir dire « A gouvernant B » plutôt que « B gouvernant A ». Mais, puisque l'un au moins de A et de B entend gouverner l'autre, c'est, ou bien qu'il dit que les deux se gouvernent mutuellement, ou bien que c'est des deux celui qui est naturellement porté à gouverner qui régit l'autre.


Indifférent à la précédence de A sur B comme à celle de B sur A, notre être mathématique exprime aussi bien <b>(x)</b> B que <b>(x)</b> A, et représente donc, par définition, la somme directe <b>(W)</b> B.


On peut cependant objecter qu'il représente d'autres sommes dans le même temps. Admettons que les cellules excitées de A' soient { a1, a2, a3 }, par exemple (nous prenons p = 3 pour fixer les idées). Admettons que les cellules excitées de B' soient { b1, b2, b3 }. En ce cas, C' est l'état mental constitué des excitations { a1, a2, a3, b1, b2, b3 }, chacune dans un de leurs k états respectifs. Et l'on a bien C' = { a1, a2, a3, b1, b2, b3 } = { a1, a2, a3 } <b>U</b> { b1, b2, b3 } = A'<b>(W)</b> B'.


Fort bien, mais on pourrait tout aussi bien découper C' autrement, en disant que C' = { a1, a2, b1, b2, b3, a3 } = { a1, a2, b1 } <b>U</b> { b2, b3, a3 } = U'<b>(W)</b> V', où U' et V' sont deux « nouveaux » états mentaux...


Ainsi, peut-être que A', c'était « je bois (quelque chose) » et B', « une bière », de sorte que C' = A'<b>(W)</b> B', c'était « je bois une bière ». Mais, si U' se révèle être « il fait beau » et V' = « à Barcelone », alors l'état mental C' exprimera à la fois « je bois une bière » et « il fait beau à Barcelone » !


Pour cette raison, on a envie de dire qu'on ne peut pas engrammer des idées complexes au moyen d'un substrat matériel (cerveau ou autre) qui se baserait sur ce principe. Mais, c'est aller un peu vite en besogne : en vérité, on peut parfaitement se servir d'un cerveau qui fonctionnerait ainsi, et sans pâtir de l'aléa que nous venons de mentionner; car, les probabilités travaillent pour nous.


Ce serait bien étonnant en effet que nos cellules du substrat soient en petit nombre. Nous pouvons donc supposer N très grand. Le nombre p d'autre part, est à considérer par rapport à N. Si p vaut 1, cela revient à dire que chaque état mental n'est porté que par une seule cellule(@), il n'y aura donc jamais que N états mentaux distincts (pk s'il y a k états excités distincts).


En prenant p=2, on considère, non plus les cellules du substrat prises isolément, mais les paires de telles cellules. Cela fait beaucoup plus d'états mentaux envisageables ! (cela en fait C(N,2) s'il n'y a qu'un seul état excité).


En prenant p=3, puis 4, 5, etc., ce nombre d'états mentaux « engrammable » augmente considérablement à chaque fois. Mais évidemment, dans le même temps, nous avons de plus en plus de mal à caser les états mentaux dans leur espace propre, « sans qu'ils se nuisent les uns aux autres ». Supposez que p vaille la moitié de N, alors si A' est un état mental, il occupe la moitié des cellules du substrat, et il n'y a que les états mentaux qui occupent l'autre moitié qui peuvent « raisonnablement » se composer à lui.


Donc, plus p augmente, plus notre substrat peut représenter un grand nombre d'idées, mais plus ces idées sont en danger de ne pouvoir se composer, faute de « place » dans l'espace qui les fait vivre.


Avec un seul état excité distinct du fondamental (k=1), on a C(N,p) idées distinctes envisageables. Ce nombre est un coefficient du binôme : le p-ième terme de la N-ième ligne du triangle de Pascal. Il est maximal lorsque p vaut la moitié de N, mais nous avons vu que cette situation est de peu d'intérêt.


En fait, il nous suffit, pour disposer d'un substrat efficace, d'avoir p assez grand, tout en restant petit devant N. Prenons par exemple un ensemble d'un million de cellules pouvant être, soit dans l'état 0 (fondamental), soit dans l'état 1 (le seul état excité) : avec p=100, on aura environ (106)100/100! états mentaux envisageables (c'est énorme).


En outre, la probabilité que deux états mentaux pris au hasard « entrent en collision » (c'est-à-dire : se retrouvent avec des substrats non disjoints) est très faible. Un ordre de grandeur nous est donné par la probabilité que les deux substrats se recouvrent à moitié.


Soit p = 2q, pour que deux substrats se recouvrent à moitié, cela revient à choisir q cellules, puis q parmi les N-q qui restent, puis q parmi les N-2q qui restent, tout en sachant qu'on compte 3! = 6 fois trop de cas. Il y a donc C(N,q)C(N-q,q)C(N-2q,q)/6 telles configurations. D'autre part, le nombre d'états mentaux envisageables est C(N,2q). Il y a donc C(N,2q)C(N,2q)/2 paires d'états mentaux possibles.


La probabilité que deux états mentaux se recouvrent à moitié par hasard est donc :

C(N,q)C(N-q,q)C(N-2q,q) / 3.C(N,2q)C(N,2q)

soit, puisque q est petit devant N :

C(N,q)3 / 3.C(N,2q)2 ~ (N3q/3(q!)3).((2q)!2/N4q)
= 1 / 3.Nq.q!.C(p,q).C(p,q)


De plus, nous imaginons que les états mentaux se répartissent de manière homogène dans l'espace des idées, c'est-à-dire que deux idées pouvant être utilement liées dans une prédication n'ont pas de raison a priori d'user de cellules identiques. En ce cas, la probabilité qu'un état mental somme C' = A' <b>(W)</b> B', avec <b>(W)</b> B prédication utile, puisse également s'écrire C' = U' <b>(W)</b> V', <b>(W)</b> V étant une autre prédication utile, est infime.


Un facteur important est le rapport p/N qui indique à quel degré chaque idée simple « monopolise » le substrat. Nous l'appelons la continence du substrat, et la notons η= p/N


La probabilité que deux idées simples aient exactement le même susbtrat est de l'ordre de p!/Np pour k=1, elle est donc inférieure à (p/N)p = ηp. Ceci donne une idée de la façon dont la continence du substrat règle sa puissance expressive.


Avec N grand devant p, et p lui-même un petit peu grand (mais déjà dix, c'est énorme), on semble pouvoir réaliser des prouesses, sans même mentionner le fait qu'on peut jouer sur k, si l'on est sûr de la disjonction des substrats.


Notons encore que deux sous-ensembles de cellules excitées peuvent fort bien empiéter légèrement l'un sur l'autre sans que cela porte nécessairement préjudice au calcul. Car, imaginons que les calculs menés en aval de ces excitations du substrat ne tiennent pas compte de l'indvidualité de chaque cellule excitée en amont, mais plutôt du paysage global que les sous-ensembles constituent : alors, dans ce cas, deux sous-ensembles A' et B' sommés l'un l'autre, mais se recouvrant sur une petite partie D' = A' <b></b> B', cela ne portera pas préjudice à la représentation, et l'idée composite A'<b>(W)</b> B' demeure.


Terminons cette page par une tentative d'évaluation des ordres de grandeur numériques utiles. Une idée complexe courante mobilise, je dirais, en moyenne trois à cinq idées simples. Une phrase que l'on dit, tout simplement, se résume en général à trois ou cinq morceaux basiques. Une idée complexe, celle qu'on essaie de formuler au cours d'un débat très argumenté, peut s'élever jusqu'à dix ou douze idées simples.


Si l'on se servait d'un substrat du type précédent, avec N = un million de cellules, p = 100 cellules parmi ces N pour chaque idée simple, et k = 1, un seul état excité envisageable, comme la continence vaut 10-4, cela veut dire qu'on ne saurait considérer plus de 1/η= 10 000 idées simples à la fois sans dommage, mais qu'en pratique à partir de M = η-1/2 idées simples à la fois, on a du mal.


Ici, M = 100. Un tel substrat resterait donc à l'aise avec des pensées allant jusqu'à 100 idées simples à la fois. Il semble que ce soit suffisant pour ce qui est du langage !


Une phrase de Proust peut bien représenter une cinquantaine d'idées simples à la fois... Mais personne ne lit une phrase de Proust d'une seule traite, en ayant encore en tête les idées fraîchement élaborées à la fin de la lecture de la phrase, en même temps que les idées du début au même degré d'élaboration. Les longues phrases des romans, de même que les épisodes de la vie qui durent tant soit peu, sont le fruit d'un calcul qui se fait en plusieurs étapes, et de ce fait ne rentrent pas dans le cadre hypothétique que nous venons de formuler.


RÉFÉRENCES