Bonobos parlent comme nous: Une étude révèle leur capacité à créer des phrases!

Publié le :

Par : Pierre Dupont

Partager l'article

Les humains ont la capacité remarquable de discuter d’une infinité de sujets, allant des neurosciences aux éléphants roses, en formant des phrases à partir de mots. Cette faculté repose sur la compositionnalité : la capacité de combiner des unités de sens pour former des structures plus grandes, dont le sens provient à la fois des unités elles-mêmes et de leur agencement.

Pendant longtemps, on a cru que la compositionnalité était une caractéristique exclusivement humaine. La communication animale était considérée comme une simple collection aléatoire de cris, avec de très rares manifestations de compositionnalité. Toutefois, notre récente étude, publiée dans la revue Science, démontre le contraire.

En étudiant en profondeur la communication vocale des bonobos dans leur habitat naturel, la Réserve Communautaire de Kokolopori en République Démocratique du Congo, nous avons découvert que la communication vocale des bonobos – nos plus proches parents vivants avec les chimpanzés – repose largement sur la compositionnalité, tout comme le langage humain.

Un dictionnaire bonobo

Étudier la compositionnalité chez les animaux nécessite d’abord une compréhension solide de la signification des appels individuels et de leurs combinaisons. Cela a longtemps été un défi, car pénétrer l’esprit des animaux et décoder de manière fiable la signification de leurs appels est difficile.

Pour y remédier, nous avons développé une nouvelle méthode permettant de déterminer de manière fiable la signification des vocalisations des bonobos, et nous l’avons utilisée pour comprendre tous leurs appels individuels et leurs combinaisons.

Nous avons supposé qu’un appel de bonobo peut avoir différents types de significations. Il peut émettre un ordre (« Cours »), annoncer des actions futures (« Je vais voyager »), exprimer des états internes (« J’ai peur ») ou faire référence à des événements externes (« Il y a un prédateur »).

Pour comprendre de manière fiable la signification de chaque vocalisation tout en évitant les biais humains, nous avons décrit en détail le contexte d’émission de chaque vocalisation, en utilisant plus de 300 paramètres contextuels. Par exemple, nous avons enregistré la présence d’événements externes (comme la présence d’un autre groupe de bonobos ou de singes à proximité) et le comportement de l’émetteur, qu’il soit en train de se nourrir, de voyager, de se reposer, etc.

Nous avons également codé, pour les deux minutes suivant la production d’un appel, ce que l’émetteur et le public ont commencé à faire, ont continué à faire ou ont arrêté de faire. Nous avons utilisé cette description très détaillée du contexte pour attribuer un sens aux appels, le sens étant les paramètres contextuels associés à l’émission de cette vocalisation. Par exemple, si l’émetteur commence toujours à voyager après un appel particulier, alors cet appel signifie probablement « Je vais voyager ».

Avec cette approche, nous avons pu créer une liste complète des appels des bonobos et de leur signification associée : une sorte de dictionnaire bonobo. Ce dictionnaire représente une étape importante dans la compréhension de la communication animale, car c’est la première fois que des chercheurs ont systématiquement déterminé la signification de tous les appels d’un animal.

Compositionnalité chez les bonobos

Dans la deuxième étape de notre étude, nous avons développé une méthode pour enquêter si les combinaisons d’appels chez les animaux sont compositionnelles. Nous avons trouvé de nombreuses combinaisons d’appels dont la signification était liée à celle de leurs éléments – un signe distinctif de la compositionnalité. De plus, certaines de ces combinaisons d’appels ressemblaient étonnamment aux structures compositionnelles plus complexes de la langue humaine.

Dans la langue humaine, la compositionnalité peut prendre deux formes. Dans sa version simple (ou triviale), chaque élément de la combinaison contribue indépendamment au sens de l’ensemble, et la combinaison est interprétée par la somme de ses parties. Par exemple, « danseur blond » fait référence à une personne qui est à la fois blonde et danseuse. Si cette personne est également médecin, nous pouvons déduire qu’elle est aussi un médecin blond.

Dans une syntaxe complexe (ou non triviale), les unités dans une combinaison ne contribuent pas à des significations indépendantes, mais interagissent de manière à ce qu’une partie de la combinaison modifie l’autre. Par exemple, « mauvais danseur » ne fait pas référence à une mauvaise personne qui est aussi danseuse. En effet, si cette personne est également médecin, nous ne pouvons pas déduire qu’elle est un mauvais médecin. Ici, « mauvais » est lié uniquement à « danseur ».

Des études antérieures sur les oiseaux et les primates ont montré que les animaux peuvent former des structures compositionnelles triviales. Cependant, il y avait peu de preuves claires de compositionnalité non triviale chez les animaux, renforçant l’idée que cette capacité était uniquement humaine.

Pour déterminer si les appels des bonobos étaient compositionnels, nous avons emprunté une approche de la linguistique qui stipule que, pour être considérée comme compositionnelle, une combinaison doit répondre à trois critères :

  1. Chacun de ses éléments a des significations différentes.

  2. La signification de la combinaison est différente de celle de ses éléments.

  3. La signification de la combinaison provient de la signification de ses éléments.

De plus, nous avons évalué si une combinaison compositionnelle était non triviale en déterminant si sa signification était plus que la somme des significations de ses parties. Pour ce faire, nous avons construit un espace sémantique – une représentation multidimensionnelle des significations des appels des bonobos – ce qui nous a permis de mesurer les relations entre la signification des appels individuels et des combinaisons.

Nous avons utilisé une méthode dérivée de la sémantique distributionnelle, une approche linguistique qui cartographie les mots en fonction de leurs similarités de sens, avec l’idée que les mots ayant des sens proches sont utilisés dans des contextes similaires. Par exemple, les mots « requin » et « animal » sont souvent utilisés à côté de mots similaires, tels que « poisson » et « prédateur », suggérant qu’ils ont des significations liées. En revanche, « animal » et « banque » sont utilisés dans différents contextes, ils ont des significations moins liées. Cette approche permet de représenter et de mesurer de manière fiable la relation entre les significations de différents mots.

En appliquant cette méthodologie aux vocalisations des bonobos, nous avons cartographié la signification des appels et des combinaisons d’appels dans un espace sémantique basé sur leur contexte d’utilisation. Cela nous a finalement permis de déterminer quelles combinaisons répondaient aux trois critères de compositionnalité et, en outre, si elles affichaient une compositionnalité non triviale.

Nous avons identifié quatre combinaisons d’appels dont la signification était liée à celle de leurs parties individuelles, un signe distinctif de la compositionnalité. Il est important de noter que chaque type d’appel apparaissait dans au moins une combinaison compositionnelle, de la même manière que chaque mot peut apparaître dans une phrase en langue humaine. Cela suggère que, comme dans le langage humain, la compositionnalité est une caractéristique fondamentale de la communication des bonobos.

De plus, trois des combinaisons d’appels présentaient une ressemblance frappante avec les structures compositionnelles non triviales plus complexes observées dans la langue humaine. Cela suggère que la capacité de combiner des types d’appels de manière complexe n’est pas aussi unique aux humains que nous le pensions auparavant, laissant penser que cette capacité pourrait avoir des racines évolutives plus profondes que ce que l’on supposait auparavant.

Un bonobo émet un léger pépiement, signifiant ‘J’aimerais…’, avant le sifflement, qui signifie ‘Restons ensemble’. Dans des situations sociales tendues, cette combinaison signifie quelque chose comme ‘Détendons-nous’

Évolution du langage

Une implication importante de cette recherche est l’éclairage qu’elle apporte sur les racines évolutives de la nature compositionnelle du langage. Si nos cousins les bonobos s’appuient largement sur la compositionnalité, tout comme nous, alors notre dernier ancêtre commun en était probablement également capable.

Cela suggère que la capacité de construire des significations complexes à partir de petites unités vocales était déjà présente chez nos ancêtres il y a au moins 7 millions d’années, sinon plus tôt. Ces nouvelles découvertes indiquent que, loin d’être unique au langage humain, la compositionnalité existait probablement bien avant l’apparition des humains.

Articles similaires

Notez cet article
Partager l'article
Lire aussi :  Villes et arbres: Pourquoi doit-on parfois les abattre et comment le faire correctement?

Laisser un commentaire

Share to...