Géométrie et vision – 3.

Géométrie et vision
3 – 9 juillet 1995
par Jean-Michel Morel

Participants

Jean-Pierre d’Alès (Centre de recherches en mathématiques de la décision (CEREMADE), université de Paris IX Dauphine), François Bergeaud (Ecole centrale, Paris), Stéphane Brault (Centre de recherche en épistémologie appliquée (CREA), Ecole polytechnique, Paris), Claude Brisson (CREA, Ecole polytechnique, Paris), Yves Candau (CREA, Ecole polytechnique, Paris), Hervé Hamy (CREA, Ecole polytechnique, Paris), Martin Lefébure (CEREMADE, université de Paris-IX Dauphine), Jean-Michel Morel (CEREMADE, université de Paris-IX Dauphine), Jean Petitot (CREA, Ecole polytechnique, Paris), Patrick Popescu-Pampu (Ecole normale supérieure (ENS), Paris), Patrice Prez (CREA, Ecole polytechnique, Paris), Bernard Teissier, organisateur (ENS, Paris), Nicolas Vayatis (CREA, Ecole polytechnique, Paris)

Compte rendu

La rencontre a été organisée comme un atelier, les jeunes chercheurs étant invités à exposer leurs résultats devant les plus âgés. Le texte suivant de Jean Michel Morel, préface (1) de la traduction française de la Grammatica del Vedere de Kanizsa, en partie élaboré durant un groupe de travail qui s’est tenu pendant la rencontre, donne une bonne vue d’ensemble des sujets qui ont été abordés.

« Voici enfin traduite en français la Grammatica del Vedere, presque dix ans après les publications anglaise, italienne, espagnole ou japonaise. Pourquoi me risqué-je à prédire un grand impact à un livre qui est a priori destiné à un public de psychologues spécialisés dans la perception visuelle ? C’est que l’importance et l’universalité des phénomènes discutés par Kanizsa et le caractère extraordinairement amène de l’ouvrage devraient en faire un outil irremplaçable pour les professionnels de l’image, qu’ils soient artistes, ingénieurs ou savants.

Un livre qui vous montre, à l’aide de figures géométriques aussi simples qu’ingénieuses, ce que l’on voit et ce que l’on ne peut pas voir dans une image, n’est pas un livre ordinaire. On peut comparer avantageusement le Kanizsa aux tentatives d’un autre gestaltiste, Arnheim, de populariser les vues de la Gestalt en théorie de l’art. Car les ouvrages d’Arnheim ont le défaut de la vulgarisation : les sources du raisonnement gestaltiste y sont littéralement rejetées dans les marges. Si les analyses gestaltistes d’Arnheim nous aident à regarder des tableaux, l’inverse n’est pas vrai, et regarder les tableaux qu’il analyse ne nous aide guère à comprendre les éléments de notre perception.

Les illusions visuelles

On peut se contenter de lire la Grammaire du voir en consommateur d’images et de contempler les figures (une par page !) et les commentaires qui les accompagnent. Mais ces figures forment un réseau subtil d’expériences et de contre expériences qui captive très vite. Y sont enfin expliquées, ou à tout le moins discutées, les curiosités visuelles que l’on peut rencontrer dans les nombreux ouvrages parus récemment et dont l’objet semble être une sorte de “médiatisation de la Gestalt”.

Je pense notamment au Visual Allusions de N. Wade ou au Vous n’en croirez pas vos yeux de J.-R. Block et II. E. Yuker. Que trouve-t-on dans ces ouvrages ? Eh bien, une série de figures, dessins, voire de photographies ou de tableaux contenant un paradoxe visuel : droites qui semblent se tordre, droites parallèles dont on jurerait qu’elles se rapprochent, longueurs égales d’aspect visuellement inégal, architectures impossibles. Et, parmi elles, les fameuses expériences de “contours subjectifs” auxquelles Kanizsa a associé son nom.

Privées de leur contexte scientifique et de leur discussion expérimentale, ces figures dites illusoires risquent de nous lasser : car ce sont toujours les mêmes, à quelques variations près. Il y a la petite dizaine d’illusions visuelles dites proprement optico-géométriques (Sander, Poggendorf, Zöllner, Hering, Ponzo, Müller-Lyer, Delbœuf…), les bandes de Mach et puis les illusions que l’on peut appeler gestaltistes : les figures masquées, les contours subjectifs, la fourchette de Penrose (reprise dans les architectures impossibles d’Escher et les dessins humoristiques de Shephard), les images à figure et fond réversibles de Rubin, et, dans le même esprit, quelques images d’Epinal (la bergère a perdu ses moutons : trouvez-les !) et c’est bien tout.

Le risque d’un malentendu est réel : un siècle de recherches expérimentales sur la perception visuelle se résumerait-il à une petite vingtaine de croquis qui signaleraient les quelques “anomalies” de notre système visuel ? A l’orée de toute science, il y a certes la collecte d’objets étranges et de trouvailles ingénieuses qui commencent par remplir le cabinet des merveilles du collectionneur ou le traité de l’alchimiste. C’est au scientifique qu’il revient de découvrir que les anomalies sont, sinon la règle, du moins ce qui nous révèle la présence de règles, de lois. Et quoi de plus énigmatique que le petit nombre de ces anomalies dans le système visuel ? Il semble en effet que la liste des illusions optico- géométriques et gestaltistes ait été close très tôt dans le siècle. Restait à tenter leur systématisation. C’est ce qu’avait entrepris l’école gestaltiste et on peut trouver la somme de leurs recherches dans le passionnant ouvrage de Metzger.

Le Metzger, aujourd’hui non disponible, a le défaut de tous les ouvrages à visée encyclopédique et totalisante : ils exigent une réécriture constante pour rester à jour et ne survivent pas à l’énergie de leur auteur. Il suffit pourtant de le lire, avec ses 676 pages et ses 700 illustrations, pour y retrouver la logique perdue d’une école allemande et autrichienne dispersée par la guerre. Cette école a trouvé une heureuse continuation en Italie grâce à Musatti, Benussi, Metelli, Kanizsa et leurs élèves. Les recherches de cette école sont certes condensées dans les chapitres XIII et XIV de la dernière version du Metzger (1975). Mais si le lecteur désire retrouver non seulement les acquis, mais aussi l’esprit vivant de l’école gestaltiste, il le retrouvera plus sûrement dans le livre de Kanizsa, où se conjuguent esprit philosophique, imagination graphique et la verve polémique d’une école qui a survécu presque miraculeusement jusqu’à nos jours. Il est impossible de rendre compte du mouvement gestaltiste comme d’un tout : c’est un croisement complexe de doctrines psychologiques. Aussi allons-nous nous contenter d’évoquer ce qui constitue proprement le programme gestaltiste d’analyse de la perception visuelle, tel qu’il avait été lancé par Wertheimer.

Le programme gestaltiste géométrique

L’ambition des gestaltistes n’est pas de suivre la voie physiciste de Helmholtz ou de Mach, qui utilisaient les illusions optico-géométriques comme des révélateurs de la physiologie de la vision. Les tentatives d’“explication physiologique” de ces illusions sont d’ailleurs toujours l’objet de discussions. Les explications physicistes conçoivent les illusions comme des erreurs rendues nécessaires par l’architecture du cortex visuel. Elles postulent par exemple que la schématisation de l’image rétinienne brute par cette machine mathématique que serait notre appareil visuel impliquerait des “erreurs d’arrondi” expliquant certaines des distorsions constatées. L’école gestaltiste, elle, s’écarte résolument de toute tentative d’explication physiologique. Elle tente de “récupérer” les illusions comme un élément parmi d’autres dans un programme beaucoup plus ambitieux : il s’agit de donner des lois de constitution des objets dans le champ visuel permettant d’expliquer comment et pourquoi nous voyons les formes, les choses et leurs mouvements. L’hypothèse gestaltiste est que notre système perceptif est par essence, et non par accident, une vaste machine à illusions géométriques ou, pour emprunter l’heureuse expression de Gombrich, une machine à “reconstruction visuelle”. Kanizsa nous explique que la perception d’un cercle ou d’une droite est aussi une illusion visuelle. Que nous puissions voir une droite “tordue » surprend, certes, mais le phénomène “normal » consistant à voir une droite “droite” requiert aussi une explication, ni plus, ni moins. Car le stimulus qui arrive sur notre rétine n’est jamais un cercle, n’est jamais une droite.

Pour Wertheimer, le fondateur du “gestaltisme géométrique”, les recherches doivent établir selon quelles lois les informations atomiques (identifiées par lui à des points noirs sur une feuille de papier) sont regroupées par le mécanisme de reconstruction visuelle pour donner lieu à des groupes de points, puis à des lignes, des courbes, des formes enfin. Il y a donc des lois de regroupement à établir, fixant sous quelles conditions des points s’assemblent en un tout, une Gestalt, et quelles sont les parties de ce tout admises à l’existence perceptuelle. Par exemple, un carré aura pour parties visibles ses quatre sommets et ses quatre côtés. Toute autre partie, par exemple la moitié supérieure du côté vertical gauche, peut certes être “pensée”, mais n’est pas “visible” quand on regarde le carré : elle est donc en quelque sorte “masquée” par la figure qui la contient.

Le programme de recherches ne part pourtant pas du principe que “le tout prime la partie”, dont on a parfois fait le slogan du gestaltisme. Aucun gestaltiste n’a pu ignorer cette évidence physique qu’est le caractère dispersé, atomisé des informations qu’envoient sur notre rétine les objets de l’Umwelt. L’expérience visuelle doit bien sûr partir de ces sensations atomiques, quelles qu’elles soient, avant de procéder à ce jeu subtil du tout et de la partie, d’où va émerger notre perception global d’une image. Toutefois, les gestaltistes ne se préoccupent guère de remonter à ces hypothétiques “atomes perceptifs” que les psycho-physiciens actuels tentent de représenter très matériellement par les neurones qui seraient chargés de leur calcul. En effet, les expériences gestaltistes, et particulièrement les fameuses expériences de “contours subjectifs” (“modaux” selon la terminologie de Kanizsa) prouvent que l’image perçue est littéralement réécrite, au point que seule une attention dirigée du sujet permet de faire la différence entre un contour subjectif et un contour physiquement réalisé. Les contours “modaux” sont donc les seuls contours réels, ceux dont doit partir la théorie de la perception. Contrairement à une opinion répandue, les contours subjectifs n’ont pas été trouvés par Kanizsa, qui les attribue à F. Schumann. Mais la série d’expériences inventée par Kanizsa pour fixer leur statut ontologique est proprement géniale. Que l’on regarde par exemple la figure 8.21 et son commentaire : selon le point d’impact du regard sur cette figure, on y voit tantôt un objet transparent “sur” un autre et ses contours “modaux”, tantôt deux objets superposés. Et, dans ce deuxième cas, les contours “modaux” disparaissent sans laisser de trace et l’apparence des surfaces grises en est changée !

Voir n’est pas penser

La réécriture de l’image “physique” qu’effectue notre perception, les gestaltistes en viendront à l’appeler “masquage”. Elle correspond à un processus primaire, à opposer au processus secondaire que serait l’interprétation raisonnée de l’image. A ce titre, elle n’est pas, comme nous le montre Kanizsa par des expériences fort humoristiques, le fruit de l’expérience du sujet ou de ce qu’il sait. Elle est bien plutôt ce que les sujets “ne peuvent pas s’empêcher de voir” (non potevano far a meno di vedere), même s’ils peuvent vérifier directement, matériellement, que leur perception les trompe, comme par exemple dans l’expérience de l’“autruche qui danse”. Cette condition expérimentale est d’ailleurs ce qui nous donne un accès si direct aux résultats des recherches gestaltistes : le lecteur est invité à se substituer au sujet de l’expérience et à juger par lui-même de ce qu’il est forcé de voir. Aussi, le livre de Kanizsa est-il une leçon de la méthode, faite à vrai dire comme en passant, à l’occasion de la discussion des nombreuses erreurs méthodologiques qui guettent le phénoménologue de la perception. Mentionnons l’erreur qu’il appelle cognitiviste qui consiste en la réduction de la perception visuelle à un “raisonnement”, voire à un problem solving. Cette erreur, que Kanizsa qualifie pudiquement de malentendu, constitue évidemment une régression par rapport aux acquis gestaltistes et laissera pensifs ceux qui croient qu’en science, vérité acquise ne se peut perdre. Elle fait aussi l’objet de l’autre ouvrage, non moins remarquable, que nous a livré Kanizsa pendant ses années de professeur émérite, Voir et penser (Vedere et pensare). Il nous y montre que le sujet de l’expérience (et donc aussi le lecteur) doit être “averti”, c’est-à-dire qu’il doit distinguer entre ce qui relève d’un éventuel raisonnement sur l’image le conduisant à imaginer des interprétations et ce qu’on pourrait appeler sa vision spontanée. “Vedere et pensare » est donc plutôt à traduire “voir n’est pas penser”.

La “complétion amodale” d’Euclide

L’analyse des erreurs méthodologiques est pour Kanizsa une pratique productive, car elle est l’occasion d’expériences nouvelles qui ont une valeur de réfutation. C’est more geometrico (nous voulons dire à l’aide de figures) que Kanizsa s’attache à nous éviter tout emploi erroné du dogme gestaltiste que le tout prime sur la partie par une série d’expériences magistrales sur la “complétion amodale”. A l’encontre du dogme du Ganzfeld, Kanizsa prouve que celle-ci dépend en grande partie de singularités locales de l’image (les jonctions en T ou en X) et seulement secondairement d’une perception globale de l’image. Comment illustrer la complétion amodale ? Le lecteur se souviendra peut-être des droites que les professeurs de mathématiques tracent à la craie sur un tableau noir et dont ils affirment froidement qu’elles sont infinies. Ils n’ont pas besoin, pour entraîner la conviction de leur auditoire, de tracer la droite sur plus de quelques décimètres. Il est même inutile qu’ils prolongent le trait par des pointillés valant pour et cœtera.

Kanizsa nous montre en effet que tout trait droit qui s’interrompt abruptement est perçu comme s’il « continuait” et est donc, sinon “infini actuel”, du moins sans limites, infini en puissance. Aussi, la vision géométrique des gestaltistes rejoint-elle et interprète celle d’Euclide, et l’on peut voir dans les tentatives d’axiomatisation de la vision tentées par Wertheimer un essai incomplet, mais fructueux, d’unifier géométrie et théorie de la vision. En tout cas, les objets d’Euclide, droites, cercles, triangles, carrés, etc., sont aussi les objets de base de l’expérimentation gestaltiste. Toutes les figures présentées par Kanizsa sont de telles combinaisons de géométrie euclidienne élémentaire, à quelques exceptions notables et humoristiques près (le “cheval allongé”, l’“arbitre embroché”). Ces dernières expériences, témoins de l’humour de Kanizsa, sont utilisées pour prouver que les lois perceptuelles et les anomalies démontrées avec des triangles et des cercles peuvent se lire et se vérifier sans peine dans les images de tous les jours, et ce, même quand elles s’opposent au “bon sens” et à notre longue familiarité avec certains objets.

Gestalt et vision par ordinateur

L’article fondateur de Wertheimer contient un appel aux mathématiciens sensé apporter la formalisation correcte du processus primaire. On peut bien dire que cet appel est resté sans écho jusqu’aux premières tentatives de simulation informatique de la vision, dans les années 1970. Le programme de Marr est la première tentative de réponse, avec l’établissement d’un programmé de simulation informatique et de vérification mathématique de ce que David Marr baptise le raw primal sketch, c’est-à-dire la constitution des percepts de base (bords, coins, et d’ailleurs aussi les jonctions en T de Kanizsa) à partir desquelles s’élaborerait le raisonnement ou l’interprétation raisonnée. La décision d’expérimenter la vision sur ordinateur a apporté une confirmation éclatante des thèses gestaltistes. Les recherches de vision par ordinateur (computer vision) ont en effet buté d’emblée sur le problème de la détection des contours (edge detection). Pour les critères mathématiques simplistes utilisés en vision par ordinateur à ses débuts, basés sur une analyse des variations locales de luminance de l’image, il s’avérait qu’il y avait des contours partout dans une image. « L’impression générale, et presque désespérante, des premiers chercheurs (…), nous dit Marr à ce propos, fut que pratiquement tout pouvait arriver dans une image et que, de fait, on y trouvait pratiquement n’importe quoi !” Alors, comment trouver les “bons contours”, ceux des formes que l’on voit ? Les “bons” sont justement ceux qui se définissent par les lois de la Gestalt, par des considérations globales sur l’image : voilà comment les informaticiens ont redécouvert qu’il n’y a pas d’autres contours que les contours subjectifs ! En vision par ordinateur, les années 1980 et 1990 auront été consacrées à l’étude de modèles mathématiques de méthodes toujours plus sophistiquées, sans que l’on puisse prétendre avoir encore établi une simulation informatique du “processus primaire”, tel que l’entend Kanizsa, ni une théorie mathématique complète. Toutefois, c’est les intuitions mathématiques des gestaltistes, à savoir le “principe de minimisation” proposé par Koffka en 1935, le Ganzfeld de Metzger ou les appels de Köhler à une théorie des surfaces minimales adaptée à la Gestalt que les méthodes modernes de segmentation d’image trouvent leur source : malgré les difficultés que pose une telle formulation, c’est par un principe physique de moindre action que les mathématiciens Geman, Mumford et Shah se sont attaché à formaliser la recherche des bords dans une image.

La méthode de Kanizsa et la liberté du gestaltiste

A lire le mode opératoire de Kanizsa et à le comparer aux méthodes psychophysiques actuelles, on est surpris de la liberté avec laquelle sont définis ses protocoles expérimentaux. Bien que Kanizsa prenne la peine de soumettre ses figures à des groupes de sujets nouveaux, de les questionner et d’établir quelques statistiques élémentaires, on garde le sentiment d’une expérimentation personnelle, proche de celle du peintre qui dessine, regarde, évalue, dessine encore. D’où la passionnante variété des figures soutenant son argument. On est loin des protocoles à la Julesz, où l’on force la vue des sujets à garder une direction fixe, où l’on mesure les temps d’exposition (très brefs) de chaque image, où la rémanence de l’image rétinienne est évitée par la projection immédiate d’un masque. Il n’y a pas chez Kanizsa de concept de “vison préattentive”, opposé à la vision attentive, c’est-à-dire à l’exploration visuelle. Pourtant, il est difficile de ne pas penser que le processus primaire du gestaltiste et la vision préattentive du psycho-physicien se recouvrent largement.

Du point de vue du gestaltiste, peu importe le temps passé à regarder une figure si on suppose que l’interprétation fournie par le processus primaire ne change pas au cours du temps. La question de savoir quel est le temps minimal pour qu’une Gestalt s’établisse devient subsidiaire et concerne la compétence concrète de l’appareil perceptif (généralement identifié avec le cortex visuel) et non sa performance, pour reprendre les termes de Chomsky. Aussi, Kanizsa ne se préoccupe-t-il jamais du cerveau proprement dit : cela tombe en dehors de son champ d’investigation. Les constantes de temps de l’arc réflexe ne l’intéressent pas. Ses garde-fous ne sont pas la méticulosité d’un protocole, qui d’ailleurs n’évitera jamais les erreurs de méthode, mais plutôt la confrontation continuelle des théories, la réputation expérimentale des assertions trop générales, l’invention de variantes, un mélange, enfin, d’esprit philosophique et d’imagination. Comme le remarque fièrement le préfacier de l’édition italienne, Paolo Bozzi, les descendants italiens de la Gestalt n’ont rien à envier à leurs grands prédécesseurs. On peut lire dans le Metzger nombre de jeux inventés par les gestaltistes pour confirmer leurs thèses. En voici un, inventé par Wohfahrt, dont je garantis le succès en société : un des participants dessine en cachette une figure sur une feuille de papier, puis s’éloigne de plusieurs mètres, afin de la présenter à une distance où les autres joueurs perçoivent avec peine la présence du dessin sur le papier. Chaque joueur est alors invité à dessiner ce qu’il “voit”. La comparaison des dessins obtenus, entre eux et avec l’original, est d’un comique irrésistible.

Mais il est encore plus passionnant de voir, grâce à ce protocole d’expérience, les lois de prégnance géométrique de Wertheimer en action : chaque sujet a en effet restitué non pas la chose vue, mais une “bonne forme”, compatible en quelque sorte avec celle-ci et respectant les principes d’organisation gestaltiste décrits par Kanizsa dans le premier chapitre du présent livre : “bonne continuation”, convexité, proximité, fermeture, similitude, etc.

Le jeu auquel nous convie Kanizsa s’imposera de lui-même au lecteur, qui cherchera à infirmer ou à confirmer les assertions de Kanizsa en inventant des variantes. Un stylo bille noir, une feuille blanche suffisent à cela, et il n’est besoin d’aucun talent particulier pour le dessin. Un des charmes de la théorie de la vision ainsi pratiquée est de côtoyer pour un temps la frontière entre l’art et la science. »

_________

(1) Préface à la Grammaire du voir de Gaetano Kanizsa, traduction française de Grammatica del Vedere par Antonin Chambolle, Diderot Editeur, 1996.

Ce contenu a été publié dans Archives mises en ligne, avec comme mot(s)-clé(s) , , . Vous pouvez le mettre en favoris avec ce permalien.