VOIR ET NE PAS VOIR LE CHANGEMENT:

L'INCIDENCE DES DONNÉES COGNITIVES SUR LA VISION

 

Bernard Cadet

 

UFR de Psychologie

Université de Caen Basse Normandie (U.C.B.N.)

courriel : cadet@psycho.unicaen.fr

Tél. et fax : +33 (0) 231 56 53 18

 

 

 

Résumé

La perception visuelle est-elle entièrement déterminée par les structures neuroanatomiques et les opérations neurophysiologiques traditionnellement considérées comme constitutives de la vision? En d'autres termes peut-on exercer la fonction visuelle dans des conditions efficientes (voir) sans pour autant identifier et catégoriser les aspects déterminants du message visuel (ne pas percevoir sa "signification")? Plusieurs travaux actuels soulignent l'importance des apports cognitifs dans la perception visuelle et le rôle déterminant qu'y tiennent certaines fonctions fondamentales ou exécutives. En s'attachant à l'étude des importantes difficultés que rencontre de façon systématique l'individu humain lorsqu'il doit détecter visuellement le changement (phénomène si répandu qu'il a reçu l'appellation de "cécité au changement"), ce travail s'attache à montrer l'importance de "l'attribution de ressources cognitives " dans le traitement du message visuel. Trois fonctions sont principalement étudiées : l'attention, la mémoire et le langage (catégorisation). Si des conditions expérimentales réduisent ces apports, l'identification du changement devient très difficile. Ces situations montrent que la perception visuelle est une démarche cognitivement construite et que le message résultant est fondamentalement différent du message d'entrée. Cet écart tient à l'intervention d'opérations de haut niveau qu'il convient d'introduire dans toute conceptualisation ou toute modélisation de la fonction visuelle. Leur présence permet aussi en cas de troubles visuels importants, d'envisager l'utilisation de références cognitives (et non plus seulement sensorielles) dans l'élaboration de procédures d'aide à l'identification du message.

 

Introduction

 

Les deux décennies qui viennent de s'écouler ont profondément modifié les connaissances que nous avions sur la vision. A partir des années 1980, les sciences cognitives, largement impliquées dans cette évolution, ont produit de nombreux travaux qui mettent en évidence le rôle déterminant que jouent différentes fonctions cognitives telles que l'attention, la mémoire, la reconnaissance, l'anticipation, l'inférence, etc  dans le traitement des informations visuelles intervenant dans l'élaboration de nos comportements.

La présente communication se donne pour objet de traiter l'un des aspects de cette problématique : celui des relations qui existent entre la vision et l'attention à partir de l'étude d'une situation bien particulière : celle de la perception visuelle du changement. Le propos sera organisé en cinq grands volets. Après avoir défini, dans l'optique de la psychologie cognitive, les termes en présence (partie 1), nous préciserons les méthodes d'étude utilisées (partie 2) avant de nous attacher à l'analyse du rôle central de l'attention dans les relations entre vision et "non vision" du changement (partie 3). La partie 4 en proposera une modélisation tandis que la partie 5 récapitulera sous forme de remarques terminales, quelques considérations générales sur les modes de traitement des informations visuelles.

 

1-La vision et le changement visuel : définitions et modalités d'études

 

Est-il possible dans le cours de la même activité, de recevoir des messages (par les récepteurs visuels) et de ne pas percevoir (au niveau cognitif)? Se peut-il, en particulier, en cherchant explicitement à détecter des modifications importantes, que celles-ci nous échappent? Pour apporter réponse à ces questions posons quelques repères fondamentaux.

1.1 Aspects cognitifs et neuropsychologiques de la vision

Afin de mieux cerner l'approche cognitive qui servira de fil conducteur à cette présentation, il est indispensable de rappeler deux contributions princeps. La première est l'ouvrage de Marr [1] illustrant l'idée que la vision n'est pas une donnée immédiate et unitaire qui nous viendrait de l'environnement mais qu'elle est le résultat de la mise en œuvre de plusieurs processus de traitement des informations. Selon cet auteur la vision est une activité construite qui transforme des influx lumineux en messages pourvus de signification. Elle implique le déroulement d'une séquence complexe comportant trois niveaux. Le niveau 1 dit computationnel "planifie" le déroulement de l'ensemble du processus de traitement. Le niveau 2 dit algorithmique permet de distinguer les différentes opérations nécessaires à sa réalisation tandis que le niveau 3 dit de l'implémentation ou du hardware, s'attache à connaître les supports neuro-physiologiques mis en œuvre. Pour Marr [1] toute analyse de la vision doit être entreprise en se référant à une théorie modulaire incluant les trois niveaux. Cette organisation séquentielle implique que si un module est défaillant, il transmet au suivant une information "incomplète" génératrice de difficultés perceptives ou de pathologies visuelles. Bien qu'ayant fait l'objet de critiques, notamment sur les modes de relation entre modules [2], les conceptions de Marr ont eu le mérite de "déglobaliser" la notion de perception visuelle et de la concevoir comme constituée de différentes facettes interdépendantes.

Le second apport, à la fois contemporain et conceptuellement très proche du précédent bien que d'une portée théorique plus large, est celui de Fodor [3]. Les conceptions très connues de cet auteur soulignent que tout traitement d'information est réalisé par des modules hautement spécialisés dont chacun traite spécifiquement une caractéristique bien déterminée de l'information. Les modules, représentés par des réseaux neuronaux, ne sont donc pas interchangeables et ne sont pas en mesure d'effectuer n'importe quelle tâche.

1.2 Le changement visuel : définitions

L'importance des apports cognitifs dans la vision est assez difficile à mettre en évidence de façon spontanée, compte tenu du caractère totalement non conscient qui préside à leur intervention. Il nous paraît absolument "naturel" de voir, d'identifier puis de catégoriser ou juger un objet, une situation voire un état affectif ou une émotion. Pour mettre en évidence l'incidence des données cognitives, nous aurons donc besoin de recourir à des situations bien particulières parce que "révélatrices". L'une des plus utilisées actuellement consiste à étudier dans quelle mesure nous percevons visuellement le changement dans le monde extérieur. Le terme changement est entendu ici dans son sens le plus habituel c'est à dire comme la perception, par la vision, d'une modification sensible dans un ensemble préalablement connu. Le travail de clarification préalable à toute étude scientifique amène Rensink [4] à distinguer le changement proprement dit de notions voisines telles que la perception du mouvement ou de la différence, que nous n'envisagerons pas dans le cadre de cette présentation. Retenons ici que le changement s'applique à la modification interne, dans le temps, d'une structure bien définie. L'intérêt de son étude réside dans le fait qu'il implique des opérations de traitement à trois niveaux : celui des données sensorielles visuelles, celui des fonctions exécutives (attention, mémoire, planification, etc..) indispensables à leur traitement, celui enfin des "'opérations centrales de haut niveau" ([5] p.17) qui permettent, in fine, d'énoncer un jugement du type : il y a (ou non) changement.

1.3 Difficultés de perception du changement visuel

L'idée qui vient spontanément à l'esprit consiste à penser que "le changement saute aux yeux". Cela est en partie vrai s'il se produit alors que l'observateur est en train de regarder la scène c'est à dire lorsque, au sens le plus littéral, le changement se produit "sous ses yeux". Cela n'est plus du tout vrai si le changement se produit pendant une interruption, fut-elle de très courte durée, de l'apport des données visuelles. De telles interruptions peuvent être naturelles (saccades oculaires, clignements des yeux, retour sur un même lieu..) ou provoquées en utilisant un dispositif expérimental. Dans ce dernier cas, le seul que nous retiendrons, il s'agit d'introduire un masquage qui entraîne la nécessité de comparer une première observation (avant masquage) avec une seconde (après masquage). Concrètement, les procédés les plus couramment utilisés consistent à provoquer une coupure (type coupure de cinéma), à masquer la scène (ou une partie) par un écran blanc, à introduire des taches (type taches de boue) sur une première image, etc…L'important est qu'une discontinuité soit créée et que le changement soit introduit pendant l'interruption des apports visuels. Dans de telles conditions, de nombreuses études montrent que le changement devient singulièrement difficile à percevoir en dépit de l'apport des messages sensoriels. Certains auteurs parlent d'une "cécité au changement" (change blindness) [6, 7, 8] définie comme "la défaillance d'observateurs à détecter des changements importants et soudains dans un dispositif visible" ([9] p.1470). On a pu montrer [10] que la cécité au changement peut, sous certaines conditions, se produire aussi en l'absence de discontinuité. De façon systématique, la cécité au changement s'avère être un phénomène opérant et persistant par delà les individus et les circonstances comme en témoignent les revues récentes faites sur la question [9, 11]. C'est donc un phénomène constant et "robuste" dont l'étude peut nous renseigner sur les modes de fonctionnement de la perception visuelle.

 

2 Méthodes d'études

 

En psychologie cognitive, les méthodes d'études du changement visuel consistent à placer un sujet (observateur) face à une situation initiale qui sert de stimulus et de référence (temps t1), à modifier hors de sa vue (par exemple pendant une courte interruption) et de façon contrôlée, certaines caractéristiques de la scène. La situation modifiée est ensuite présentée au temps t2. Les réponses du sujet sont enregistrées et si possible mesurées en utilisant certains indicateurs (temps de réaction, localisation du changement, importance éprouvée, etc...). Dans tous les cas le plus grand soin est apporté à ce que les modifications relèvent exclusivement du changement et non pas d'autres facteurs.

2.1 Les différentes formes du changement

Plus précisément, le changement qu'il convient de percevoir peut se rapporter à diverses caractéristiques du message visuel telle que l'existence d'un élément (ajouté ou enlevé), la modification de ses propriétés (changement de forme, d'orientation, de taille, etc.) ou de sa signification (un avion décolle ou atterrit). Les sujets ont pour consignes d'indiquer soit la détection, soit la localisation, soit l'identification du changement, soit les trois à la fois [4].

2.2 Les caractéristiques de présentation

La façon dont le changement est présenté au temps t2 permet de distinguer deux paradigmes. Ou bien le changement est présenté une seule fois sous forme d'un instantané projeté pendant un temps déterminé (one shot paradigm); ou bien, et c'est le cas le plus fréquent, le changement est présenté en projetant en boucle une séquence composée de présentations répétées du stimulus modifié (flicker paradigm). Notons que ces paradigmes ne donnent pas lieu à l'évaluation des mêmes performances visuelles. Le premier vise à déterminer, après une seule présentation, si un changement s'est produit. Cette procédure permet de "minimiser" l'investissement des mouvements oculaires ainsi que la mémoire à long terme [4]. Le second, en mode répétitif, cherche à mobiliser, dans l'instant même de l'analyse visuelle, les fonctions cognitives et donne lieu à une mesure du temps mis à détecter le changement (temps de réponse).

 

3 Vision, "non vision" et fonctions cognitives

 

3.1 Vision et fonctions exécutives

En psychologie cognitive l'exercice approprié d'une fonction ne se limite pas aux informations contenues dans le message sensoriel présent ici et maintenant. En effet, ce message est en quelque sorte considéré comme un signal brut qui doit être traité, Cette tâche est d'abord dévolue aux fonctions exécutives. Par fonctions exécutives, il faut entendre "des fonctions cognitives de haut niveau qui sont impliquées dans le contrôle et la direction de fonctions de plus bas niveau" ([12] p.407). Ces fonctions exécutives, activées par les lobes frontaux, ont donc pour objet d'assurer la réalisation des opérations qui vont permettre le traitement. Très schématiquement, elles disposent de deux modes d'action. Le premier consiste à rechercher des informations supplémentaires en recourant par exemple aux différents registres de la mémoire ; le second s'attache à créer des conditions qui permettent le contrôle général de la situation et la planification correcte des différentes opérations : c'est le cas de l'attention.

3.2 L'attention visuelle et ses formes

Les travaux contemporains ont mis en évidence l'importance de l'une de ces fonctions exécutives : l'attention. Elle n'y est pas considérée comme une élévation globale indifférenciée des moyens d'analyse comme le serait par exemple la vigilance. Il s'agit plus précisément d'un processus focalisé d'attribution de ressources cognitives à certains éléments d'information de façon à les valoriser et à permettre leur traitement en vue d'identifier le changement [9]. Dans les conditions habituelles, le changement s'accompagne souvent de signaux précurseurs qui traduisent le fait qu'il va se produire et qui permettent "d'attirer l'attention" de l'observateur sur quelques informations importantes. Cela signifie qu'elles vont se voir attribuer des ressources cognitives supplémentaires disponibles (appelées "attention") en vue de leur traitement. Dans les paradigmes de recherche, il en va tout autrement du fait de l'introduction d'un masquage ou d'une interruption au moment où se produit le changement. Cette interruption empêche l'observateur de pouvoir accéder à ces métasignaux révélateurs. Il en découle que l'observateur ne sera pas en mesure de focaliser son attention sur les informations pertinentes et que le changement, si important soit-il, sera difficile à percevoir.

3.3 La sélection des informations

Un autre processus cognitif important de la vision est celui qui consiste à sélectionner les informations. Contrairement à l'idée immédiate que nous en avons, lorsque nous regardons un paysage ou une scène nous ne voyons pas la multitude des informations qui s'y trouvent rassemblées, mais nous nous attachons seulement à quelques unes d'entre elles sans même en prendre conscience [13]. Un processus sélectif se met en place pour extraire les informations que l'observateur considère importantes. Sauf circonstances particulières, par exemple dans des situations répétitives (de type professionnel entre autres), ces informations importantes ne sont pas définies a priori : c'est un processus d'attribution de moyens attentionnels qui va amener à mettre en exergue certaines d'entre elles et à en négliger d'autres. L'attention visuelle produit donc une sélection de l'information mais cette attribution de ressources dépend elle-même de facteurs cognitifs de haut niveau tels que les connaissances antérieures et l'analyse conceptuelle qui sera faite de cette scène. Par conséquent, en termes quantitatifs, de nombreuses informations arrivant sur la rétine ne seront pas exploitées par non attribution de ressources attentionnelles.

Ce type de fonctionnement soulève une première question : celle de savoir comment sont attribuées ces ressources. Deux conceptions théoriques différentes se proposent de l'expliciter. La première décrit l'attention visuelle à partir de la notion de champ et de localisation : dès qu'une information apparaît intéressante, elle amène à jeter un coup de projecteur ou de zoom, sur le secteur concerné [14]. Dès lors tout ce qui se trouve dans cette petite partie, comme sous le champ d'un microscope, va se trouver traité. La seconde, avance au contraire que l'attention se réfère à la notion d'objet [15]. Dans ce cas, seul l'objet recherché est traité et n'importe quel autre objet, aussi proche soit-il, ne sera pas pris en considération. L'option de l'attribution extensive (champ) et de l'attribution focalisée (objet) ont été opposées pendant plusieurs années. On pense maintenant qu'il s'agit plutôt de deux modalités qui répondent à des finalités différentes dépendant de la nature de la tâche.

3.4 Attention visuelle et cécité au changement

Rensink, O'Regan et Clark [16] soulignent le rôle déterminant de l'attention visuelle dans la perception du changement. Si nous considérons la perception visuelle comme un processus construit, nous pouvons y distinguer trois apports successifs : des données sensorielles, un étayage sur des fonctions exécutives, et enfin un traitement de niveau cognitif. La non perception du changement en situation expérimentale pourrait résulter d'un manque de coordination dans la gestion de ces trois références. L'hypothèse la plus plausible porte sur une défaillance des fonctions exécutives d'attention elles-mêmes complexes [17]. Plus précisément, des ressources attentionnelles sont bien libérées par la consigne donnée aux sujets mais elles restent diffuses, non employées et non focalisées si bien que l'accès au jugement n'est plus assuré. Ce serait parce qu'elles n'ont pas été "soutenues" que les informations pertinentes au repérage du changement n'ont pas été prises en compte.

 

4 Modélisation

 

Si l'attention apparaît bien comme une fonction essentielle de la perception visuelle, restent à expliciter conditions qui lui permettent de produire des effets et à dresser un tableau dynamique du traitement du changement : c'est l'objet de la démarche de modélisation.

4.1 La théorie de la cohérence

L'une des modélisations qui répond le mieux aux caractéristiques présentées antérieurement est la théorie de la cohérence de Rensink [18] qui modélise la perception visuelle à partir d'une "architecture triadique" dans laquelle sont impliqués trois systèmes qui paradoxalement, sont à la fois largement indépendants mais aussi interdépendants.

Dans une première étape, dite de processus précoces, on trouve des traitements rapides, de bas niveau, menés en parallèle dans divers secteurs du champ visuel. Ces processus permettent de dégager des proto-objets, sortes d'esquisses, dont les propriétés spatiales ne sont pas nécessairement bien connues et qui, temporellement, sont "volatiles" ([4], p. 262) puisqu'ils peuvent rapidement disparaître sous l'influence d'un autre stimulus. Lors de la seconde étape dite de l'objet, apparaît l'attention focalisée qui a pour fonction de stabiliser ces esquisses.  Elle "agit comme une main …qui saisit plusieurs proto-objets" ([4], p. 262) et les dégage de la mouvance précédente. Elle contribue à établir un "champ de cohérence" indispensable à une représentation cohérente de l'objet (ou de la scène). C'est donc un niveau intégratif qui va permettre de passer de la diversité et de la labilité à l'unité et à la permanence. Le troisième système détermine les conditions d'ensemble (setting) qui président à ces opérations. Il favorise certaines d'entre elles en se fondant soit sur l'agencement des éléments d'information (layout), soit sur la signification essentielle (gist).

Pour traiter plus spécifiquement des relations entre attention et changement, il convient d'analyser les processus qui permettent le passage du premier au deuxième système. Il s'agit essentiellement d'un tissage informationnel entre les proto-objets du niveau le plus bas et un niveau médian de convergence appelé nexus en lien avec la mémoire à court terme. Les nombreux liens d'action et de rétroaction qui s'établissent entre ces deux niveaux contribuent à délimiter un champ construit à partir d'un ensemble de propriétés cohérentes, c'est à dire connues pour être associées ou en covariation. Ceci va permettre d'identifier et d'individualiser les objets à partir de leurs propriétés pour savoir s'ils relèvent du champ ou non. Ces liens, que l'on peut comparer aux fils d'une toile, sont tout à fait fondamentaux car ils "tissent" le champ de cohérence en instaurant deux démarches cognitives : l'une vers "l'avant", de recherche d'informations complémentaires, l'autre vers "l'arrière", pour assurer ses bases. Le nexus est en charge de stabiliser les proto objets et de les donner à percevoir aux structures qui vont assurer la suite du traitement qui consistera à reconnaître l'objet ou la scène. Le processus cessera lorsque la boucle de rétroaction sera brisée ce qui fait que l'attention disparaît et cède la place aux processus de jugement et d'inférence et donc à l'identification cognitive.

4.2 Incidences sur la cécité au changement

La modélisation par la cohérence permet de mettre en évidence différentes causes de non investissement attentionnel et donc de non perception du changement.

4.2.1 La limitation des capacités

L'un des premiers déterminants de la cécité au changement tient à la limitation des capacités humaines. Elle se manifeste dès la phase de détection des proto objets qui doivent être repérés rapidement (300 ms) à partir du traitement d'un nombre très limité d'informations. Plusieurs études expérimentales ([19, 20]) estiment que seulement quatre éléments d'information (propriétés) peuvent être traités simultanément et utilisés pour asseoir la cohérence. Cette limitation de la "capacité du canal" correspond d'ailleurs aux performances limitées, qui sont du même ordre, de la mémoire visuelle à court terme (vSTM).

4.2.2 Les modes d'appréhension

L'une des grandes questions traditionnellement soulevées en matière d'information visuelle est celle du mode d'appréhension des informations : sont-elles prélevées de façon ponctuelle ou de façon ensembliste? Dans le premier cas, il s'agit d'une démarche analytique qui agrège les éléments; dans le second, le mode d'appréhension est global, de type holistique et traite d'emblée des sous-ensembles. Le sens du traitement est important par rapport à la notion de cohérence qui est nécessairement tardive en analytique et nécessairement précoce en global.

Lorsqu'il s'agit de scènes ou de stimuli complexes, ce qui représente la majorité des situations, il y a peu de place pour le traitement du détail et pour celui de tous les objets ou éléments qui s'y trouvent représentés. Ainsi, si nous voyons un voilier longer une plage, nous ne nous attachons pas au traitement de la totalité des éléments d'information disponibles, dont la plupart du temps nous n'avons d'ailleurs pas besoin. Nous allons extraire de l'information et travailler à l'aide d'une "représentation virtuelle" [4] de la scène fondée sur quelques informations. Une telle représentation, maillon essentiel de la vision, est fortement influencée par la nature de la tâche et les attentes de l'observateur. Supposons que nous observions un voilier longer une plage. La scène ne sera pas traitée de la même façon par un estivant, un peintre, un marin, un marchand de bateaux ou par autre plaisancier qui croise à proximité. La représentation virtuelle globale est donc à la fois dynamique et plus opérante que si nous avions cherché à rassembler un maximum d'informations. Une telle représentation est donc à distinguer du concept (de voilier par exemple), référence par nature statique et générale. L'usage d'une représentation virtuelle de type holistique, apparaît comme une condition cognitive indispensable pour stabiliser les proto objets en même temps qu'elle permet de focaliser le processus de recueil des informations.

4.2.3 Le "chunkage"

Le terme de "chunk" (traduit en Français par schéma) s'applique, en psychologie cognitive, à une entité de haut niveau c'est à dire pourvue d'une référence signifiante au niveau des modes de stockage des informations. Ainsi, si dans une situation, je relève les informations suivantes je rentre dans une salle où il y a de nombreuses tables avec des couverts dressés et quelqu'un vient vers moi, je peux considérer que j'arrive dans un restaurant. Le schéma (chunk) restaurant a été activé. Dans l'architecture ACT-R (adaptative control of thought) [21], le terme désigne une "brique" à valeur sémantique du réseau des connaissances déclaratives. Chaque chunk comporte un symbole central (étiquette) permettant de l'identifier et une liste de propriétés pouvant être activées. Il s'agit d'un mode de représentation des connaissances, présent dans la mémoire à long terme, caractérisé par un ensemble de propriétés qui peuvent être utilisées dans la mémoire visuelle à court terme. A ce titre, le chunk intervient dans la "signification" attribuée à la scène ou dans sa coloration affective, et oriente les processus ultérieurs de recherche et de traitement de l'information.

La référence au chunk, et donc au niveau cognitif le plus élevé, permet deux opérations fondamentales pour le traitement de l'information visuelle. Elle offre d'abord un ancrage précoce qui permet une identification par référence à des propriétés cognitives ou à des affects mémorisés. Elle oriente ensuite les processus de recherche d'informations visuelles en les sélectionnant grâce à la mise en œuvre d'une démarche de sélection-accentuation ("selective tuning") [2] selon laquelle les informations venant confirmer l'ancrage vont se trouver accentuées et valorisées tant au niveau de leur recherche que dans l'importance (pondération) qui leur est attribuée.

L'utilisation de ces schémas fournit plusieurs indications intéressantes. Elle montre d'abord que la perception ne se construit pas à partir de l'addition d'éléments isolés mais en référence à des unités signifiantes déjà constituées. Elle souligne ensuite l'intervention très précoce (et non pas finale comme on l'a cru longtemps) des références sémantiques caractérisées : pour percevoir l'homme se sert très précocement de la signification, des registres langagiers et des informations stockées et identifiées. Elle indique enfin l'existence, très précoce elle aussi , d'opérations d'inférence et de généralisation réputées être propres au jugement mais qui s'avèrent déterminantes pour la perception. En somme, en matière de perception visuelle, on infère très précocement, en contexte d'incertitude, avant d'aboutir à une identification plus certaine.

 

Bien entendu, si le recours à de tels schémas permet de traiter les informations avec économie, c'est à dire en leur affectant un minimum de ressources cognitives, ils n'évitent pas de commettre des erreurs. La plus fréquente consiste à croire que l'on se trouve dans un schéma alors qu'en réalité, on se trouve dans un autre (exemple : l'erreur diagnostique du médecin, de l'ingénieur, du psychologue ou du pilote d'avion). Les informations présentes dans un chunk influencent la perception du changement mais selon des modalités, semble-t-il, extrêmement spécifiques. Ainsi, la référence à des schémas identifiés sous une appellation générale ("une plage") rend plus difficile la détection du changement que lorsque que l'on se réfère à des schémas spécifiques ("la plage fréquentée par Timoléon cet été")[7]. Il semblerait donc que des facteurs sémantiques de haut niveau soient aussi impliqués dans la détection du changement sous des formes très précises et très spécifiques [22] contrairement à l'idée qui prévaut volontiers, sans avoir été démontrée, que le conceptuel régit préférentiellement le fonctionnement cognitif.

 

5 Remarques terminales

 

5.1 La cécité au changement et ses déterminants

Si la cécité au changement semble bien relever des caractéristiques cognitives, quels en sont les déterminants? Ils ne sont pas connus avec certitude et nous reprendrons ici brièvement cinq "causes" possibles répertoriées par Simons [11]. La toute première consiste à postuler l'effacement du premier stimulus : l'information qui n'a pas été extraite de la première présentation est recouverte (écrasée) par l'information nouvelle. Une seconde éventualité, opposée en quelque sorte, consiste à invoquer le rôle prégnant de la première perception au temps t1 et la difficulté qui en découle à traiter le percept suivant, c'est à dire le stimulus modifié du temps t2. La troisième explication, la plus radicale, consiste à considérer que rien n'a été stocké ou mémorisé. Une quatrième piste indiquerait que toutes les informations sont stockées mais que rien n'est comparé et que, en conséquence, le changement n'est pas détectable. Une cinquième hypothèse explicative fait état d'une "combinaison des traits"qui postule que les observateurs mélangeraient les informations provenant de chacune des scènes au point de ne plus pouvoir les différencier. Dans tous ces cas, les processus invoqués contribuent sous des formes diverses, à rendre difficile toute comparaison entre la première et la seconde présentation.

5.2 La perception visuelle : une démarche cognitivement construite

Globalement, ces résultats montrent que la perception du changement et par delà la perception visuelle, résultent de processus construits dans lesquels les données cognitives sont déterminantes. Nous sommes donc dans une situation qui est totalement à l'opposé de la métaphore de la caméra, et en aucun cas, la vision ne peut être assimilée à un tel dispositif d'enregistrement sans que ses aspects les plus fondamentaux s'en trouvent éliminés. Les connaissances maintenant établies amènent à se rallier à une conception dans laquelle la vision apparaît comme un "message-résultant" obtenu au terme d'un processus qui peut être qualifié par deux termes : activité d'une part [23] et complexité d'autre part [2]. La difficulté à détecter le changement incite à examiner plusieurs points importants. Elle montre que dans un monde visuel extrêmement riche, très peu d'informations sont conservées d'une observation à la suivante, constat qui éclaire le rôle joué par les composantes cognitives. La première d'entre elles, la mémoire visuelle à court terme, fait preuve de capacités de stockage et de conservation des plus limitées. Elle n'opère pas sur de vastes ensembles de données susceptibles de caractériser une scène mais sur quelques points. Une seconde composante dont le rôle est déterminant est l'attention visuelle dont le rôle n'est pas limité à l'accompagnement de l'activité. L'attention s'intègre à la vision, elle ne vient pas seulement la faciliter, elle en est la composante centrale: celle qui va déterminer les éléments retenus. A un troisième niveau, réputé le plus élevé se trouvent les fonctions qui vont conférer au message sa signification en recourant aux données sémantiques activées par le biais de stratégies de dénomination et d'inférence.

Cependant de nombreuses questions restent posées notamment quant aux relations entre processus centraux et marginaux, aux effets du masquage, à ses formes, etc..[24]. D'un point de vue très global, ces travaux soulignent qu'il convient de considérer la vision comme une activité composite et hiérarchisée dans laquelle des facteurs d'attention, de mémoire, d'identification, de dénomination et d'inférence tiennent une place si importante que, depuis quelques années, il est légitime de se demander si, à la dénomination "vision" ne devrait pas être substituée celle de cognition visuelle, qui traduit mieux ce que l'on connaît aujourd'hui de ces processus et qui a le mérite d'ouvrir des perspectives pluridisciplinaires.

 

RÉFÉRENCES

 

[1] Marr D. (1982). Vision : a computational investigation into human representation and processing of visual information. San Francisco  : Freeman.

[2] Tsotsos J.K. (2001). Complexity, vision and attention. in M. Jenkin & L. Harris (Eds.). Vision and attention (pp. 105-128). New York : Springer.

[3] Fodor J. (1983). The modularity of the mind. Cambridge: MIT Press. Traduction française: La modularité de l'esprit. Paris : Editions de Minuit (1986).

[4] Rensink R.A. (2002). Change detection. Annual Review of Psychology, 53, 245-277.

[5] Costermans J. (2001) Les activités cognitives. Bruxelles : De Boeck Université (2e édition).

[6] Simons D.J. & Levin D.T. (1997). Change blindness. Trends in Cognitive Sciences, 1, 261-267.

[7] Archambault A., O'Donnell C.; & Schyns P.G. (1999) Blind to object change : when learning the same object at different levels of categorization modifies its perception. Psychological Science, 10, 249-255.

[8] Rensink R. A. (2001). Change blindness : implications for the nature of visual attention. In : M. Jenkin & L. Harris (Eds.). Vision and attention (pp. 169-188). New York : Springer

[9] Rensink R. A. (2000). Seeing, sensing and scrutinizing. Visual Research, 40, 1469-1487.

[10] Simons D.J., Franconeri S.L. & Reimer R.L. (2000). Change blindness in the absence of a visual disruption. Perception, 29, 1143-1154.

[11] Simons D.J. (2000). Current approaches to change blindness. Visual Cognition, 7, 1-15.

[12] Stuss D.T. & Levine B. (2002). Adult clinical neuropsychology : Lessons from studies of the frontal lobes. Annual Review of Psychology, 53, 401-433.

[13] Harris L.R. & Jenkin M. (2001). Vision and attention. In M. Jenkin & L.R. Harris (Eds.) Vision and attention (pp. 1-17). New York : Springer.

[14] Posner M. I. (1980). Orienting of attention. Quaterly Journal of Experimental Psychology, 32, 3-25.

[15] Egly R., Driver J. & Rafal R.D. (1994). Shifting visual attention between objects and locations: evidence from normal and parietal lesion subjects. Journal of Experimental Psychology (General), 123, 161-177.

[16] Rensink R.A., O'Regan J.K. & Clark J.J. (1997). To see or not to see : the need for attention to perceive changes in scenes. Psychological Science, 8, 368-373.

[17] Stuss D.T., Shallice T., Alexander M.P. & Pincton T. (1995). A multidisciplinary approach to anterior attentional functions. Annals of New York Academy of Science, 769, 191 212.

[18] Rensink R. A. (2000). The dynamic representation of scenes. Visual Cognition, 7, 17-42.

[19] Luck S. J. & Vogel E. K. (1997). The capacity of visual working memory for features and conjunction. Nature, 390, 279-280.

[20] Pashler H. E. (1998). The psychology of attention. Cambridge MA : M.I.T. Press.

[21] Anderson J.R. & Lebiere C. (1998) The atomic components of thought. Mahwah, N.J. : Lawrence Erlbaum.

[22] Ro T., Russell C. & Lavie N. (2001). Changing faces : a detection avantage in the flicker paradigm. Psychological Science, 12, 94-99.

[23] Findlay J.M. & Gilchrist I.D. (2001). Visual attention : The active vision perspective. In M. Jenkin & L.R. Harris (Eds.) Vision and attention (pp. 83-103). New York : Springer.

[24] O'Regan J.K.(2001).Thoughts on change blindness. In : M. Jenkin & L. Harris (Eds). Vision and attention (pp. 281-301). New York : Springer.

 

CADET, B. Voir et ne pas voir le changement : L'incidence des données cognitives sur la vision. Actes du 5ème Congrès International des Initiatives en Basse Vision. Nîmes, 8 et 9 octobre 2004, pp 13-19.