Palmer Cap 6

Le traduzioni che potrete trovare su questo sito sono unicamente destinate ad uso interno per il corso di Psicologia della Percezione dell'Università degli studi di Trieste. Nascono con l'intento di fornire un ausilio a quegli studenti che non hanno molta dimestichezza con la lingua inglese. Le traduzioni sono opera degli stessi studenti del corso di Psicologia della Percezione 1999 - 2000. Nell'utilizzo di questo materiale va tenuto conto che la correttezza dello stesso va verificata confrontando le traduzioni con il testo originale. Per ulteriori domande, clicca qui.

INTRODUZIONE


Il mondo che conosciamo e percepiamo è popolato da oggetti in larga scala come le persone, le cose, gli alberi e non da margini, ostacoli o macchie. L'organizzazione percettiva è così pervasiva e profondamente integrata nell'esperienza visiva che è spesso difficile apprezzarne l'importanza. Quando osserviamo l'ambiente spesso percepiamo invariabilmente interi oggetti integrati nello spazio tridimensionale e lo facciamo in maniera così automatica e con una sicurezza tale che è difficile immaginare che ogni cosa è costituita in un modo terribilmente complesso. Se la percezione non fosse organizzata affatto, l'ambiente sarebbe caratterizzato da superfici estese ed oggetti senza nessuna struttura a larga scala. Forse la migliore descrizione per una percezione visiva destrutturata è una "tempesta" di input percettivi dal moto vorticoso e multicolorati risultante dall'output di milioni di recettori retinici non correlati.
I teorici della percezione, nella tradizione empirista, suppongono che questa dovrebbe essere l'esperienza di un bambino appena nato. Poiché gli empiristi credono che tutta la struttura visiva è appresa dall'esperienza, ne consegue che il mondo di un neonato deve essere completamente non strutturato.
Il noto filosofo - psicologo W. James, chiama questa una "blooming - buzzing confusion" cioè una "fiorente e ronzante confusione". Infatti non sappiamo esattamente quella che è l'esperienza visiva di un neonato, perché costui non ce lo dice, non direttamente almeno.
Recentemente è sono state sviluppate delle tecniche interessanti ed innovative; esse hanno permesso di inferire quello che dovrebbe essere il mondo visivo di un infante. Dalle scoperte fatte appare chiaro che anche un bambino presenta un certo tipo di organizzazione percettiva, il resto sembra svilupparsi dal sesto all'ottavo mese di vita durante il quale il piccolo apprende dall'interazione con l'ambiente.

PROBLEMA DELL'ORGANIZZAZIONE PERCETTIVA:

Sono stati gli psicologi della Gestalt all'inizio del secolo a coniare il concetto di organizzazione percettiva. Esso costituiva uno dei concetti centrali nel loro attacco alle assunzioni atomistiche dello strutturalismo. Come discusso nel capitolo 2, gli strutturalisti concepiscono la percezione visiva come una semplice concatenazione di atomi sensoriali consistenti in una sorta di punti colorati.
Questa visione della percezione visiva è estremamente localizzata nel senso che ogni atomo è definito da una particolare posizione sulla retina e considerato indipendente dagli altri, per lo meno finche essi venivano insieme all'interno di complessi spaziali più grandi attraverso il processo di apprendimento associativo. I Gestaltisti, contrariamente, pensavano che percezione visiva risultasse dalle interazioni globali all'interno del sistema nervoso visivo e dalla struttura complessiva della stimolazione visiva stessa.
Max Wertheimer, uno dei padri fondatori della psicologia della Gestalt, per primo propose la questione dell'organizzazione percettiva. Il suo punto di vista può essere compreso considerando che l'output del mosaico retinico favorirebbe una semplice ma più strutturata immagine. La figura 6.1.1A illustra un output come una matrice numerica nella quale ogni numero rappresenta il responso neurale di un singolo recettore retinico. In questa struttura numerica è pressoché impossibile cogliere la struttura e l'organizzazione dell'immagine. La situazione è molto simile al sistema di riconoscimento delle facce, poiché la struttura che percepiamo in modo così diretto non è esplicitamente fornita dall'immagine stimolo, ma deve essere scoperta dal sistema nervoso. Infatti c'è un numero potenzialmente illimitato di possibili organizzazioni in un'immagine, ma ne percepiamo solo una. Quale di esse percepiamo e perché ne percepiamo una piuttosto che un'altra sono domande che richiedono spiegazioni.
La struttura dell'immagine numerica diviene completamente ovvia quando si possono osservare quei stessi valori come livelli luminosi, come illustrato dall'immagine 6.1.1B.Una figura di molti quadrati bianchi e neri organizzati su quattro righe orizzontali su sfondo grigio.
Ma perché l'immagine dei quadrati appare così ovvia, mentre la struttura sotto forma di matrice numerica risulta così oscura? La ragione è che il sistema visivo umano si è sviluppato apprendendo come riconoscere bordi, regioni, oggetti, gruppi e modelli delle strutture di luminanza e colori nell'immagine ottica. L'immagine della scala di grigio comprende appieno questo meccanismo, mentre la matrice numerica lo fa molto scarsamente.
Perché l'esperienza visiva è organizzata in questo modo?
La risposta più ovvia è che semplicemente riflette la struttura del mondo esterno. L'ambiente fisico consiste di cose come superfici ed oggetti disposti nello spazio piuttosto che punti e colori; questo perché la percezione è organizzata così com'è.

L'ERRORE D'ESPERIENZA.

Il sistema visivo non ha un diretto accesso ai fatti sull'ambiente, ma solo ai fatti circa l'immagine proiettata sulla retina. Cioè un organismo non può presumere di conoscere come l'ambiente è strutturato se non attraverso l'informazione sensoriale. I Gestaltisti
parlano di errore esperienziale circa il problema dell'organizzazione percettiva poiché si suppone che la struttura dell'esperienza percettiva è in qualche modo direttamente fornita dagli assetti ottici che cadono sul mosaico retinico.
La confusione che sta alla base dell'errore esperienziale è supporre che il punto di partenza per la visione è lo stimolo distale piuttosto che quello prossimale. E' molto facile cadere in errore poiché lo stimolo distale è una componente essenziale nella catena casuale di eventi che solitamente producono le esperienze visive. Prendendo lo stimolo distale come punto di partenza per la visione si sottovaluta pericolosamente la difficoltà della percezione visiva perché si presuppone che determinate informazioni giungano in modo diretto. Ma la struttura dell'ambiente va considerata come il risultato della percezione visiva piuttosto che il suo punto di partenza.

6.1 RAGGRUPPAMENTI PERCETTIVI
L'approccio iniziale di Wertheimer al problema dell'organizzazione percettiva fu quello di studiare i fattori stimolo che producono raggruppamenti percettivi . Egli ha affrontato questo problema costruendo matrici di elementi geometrici molto semplici e variando le relazioni tra gli stimoli per determinare quali fossero responsabili della percezione di elementi raggruppati.

6.1.1 I PRINCIPI CLASSICI DI RAGGRUPPAMENTO

Wertheimer iniziò con una singola linea di punti equidistanti. Questi non erano raggruppati insieme in alcun modo, eccetto il gruppo costituito dall'intera striscia di punti. Successivamente notò che quando alternava lo spazio tra i punti adiacenti ( fig. 6.1.2B ), allora era più facile concepire i punti raggruppati per coppie. Tale fattore di relativa vicinanza, chiamato da Wertheimer prossimità", fu la prima delle sue famose LEGGI DEL RAGGRUPPAMENTO.
Wertheimer illustrò altri principi come quello della "similarità": pur essendo uguali, gli elementi più simili (per colore, misura ed orientamento) tendono ad essere raggruppati insieme. La similarità può essere considerata un principio generale di raggruppamento poiché ricopre proprietà assai diverse.
Un altro fattore è ciò che Wertheimer chiamava "sorte comune". Pur essendo uguali, gli elementi che si muovono nella stessa direzione, vengono raggruppati insieme. Va notato che la sorte comune può essere considerata un caso speciale di similarità, nel quale la proprietà similare è la velocità del movimento.
Gli psicologi della Gestalt hanno descritto alcuni fattori che influenzano il raggruppamento di elementi.
La "simmetria" (fig. 6.1.2G) ed il "parallelismo" (fig. 6.1.2H) sono fattori che influenzano il raggruppamento di curve e linee.
Un altro fattore è quello di "continuità" di linee e bordi: essendo tutti uguali, gli elementi possono essere visti come continuazioni lineari l'una dell'altra che tendono ad essere raggruppati insieme (fig. 6.1.2I).
Il fattore della "chiusura" (fig. 6.1.2J) è presente quando gli elementi formano una figura chiusa ed essi tendono ad essere raggruppati insieme. L'effetto di chiusura può rievocare la continuità perché le stesse linee che erano organizzate come intersecanti, sono ora organizzate come due angoli che si incontrano in un punto unico.
Ciò accade perché segmenti non continui ora costituiscono parti della stessa figura chiusa. Le dimostrazioni di continuità e chiusura illustrano una importante limitazione nelle conoscenze sui principi di raggruppamento. Come sostenuto dagli psicologi gestaltisti, le regole possono predire l'esito dei raggruppamenti con certezza solo quando ogni cosa è sullo stesso livello, cioè, quando non esistono altri fattori di raggruppa- mento che influenzano gli esiti. Per esempio abbiamo visto che la continuità determina l'effetto di

raggruppamento quando gli elementi non formano una figura chiusa, ma la continuità stessa può essere soppiantata dall'effetto di chiusura.
Tali regole hanno il problema di non disporre di schemi che possono integrare i fattori di raggruppamento sopra menzionati.
Se abbiamo un caso in cui la prossimità svolge un ruolo di raggruppamento e allo stesso tempo anche il colore svolge lo stesso ruolo, percepiamo l'effetto che si manifesta più decisamente.

6.1.2 NUOVI PRINCIPI DI RAGGRUPPAMENTO

Recentemente sono stati proposti 3 nuovi principi di raggruppamen-
to: "sincronia", "regione comune", ed "elementi connessi".
Il principio di sincronia sostiene che, essendo tutti uguali, gli elementi visivi che si manifestano nello stesso momento vengono percepiti insieme.
Tale fattore è stato studiato in relazione alla percezione acustica e solo recentemente in campo visivo.
Nell'esempio dato (fig. 6.1.5) una striscia di punti bianchi e neri equamente distanziati mutano nel colore l'uno dell'altro in un tempo dato. Metà dei punti cambiano colore allo stesso tempo e l'altra metà in un tempo diverso. Quando il tempo di alternanza è circa di 25 cambiamenti per secondo o meno, l'osservatore vedrà i punti fortemente raggruppati in coppie in base alla sincronia. Ad un tempo più veloce, non è possibile osservare l'effetto di raggruppamento dei punti. Ad un tempo molto basso invece, si osserva il raggruppamento al momento dei cambiamenti, ma esso si dissolve durante l'intervallo tra i salti da un colore all'altro.
Un altro principio recente è quello della " regione comune". Esso sostiene che, essendo tutti gli elementi uguali, quelli chiusi all'interno di una regione comune sono raggruppati insieme ( fig. 6.1.6 ).
Il terzo principio di raggruppamento è la "connessione di elementi":
essendo tutti uguali, gli elementi connessi sono raggruppati insieme. Palmer e Rock ( 1994 ) fornirono una serie di dimostrazioni, una delle quali analoga a quella classica di Wertheimer.
Una linea di punti ugualmente distanziati è maggiormente costituita in gruppi quando elementi come linee orizzontali uniscono i punti tra di loro (fig.6.1.7).

Wertheimer considerava questo un caso limite di prossimità; Palmer e Rock invece distinguevano la prossimità dalla connessione di elementi per diverse ragioni:
1) esiste un importante distinzione qualitativa tra la connessione e la mera prossimità.
2) essi notarono che "going together" è più adatto agli elementi connessi piuttosto che a quelli solamente vicini.
3) esiste una importante differenza fenomenologica tra oggetti connessi e oggetti vicini. Gli elementi connessi risultano nella percezione di un singolo oggetto unificato costituito da parti differenti; mentre la sola prossimità consiste in un aggregato approssimativo di molti oggetti separati ma in relazione.

6.1.3 MISURAZIONE QUANTITATIVA DEGLI EFFETTI DI
GRUPPO

Le dimostrazioni della Gestalt sui raggruppamenti sono adeguate per spiegare le regole del "ceteris paribus", ma non lo sono per spiegare in che maniera possono essere integrati tali fattori.
Sono stati adottati due metodi recentemente, uno basato direttamente sui raggruppamenti stessi, e l'altro basato su un compito indiretto ma oggettivamente definito.
Kubovny e Wagenmans hanno misurato la relazione che intercorre tra diversi raggruppamenti.
Gli sperimentatori mostrarono ai soggetti un reticolo di punti per circa 300ms; quindi chiesero ai soggetti di indicare, scegliendo tra altri quattro reticoli di punti che evidenziavano orientamenti diversi, a quale reticolo corrispondesse l'orientamento di quello assegnato (fig. 6.1.9 ). In accordo con il principio della prossimità, i risultati mostrarono una preferenza per l'organizzazione nella quale i punti erano più strettamente vicini. Dopo molte prove venne calcolata la probabilità di percepire ogni raggruppamento. I dati

vennero trattati in un modello matematico nel quale l'attrazione tra i punti decresceva esponenzialmente in funzione della distanza.
Un altro metodo quantitativo per lo studio dei raggruppamenti è il cosiddetto compito di discriminazione e ripetizione proposto da Palmer e Beck.
Si tratta di un quadro nel quale ci sono file di cerchi e quadrati che si alternano eccetto per una coppia adiacente di quadrati o cerchi. Il compito dei soggetti e di determinare se la coppia ripetuta è composta da quadrati o cerchi; i soggetti devono rispondere premendo un bottone più velocemente possibile. Le risposte sono misurate in tre differenti condizioni ( fig. 6.1.10 ): la prova within group, nella quale c'è un gruppo formato, per prossimità, dalla coppia ripetuta; la prova between group, nella quale gli oggetti ripetuti fanno parte di gruppi diversi; la prova neutrale nella quale non ci sono distorsioni rispetto al target. Ci si aspetta che il target venga riconosciuto più velocemente quando fa parte dello stesso gruppo, piuttosto che faccia parte di gruppi diversi.
Effettivamente i risultati dimostrarono una risposta più veloce nel within group ( 719ms ), piuttosto che nel between group ( 1144ms ).
I metodi quantitativi come questi hanno il vantaggio di fornire una precisa misurazione degli effetti di raggruppamento quando la fenomenologia non è chiara.

6.1.4 IL RAGGRUPPAMENTO E' UN PROCESSO PRECOCE O TARDIVO ?

La questione su dove è situato il raggruppamento nel processo visivo è molto importante. E' un processo che lavora a livello di struttura dell'immagine o lo fa più tardi, dopo che le informazioni di profondità sono state estratte ed è stata raggiunta la costanza percettiva?
Wertheimer sosteneva che i raggruppamenti avvenissero ad un livello molto basso, corrispondente a ciò che è rappresentato dal processamento dell'immagine base. Ciò nonostante questa visione è stata spesso messa in discussione, anche recentemente. Le dimostrazioni della Gestalt sul raggruppamento non seguivano questo assunto perché nei quadri impiegati, la profondità e la costanza erano irrilevanti; venivano mostrati quadri bidimensionali sul piano frontale con illuminazione omogenea. Su queste basi non era possibile determinare se il fattore critico di raggruppamento operasse a livello bidimensionale o tridimensionale.

Il primo esperimento che era volto a separare esplicitamente le predizioni di organizzazione ai due livelli concerneva il raggruppamento per prossimità.(Rock e Brosgole ).
La questione era se le distanze che governano i raggruppamenti per prossimità erano definite su un'immagine piana bidimensionale o nello spazio tridimensionale.
Un quadro di perle luminose(fig.6.1.12 ) veniva mostrato dapprima su due dimensioni all'interno di uno sfondo scuro; successivamente lo stesso quadro veniva presentato in profondità ( in 3D ). I soggetti sostenevano di percepire nel primo caso ( bidimensionale ) le perle raggruppate per colonne. Nel secondo caso invece (visione tridimensionale) le perle venivano percepite come raggruppate per righe, orizzontalmente se l'osservazione dello stimolo era monoculare; altrimenti, con l'ausilio dell'informazione binoculare, i soggetti riportavano di vedere le perle raggruppate per colonne. Tutto ciò supporta l'ipotesi che il raggruppamento avvenga dopo la percezione stereoscopica di profondità.
Alcuni risultati mostrano che i raggruppamenti non possono essere attribuiti interamente a un processamento visivo precoce, prima di aver raggiunto la costanza visiva. Ad ogni modo essi sono compatibili con la possibilità che il raggruppamento è un processo temporalmente esteso che include componenti ad un livello sia precoce sia successivo di processamento.

6.1.5 EFFETTO DELL'ESPERIENZA PASSATA

Il concetto della past experience si riferisce all'idea che se alcuni elementi sono stati associati in precedenza prima dell'osservazione diretta, essi tenderanno ad essere associati. Un esempio chiaro di tale principio è quello relativo alla figura nella quale, dopo attenta osservazione, si può vedere un dalmata che annusa la strada. Così, una volta percepito il soggetto della figura, sarà quasi impossibile non vederlo. Il principio della past experience è fondamentalmente differente dagli altri fattori discussi da Wertheimer poiché non riguarda proprietà geometriche della configurazione dello stimolo stesso. Proprio forse per questo la Gestalt ha ignorato tale principio.

6.2 Analisi regionale

L'attento lettore può aver notato un'importante lacuna nella storia dell'organizzazione della percezione. Secondo i Gestaltisti: essi trascuravano di spiegare come gli elementi della loro analisi sorgessero in primo luogo. Wertheimer sembra aver semplicemente accettato l'esistenza di tali elementi come se fosse fenomenologicemente ovvio che l'analisi non era necessaria. Se è così questo è un esempio dell'errore di esperienza per il quale spesso i Gestaltisti criticano gli altri. Gli elementi delle dimostrazioni di Wertheimer non sono dati direttamente dalla struttura della disposizione dello stimolo, ma richiedono una spiegazione comprendente un'analisi dei fattori che ne governano l'esistenza come oggetti di percezione. La base ovvia per gli elementi delle esperienze di percezione che Wertheimer presupponeva nei suoi principi di raggruppamento è un'analisi delle regioni: determinate da confini, aree a 2-D che costituiscono sottosezioni spaziali dell'immagine. Per quanto fondamentale sia il concetto di regione per l'elaborazione delle immagine, non ne abbiamo ancora discusso esplicitamente, essendoci concentrati principalmente sui concetti monodimensionali di linee e margini. Nel cap. 4, per es., abbiamo discusso ampiamente sulle modalità con cui possono essere localizzati i margini a 1-D, ma abbiamo detto
molto poco riguardo al motivo per cui tali margini possono essere importanti. Nel cap. 5 abbiamo visto che i margini erano interessati a diversi aspetti cruciali della percezione di profondità, come l'interpretazione dei margini e l'informazione di prospettiva. Ora considereremo un altro importante aspetto della funzione percettiva: come i confini che determinano regioni a 2-D. Regioni definite sono centrali per l'organizzazione percettiva perché possono ben definire il primo livello di unità pienamente bidimensionale sul quale è basata l'elaborazione successiva.

6.2.1. Connessione uniforme

Palmer e Rock (1994a) danno un'analisi esplicita della modalità con cui gli elementi presupposti da Wertheimer potessero essere formati in termini di un principio di organizzazione che si definiscono di connessione uniforme: le tendenze a percepire le regioni connesse di proprietà uniformi di immagine- vale a dire per esempio luminosità, colore, la struttura dell'immagine, moto e disparità come le unità iniziali di organizzazione percettiva. Come vedremo, il principio di connessione uniforme, forma anche un collegamento cruciale tra la letteratura sull'avvertimento di immagini discusso nel cap.4 e quello riguardante l'organizzazione percettiva e i raggruppamenti discussi in questo capitolo.
Ora considereremo gli elementi nella dimostrazione originale di Wertheimer come esempio di come l'organizzazione in regioni per mezzo di connessione uniforme possa avvenire come uno stadio iniziale nella organizzazione percettiva. I punti, le linee, e i rettangoli nella fig.6.12A,6.12F sono tutte regioni connesse di luminanza uniforme, e corrispondono agli elementi ai quali Wertheimer faceva riferimento nella sua analisi dei raggruppamenti. Le lettere V nella fig.612G e612H, i disegni a forme di X nella figura 612I,e l'aspetto a contorno di clessidra nella fig.612J sono anche regioni uniformi connesse sulla base dell'analisi di Palmer e Rock, ma la loro relazione agli elementi di Wertheimer è leggermente più complessa e sarà considerata più tardi completamente.
Il potente effetto della connessione uniforme sull'organizzazione percettiva può essere rappresentata in semplici dimostrazioni di punti come quelli usati da Wertheimer, illustrati nella figura 6.2.1. La parte A mostra che una fila di punti di diversa luminosità spaziati uniformemente si vedono come entità unitarie e la parte B mostra che la stessa cosa è vera per le regioni che vengono definiti come elementi orientati differentemente nella loro struttura. La parte C e D mostra che tali regioni si fondono in più ampi e più complessi unitari quando essi sono collegati da regioni definite dalle stesse proprietà, laddove la parte E F mostrano che quando esse sono collegate dalle regioni di proprietà diverse, esse non vengono più percepite come degli elementi pienamente unitari. Si potrebbe dapprima pensare che la connessine uniforme sia niente di più che un principio di similarità che funziona sulla base di luminosità e colore. Per es., se una piccola macchia di luce, che cade su ciascun recettore della retina fosse considerata come elemento, potrebbero le regioni uniformemente connesse non essere spiegate raggruppando questi elementi sulla base di luminosità e colore? Forse, questo è ciò che Wertheimer spesso pensava a proposito dell'organizzazione degli elementi. Ma l'identicità del colore non è sufficiente per spiegare l'unità percettiva di regioni uniformemente connesse, perché non dà spiegazioni sulle differenze tra le regioni connesse di colore omogeneo e quelle disconnesse. Vale a dire, senza l'addizionale vincolo della connessione, non c'è una base per prevedere che due aree nere entro lo stesso punto o sbarretta, non sono più strettamente correlate rispetto a delle aree compa rabili nere entro due diversi punti o sbarrette.

Nota 2: Un altro modo per spiegare questo fatto è quello di fare appello al raggruppamento associato (Geissler in stampa) l'idea del raggruppamento associato riguarda il fatto che, se A è raggruppata con B e B con C, allora A sarà raggruppato con C. Questa ipotesi può essere usata per spiegare perché i punti entro una regione uniformemente connessa sono raggruppati più fortemente l'uno con l'altro, rispetto ad altri punti in altre regioni.

Fenomenologicamente non c'è dubbio, che ogni punto individuale è più strettamente organizzato come oggetto percettivo rispetto ad ogni paio di punti separati. Questa osservazione suggerisce l'ipotesi che la connessione uniforme è un importante principio dell'organizzazione percettiva.
Palmer e Rock (1994a, 1994b) sostengono che la connessione uniforme non può essere ridotta a nessun principio di raggruppamento in quanto la connessione uniforme non è per nulla un princi-
pio di raggruppamento. Questo loro modo di ragionare riguarda il fatto che il principio di raggruppamento presuppone l'esistenza di elementi indipendenti che devono essere raggruppati insieme, laddove la connessione uniforme è definita su di un'immagine non segregata. Per questa ragione, la connessione uniforme deve logicamente operare prima che ogni principio di ragguppamento possa avere effetto. Questo è solamente un altro modo di dire, poiché la connessione uniforme è il processo responsabile per la formazione di elementi in primo luogo, che deve avvenire prima dell'operare di ogni processo su tali elementi.
Se la connessione uniforme è così fondamentale nell'organizzazione percettiva, è importante capire perché Palmer e Rock sostengono che ciò avviene a causa del suo valore informativo per designare oggetti connessi (o parti di oggetti) nel mondo. Come regola generale, se un'area
dell'immagine retinica costituisce una regione omogeneamente connessa, essa quasi certamente proviene dalla luce riflessa da un singolo oggetto collegato nell'ambiente. Questo non è invaria- bilmente vero, naturalmente, poiché qualche volta il modello su un animale camuffato si fonde con una regione ugualmente colorata nello sfondo del suo habitat naturale, come illustrato nella fig. 6.1.8. Questo è un altro esempio di un caso nel quale la percezione viene sballata ogni volta che le assunzioni euristiche che sottointendono un processo percettivo vengono meno. Anche così, tali situazioni sono piuttosto rare e la connessione uniforme è davvero un eccellente eurismo per trovare le regioni di immagine corrispondenti a parti di oggetti connessi nell'ambiente. Allora ha senso, per il sistema visivo, fare un primo passo nell'organizzare un'immagine in oggetti, dividendola in regioni uniformemente connesse.
Sulla base di questo ragionamento, Palmer e Rock suggeriscono che la connessione uniforme è il primo principio dell'organizzazione percettiva a 2-D da operare, è il fondamento sul quale è basata tutta la organizzazione percettiva. L'obiettivo di questa analisi iniziale è quello di dividere la immagine in un set di regioni reciprocamente esclusive - chiamata una partizione della immagine molto simile ad un vetro cattedrale o a un modello dipinto a numeri. La regione così identificata può essere ulteriormente organizzata con altri processi come ad esempio discriminare delle figure dallo sfondo, raggruppando due o più regioni insieme, e dividendo una singola regione in due o più subregioni. Un diagramma di flusso che rappresenti l'idea di Palmer e Rock (1999a) delle relazioni dei processi organizzativi è rappresentato nella fig.6.2.2.Più avanti in questo capitolo considereremo la addizionale processo di organizzazione di determinazione figura/sfondo, e nel capitolo successivo considereremo questa divisione. Ma prima di farlo dobbiamo analizzare in dettaglio come una immagine possa essere divisa in regioni uniformemente connesse.
6.2.2. Segmentazione delle regioni

Il processo di divisione di un'immagine in aree mutualmente esclusive, basate sull'uniformità di proprietà di immagini base, come la luminanza, il colore cromatico, la struttura, il movimento, o la disparità binoculare, viene chiamata segmentazione regionale. E' il processo che sotto intende il principio della connessione uniforme. Ci sono due modi ovvi di affrontare questo compito. Uno è quello di individuare esplicitamente l'identità o la similarità delle porzioni adiacenti dell'immagine. Sebbene questa sia una logica possibilità sulla quale torneremo presto, ci sono buone ragioni per credere che in realtà il sistema visivo avverte le differenze (o i gradienti) in proprietà visive locali che dividono una regione da un'altra e che questa sia alla base della segmentazione per regione.

Gli approcci basati sui confini: meno rettamente abbiamo già discusso un possibile meccanismo per l'approccio basato sulla segmentazione delle regioni: gli algoritmi dell'identificazione dei margini (vedi 4.3.2.). Ogni qualvolta i bordi di luminosità formano un contorno chiuso, essi necessariamente definiscono due regioni: quella completamente chiusa dentro e quella parzialmente chiusa fuori. Un'immagine può quindi essere segmentata in una serie di regioni connesse usando un algoritmo di detenzione dei margini per individuare i contorni chiusi. Questa idea forma un collegamento teorico effettivo tra il lavoro ben noto di calcolo fisiologico sull'individuazione dei margini e il lavoro della Gestalt sull'organizzazione percettiva. Specificatamente, suggerisce che la percezione a 1-D dei margini possa essere il primo passo nell'organizzazione percettiva come parte del processo di segmentazione di regioni a 2-D, il cui proposito è quello di trovare delle regioni con delle aree grossolanamente connesse, nell'immagine in modo uniforme.
Abbiamo descritto l'algoritmo zero-crossing di Marr e Hildreth (1980) per la detenzione dei margini in un certo dettaglio, nella sezione 4.3. Ci sono anche algoritmi che producono risultati simili, come quello di Canny (1986) per la detenzione dei margini, poiché tutti funzionano individuando esplicitamente un gradiente (o dei cambi graduali) di luminosità.
Nell'algoritmo di Marr-Hildreth, questo si compie attraverso un'immagine con un set di operatori di margine di secondo ordine e individuando lo zero-crossing nel risultato. Un vantaggio nello schema di Marr e Hildreth della prospettiva corrente si nota nei margini definiti da questo zero-crossing che necessariamente formano dei contorni chiusi. Essi quindi definiscono, implicitamente, una parte dell'immagine come definita nella figura 6.2.3. Dati questi margini, ogni punto può essere assegnato a una sola regione d'immagine. Gli algoritmi per individuare i margini di luminanza possono così essere usati come partizione dell'immagine in regioni connesse, di luminanza approssimativamente uniforme. Per alcuni schemi geometrici senza interferenza, estremamente semplici come quelli usati per dimostrare i principi classici di raggruppamento, nella fig.6.1.2. gli algoritmi di luminanza di margine sarebbero sufficienti per dividere l'immagine negli stessi oggetti che la gente avverte guardandoli. Nelle immagini che si presentano più naturalmente, tuttavia, molti altri fattori devono essere presi in considerazione per determinare le regioni che un osservatore umano potrebbe identificare come tali. Considerate più attentamente l'esempio mostrato nella figura 6.2.3. La parte A mostra l'immagine originale, e la parte B mostra la sua segmentazione in regioni con lo zero-crossing. Notate che questo operatore di margine ha individuato molte regioni percettivamente spurie. Alcune di loro risultano da differenze relativamente piccole nella luminanza, che possono essere eliminate semplicemente fondendo regioni adiacenti tra le quali ci sia un sufficiente margine basso di contrasto (Yakimovsky, 1976).
Più importante, tuttavia, ci sono anche delle regioni distinte definite da delle differenze di luminanza relativamente ampie che corrispondono a differenti regioni dello stesso oggetto percepito.
Molti casi risultano dalla interazione di luce e superficie come ombre e luci forti riflesse. Tali regioni devono essere unificate da dei processi di costanza di luce. Per esempio, ci sono delle regioni piuttosto ampie di alta luminosità nella fig. 6.2.3. che sono raggruppate insieme con delle regioni su
re adiacenti, tutte costituiscono la superficie scura della scultura. Questa percezione di una superficie scura e luminosa, risultano dalle regioni di luce che sono interpretate come luci alte che sorgono dalla luce riflessa.
Altri esempi di regioni distinte nell'immagine che appartengono allo stesso oggetto percepito ven-
gono dall'occlusione. Quando un oggetto è davanti ad un altro, che occlude parte di esso dalla vista, due o più regioni distinte possono essere presenti nell'immagine che noi percepiamo come parte dello stesso oggetto. Processi di raggruppamento devono essere allora usati per metterli insieme nuovamente. I fenomeni come le ombre, le occlusioni indicano che molti processi aldilà della segmentazione regionale sono richiesti per determinare l'organizzazione finale dell'immagine realistica negli oggetti che le persone percepiscono. Considereremo più tardi alcuni di questi punti in questo capitolo.

Approcci basati sulle regioni

Forse vale la pena di menzionare il fatto che questi algoritmi basati sui confini per la segmentazione delle regioni sono piuttosto differenti da quella sorta di processi che i teorici della Gestalt presero in esame quando parlavano dei fenomeni di raggruppamento. Le dimensioni di Wertheimer e le discussioni sul raggruppamento per similarità suggerisce un processo globale più complesso che riunisca una serie di elementi discreti forse con dei processi di mutua attrazione dovuta a proprietà comuni. Questo è piuttosto diverso dall'approccio della ricerca dei confini alla segmentazione delle regioni che avviene come sottoprodotto della individuazione dei margini. Le idee della Gestalt suggeriscono che ci possono essere altri approcci alla segmentazione delle regioni che avviene come sottoprodotto della individuazione dei margini. Le idee della Gestalt suggeriscono che ci possono essere altri approcci alla segmentazione delle regioni che non dipendono da un processo precedente di individuazione del margine locale ma trovano regioni più direttamente. In verità è persino possibile che la detenzione dei margini sia il risultato di una segmentazione regionale piuttosto che la sua causa. Vale a dire, se un processo trova regioni uniformemente connesse per mezzo di un processo globale di attrazione, i margini vengono definiti implicitamente dai confini tra le regioni. Questo è l'opposto dell'approccio basato sul margine.
Sebbene virtualmente tutti gli algoritmi per trovare i margini tra le regioni che sono stati immaginati fina ad oggi sono essenzialmente processi locali, può essere preferibile per essi essere determi- nati più globalmente. Gli operatori di margine definiti da Marr e Hildreth, Canny e altri, tutti trovano dei gradienti di luminanza facendo dei calcoli su parti molto ristrette dell'immagine.
Questi margini locali devono essere integrati in un set di contorni chiusi per trovare le regioni nelle quali l'immagine sarà segmentata.
Questo processo può essere difficile dal punto di vista del calcolo e di rado produce delle segmentazioni intuitivamente soddisfacenti della scena in regione (per es. la fig. 6.2.4 D, che illustra il prodotto di un individuatore del margine di Canny sull'immagine del pinguino delle fig. 6.2.4.A).
Una procedura più globale basata sulla regione è stata recentemente immaginata da Malik e i suoi colleghi (Lenng e Malik 1998; Shi e Malik,1997).
Il loro approccio di teoria grafica non comincia per nulla trovando margini e linee, piuttosto divide direttamente l'immagine in regioni trovando quel set di punti che sono simultaneamente più simili entro una certa regione e più diversi tra le regioni. La similarità è definita nel loro algoritmo dall'integrazione di un numero di fattori di Gestalt, come la similarità di luminanza, colore, strutture e
movimento.
La fig. 6.2.4. mostra un esempio di un'immagine di pinguino (parte A) e le regioni nelle quali il loro algoritmo lo divide (parte B). I confini di queste regioni che sono illustrati in parte C, sono piuttosto differenti rispetto a questi tipi di margini locali che si trovano con gli individuatori standard di margine (parte D).Notate, per esempio, che il risultato dell' individuatore di margine Canny produce di rado delle regioni non connesse, laddove l'approccio basato su regioni di Malik e colleghi lo introduce attraverso il disegno. La partizione regionale, sebbene non perfetta, è piuttosto plausibile e trova dapprima le regioni importanti, con la minima preferenza di margini sconnessi
non sequenziali che affliggono la maggior parte degli altri metodi. Seppure non sia ancora chiaro come un tale approccio teorico possa essere implementato nel cervello, questo lavoro è un importante ricordo che l'approccio basato sui margini alla segmentazione delle regioni, non è l'unico modo, e certamente non il migliore, per separare un'immagine in regioni uniformemente connesse.

La prova di immagini stabilizzate

Abbiamo suggerito che la detenzione dei margini, per quanto possa attualmente essere calcolata, è un probabile meccanismo per dividere la immagine in regioni differenti, ma non abbiamo ancora fornito alcuna prova per questa affermazione. Sulle modalità di verifica, esiste un contributo impressionante di ciò da esperimenti riguardanti la percezione di immagini stabilizzate: immagi- ni presentate in modo che esse siano completamente stazionarie sulla retina (vedere sez.111).
Per quanto possa apparire strano, il sistema visivo, attualmente, smette di adattarsi alle strutture ottiche nell'immagine retinica se non si verifica cambiamento nel tempo.(Ricordare dal cap.1 che questo è il motivo per cui noi non percepiamo il punto cieco o i vasi sanguigni nella nostra retina).Lo straordinario risultato degli elementi sulle immagini stabilizzate lo verifichiamo dopo averne osservata una per più di pochi la quale scompare completamente!
La rilevanza di immagini stabilizzate secondo l'affermazione che la detenzione dei margini è la
base della segmentazione regionale e sostiene la conclusione che le persone fanno esperienza
della forma e colore delle regioni solamente sulla base dell'informazione di margine. Forse la più significativa dimostrazione deriva da un semplice ma elegante esperimento di Krauskopf (1963).
Egli ha presentato degli osservatori con un circolo centrale rosso circondato da un anello verde. In condizioni normali di visione, esso appare come un circolo rosso dentro un anello verde. Ma Krauskopf ha stabilizzato il contorno interno tra le porzioni rosse e verdi del campo visivo senza stabilizzare quello esterno. Il risultato stupefacente è dimostrato dal fatto che il disco rosso interno scompare e si riempie la parte di quello verde per creare la percezione di un grande e unico anello verde!
Si può sperimentare un fenomeno strettamente correlato guardando nel punto della fig.6.2.5 per un minuto o circa. Perché dato che, non si possono tenere gli occhi fermi abbastanza per stabilizzare completamente interno, è stato disegnato così "confuso" che i piccoli movimenti oculari involontari hanno solamente poco effetto sul sistema visivo. Come risultato, dopo aver guardato il punto nero centrale abbastanza a lungo per fare in modo che il sistema visivo si adatti al contorno incerto interno, la regione luminosa centrale scompare ed è riempita dal grigio scuro circostante.
Allora se si compie un grande movimento del l'occhio la regione interna riappare perché il bordo indistinto è nuovamente percepito.
I risultati di Krauskopf sono proprio quello che uno si può aspettare se, i colori e i contorni percepiti e i contorni delle regioni fossero determinati esclusivamente dall'informazione di margine.
Solo quando l'adattamento al bordo interno è completo (a causa della sua stabilizzazione sulla retina), il margine esterno ha un effetto sul sistema visivo. Così, la situazione è la stessa come quando è presente solo un grande circolo verde: la presenza di un bordo esterno verde senza altri margini intorno ad esso. Questo è precisamente ciò che le persone percepiscono quando il bordo interno è stabilizzato, nonostante la continua presenza fisica del cerchio rosso sulla retina.
Questo è precisamente ciò che le persone percepiscono quando il bordo interno è stabilizzato, nonostante la continua presenza fisica del cerchio rosso sulla retina.
Questo notevole fenomeno può sembrare una semplice curiosità di laboratorio ma in realtà avviene nella visione normale di tutti i giorni. Come abbiamo menzionato nella sezione 1.3.2,esistono due tipi di fenomeni di filling-in che producono esperienze visive: nel punto cieco e dove i vasi sanguigni cadono sui recettori. Queste sono delle immagini naturalmente stabilizzate, poiché essi collaborano continuamente con la retina. Come risultato, siamo letteralmente ciechi ad essi in condizioni normali di visione.

Le parti e il parsing

Ora abbiamo discusso due processi fondamentali di organizzazione percettiva: la segmentazione regionale e i raggruppamenti. Inoltre abbiamo ipotizzato che la segmentazione regionale sia, il processo più antico e primitivo in quanto definisce gli elementi sui quali operano i processi di raggruppamento. Ma un altro interessante processo è interessato all'organizzazione dei oggetti percettivi che non abbiamo ancora considerato: la divisione in parti di un singolo elemento. Questo elemento si definisce parsing.

Il parsing è un importante aspetto del l'organizzazione percettiva in quanto determina quali subregioni di unità percettiva sono percepite come "raggruppate insieme" più coerentemente. Per comprendere, considerate nuovamente le figure connesse uniformemente 6.2.1.C. Il principio di connessione uniforme definisce ciascuna regione come singola, e questo si conforma alla nostra esperienza con essa come oggetti singoli. Ma li sperimentiamo anche come possessori di parti chiare e ovvie: vale a dire, due parti circolari connesse da una sbarretta. Consideriamo anche la figura a forma di X nella fig.6.1.2.I. Nonostante la sua unità globale, l'analisi della sua organizzazione in due linee intersecanti in accordo con una buona continuazione richiede che sia costituita da quattro elementi, dei quali, come sosteneva Wertheimer, le coppie vengono raggruppate insieme. In accordo con l'analisi di Palmer e Rock (1994a), tuttavia, l'unità dell'intera figura si presenta in un primo momento, seguita dalla divisione nei quattro segmenti. I quattro segmenti, allora, possono essere raggruppati attraverso una buona continuazione come suggerisce Wertheimer.
Attraverso quale modalità il parsing divide gli oggetti in parti? Per prima cosa potete notare che ciò dipende dalla forma dell'oggetto. Un circolo completo o una linea dritta, per es., non hanno
un parsing naturale, nel quale due circoli o due linee che si intersecano l'uno sull'altro come il-
lustrato nella fig.6.2.6.Se esaminiamo i luoghi nei quali è naturale dividere tali figure emerge che esse si dividono in cavità profonde: punti nei quali il contorno è oggetto di una marcata piega verso l'interno della regione.(Hoffman e Richards,1994).Nella fig. 6.2.6, i punti di freccia indicano le discontinuità concave.
Illustra come il parsing avvenga dove sono presenti coppie di tali discontinuità. Avremo ancora molto da dire riguardo le parti di parsing nel cap.7 e 8 quando discuteremo in dettaglio la forma degli oggetti. Per ora la questione importante è relativa alle modalità attraverso le quali questo parsing si collega alla segregazione regionale e ai processi di raggruppamento dei quali abbiamo già trattato. Come raggruppamento, logicamente, il parsing deve avvenire successivamente alla segregazione regionale, poiché il parsing presuppone l'esistenza di un elemento da dividere e noi abbiamo presupposto che la segregazione regionale formi tali elementi.
Notate che il parsing è essenzialmente l'opposto del raggruppamento, poiché usufruisce di una
singola unità percettiva e la suddivide in due o più unità, piuttosto che raggrupparle unicamente. Ma non esiste un vincolo specifico relativo al l'ordine attraverso il quale il parsing e il raggruppamento debbano manifestarsi; potrebbero avvenire simultaneamente. Questo avviene perché il diagramma di flusso delle teorie di Palmer e Rock (fig.6.2.2) dimostrano che il raggruppamento e il parsing avvengono contemporaneamente dopo la definizione delle due regioni.
La fig.6.2.7.da un esempio relativo a Palmer e Rock (1994a) delle modalità attraverso le quali questi tre processi organizzativi - segregazione regionale, raggruppamento e parsing - si collegano l'uno con l'altro per arrivare ad una organizzazione percettiva connessa. La disposizione degli stimoli la cui organizzazione sarà considerata, è rappresentata sopra alla figura. In un linguaggio normale, qualcuno potrebbe descriverla come una fila costituita da tre paia di figure a doppio lobo. In un primo momento, notate che la descrizione implica una gerarchia di livelli. Al più alto livello è presente la figura intera, al secondo livello più basso ci sono tre paia di figure. Al livello sottostante le stesse figure. In basso sono presenti i "lobi" nei quali le figure possono essere percepite come divise. Attraverso quali modalità questo tipo di organizzazione gerarchica potrebbe essere ottenuta attraverso processi organizzativi?
In accordo con le spiegazioni teoriche di Palmer e Rock, la segregazione regionale deve operare dal principio in quanto è l'unico processo organizzativo che funziona su immagini meno organizzate. I processi relativi ad alcuni tipi di immagine regionale dividono l'immagine in una serie di regioni connesse, uniformi, e non sovrapposte. A questo punto, un altro processo organizzativo, definito "organizzazione figura-sfondo" deve funzionare, ma definiremo la discussione più tardi nel capitolo. L'organizzazione figura-sfondo indica quali regioni devono essere prese come oggetto (o figura) e quali invece come sfondo (o base) assegnando ogni contorno come appartenente ad un lato o all'altro (lato della figura).Allora, le regioni designate come figure costituiscono le prime unità dell'organizzazione percettiva e danno l'entrata iniziale della gerarchia parte - intero, come indicato nella figura 6.2.7.Palmer e Rock definiscono questo livello come una unità a livello di entrata. Dopo aver stabilito l'ordine delle unità a livello di entrata, il resto della gerarchia partetutto può essere costruita dal l'applicazione di processi di raggruppamento e di divisione. Vale a dire, le unità a livello di entrata possono essere o aggregate in unità sovraordinate ad un livello più alto dall' operazione di processi di raggruppamento divise in unità subordinate ad un livello più basso
dall'operazione di processi di divisione. La logica non determina l'ordine attraverso il quale questi due processi devono essere applicati. In verità, essi possono operare simultaneamente per estendere la gerarchia parte tutto simultaneamente in entrambi le direzioni. Nell'esempio presente, il
raggruppamento unifica delle coppie di figure a livello di entrata in due gruppi di due unità e poi
unifica le tre paia nell'intera fila di figure. Il livello subordinato al livello di entrata è costruito facendo la divisione di ciascuna figura connessa uniformemente in due parti circolari alla coppia di dis-continuità concave nel centro di ciascuna unità a livello di entrata.
Palmer e Rock (1994a) e la loro analisi teorica tenta di fare un collegamento nell'in- tervallo tra le idee classiche della Gestalt riguardo l'organizza- zione percettiva e le teorie di calcolo moderne nella scienza della visione. Sebbene adempiano a questa funzione ragionevolmente bene, esisto-
no certamente altre possibilità (per esempio Geissler, nel suo; Rensink e Enns, 1995).Il fatto che non ci sia ancora una prova che le unità a livello di entrata sono elaborate prima rispetto ad altri livelli nella gerarchia parte tutto suggerisce che le proposte di Palmer e Rock devono essere viste con cautela.

Segregazione della struttura

Palmer e Rock (1994a) sostenevano che le regioni connesse uniformemente potevano essere definite da proprietà di ordine più alto rispetto alla luminanza e al colore. Questa tesi è basata largamente sull'ampia letteratura della segregazione della struttura che dimostra che le regioni possono essere percepite solamente sulla base della informazione strutturale. A questo punto, sarebbe appropriato dare una definizione chiara e non ambigua di struttura, ma, come vediamo, non è una questione facile.
La segregazione della struttura viene solitamente studiata in immagini composte da molti elementi
distinti, come è rappresentato nella figura 6.2.8.Il quadrante in basso a destra viene percepito senza sforzo come diverso dal resto del circolo, anche senza percepire coscientemente le forme degli elementi individuali che comprende. La segregazione per struttura sembra chiaramente cor-
relata sia al ragruppamento classico che alla segmentazione regionale ma in diversi modi. La sua connessione al raggruppamento classico è relativa al fatto che può essere considerata il risultato
di elementi di raggruppamento testuale secondo il principio di similarità della Gestalt. Come abbiamo già notato, tuttavia, non tutte le similarità sono valide nel raggruppamento(vedere fig.6.1.3), e Wertheimer non aveva studiato la rilevanza di similitudini diverse. La segregazione strutturale può essere anche compresa come un caso speciale di segmentazione regionale; uno nel quale gli operatori di margine individuano dei gradienti spaziali di alcune dimensioni ancora indefinite di struttura, analoghe all'identificazione dei cambi repentini di luminanza che abbiamo discusso
nel cap.4.Come vedremo, i recenti progressi teorici, nella comprensione della segregazione per
struttura sono stati fatti attraverso questo ultimo approccio, estendendo le tecniche di segmentazione regionale alle proprietà strutturali.

Scoprire le caratteristiche della struttura
Le prime grandi scoperte della natura di queste percezioni strutturali furono effettuate da Jacob
Beck, uno psicologo della percezione dell' Università di Oregon. Egli aveva fatto in modo che i soggetti compissero delle operazioni tali da individuare quali regioni in un modello di molti elementi di struttura potessero apparire diversi rispetto al resto, come illustrato nella figura 6.2.9.A.
Per esempio, si percepiscono le T inclinate nella regione più a sinistra della figura 6.2.9A rispet-
to alle T diritte nella regione centrale e si nota ciò più rapidamente e facilmente di quanto non si percepiscano le L diritte nella regione più a destra essendo diverse rispetto alle T diritte al centro Verificando le modalità attraverso le quali le persone riuscivano in questo compito, Beck iniziò con l'ipotesi che l'esempio contenente un gran numero di elementi sarebbe stato raggruppato sulla base della similarità di forme come si potrebbe prevedere dal processo di similarità della Gestalt.
Ma presto scoprì che i fattori che regolavano la segregazione strutturale non sono necessariamente gli stessi rispetto a quelli che determinano la similarità di forma degli stessi elementi quan-
do essi sono percepiti come figure individuali. Per esempio, la segregazione strutturale evidente nella fig.6.2.9A risulta essere l'opposto rispetto a ciò che risulterebbe prevedibile dalla semplice classificazione della similarità di forma. Quando i soggetti giudicavano questi stessi elementi con forma simile come figure individuali (vedi fig. 6.2 9B), una T inclinata veniva giudicata come più simile di quanto fosse una L dritta. Dai risultati di molti esperimenti simili, Beck (1972, 1982) con classe che la segregazione per struttura risultava dall'avvertimento di caratteristiche - diverse per unità di area - di alcuni attributi semplici, come l'orientamento delle linee, la luminanza generale, il colore, la forma e il movimento.

Segregazione di struttura come un processo parallelo

Altre importanti idee riguardo la segregazione strutturale furono introdotti da Bela Julesz, lì inventore di stereogrammi a punti casuali. Egli precisò che le strutture potevano essere discriminate in uno dei due modi: attraverso una normale spiegazione strutturale, che avviene senza sforzo e simultaneamente su tutto il campo visivo, o attraverso quello che egli definì "uno scrutinio conscio".
In accordo con Julesz, lo scrutinio implica la focalizzazione dell' attenzione sequenziale sulle parti differenti dell'esibizione nel tentativo di trovare differenze di forme tra gli elementi individuali. Egli sostenne quindi che la normale segregazione strutturale era un processo preattentivo, ma che avviene prima della focalizzazione dell' attenzione.(Nella sezione 11.2.5 sosterremo che, sebbene questa elaborazione funzioni prima della focalizzazione dell' attenzione per gli oggetti individuali, non avviene in genere prima del processo di attenzione).Nella sua ricerca riguardo la segregazione strutturale, inoltre Julesz discoprì anche che molte di queste strutture costruite intelligentemente non potevano essere segregate in parallelo, nonostante le ben definite diversità fisiche negli elementi dai quali esse erano composte. La fig.6.2.10A illustra un esempio: delle R normali a sinistra non possono essere discriminate dalle R riflesse attraverso uno specchio a destra se esse sono
orientate casualmente. Egli formulò la congettura che le strutture fisicamente diverse potessero essere segregate solo ed esclusivamente se possedevano delle diverse proprietà statistiche basate sulla leggerezza di coppie di punti - che egli definì statistiche di polo dell'immagine -e molti esperimenti sembravano sostenere la sua ipotesi (vedere Julesz,1975). Infine scoprì dei modelli come quelli rappresentati nella fig. 6.2.10B,che presentano le stesse statistiche di secondo ordine e terzo ordine e tuttavia, sono facilmente discriminabili come strutture. Tali esempi portarono Julez a tralasciare a tralasciare la sua analisi basata sulle proprietà statistiche e a proseguire con una teoria come quella di Beck. Egli, infine, propose che le strutture fossero segregate individuando i cambiamenti nella densità di certe semplici caratteristiche, locali e strutturali che egli definì textous(Julesz, 1981).
Secondo Julesz (1981), ci sono tre tipi di textous:1) relativo a dei cumuli allungati definiti dai loro
colori, lunghezza, larghezza, orientamento, disparità binoculare, tasso di apparizione.2) terminatori di linee; e 3) incroci o intersezioni di linee. Egli suggerì anche che esistono dei detentori nel sistema visivo che sono sensibili a questi textous e che la segregazione strutturale avviene attraverso l'attivazione di questi detentori di textous. Notate che questi detentori di struttura di Julesz appaiono simili rispetto a quelle caratteristiche fondamentali assegnate alle cellule corticali in V1 da Hubel e Wiesel (1968) e come alcuni dei primitivi elementi di quel disegno primitivo di Marr (1982), come descritto nel cap.4.Questo lavoro sulla segregazione strutturale da parte sia di Julesz che di Back fu importante perchè cominciò a formare un collegamento teorico attraverso
tre argomenti interrelati: i dati percettivi sulla segregazione strutturale, la fisiologia della corteccia visiva, e le teorie computazionali della visione. Da questi indizi, sono sorte nuove teorie che tentano di rappresentare un resoconto unificato delle loro interelazioni.

Teoria sulla segmentazione di struttura

Gli scienziati della visione Jutendra Malik e Pietro Perona (1990) hanno proposto una teoria biologicamente plausibile; teoria computazionale di segregazione strutturale basata sulla individuazione di margini nelle produzione di tipi conosciuti di cellule corticali. La loro teoria- che menzioniamo nella sezione 4.3.3.- consiste in tre stadi illustrati nella fig.6.2.11: uno stadio di filtro, uno stadio di inibizione laterale e uno stadio di computazione a gradiente (o di individuazione di margini).Consideriamo questo modello attraverso alcuni dettagli per due ragioni: Primo, viene finora considerata una delle teorie di maggior successo della segregazione di struttura. Secondo, è un buon esempio di approccio interdisciplinare alla visione. Contributi alle scienze percettive biologiche e computazionali furono prodotti per produrre un progresso significativo rispetto a quanto si sarebbe ottenuto solamente entro un singolo approccio individuale. I modelli relativi allo sta-
dio di filtro iniziale della produzione delle cellule V1 come descritto nella sezione 4.1. I filtri usati da Malik e Perona includono i campi recettivi centro-bordo (fig.6.2.12A e 6.2.12B) e vari campi di recettori a sbarra orientati in vari modi (fig.6.2.12C). Ciascuno di questi tipi di filtro presenta una
dimensione strutturale che il sistema visivo può usare per dividere delle regioni sulla base della
struttura. Molti tipi di filtri sono densamente distribuiti sul campo visivo, cosicchè alla produzione di un set completo si approssima ad ogni posizione la circonvoluzione dell' immagine con il campo recettivo di questo tipo di filtro(vedere sezione 4.3 per una spiegazione delle circonvoluzioni).
La fig. 6.2.13A rappresenta una struttura di forme allungate a orientamenti diversi. La fig.6.2.13B
rappresenta l'uscita di questa immagine ad ogni posizione e del set di filtri a sbarra scura il cui campo percettivo viene raffigurato negli angoli in basso a destra. Queste immagini in output rappresentano le circonvoluzioni delle immagini in entrata (parte A) con l' appropiato tipo di filtro.
Secondo una implementazione neurofisiologica del modello, la luminanza indica ad ogni posi-
zione in questa immagine in uscita, l' ammontare di una attività neuronale, che risulterebbe in cellula una cellula entro il campo di recezione, dato dalla corrispondente posizione nel campo visivo. Quindi l'immagine in output corrisponde approssimativamente ad una mappa retinotopica
relativa a quei campi di cellule attivate che possiedono uno specifico campo recettivo.
Notate che il filtro a sbarra lucente ( alla base della fig.6.2.13) produce una uscita ben più ampia
di struttura rispetto alla parte destra. Poichè il filtro a sbarra lucente (alla base della fig.6.2.13) è centrato con un orientamento molto simile a quello relativo alla macchie a sinistra e, parecchio diverso dalle macchie a destra. Così, esiste una grande difficoltà (o gradiente) tra le metà sia di sinistra che di destra per il campo visivo di questo filtro. Nell'immagine in output questa differen-
za è rappresentata da una ampia diversità della luminanza generale nel campo di sinistra e di
destra.(Notate che, sebbene questa differenza esista implicitamente nell'output relativo allo stadio di filtro, questa non viene identificata esplicitamente fino allo stadio finale del modello).Per contrasto, i filtri a sbarra scura producono , con lo stesso orientamento, solo una debole risposta(fig. 6.2.13B.) verso la parte sinistra e quindi solamente un gradiente molto leggero per la stessa immagine in input. La seconda fase del modello Malik-Perona impone un'inibizione laterale tra delle cellule spazialmente contigue che possiedono diversi campi recettivi. Il proposito di questa inibizione laterale è quello di eliminare o ridurre le risposte deboli spurie. Attraverso questo meccanismo, per esempio, le risposte deboli dei filtri a sbarra scura (fig.6.2.13B) verrebbero soppressi dalle forti risposte dei filtri a barra chiara (fig.6.2.13C). Sebbene non siano conosciute esattamente quali interconnessioni inibitorie esistano nella corteccia visiva, il modello di Malik-Perona non contraddice alcun fatto biologico conosciuto, e ciò è plausibile, data l'attuale conoscenza della corteccia visiva. Il terzo e ultimo stadio del modello calcola esplicitamente la forza dei gradienti di struttura. Prende l'output dello stadio di interazione inibitoria per ciascun tipo di filtro e lo analizza attraverso un set di operatori grezzi di detentori di immagine a bassa risoluzione con diversi orientamenti e posizioni, proprio come discusso nella sezione 4.3.2 nella qual abbiamo considerato le teorie computazionali di potenziale di margini. L'operatore di margine di Malik e Perona è abbastanza grande relativamente agli elementi di struttura che si determinano nella media verso l'uscita di molti filtri individuali con gli stessi campi di recezione. Analisi separate di questo tipo sono eseguite per ciascun set di questi filtri di campi recettivi. Nel gradiente finale di struttura viene definito il massimo gradiente sopra tutti i tipi di filtro. I confini di struttura sono allora localizzati al massimo locale dell'uscita di questo stadio di calcolo del gradiente.
La teoria di Malik-Perona ha molti attributi desiderabili :
1. differentemente dalla teoria caratteristica di Beck e di quella del texton di Julesz, viene completamente specificata in termini computazionali espliciti. Questo significa che può essere - ed è stata messa - in funzione su un programma di computer che compie tutte le segregazioni di struttura delle immagini.
2. Differentemente dalla teoria di Beck e di Julesz, si applica a qualsiasi tipo di immagine, non solo ad una unica composta da elementi distinti. Per illustrare questo fatto, Malik e Perona usarono l'implementazione con il computer, per trovare dei confini di struttura di una porzione di un dipinto di Gusatv Klimt, come illustrato nella fig.6.2.14. Sebbene si possa discutere di piccole deviazioni rispetto a quelle percepite normalmente dalle persone, il modello compie un valido lavoro nel catturare margini di struttura essenziali da questa immagine complessa.
3. Una misura di quanto fortemente diverse strutture siano discriminate dal modello, corrisponde di molto alle performance umane riguardo la stessa struttura. La fig.6.2.15 raffronta la performance umana e quella del computer su dieci strutture ampiamente differenti. Illustra i dati relativi ai risultati ottenuti dalle performance umane in un compito di segregazione di struttura (Kròse, 1986,1987) e le predizioni in unità del modello che sono regolati per corrispondere ai dati umani. Esiste spazio per il miglioramento , ma la rispondenza generale risulta impressionante.
4. Il modello di Malik-Perona per le segregazione della struttura integra numerosi fattori differenti in una predizione generale da ogni immagine arbitraria di stimolo. E' vero che riguarda solo un piccolo subset di principi classici del raggruppamento di Wertheimer - vale a dire delle similitudini correlate in forma e forse colore- ma è tuttavia un importante primo passo.
5. Finalmente, le dimensioni del loro modello corrispondono più strettamente alla struttura del campo recettivo delle cellule che essi rappresentano , piuttosto che alle caratteristiche naturali del loro ambiente. Così il modello suggerisce che il sistema di elaborazione della struttura possa essere uno dei molti moduli diversi basati sulla produzione delle prime cellule corticali, come suggerito nella fig.4.3.20.
E' ancora una questione aperta se gli algoritmi di segmentazione della struttura come quelli di Malik-Perona possano anche essere validi per casi di raggruppamento classici per similitudine come discussi da Wertheimer. Siamo dell'opinione che la segregazione per struttura possa essere più utilmente vista come un caso di segmentazione regionale basata sulle proprietà strutturali piuttosto che un esempio di raggruppamento di similitudini classiche, ma questa distinzione potrebbe risultare infondata. Se è così, gli algoritmi come quelli di Malik e Perona possono essere estendibili per spiegare entrambi i tipi di fenomeni, come suggerito da Nothdurft (1992). Ancora è chiaro come altri fenomeni di raggruppamento, in particolar modo quelli di formazione di unità basati sulla chiusura, sulla continuità, e in certi casi di destino comune, sono di un tipo del tutto differente e richiedono un tipo di teoria differente. Considereremo questo tentativo in questa direzione più tardi nel capitolo.
6.4 INTERPOLAZIONE VISIVA

Uno dei più importanti fattori di complicazione nel portare a termine la corretta organizzazione è che le superfici sono opache,quindi nascondono meccanicamente porzioni di oggetti alla vista.Come noi ci muoviamo attorno nel mondo tridimensionale,le superfici sono continuamente sottoposte a continue occlusioni e disocclusioni da parte dei bordi delle superfici chiudenti (vedi sezione 5.4.4).E' necessario quindi ,per far fronte a tali situazioni,inferire in qualche modo la natura delle parti nascoste partendo da quelle visibili.Nel sistema visivo si sono evoluti dei meccanismi,che noi chiameremo processi di interpolazione visiva ,in grado di fare tali inferenze.Naturalmente questi meccanismi hanno dei limiti,principalmente perché tutto quello che possono fare è proporre la migliore supposizione su qualcosa che non possono vedere.
Prima di passare a descrivere il fenomeno dell'interpolazione,deve essere fatta una distinzione tra il tipo di completamento percettivo che avviene quando parti di superfici sono occluse e il letterale filling in che avviene nella macula cieca.
Il filling-in (= riempimento) si riferisce ai casi in cui l'osservatore ha tutte le esperienze visive di appropriate qualità sensoriali nella porzione mancante dell'immagine.
L'interpolazione visiva,invece,non include esperienze visive di superfici completate ma solo la conoscenza percettiva - o meglio le credenze - sulle sue proprietà.

6.4.1 COMPETAMENTO VISIVO
Il fenomeno del completamento visivo ( o completamento amodale ) è dato dal fatto che il sistema visivo percepisce spesso automaticamente superfici e oggetti parzialmente occlusi come interi e completi,includendo solitamente anche la loro forma,trama e colore.Un semplice esempio è fornito nella fig.6.4.1.

6.4.1

Un soggetto percepisce spontaneamente un cerchio pieno dietro un quadrato (come in 6.4.1B ) anche se un quarto di quest'area non è visibile.Sebbene i termini "amodale" e "visivo" possano sembrare contraddittori,entrambi sono appropriati per i diversi aspetti del fenomeno del completamento.Infatti può giustamente essere chiamato "amodale"perché la porzione completata dell'immagine non è supportata da locali stimolazioni sensoriali in nessuna modalità.Inoltre può essere definito "visivo"perché la porzione completata è supportata indirettamente da informazioni visive presenti altrove nell'immagine.
Come abbiamo visto nel Cap.1,il completamento visivo è logicamente indeterminato.Il vero stato dell'evento corrispondente alla fig.6.4.1 può essere un quadrato che copre un cerchio intero (B),un mosaico formato da un quadrato adiacente a tre-quarti di cerchio(o Pac-man) come nella parte C ,o un quadrato di fronte ad un cerchio con bizzarre sporgenze (D),o un infinito numero di altre possibilità.Il sistema visivo appare dunque avere forti preferenze sul modo in cui completare oggetti parzialmente occlusi,e queste preferenze sono chiaramente indirizzate a portare a termine una percezione veridica di tutti gli oggetti nel mondo.
Come può succedere?
Sono state avanzate differenti teorie del completamento amodale e noi ne considereremo i tre tipi principali.

Teorie della familiarità della figura.Una possibilità è che noi completiamo il cerchi dietro al quadrato a causa di esperienze precedenti nella visione di cerchi pieni.Quindi le persone completano figure parzialmente occluse in accordo con la forma più frequentemente incontrata che sia compatibile con le informazioni dello stimolo visivo.Un problema e però che noi sembriamo in grado di completare oggetti che non abbiamo mai visto prima con la stessa facilità di quelli familiari.Un esempio è nella fig.6.4.2A.

6.4.2

Questa obiezione non vuole però provare che la familiarità non ha alcun effetto:semplicemente indica che qualcos'altro,oltre ad essa,deve essere coinvolto nel processo.Infatti ci sono alcuni inequivocabili esempi dell'effetto della familiarità sul completamento:la fig.6.4.2B mostra una lettera parzialmente occlusa in un contesto di altre lettere.La maggior parte delle persone la completa come una "R" ,sebbene potrebbe essere logicamente percepita come una "P" o una "B" o un qualche altro pattern geometrico che non abbia forma di lettera.Il fatto che "R","P" o "B" siano lettere familiari e che la parola "WORD" sia una parola familiare in inglese -mentre "WOPD" o "WOBD" non lo siano - sembra essere un fattore importante in questo esempio.

Teorie della semplicita' della figura.Una seconda possibilità è che le figure parzialmente occluse sono completate in modo che risultino le "più semplici" figure percepite.Per esempio il quadrato occludente il cerchio nella fig.6.4.1A è intuitivamente la più semplice fra le alternative possibili. L'idea di spiegare il fenomeno dell'organizzazione percettiva in termini di massimizzazione della semplicità è stato l'approccio teorico favorito dagli psicologi della Gestalt che chiamarono la loro ipotesi ,secondo la quale il sistema visivi percepisce la maggior semplicità possibile,il principio di Pregnanza ( definito da altri più tardi il principio minimo ).Esso afferma che il percetto è tanto più buono più le condizioni prevalenti lo concedono,dove il termine "buono" si riferisce al livello di semplicità e regolarità della figura, e le condizioni prevalenti alla struttura dell'attuale immagine dello stimolo.Il problema principale di tale approccio è però la mancanza di un'esatta definizione di "bontà".Alcuni teorici hanno ipotizzato che la "bontà" di una figura può essere misurata contando il numero degli assi di simmetria bilaterale,quindi ad un maggior numero di assi corrisponde una maggior bontà della figura.Secondo tale definizione la percezione di un quadrato che occlude un cerchio è la più semplice perché il cerchio è bilateralmente simmetrico rispetto agli assi passanti per il suo centro; l'interpretazione del mosaico ne ha uno solo e il cerchio con protuberanze non ne ha per niente.
Sebbene tali considerazioni e ipotesi possano rendere conto di molti esempi,ce ne sono altri per i quali non sembrano in grado di fare previsioni corrette.Un contro-esempio è mostrato nella fig.6.4.3A : la percezione usuale è un quadrato posto di fronte ad un altro quadrato al quale manca il più basso angolo a destra.In base alla definizione di simmetria,il completamento più semplice dovrebbe essere l'esagono ( fig.6.4.3C ) perché questo ha 2 assi di simmetria laddove il quadrato senz'angolo ne ha uno solo.

6.4.3

Ovviamente questo contro-esempio può semplicemente indicare un'incrinatura nella definizione di "bontà" della figura:per esempio il numero dei lati può essere un fattore cruciale per la bontà.Infatti definendola esclusivamente in termini di numero di lati si riesce a dare la risposta corretta anche in questo caso:il quadrato senz'angolo,che è stato preferito, ha solo 5 lati quando l'esagono ne ha 6.E' anche possibile che più fattori insieme determinino la bontà di una figura.Questo esempio rivela però un problema generale delle teorie del completamento basate sul principio di pregnanza:la loro validità varia a seconda della misura di bontà e semplicità che è stata assunta.Quindi cambiando definizione si possono spiegare risultati dei quali prima non si riusciva a render conto e che,anzi,inficiavano la teoria.Il cambiamento di definizione può ovviamente corrispondere al raggiungimento della definizione più corretta,ma rende tali teorie difficili da falsificare.

Teorie dei limiti ecologici.Cercano di spiegare il completamento visivo ricorrendo direttamente all'evidenza ecologica dei contorni occlusi.Per esempio, quando il contorno di un oggetto è occluso da un altro,si forma tipicamente un'intersezione nota come giunzione a T ( T-junction ).Il contorno continuo ( la stanghetta della T ) è interpretato come il contorno occludente,la superficie del quale occlude l'altro bordo ( la gamba della T ).Un'ulteriore assunzione è che il bordo occluso ( e la superficie delimitata da esso ) in qualche modo si connette con un altro bordo della scena.
Una delle teorie di questo gruppo è la teoria della relazionabilità di Kellman e Shipley,e si può considerare come una più complessa e specifica estensione del classico principio della buona continuazione.La teoria si basa sui seguenti quattro assunti:
1.La discontinuità dei bordi è condizione necessaria ma non sufficiente per l'interpolazione visiva
di contorni amodali.
Intuitivamente la discontinuità del bordo è un repentino cambiamento nella direzione del contorno,ed è presente in tutte le intersezioni tra contorni,come i vertici di un triangolo o gli angoli di un quadrato.Quindi le discontinuità da sole non sono in grado di produrre completamento amodale perché esso dipende dalla possibilità che la discontinuità ha di essere relazionata con altre presenti nell'immagine - da qui il nome della teoria -.
2.I contorni completati amodalmente sono percepiti quando i bordi dominanti nella discontinuità
sono relazionabili ad altri ( fig.6.4.4B ).
6.4.4
Per Kellman e Shipley due bordi sono relazionabili se e solo se:
. le loro estensioni si intersecano in un angolo di non meno di 90°
. possono essere facilmente connessi con ciascun altro bordo (fig.6.4.4B)
La figura 6.4.5 mostra tre casi di bordi relazionabili e tre non relazionabili.E' da notare che questa
Definizione determina se un dato paio di bordi sono relazionabili ma non specifica come il sistema visivo determini che bordo è percepito attualmente come relazionato con quale altro.Questa corrispondenza è importante perché un dato bordo può essere relazionato con molti altri ma solo uno può essere la sua estensione. Presumibilmente il sistema visivo tenta di trovare le migliori combinazioni rintracciando le corrispondenze che hanno la più forte relazionabilità globale.
6.4.5
3.Una nuova unità percepita si forma quando i bordi completati amodalmente formano un'area
circoscritta (6.4.4C )
Questo significa semplicemente che quando i bordi passanti per la discontinuità sono stati relazionati con ciascun altro bordo è richiesto un altro processo per determinare che insieme di bordi connessi forma un contorno chiuso (fig.6.4.4C)
4.Sono assegnate posizioni di profondità basate sulle disponibili informazioni di profondità (fig.6.4.4D).
Nel completamento ,per esempio,l'informazione di profondità dall'occlusione specifica che i bordi completati amodalmente sono dietro l'oggetto al quale terminano.
Il processo di assegnazione delle profondità è attualmente separato dallo stesso processo di formazione dell'unità,ma è incluso nella teoria perché permette agli stessi processi subordinati di rendere conto di altri fenomeni della formazione dell'unità,come i contorni illusori,la trasparenza, la scissione di figure.
Esperimenti hanno dimostrato che il processo di completamento di semplici forme geometriche,come il quadrato e il cerchio,richiedono circa 400 ms ma non si sa ancora se il processo che ha luogo in quest'arco di tempo corrisponde a quello delineato dalla teoria della relazionabilità.

6.4.2 PROFILI ILLUSORI
La prossima forma di interpolazione visiva che considereremo produce un'affascinante illusione nella quale i contorni sono visti come non esistono attualmente nell'immagine-stimolo.Tale fenomeno dei profili illusori ( o profili soggettivi )è conosciuto da molto tempo ma la moderna rinascita di interesse nei suoi confronti si deve alla dimostrazioni di Kanizsa.Uno degli esempi più conosciuti è il triangolo di Kanizsa (fig.6.4.6):il triangolo bianco che è percepito immediatamente nell'immagine è una figura illusoria, definita dai profili illusori ,in quanto l'immagine-stimolo consiste solamente nei tre Pac-man neri e nei tre segmenti di linea disposti in questo modo particolare.Inoltre molti riportano di vedere la regione interna al triangolo più luminosa della regione circostante.
6.4.6
La percezione dei profili illusori è generalmente accompagnata dal completamento amodale dagli elementi inducenti:il triangolo illusorio è dato dalla percezione dai Pac-man come dei cerchi parzialmente occlusi e dei segmenti come delle linee continuanti sotto il triangolo.Infatti se gli elementi inducenti non sono percepiti come incompleti ,non si vedrà nessun profilo o figura illusoria (fig.6.4.7) .
6.4.7
Nella parte A si percepisce un rettangolo illusorio perché gli elementi inducenti sono visti come degli ottagoni incompleti ma ,nella parte B e C,nonostante la presenza degli stessi contorni locali (cioè quelli che in A creano il rettangolo ),nessun rettangolo è percepito.La differenza è che in B gli angoli tagliati sono percepiti come parte integrante delle croci,le quali sono visibili nella loro interezza e quindi non richiedono nessuna "spiegazione" percettiva in termini di oggetti occludenti.Fattori come la simmetria e il parallelismo sembrano bloccare la percezione di profili illusori:per percepire le croci come parzialmente occluse da un rettangolo,la simmetria dovrebbe essere considerata accidentalmente derivante dallo specifico allineamento del rettangolo bianco occludente e gli elementi inducenti - cosa nel mondo reale improbabile -.Comunque la regola della simmetria non è poi così generale,in quanto anche figure asimmetriche possono non produrre contorni illusori fintantoché i lati sono paralleli (fig.6.4.7).
In ogni caso,questo contrasto dimostra molto chiaramente che le figure e i profili illusori sono fenomeni relativamente complessi che dipendono dalle locali condizioni di stimolazione.E' un buon esempio per l'affermazione della Gestalt secondo la quale ciò che viene percepito dipende in modo rilevante dalla struttura di tutta la configurazione e non può essere facilmente predetto dalla struttura locale delle singole parti.
6.4.8
La fig.6.4.8 dimostra che anche per le figure illusorie,come per quelle completate amodalmente,si ha la stessa facilità di percezione sia per quelle nuove,e quindi non familiari,che per quelle familiari.
Altri casi di profili illusori,illustrati nella fig.6.4.8,possono essere prodotti da segmenti di linee che terminano come se fossero occluse e ciò porta alla percezione di un cerchio bianco che copre un insieme di segmenti disposti a raggiera (A);o quando segmenti sono semplicemente disposti dentro e fuori il contorno illusorio (C).Kennedy ha dimostrato che per indurre la percezione di figure illusorie è importante la natura delle terminazioni delle linee:se queste si assottigliano in un punto o hanno una terminazione rotondeggiante la percezione illusoria non avviene (D).Questi dati ,quindi,concordano con l'affermazione che i profili illusori dipendono dalla percezione di occlusione.
Relazione con il completamento visivo.Abbiamo già accennato a tale relazione:gli elementi inducenti sono completati amodalmente dietro alla figura illusoria.Secondo Kellman e i suoi colleghi però, tale relazione va molto più in profondità:affermano infatti che il completamento visivo e la percezione di profili illusori sono il risultato di uno stesso insieme di processi di unità che possono essere descritti in termini di teoria della relazionabilità.
6.4.9
Molte figure illusorie possono assumere un'apparenza alternativa che produce completamento amodale invece di contorni illusori.Il triangolo di Kanizsa ( fig.6.4.9A ) può anche essere visto,sebbene con qualche difficoltà,come un triangolo bianco su uno sfondo omogeneo nero osservato attraverso tre fori circolari in una superficie occludente bianca.Questo si vede più chiaramente nella fig.6.4.9B con l'inclusione delle porzioni mancanti dei bordi dei fori.La cosa importante è che i profili illusori sono completati amodalmente dietro la superficie bianca occludente.
6.4.10
Kellman e Shipley dimostrarono inoltre che molte configurazioni di profili illusori possono essere convertite in esempi di completamento amodale attraverso una semplice procedura (fig.6.4.10):
1.Si inizia con una figura illusoria (parte A );
2.Si prendono le parti completanti gli elementi inducenti,dette completamenti,(parte B);
3.Si aggiunge una figura occludente i cui contorni seguono facilmente i bordi interni delle parti completanti gli elementi inducenti (C).
Il risultato è un esempio di completamento amodale nel quale i contorni mancanti della figura completata -precedentemente i contorni illusori- sono ora percepiti come una nuova figura.
Ma se è effettivamente come Kellman afferma (cioè che profili illusori e completamento amodale sono due manifestazioni differenti dello stesso insieme di processi sottostanti),perché allora gli esempi dei due fenomeni sono così diversi?
La risposta è nel quarto assunto della teoria della relazionabilità,quella riguardante cioè le relazioni di profondità tra le figure in questione:se i contorni mancanti sono parte della figura che occlude,allora saranno percepiti come contorni illusori;se invece sono parte della più lontana figura occlusa,saranno completati amodalmente dietro la figura occludente.
Basi fisiologiche dei profili illusori.Recenti ricerche sulla fisiologia corticale hanno identificato delle cellule nell'area V2 che sembrano rispondere alla presentazione di figure illusorie ed inizialmente il loro campo recettivo non appare differente da quello in V1 (vedi sezione 4.1.2).Accurate ricerche di von der Heyt hanno mostrato che circa il 40% delle cellule di orientamento selettivo in V2 scaricano quando sono stati presentati stimoli che inducono profili illusori nella percezione umana.La fig.6.4.11 mostra degli esempi del tipo di stimoli usati negli esperimenti.Prima veniva registrata l'attivazione di ogni cellula per la presentazione di una barra bianca disposta in 16 diversi orientamenti ( fig.6.4.11A) e se la risposta era selettiva per un orientamento -come mostra il profilo nella fig.6.4.12- allora si registravano le risposte anche per la presentazione di profili illusori (fig.6.4.11B).Trovarono così che molte cellule,come si vede dal grafico,reagivano a tali stimoli illusori(anche se la frequenza di scarica per stimoli reali e illusori era per alcune cellule molto simile ma per altre diversa).
6.4.11
6.4.12
Come possono tali cellule produrre riposte per tali stimoli?
Ci sono molte possibilità ed una teoria è quella soprannomina cellule contorno quelle che integrano l'output del numero di cellule orientate in V1 (fig.6.4.13).Un tipo di input proviene dalle cellule V1 semplici o complesse,l'altro tipo da un gruppo di cellule V1 autoterminanti orientate ortogonalmente,le cui terminazioni inibitorie sono allineate lungo il favorito orientamento del contorno.
6.4.13
Questa teoria non fornisce una completa spiegazione dei profili illusori ma solo un plausibile meccanismo per spiegare come le risposte delle cellule contorno V2 possono essere derivate dall'output delle cellule V1.In particolare non spiega perché la figura illusoria compaia di fronte agli elementi inducenti e perché la fig.6.4.7A produce profili illusori e la fig.6.4.7B no.Quindi per
rendere conto di questo importante fenomeno c'è bisogno di una teoria più complessa.

6.4.3 TRASPARENZA PERCEPITA
Un altro fenomeno dell'organizzazione percettiva che è strettamente collegato con il completamento amodale e i profili illusori è quello della trasparenza percepita:cioè la percezione di un oggetto come fosse visto attraverso un altro oggetto traslucido e occludente (traslucido è un oggetto che trasmette una porzione della luce riflessa da altri oggetti piuttosto che rifletterla o assorbirla tutta).La percezione di trasparenza dipende sia dalle condizioni spaziali che da quelle cromatiche e la violazione delle relazioni tra queste due qualità è sufficiente per bloccarla.
Nei casi in cui invece è percepita,avviene un fenomeno chiamato scissione del colore o separazione del colore che porta a percepire i colori dell'immagine come una combinazione di altri due colori:uno appartenente allo sfondo e l'altro alla superficie traslucida.La scissione non avviene se le relazioni spaziali o cromatiche non sono state rispettate:se la superficie traslucida giace completamente in una regione di singola riflettanza (fig.6.4.14B ) l'immagine è percepita come una sola superficie opaca contenente regioni di diversa riflettanza,ma nessuna traccia di trasparenza.La percezione di trasparenza può essere anche bloccata distruggendo l'unità percettiva della regione traslucida (fig.6.4.14C ) o semplicemente indebolendola (fig.6.4.14D ).
6.4.14
Esaminiamo ora brevemente le relazioni di colore richieste per la percezione di trasparenza.In una semplice immagine a due superfici ,come quella che stiamo considerando,ci sono quattro regioni spaziali (fig.6.4.15):due di queste regioni (A e B) hanno due diverse riflettanze rispetto alle regioni sottostanti,che sono superfici opache;le altre due regioni (C e D) mostrano queste stesse riflettanze sottostanti come filtrate attraverso la superficie traslucida.Il problema che la scissione del colore presenta al sistema visivo è che una sola immagine di colore è realmente presente in ciascuna delle due regioni della parte sovrapposta (C e D),ma due colori ambientali superficiali sono presenti in entrambe le regioni:una per lo sfondo e una per lo strato trasparente.
6.4.15
Le informazioni addizionali richieste per risolvere il problema provengono dall'assunzione euristica concernente le relazioni tra colori nel contesto spaziale circostante.Il ruolo critico del contesto può essere semplicemente dimostrato osservando le due regioni sovrastanti attraverso uno schermo di riduzione :in questo caso nessuna scissione o trasparenza sarà percepita.Quindi lo schermo di riduzione può in qualche modo rimuovere le informazioni cruciali che permettono a tali fenomeni di accadere.
Qualitativamente possiamo dire che il colore percepito in entrambe le regioni sovrapposte (C e D)è
è separato in due componenti:una dallo strato trasparente e una dallo strato opaco.Se possono essere separate in modo tale che le componenti adatte allo strato trasparente sono le stesse,allora la scissione del colore può essere esperita e la trasparenza percepita.Secondo Metelli e Gerbino la trasparenza richiede che la regione delle parti sovrapposte sia intermedia tra la lightness dello strato opaco e quella dello strato traslucido:se lo strato opaco è per esempio nero e quello traslucido di un grigio medio,il risultato ottenuto nella regione della parte sovrapposta sarà grigio scuro.

6.4.4 SCISSIONE DELLE FIGURE
E' il fenomeno finale che discuteremo come esempio di interpolazione visiva.Nella scissione delle figure una sola regione omogenea è percettivamente separata in due figure dello stesso colore ,dove una è sovrapposta all'altra (fig.6.4.16).
6.4.16
Questo fenomeno ha diversi aspetti interessanti:
1.Indeterminazione.Non c'è locale informazione sensoriale che richieda che una regione uniforme sia divisa (cioè non ci sono né bordi né luminanze diverse che possano giustificare la scissione )
2.Profili illusori.Il sistema visivo ricostruisce i contorni mancanti dove si aspetta di trovarli,perciò quando avviene le scissione i profili illusori compaiono nella regione interna dove la figura occludente nasconde la più lontana.
3.Completamento.Una volta che i profili illusori della figura occludente sono stati formati,il sistema visivo completa le porzioni della figura più lontana che sono nascosti da quella occludente.
4.Ambiguità.Le condizioni dello stimolo non determinano quale figura è di fronte e quale invece è dietro,quindi entrambe possono essere percepite
5.Multistabilità.Dopo che tali immagini sono state fissate per un certo periodo di tempo,le relazioni di profondità fra le due parti si ribaltano spontaneamente.
Le strette relazioni tra i quattro fenomeni organizzativi che sono stati discussi -completamento amodale,profili illusori,scissione figurale e trasparenza percepita - sono illustrati rispettivamente nella figura 6.4.17 per una singola configurazione spaziale di bordi.
6.4.17

6.4.5 PRINCIPIO DI NON ACCIDENTALITA'
Molti dei fenomeni dell'organizzazione percettiva possono essere compresi all'interno della prospettiva generale della non accidentalità ( o genericità ):cioè il sistema visivo evita di interpretare regolarità strutturali come provenienti da improbabili irregolarità di percezione,usualmente dalla violazione dell'assunzione di un generale punto di vista.In letteratura quest'idea fu discussa per la prima volta da Irvin Rock come il rigetto del principio di coincidenza:molti fenomeni dell'organizzazione percettiva si possono spiegare presupponendo che il sistema visivo rigetta le interpretazioni nelle quali le proprietà dell'immagine retinica sono dovute a coincidenza di qualche tipo.
Simili idee furono proposte all'interno di una struttura computazionale da Lowe e poi riprese da altri.Ecco alcuni esempi dell'applicazione del principio di non accidentalità:può succedere che due regioni che si muovono nella stessa direzione e allo stesso ritmo appartengano a due oggetti diversi che per coincidenza si spostano nello stesso modo ,ma ciò è più improbabile rispetto al fatto che siano parti di uno stesso oggetto.Se sono effettivamente parti di oggetti separati,la similarità del loro movimento può essere accidentale,se invece sono parti dello stesso oggetto non lo è,e il sistema visivo preferisce l'interpretazione non accidentale.
Lo stesso vale per la buona continuazione:noi percepiamo che i segmenti della X (fig.6.4.18A )sono due linee piuttosto che due angoli accidentalmente allineati sui loro vertici perché quest'ultima è una coincidenza molto improbabile.

6.4.18
Un modo per esaminare che interpretazione sia dovuta in misura minore a coincidenze è esaminare le conseguenze di leggeri cambiamenti nella posizione degli oggetti o nel punto di vista dell'osservatore.Muovendo leggermente i due segmenti (fig.6.4.18B ) cambiano solo i più piccoli dettagli della figura,ma muovendo i due i due angoli ( fig.6.4.18C ) cambia in modo considerevole.E' comunque logicamente possibile che la continuità dei segmenti sia una coincidenza dell'allineamento di due angoli,ma è molto più è probabile che siano allineati perchè continuazione dello stesso oggetto ambientale.
Palmer inoltre afferma che regioni simmetriche o parallele tendono ad essere viste come figure in quanto gli oggetti sono molto più probabilmente simmetrici o paralleli rispetto alla spazio che li separa (il quale può essere parallelo o simmetrico principalmente grazie a coincidenze straordinarie).
Simili analisi possono essere fatte per il completamento amodale,trasparenza percepita e le figure illusorie.E' possibile naturalmente che le regioni visibili nella fig.6.4.19A siano un mosaico di forme precisamente allineate,ma questo richiede un maggior arrangiamento accidentale di quello necessario se fosse un quadrato occluso da un cerchio.Inoltre muovendo i due oggetti.mosaico si producono cambiamenti qualitativi nella configurazione (fig.6.4.19C ) maggiori rispetto a quelli prodotti muovendo le due figure sovrapposte (fig.6.4.19B ).perciò la configurazione accidentale richiede maggior precisione di allineamento rispetto a quella non accidentale e lo stesso vale per i fenomeni di trasparenza percepita e profili illusori.
6.4.19
Il principio di non accidentalità può essere visto come una particolare versione del principio di verosimiglianza di Helmotz,secondo il quale il sistema visivo percepisce la situazione come è più probabile sia stata originata da un particolare pattern di stimoli sulla retina.
La spiegazione alternativa più importante è il principio di pregnanza:la percezione sarà più "buona" più le condizioni prevalenti lo permettono massimizzando la semplicità e la regolarità piuttosto che la verosimiglianza.

6.5 MULTISTABILITA'

Nella maggior parte delle scene naturali c'è una singola organizzazione che domina completamente la percezione,ma esempi accuratamente scelti illustrano la possibilità di arrivare a differenti organizzazioni per la stessa immagine,organizzazione che possono cambiare profondamente la nostra esperienza (Wertheimer,1923 )
Esempi come il cubo di Necker,facce/vaso,anatra/coniglio (vedi fig.1.1.5 ) non solo producono più di una percezione ma sono anche percezioni multistabili :percezioni cioè che spontaneamente si alternano tra due o tre diverse interpretazioni una volta che sono state viste.
La teoria maggiormente accettata per spiegare tale fenomeno è l'ipotesi dell'affaticamento neurale proposta da Kolher ,secondo la quale la percezione di figure ambigue si alterna tra differenti interpretazioni a causa di diversi set di neuroni che diventano "stanchi" di scaricare dopo che l'hanno fatto per un lungo periodo di tempo.Le sottostanti assunzioni teoriche sono
1.Differenti interpretazioni sono rappresentate da diversi pattern di attivazione neurale;
2.La percezione corrisponde a qualunque pattern di attivazione è più attivo in quel momento;
3.La fatica neurale causa diversi pattern di attivazione che dominano in momenti differenti.

6.5.1 I MODELLI CONNESSIONISTI DELLA RETE
Per rendere più concreta l'ipotesi,supponiamo che i diversi pattern di attività neurale possano essere identificati nel ritmo di scarica di due differente reti neurali e che quando una rete diventa più attiva di un'altra,la corrispondente interpretazione sorge nella percezione conscia.Tale percezione fa sì
che i neuroni all'interno della rete si affatichino :cioè il loro livello di attività decresce perché c'è stata una deplezione dei loro neurotrasmettitori a causa delle continue scariche .A questo punto la percezione cosciente si sposta rapidamente dalla prima alla seconda interpretazione.
6.5.1
La fig.6.5.1 mostra il modello connessionista per la percezione del cubo di Necker,che è formato da due sottoreti collegate ,corrispondenti alle due differenti interpretazioni:la sottorete di destra rappresenta le percezione del cubo visto dall'alto,e quella di sinistra il cubo visto dal basso.
Ciascun nodo rappresenta l'interpretazione di un particolare vertice dell'immagine come un particolare angolo del cubo a 3-D ed è contrassegnato in base alla sua posizione:davanti o dietro ( F o B ), più alto o più basso (U o L),destra o sinistra (R o L ).
Le due differenti interpretazioni percettive del cubo nascono perché c'è ambiguità nell'interpretazione della profondità dei vertici e questa si riflette nelle due diverse etichette dei nodi corrispondenti nelle due sottoreti:infatti entrambi i nodi sono attivati dalla medesima informazione sensoriale proveniente dal vertice appropriato.
Il comportamento di questa rete esemplifica la bistabilità:l'attivazione si diffonde in modo dinamico attraverso la rete e alla fine si stabilisce in uno dei due stati corrispondenti alle due diverse sottoreti.La bistabilità deriva dall'architettura della rete:in questo caso è tale da produrre cooperazione tra coppie di nodi (attraverso mutua eccitazione ) mentre produce competizione tra altre ( attraverso mutua inibizione ).
Cooperazione:Quando due nodi sono connessi da legami di mutua eccitazione l'attivazione di uno tende ad incrementare l'attivazione dell'altro.Nel nostro esempio tali legami sono presenti tra nodi adiacenti all'interno della stessa sottorete (le frecce continue nel disegno ) e questo fa sì che quando un nodo di una data interpretazione è attivato,l'attivazione si diffonde prima ai nodi adiacenti e alla fine a tutti i nodi della sottorete.Queste connessioni rendono quindi la sottorete funzionante come un'unità coesa che tende a fissarsi in uno stato nel quale o tutti i suoi nodi sono attivi o non lo è nessuno.
Competizione:Quando due nodi sono connessi da un legame di mutuamente inibitorio l'attivazione di uno tende a far diminuire quella di un altro.Questa architettura è anche soprannominata "il vincitore prende tutta la rete".Tali legami nel nostro esempio sono presenti tra nodi corrispondenti nelle due diverse sottoreti dove il nodo più attivo della coppia riduce l'attivazione dell'altro più di quanto questo non lo inibisca:alla fine quindi solo l'unità più attiva scarica.Il risultato è perciò la competizione tra interpretazioni mutuamente esclusive dello stesso vertice.
Insieme questi due tipi di connessioni producono una rete completa nella quale l'attivazione tende a fissarsi in uno solo dei due stati possibili dove solo tutti i nodi di una sottorete sono attivi ( o quella di destra o quella di sinistra nel nostro esempio ) e questa mutua esclusività porta ad esperire una sola interpretazione in un dato momento ,quindi mai entrambe contemporaneamente.
Senza qualche fattore addizionale,però,non ci sarà vera multistabilità perché la rete,una volta stabilizzata in una stato ,tenderà a rimanervi se non ci sono modificazioni nello stimolo.Per spiegare perciò l'alternanza tra interpretazioni è necessario il meccanismo dell'affaticamento neurale.

6.5.2 AFFATICAMENTO NEURALE
I neuroni tendono a scaricare con minor intensità dopo un periodo di stimolazione prolungata perché le risorse biochimiche necessarie per continuare la scarica cominciano ad esaurirsi.Per capire come questo fenomeno causi la multistabilità,consideriamo la rete semplificata nella fig.6.5.2A .
6.5.2
Supponiamo che l'unità X è all'inizio leggermente più attiva dell'unità Y,quindi la inibisce più di quanto Y non la inibisca:abbiamo perciò che X diventa relativamente più attiva e Y relativamente meno attiva.Questa supremazia di X diventa più pronunciata con il tempo fino a quando la sua attivazione non giunge al massimo e quella di Y al minimo (fig.6.5.2B ) e ciò è dovuto alle connessioni mutuamente inibitorie tra i due nodi.
Dopo un certo periodo di tempo,però,X comincia a scaricare più debolmente a causa dell'affaticamento,riducendo quindi la sua forza inibitoria su Y:a questo punto l'attivazione di Y si innalza tanto quanto quella di X si abbassa fino a quando Y ( che ha ancora a disposizione le sue risorse ) diventa più attiva di X e la inibisce.
L'alternanza fra la dominanza di X e Y in teoria può continuare all'infinito.
Lo stesso comportamento altalenante avviene nella più complessa rete del cubo di Necker,dove X e Y sono le due sottoreti:inizialmente una guadagna la più alta posizione e muove verso la sua massima attivazione,la fatica allora comincia ad instaurarsi e riduce la sua dominanza fino a quando l'altra sottorete non subentra e sale alla sua massima attivazione.
Sono quindi tre gli elementi critici:
1.Mutua eccitazione all'interno di ciascuna sottorete che la porta ad agire come un'unità coesa;
2.Mutua inibizione tra le sottoreti che crea competizione;
3.Affaticamento neurale che produce l'alternanza.
I dati provenienti dagli esperimenti supportano le previsioni derivanti da tale teoria.

6.5.3 FISSAZIONI DELL'OCCHIO
Malgrado i successi ottenuti,l'ipotesi dell'affaticamento è stata contestata e l'idea alternativa è che il ribaltamento delle interpretazioni è causato dai movimenti oculari verso differenti punti di fissazione. In genere,nel cubo di Necker,il vertice fissato tende ad essere percepito come il più vicino.Ulteriori studi comunque,sono giunti a risultati diversi;infatti immagini consecutive e perfino immagini stabilizzate del cubo di Necker sono state trovate opposte a quelle previste.Inoltre c'è evidenza sperimentale per il fatto che i movimenti oculari possono essere il risultato del rovesciamento e non la causa.
Ricerche più recenti di Peterson e Hochbey hanno comunque confermato che l'informazione locale sulla posizione in cui l'occhio è fissato esercita un'influenza sproporzionatamente forte su ciò che è percepito.Inoltre è stato dimostrato l'effetto dell'intenzione del soggetto di percepire una data interpretazione e come tale interpretazione interagisce con la posizione di fissazione.
Ai loro soggetti fu presentata una versione modificata del cubo di Necker che aveva un vertice ambiguo e uno non ambiguo (fig.6.5.3 ),veniva quindi detto loro di fissare uno dei due vertici.Dovevano poi tenere a mente la percezione che ne derivava mentre fissavano o la linea verticale o quella orizzontale posta di fronte al vertice guardato in precedenza. I risultati dimostrarono che i soggetti furono influenzati sia dal vertice fissato che dalle istruzioni di tenere a mente una particolare interpretazione.
6.5.3

6.5.4 RUOLO DELLE ISTRUZIONI
Irvin Rock ha messo in dubbio che il meccanismo dell'affaticamento neurale sia sufficiente per spiegare la multistabilità.Egli afferma che in tutte le ricerche precedenti gli sperimentatori hanno informato i soggetti anticipatamente sulle due percezioni alternative.Ma cosa succede se un soggetto naive non è istruito sulla natura delle due differenti interpretazioni prima di vedere la figura ambigua? Saranno percepite entrambe o si alterneranno (come secondo la teoria della fatica neurale) o semplicemente percepiranno qualsiasi interpretazione verrà raggiunta per rima?
6.5.4
Rock e Martin mostrarono ai loro soggetti tre figure ambigue (come quelle nella fig.6.5.4A ) senza fornire alcuna istruzione sulle varie interpretazioni possibili e ai soggetti fu quindi chiesto se ne avessero visto più di una .La risposta fu negativa,anche quando furono mostrate le differenti interpretazioni per aiutarli.Al contrario,una volta date le istruzioni-standard,tutti riportarono di vedere frequenti capovolgimenti. I risultati quindi non confermano l'affaticamento neurale.
Ritornando al modello neurale del cubo di Necker,furono richieste due condizioni addizionali affinché la rete fosse multistabile:
1.Le interpretazioni alternative devono essere rappresentate all'interno di due sottoreti cooperative
internamente e
2.Tali sottoreti devono competere con le altre attraverso la mutua inibizione.
Le implicazioni per gli osservatori umani sono che:
1.I soggetti devono aver percepito le due interpretazioni alternative precedentemente affinché siano
disponibili;
2.I soggetti devono realizzare ( a livello percettivo ) relazioni mutuamente esclusive e competitive
fra le interpretazioni alternative.
Queste condizioni sono proprio ciò che le condizioni sperimentali standard assicurano e proprio ciò che è volutamente mancato negli esperimenti di Rock.Non sorprendono quindi i sui risultati ,anzi,la cosa sorprendente è stato trovare soggetti che esperiscano i ribaltamenti in quelle condizioni.
Forse tali soggetti adulti non erano completamente naive,o pur essendolo, "sospettavano",data la richiesta degli sperimentatori di fissare la figura,che qualcosa sarebbe successo all'immagine.
I bambini ,invece,che parteciparono agli esperimenti di Rock non percepirono alcun ribaltamento .
In ogni caso non sono ancora chiare le condizioni in cui il sistema visivo possa spontaneamente organizzare interpretazioni alternative di un'immagine per la quale ne ha già una pienamente vitale e valida.

6.6 SVILUPPO DELL'ORGANIZZAZIONE PERCETTIVA

I teorici empiristi affermano che il mondo visivo di un bambino appena nato è completamente non organizzato e che tutta l'organizzazione nasce dall'esperienza .I teorici della Gestalt,al contrario,affermano che la maggior parte dei processi di base dell'organizzazione percettiva operano dalla nascita e quindi non necessitano di essere appresi .C'è comunque una terza alternativa secondo la quale i processi organizzativi nono sono presenti dalla nascita ma si sviluppano in modo predeterminato mano a mano che il bambino matura.
Ora che sappiamo qualcosa sull'organizzazione percettiva negli adulti possiamo chiederci quale di queste tre teorie è applicabile ai processi infantili di organizzazione.

6.6.1 IL PARADIGMA DELL'ABITUAZIONE
Rispondere alla domanda che ci siamo posti non è così semplice perché ovviamente i neonati non possono descrivere le loro esperienze visive - almeno non in modo diretto -.
Il problema dell'organizzazione nella visione infantile è stato studiato in modo esteso da Kellman e Spelke utilizzando il paradigma dell'abituazione ( habituation paradigm ).In questa procedura i bambini sono esposti inizialmente ad uno stimolo nuovo e vengono lasciati liberi di guardarlo;viene quindi misurato il tempo di osservazione per questo stimolo durante una serie di prove.Come ci si poteva aspettare,il tempo di osservazione diminuisce in successive serie di prove,mano a mano cioè che il bambino si abitua allo stimolo.A questo punto vengono presentate altre due immagini:una è lo stimolo oramai familiare,l'altra è invece nuova e si misura il tempo di osservazione per ciascuna figura.In base ai risultati si è visto che persino in bambini molto piccoli il tempo dedicato alla figura nuova è maggiore di quello dedicato alla figura familiare e questo è il fenomeno conosciuto come disabituazione ( dishabituation ).
Questa tecnica fu applicata al problema dell'organizzazione percettiva nei bambini da Kellman e Spelke:nel loro esperimento il display iniziale al quale i bambini si abituavano (habituation display )
Era ambiguo perché mostrava una barra inclinata parzialmente occlusa da un rettangolo (fig.6.6.1)
6.6.1
La domanda cruciale era se i bambini percepivano le due terminazioni come connesse dietro il rettangolo occludente e quindi come un oggetto unico o no.Per rispondere a tale quesito,i bambini furono testati con due display non occlusi ( test-display ):uno rappresentava una barra intera e l'altro due frammenti disconnessi,con uno spazio in corrispondenza della porzione del rettangolo occludente nell'habituation display.
Se i bambini avevano percepito il display iniziale come un singolo oggetto occluso,il loro tempo di osservazione avrebbe dovuto essere maggiore per l'immagine test frammentata (B) perché diversa e quindi avrebbero dovuto dimostrare disabituazione oer quello stimolo.

6.6.2 SVILUPPO DELL'ORGANIZZAZIONE PERCETTIVA
Quale dei due test-display i bambini guardino di più dipende sia dai fattori particolari di raggruppamento presenti nel display di abitazione che dall'età del bambino.
Se ai soggetti di quattro mesi sono mostrati i display statici della fig.6.6.1,all'inizio non passeranno molto tempo a guardarli e non mostreranno particolari preferenze per nessuno dei test-display (i dati del tempo di osservazione sono raffigurati nella fig.6.6.2A)

6.6.2
Ma se agli stessi bambini sono presentati display che si muovono,nei quali le due estremità della barra oscillano avanti e indietro in un movimento comune,avranno un tipo di risposta completamente differente (fig.6.6.2B ):dopo che c'è stata abitazione mostreranno una preferenza molto forte nel guardare il test-display frammentato -che viene quindi considerato nuovo - .Allora possiamo concludere che i bambini percepiscono l'habituation-display occluso come un singolo oggetto nella condizione test di movimento,ma non nella condizione di staticità dell'oggetto.
Si è notato inoltre che qualunque movimento uniforme di traslazione produce questo risultato,anche se le due estremità occluse nel display sono piuttosto differenti nella forma,nel colore,nella trama e nelle dimensioni ( fig.6.6.3 ).
6.6.3
Perciò quello che Wertheimer ha chiamato "destino comune" sembra essere un principio molto importante nell'organizzazione percettiva in bambini di quattro mesi.Questo ovviamente non prova che tale principio sia innato, in quanto i bambini possono averlo appreso in qualche maniera,comunque sia è chiaramente presente in modo precoce nell'infanzia,molto prima di quanto i ricercatori non si aspettassero.
Altri classici fattori di raggruppamento non producono invece gli stessi risultati:se l'habituation display contiene due parti stazionarie simili per colore,dimensione,orientamento,trama ed hanno una buona continuazione dei bordi attraverso l'oggetto occludente ( fig.6.6.4) ,

6.6.4
i bambini non mostrano alcuna preferenza per un particolare test-display.Questo indica che i bambini di quattro mesi non usano tali fattori statici di raggruppamento per completare le due terminazioni visibili.Appare allora che,contrariamente alle credenze gestaltiste,i fattori di raggruppamento statici non sono abilità innate ma apprese attraverso l'esperienza di interazione con il modo circostante o si sviluppano in modo spontaneo con la crescita del bambino.
Quando questi fattori statici diventano allora operanti?
Spelke riporta che bambini di cinque mesi ai quali erano stati presentati i due habituation-display della fig.6.6.4,mostravano mostravano disabituazione per tutti e due i test-display.A sette mesi,comunque,i bambini abituati al display A (colore omogeneo e bordi allineati ) si disabituavano di più per il test-display frammentato che per quello unitario.
L'abilità perciò di utilizzare la buona continuazione e la similarità di colore come informazioni che influenzano la creazione di unità sembra svilupparsi tra i cinque e i sette mesi. I risultati,infatti, non possono essere spiegati con una inabilità nel discriminare tali proprietà perché si è dimostrato che bambini più giovani dei soggetti usati sono in grado di percepire omogeneità o disomogeneità nella colorazione delle superfici,anche se non riescono a realizzare che tali proprietà sono rilevanti per la formazione di unità.
Ci si può ora chiedere se la primaria importanza data al destino comune sia basata sul movimento nell'immagine retinica o sul movimento dell'oggetto nel mondo.
Kellman, Gleitman e Spelke fecero un interessante esperimento:posizionarono il bambino in un sedile che poteva stare fermo o muoversi ,a seconda della condizioni sperimentali,per controllare sia il movimento dell'osservatore che quello dell'oggetto.La fig.6.6.5 mostra le quattro condizioni sperimentali:
6.6.5
A.oggetto e osservatore fermi;
B.oggetto in movimento e osservatore fermo;
C.oggetto fermo e osservatore in movimento;
D.oggetto e osservatore in movimento.
I risultati mostrarono che i bambini si disabituavano solo quando era l'oggetto ad essere in movimento (condizioni B e D ).
Da queste e altre scoperte,Spelke dimostrò che né la rigida versione empirista né quella nativista sono corrette.Suggerisce piuttosto che i bambini nascono con un primitivo meccanismo per raggruppare parti disconnesse di oggetti che dipende esclusivamente da come queste si muovono nel mondo,cioè dal principio del destino comune,Questo li rende in grado di organizzare correttamente le loro esperienze visive negli oggetti,almeno in circostanze favorevoli.Come risulta dalle loro precedenti esperienze di organizzazione,apprendono che gli oggetti definiti tendono ad avere altre proprietà correlate le quali sono molto utili nella definizione della loro unità,come contorni,colori e trama omogenei.Questa conoscenza forma quindi le basi per estendere le condizioni che portano alla veridica organizzazione degli oggetti fino a che i bambini eventualmente acquisiscono la competenza che definisce le performance negli adulti.
Questa teoria non è probabilmente sufficiente in quanto altri esperimenti mostrarono che neonati testati con display in movimento come quelli nella fig.6.6.1,guardarono di più il bastone completo rispetto a quello frammentato,il che si oppone alle predizioni della teoria di Spelke.
In conclusione,noi ora sappiamo che i processi organizzativi sono presenti molto più precocemente di quanto la maggior parte degli empiristi avrebbe potuto supporre,ma tali processi non appaiono essere innati.Forse qualche spiegazione di tipo maturativi risulterà,dopotutto,essere corretta

Collaborators

I am the leader of the Neuromorphics Lab, a highly collaborative lab with connections across both academia and industry.