Hvordan fungerer menneskets persepsjon?
Vi får hele tiden en stor mengde stimuli fra miljøet rundt oss gjennom sansene våre, denne informasjonen må vi gjenkjenne, organisere og skape mening ut fra. Når vi ser på et objekt fyrer fotoreseptorceller i retina, nerveimpulser sendes til hjernen, hjernen tolker og organiserer nerveimpulsene og forsøker å forme et sammenhengende bilde av hva som er foran oss. Sansene gjør oss i stand til å se, høre, smake, lukte og føle verden rundt oss, men hvordan klarer hjernen vår å gjøre disse inntrykkene til et sammenhengende bilde som gir mening? Hvor slutter persepsjonen og hvor starter kognisjonen? Og hva er forholdet mellom disse?
Persepsjonsprosessen er kompleks. Mennesket har evnen til å oppfatte at et objekt har en stabil form, på tross av at bilde vi får på retina er helt ulikt fra ulik avstand eller retning. Dette gjør oss selvfølgelig bedre i stand til å gjenkjenne objekter, men det gjør også at vi kan lese håndskrift eller bokstaver som har ulik font. Selv om versjoner av bokstaven ‘A’ ser helt ulike ut kan vi med letthet kjenne den igjen. Det kan virke enkelt for oss, men datateknologien viser hvor komplisert denne prosessen faktisk er. Det er så vanskelig å få en datamaskin til å lese håndskrift, at CAPTCHAs (Completely Automated Public Turing Test to Tell Computers and Humans Apart) ble utviklet som en metode for å skille mellom mennesker og datamaskiner. For å forstå persepsjonsprosessen bedre kan vi se på noen av hovedteoriene som forklarer hvordan persepsjon fungerer.
Bottom-up og top-down
Teoriene deles ofte inn i to hovedkategorier, bottom-up teorier og top-down teorier. Bottom-up teoriene ser på persepsjon som data-drevet, det vil si at vi får informasjon om det ytre objektet gjennom sansene våre. Top-down teoriene legger derimot vekt på at vi ikke er nøytrale observatører, vi er farget av kunnskap, regler, forventninger og erfaringer, noe som påvirker hvordan vi oppfatter det ytre objektet. Dermed kan vi si at vi konstruerer et bilde av det ytre objektet i hjernen. La oss se nærmere på disse hovedteoriene, hvordan forklarer de persepsjonsprosessen? Hva støtter opp om dem og hva er de kritisert for?
James J. Gibsons introduserte et nyttig rammeverk for å forstå persepsjonsprosessen, med begrepene distalt objekt, informasjonsmedium, proximal stimulasjon og perseptuelt objekt. Det distale objektet er et objekt i den eksterne verden, for eksempel et hus. Dette objektet skaper et mønster via et informasjonsmedium, for eksempel refleksjoner av lysbølger. Lysbølgene fører til en proximal stimulasjon, for eksempel fyring fotoreseptorceller i retina. Dette vil i sin tur skape et perseptuelt objekt, altså et indre bilde av huset. Gibsons teori om direkte persepsjon er et godt eksempel på en teori som faller innenfor bottom-up kategorien. Gibson mente at alt av nødvendig informasjon for persepsjon er tilgjengelig i omgivelsene våre, reseptorene i sansene våre og ikke minst i den sensoriske konteksten. Kontekstuell informasjon gjør at vi kan oppfatte dybde, for eksempel ved at vi ser flere detaljer på figurer som er nært enn figurer som er langt unna. Gibson mente derfor at intelligent tankegang ikke var nødvendig for persepsjon, men at omgivelsene sørger for den informasjonen vi trenger for å persipere direkte. Gibson mente at informasjonen fra omgivelsene var vanskelig å kontrollere i en eksperimentell setting, men at den var lett tilgjengelig i den virkelige verden. Gibsons teori kalles derfor også for økologisk persepsjon.
Elanor Gibson forsket på persepsjon hos spedbarn, og observerte at dybdepersepsjon utviklet seg tidlig, noe som støtter opp om Gibsons teori om at persepsjon er direkte og ikke nødvendigvis avhengig av intelligent tankegang. Nyere forskning innen nevrovitenskap kan også tyde på direkte persepsjon. Det er identifisert egne nervebaner for å prosessere farge, form og tekstur, disse refereres ofte til som «what-pathways». Oppdagelsen av såkalte speilnevroner tyder på at vi kan forstå ansiktsuttrykk, følelser og bevegelser lenge før vi har fått tid til å tenke ut en hypotese om hva det er vi ser på. Speilnevroner fyrer både når vi utfører en bevegelse og når vi ser at andre utfører den sammen bevegelsen, speilnevronene fyrer så raskt som mellom 30 til 100 millisekunder etter en visuell stimulus.
Vi vet at visuelle stimuli sender signaler til hjernen vår, men oppfatter vi bare en refleksjon av det distale objektet eller har våre erfaringer og forventninger også noe å si for hvordan vi oppfatter verden? Top-down teoriene legger vekt på læring og intelligens i forklaringen av persepsjon. Mange forskere innenfor den strukturalistiske tradisjonen har forsøkt å forske på introspeksjon uavhengig av tidligere kunnskap, noe som har vist seg å være umulig. Ifølge konstruktivistisk teori om persepsjon lager vi hele tiden hypoteser basert på det vi ser, det vi vet fra før og det vi kan anta basert på høyere kognitive prosesser. Konstruktiv persepsjon er en teori innenfor top-down kategorien, tilhengerne av denne teorien forklarer persepsjonsprosessen som at vi konstruerer en kognitiv forståelse av en stimulus. Vi kan «se» mye, men hva vi kan gjenkjenne blir prosessert av intelligensen vår, dette er bakgrunnen for at denne teorien også noen ganger kalles for intelligent persepsjon. For eksempel ser vi at gresset er grønt selv om det er så mørkt at fotoreseptorcellene i øyet vårt ikke er i stand til å oppfatte farge, fordi vi har en erfaring og forventning om at det skal være grønt. Richard og Roslyn Warren demonstrerte dette fenomenet som ofte refereres til som konteksteffekter i et eksperiment i 1970. De fant ut at dersom man erstattet et fonem i en setning med en hostelyd, ville de som hørte på opptaket oppfatte lyden slik at setningen ga mening. For eksempel: “It was found that the *eel was on the axle”, “It was found that the *eel was on the shoe”. I den første setningen ble det manglende fonemet oppfattet som en «w», mens det i den andre setningen ble oppfatte som en «h». Dette eksperimentet viser at vi benytter oss av kunnskap og erfaring i persepsjonsprosessen, og peker også på at dette kan være en mekanisme som hjelper oss å skape mening i det som ellers ville vært kaos.
Top-down teoriene har fått kritikk for å undervurdere hvor viktig og komplett informasjon vi får fra sansene våre. Bottom-up teoriene blir derimot kritisert for å ikke ha noen god forklaring på konteksteffekter, hvorfor har vi lettere for å kjenne igjen objekter i et miljø der vi forventer å finne dem? Tyder ikke dette på at forventning og kunnskap også må spille en rolle i persepsjon? Dersom vi ikke benytter oss av den informasjonen vi har lagret i hukommelsen vår, hvorfor har vi da lagret den? Samtidig kan vi tenke oss at dersom sanseinntrykkene spilte en så liten rolle som top-down teoriene hevder, ville vi være tilbøyelig til å gjøre mange feilvurderinger fordi vi ikke brukte den informasjonen vi fikk fra sansene.
Det finnes empirisk støtte for begge hovedkategoriene. Selv om disse teoriene gir oss viktig innsikt i persepsjonsprosessen, er ingen av dem ideelle for å forklare hvordan persepsjon fungerer. Persepsjon er en kompleks prosess og selv om vi vet mye mangler vi fremdeles en komplett teori som gir oss en god forklaringsmodell. Top-down og bottom-up teoriene kan virke som motsetninger, men kanskje kan vi få et bedre bilde på hvordan persepsjonsprosessen fungerer hvis vi ser på dem som teorier som utfyller hverandre? Sanseinntrykkene gir kanskje mer tydelig og viktig informasjon enn den konstruktive persepsjonsteorien legger til grunn. Samtidig kan kanskje forventning, erfaring og tanker spille en større rolle for persepsjon enn det Gibsons teori om direkte persepsjon gir den ære for. I senere tid har man fokusert mer på hvordan disse teoriene henger sammen og påvirker vår evne til persepsjon. Det virker sannsynlig at vi benytter oss av en kombinasjon av sanseinntrykk og tidligere erfaringer for å skape et helhetlig bilde av omgivelsene våre. I fremtiden vil vi kanskje få en mer integrert teori for persepsjon som inneholder elementer fra både top-down og bottom-up teoriene.