Kako se v možganih izoblikuje odločitev? Mogoče med milijardami nevronov obstaja en “specialist”, ki izbere med Rittersport in Gorenjka čolokado, drugi, ki se aktivira, preden premaknem levo roko navzgor, ter tretji, četrti, …, odgovorni za vsako mikroskopsko dejanje vsak (zavedni in nezavedni) trenutek mojega življenja. Ne zdi se ravno elegantna rešitev, po drugi strani pa evolucija ne izbira nujno le elegantnih poti: “Whatever works and is simple enough to make?” In nevronov v možganih višjih organizmov gotovo ne manjka.
Danes se lahko vprašanja lotimo znanstveno, bistvena pa je idejna zasnova eksperimenta: želimo primerjavo med ljudmi (psihofizika, torej kontrolirane meritve obnašanja) in med opicami, ki bodo opravljale isto nalogo, vendar je pri njih možna še elektrofiziologija (torej snemanje stanja izbranih nevronov, medtem ko opravljajo nalogo). Naloga: na temnem zaslonu se bo ob vsaki osvežitvi zaslona prikazala množica svetlih pik; eksperimentator kontrolira, kakšen procent pik se giblje koherentno: pri 100% se vse pike ob osvežitvi premaknejo v levo (ali desno), pri 0% se ob osvežitvi vse pike izrišejo na novo izbranih naključnih lokacijah, pri npr. 10% se desetina pik premakne v eno smer, 90% pa jih ima naključno izbrane lokacije; naloga subjekta (človeka ali opice) je čim hitreje ugotoviti smer gibanja (levo ali desno). Očitno je pri dovoljšnji koherenci gibanja pik naloga lahka in tako opice kot ljudje se odločijo skoraj 100% pravilno v nekaj 100 milisekundah; pri šibki koherenci natančnost drastično pade in čas do odločitve naraste. Za pravilen odgovor opica dobi nagrado (sok, ki ji pride prav, ker je lačna).
Ta navidezno preprost poskus — navidezno zato, ker imamo opravka z inteligentnimi udeleženci, katerih možgani bodo hote ali nehote uporabili vsakršni namig ali “bias” v poskusu za doseganje boljšega rezultata — je zanimiv zato, ker zanj lahko izdelamo teoretično najboljšo možno strategijo. Če bi namesto opice ali človeka pike gledal stroj, ki bi uporabil vse podatke, ki so na voljo, lahko izračunamo, kako bi se moral ta stroj optimalno odločati (sequential Bayes evidence update). Vsako osvežitev zaslona dobi stroj nov “vzorec” pik, ki ga primerja s prejšnjimi pozicijami, da ugotovi premik vsake pike. Mar nista dovolj že dva vzorca? Pri nizki koherenci gibanja ne, ker je statistično možno, da je prišlo do fluktuacije, ter da le izgleda, da so se pike premaknile koherentno v levo (ali desno). Če zbira podatke še nekaj osvežitev, se bo lahko optimalni stroj (ali opica ali človek) odločil z veliko večjo zanesljivostjo.
Teorija lahko torej natančno pove, katero količino (“log likelihood, da se pike gibljejo v desno”) mora optimalni stroj akumulirati s časom, in ko preseže neko mejno vrednost (“decision threshold”), stroj proglasi odgovor (“Pike se tokrat gibljejo desno!”). Izbiro mejne vrednosti pogojuje ravnovesje med hitrostjo in pravilnostjo odločanja (če sem hitrejši, bom bolj površen). Le ena, “optimalna” vrednost maksimira dolgoročno količino nagrade — soka.
Kaj so rezultati poskusa? Tako opice kot ljudje se obnašamo podobno, kot bi se optimalni stroj. Presenetljivo pa je, da lahko pri opicah sežemo v možgane in opazujemo, kaj delajo nevroni v posebnih možganskih področjih (area MT, odgovorna za procesiranje vizualnega gibanja, ipd), medtem ko opica gleda pike in se “odloča”. Našli so nevrone, katerih aktivnost je linearno povezana z “log likelihood, da se pike gibljejo v desno”, natanko kakor teorija predvideva za optimalno odločanje. Ko je aktivnost teh nevronov dosegla mejno vrednost, je opica sporočila svojo odločitev (“Pike se gibljejo levo” ali “Pike se gibljejo desno”). (Za tiste, ki vas zanima… opica seveda odločitve ne pove, pač pa je naučena, da premakne svoj pogled v eno izmed dveh vnaprej določenih točk na zaslonu, izven polja, kjer so premikajoče se pike. To je zelo zanesljiv in hiter način, s katerim signalizira binarno odločitev).
Od tega prvega poskusa (Shadlen, Newsome, Gold) se je nabralo že kar nekaj novih rezultatov: predvsem, kateri deli možgan vsebujejo katero informacijo, kateri del akumulira dokazno gradivo (levo vs desno) in kje se ta informacija združi z informacijo o nagradi (soku). Opici se “pravil igre” ne da razložiti, pač pa se jih nauči med samim poskusom, glede na to, ali je bila nagrajena ali ne. Eksperimentalci se lahko igrajo z verjetnostjo, ali bodo izbrali od ponovitve do ponovitve poskusa gibanje v levo ali v desno (in verjetnost zmaknejo iz 50%), in če izberejo raje levo, se bo opica naučila reči raje levo, kadar bo koherenca šibka in naloga težka, saj bo tako v teh težjih primerih “uganila” pravilno z večjo verjetnostjo in bo maksimizirala nagrado. Za vse fizike je to indikacija, da možgani kombinirajo vizualne podatke s “priorjem”, da so torej možgani bayesianski.
Osnovno vprašanje, ki lahko zbega, pa je to: kako je mogoče, da je bil katerikoli eksperimentalec sploh zmožen najti tisti en nevron, zadolžen za gibanje pik, med milijardami ostalih nevronov. Odgovor je, da mora biti takih nevronov zelo veliko. A zakaj? Konec koncev ta umetna naloga ni nekaj, kar bi opica (ali človek) počela redno, za kar bi bilo namenjeno veliko procesorske moči (kot je, na primer, za prepoznavanje obrazov v Fusiform Face Area). Odgovor je spet, da so možgani izredno “plastičen” računski stroj, ki se prilagaja potrebam — opica je lačna in dobi več hrane, če nalogo dobro opravi, zato se nevroni specializirajo zanjo (kar je učenje ali trening). Razlika med softverom in hardverom, ki je tako očitna v računalnikih, je v možganih bolj nejasna: osnovne računske enote (nevroni) so sicer razdeljene v možganska področja, specializirana za različne funkcije, vendar se povezave med enotami, sinapse, s časom spreminjajo in tako generirajo različne algoritme, ki jih možgani lahko implementirajo. Če možgane zelo zaposlimo z eno nalogo, ji bodo verjetno posvetili več računske moči.
Še bolj filozofska pa je misel, da je možno z opazovanjem aktivnosti nevronov v opicah predvideti, kakšno odločitev (in kdaj) bo opica naredila, nekaj trenutkov, preden se to dejansko zgodi. Pri ljudeh si takšne invazivne eksperimentacije seveda ne privoščimo, podobne rezultate z napovedjo o odločitvi pa je mogoče doseči v neinvazivnem fMRI skenerju. Za zagrizene materialiste je to (težko?) pričakovan rezultat, drugim pa lahko ta analiza dogodka “odločitve”, ki se zdi včasih tako intimen in atomičen, povzroča spiritualno zaprtje.
Globoke misli na stran: misli ne znamo brati. Ti poskusi so uspešni predvsem zato, ker so uspeli sklopiti preprosto, binarno odločitev, s preprostim stimulusom, hkrati pa so izpeljani pod časovnim pritiskom. V tem primeru je jasno, kaj je optimalna rešitev naloge tako znanstvenikom, kot njihovim (in opičjim) možganom. Ne glede na preprostost pa rezultati nevroznanosti ponujajo upanje: to, da posamezni nevron odseva “log likelihood gibanja v desno”, je gromozanska poenostavitev. Nočna mora za vsakogar, ki se ukvarja z možgani, bi bila, da je ta teoretično pomembna količina kombinatorično zakodirana v hkratnem stanju tisočev ali milijonov posamičnih nevronov, ki jih nikoli ne bi mogli razbrati. (Bralec naj si predstavlja, kaj se lahko znanstvenik nauči, če ne ve, kako deluje CPU računalnika, lahko pa opazuje med njegovim delovanjem 10 izmed milijarde njegovih tranzistorjev ali bitov v RAMu. Pri današnji kompleksnosti operacijskih sistemov ni jasno, da bi izvedeli kaj tudi o najpreprostejši aplikaciji).
Danes se lahko vprašanja lotimo znanstveno, bistvena pa je idejna zasnova eksperimenta: želimo primerjavo med ljudmi (psihofizika, torej kontrolirane meritve obnašanja) in med opicami, ki bodo opravljale isto nalogo, vendar je pri njih možna še elektrofiziologija (torej snemanje stanja izbranih nevronov, medtem ko opravljajo nalogo). Naloga: na temnem zaslonu se bo ob vsaki osvežitvi zaslona prikazala množica svetlih pik; eksperimentator kontrolira, kakšen procent pik se giblje koherentno: pri 100% se vse pike ob osvežitvi premaknejo v levo (ali desno), pri 0% se ob osvežitvi vse pike izrišejo na novo izbranih naključnih lokacijah, pri npr. 10% se desetina pik premakne v eno smer, 90% pa jih ima naključno izbrane lokacije; naloga subjekta (človeka ali opice) je čim hitreje ugotoviti smer gibanja (levo ali desno). Očitno je pri dovoljšnji koherenci gibanja pik naloga lahka in tako opice kot ljudje se odločijo skoraj 100% pravilno v nekaj 100 milisekundah; pri šibki koherenci natančnost drastično pade in čas do odločitve naraste. Za pravilen odgovor opica dobi nagrado (sok, ki ji pride prav, ker je lačna).
Ta navidezno preprost poskus — navidezno zato, ker imamo opravka z inteligentnimi udeleženci, katerih možgani bodo hote ali nehote uporabili vsakršni namig ali “bias” v poskusu za doseganje boljšega rezultata — je zanimiv zato, ker zanj lahko izdelamo teoretično najboljšo možno strategijo. Če bi namesto opice ali človeka pike gledal stroj, ki bi uporabil vse podatke, ki so na voljo, lahko izračunamo, kako bi se moral ta stroj optimalno odločati (sequential Bayes evidence update). Vsako osvežitev zaslona dobi stroj nov “vzorec” pik, ki ga primerja s prejšnjimi pozicijami, da ugotovi premik vsake pike. Mar nista dovolj že dva vzorca? Pri nizki koherenci gibanja ne, ker je statistično možno, da je prišlo do fluktuacije, ter da le izgleda, da so se pike premaknile koherentno v levo (ali desno). Če zbira podatke še nekaj osvežitev, se bo lahko optimalni stroj (ali opica ali človek) odločil z veliko večjo zanesljivostjo.
Teorija lahko torej natančno pove, katero količino (“log likelihood, da se pike gibljejo v desno”) mora optimalni stroj akumulirati s časom, in ko preseže neko mejno vrednost (“decision threshold”), stroj proglasi odgovor (“Pike se tokrat gibljejo desno!”). Izbiro mejne vrednosti pogojuje ravnovesje med hitrostjo in pravilnostjo odločanja (če sem hitrejši, bom bolj površen). Le ena, “optimalna” vrednost maksimira dolgoročno količino nagrade — soka.
Kaj so rezultati poskusa? Tako opice kot ljudje se obnašamo podobno, kot bi se optimalni stroj. Presenetljivo pa je, da lahko pri opicah sežemo v možgane in opazujemo, kaj delajo nevroni v posebnih možganskih področjih (area MT, odgovorna za procesiranje vizualnega gibanja, ipd), medtem ko opica gleda pike in se “odloča”. Našli so nevrone, katerih aktivnost je linearno povezana z “log likelihood, da se pike gibljejo v desno”, natanko kakor teorija predvideva za optimalno odločanje. Ko je aktivnost teh nevronov dosegla mejno vrednost, je opica sporočila svojo odločitev (“Pike se gibljejo levo” ali “Pike se gibljejo desno”). (Za tiste, ki vas zanima… opica seveda odločitve ne pove, pač pa je naučena, da premakne svoj pogled v eno izmed dveh vnaprej določenih točk na zaslonu, izven polja, kjer so premikajoče se pike. To je zelo zanesljiv in hiter način, s katerim signalizira binarno odločitev).
Od tega prvega poskusa (Shadlen, Newsome, Gold) se je nabralo že kar nekaj novih rezultatov: predvsem, kateri deli možgan vsebujejo katero informacijo, kateri del akumulira dokazno gradivo (levo vs desno) in kje se ta informacija združi z informacijo o nagradi (soku). Opici se “pravil igre” ne da razložiti, pač pa se jih nauči med samim poskusom, glede na to, ali je bila nagrajena ali ne. Eksperimentalci se lahko igrajo z verjetnostjo, ali bodo izbrali od ponovitve do ponovitve poskusa gibanje v levo ali v desno (in verjetnost zmaknejo iz 50%), in če izberejo raje levo, se bo opica naučila reči raje levo, kadar bo koherenca šibka in naloga težka, saj bo tako v teh težjih primerih “uganila” pravilno z večjo verjetnostjo in bo maksimizirala nagrado. Za vse fizike je to indikacija, da možgani kombinirajo vizualne podatke s “priorjem”, da so torej možgani bayesianski.
Osnovno vprašanje, ki lahko zbega, pa je to: kako je mogoče, da je bil katerikoli eksperimentalec sploh zmožen najti tisti en nevron, zadolžen za gibanje pik, med milijardami ostalih nevronov. Odgovor je, da mora biti takih nevronov zelo veliko. A zakaj? Konec koncev ta umetna naloga ni nekaj, kar bi opica (ali človek) počela redno, za kar bi bilo namenjeno veliko procesorske moči (kot je, na primer, za prepoznavanje obrazov v Fusiform Face Area). Odgovor je spet, da so možgani izredno “plastičen” računski stroj, ki se prilagaja potrebam — opica je lačna in dobi več hrane, če nalogo dobro opravi, zato se nevroni specializirajo zanjo (kar je učenje ali trening). Razlika med softverom in hardverom, ki je tako očitna v računalnikih, je v možganih bolj nejasna: osnovne računske enote (nevroni) so sicer razdeljene v možganska področja, specializirana za različne funkcije, vendar se povezave med enotami, sinapse, s časom spreminjajo in tako generirajo različne algoritme, ki jih možgani lahko implementirajo. Če možgane zelo zaposlimo z eno nalogo, ji bodo verjetno posvetili več računske moči.
Še bolj filozofska pa je misel, da je možno z opazovanjem aktivnosti nevronov v opicah predvideti, kakšno odločitev (in kdaj) bo opica naredila, nekaj trenutkov, preden se to dejansko zgodi. Pri ljudeh si takšne invazivne eksperimentacije seveda ne privoščimo, podobne rezultate z napovedjo o odločitvi pa je mogoče doseči v neinvazivnem fMRI skenerju. Za zagrizene materialiste je to (težko?) pričakovan rezultat, drugim pa lahko ta analiza dogodka “odločitve”, ki se zdi včasih tako intimen in atomičen, povzroča spiritualno zaprtje.
Globoke misli na stran: misli ne znamo brati. Ti poskusi so uspešni predvsem zato, ker so uspeli sklopiti preprosto, binarno odločitev, s preprostim stimulusom, hkrati pa so izpeljani pod časovnim pritiskom. V tem primeru je jasno, kaj je optimalna rešitev naloge tako znanstvenikom, kot njihovim (in opičjim) možganom. Ne glede na preprostost pa rezultati nevroznanosti ponujajo upanje: to, da posamezni nevron odseva “log likelihood gibanja v desno”, je gromozanska poenostavitev. Nočna mora za vsakogar, ki se ukvarja z možgani, bi bila, da je ta teoretično pomembna količina kombinatorično zakodirana v hkratnem stanju tisočev ali milijonov posamičnih nevronov, ki jih nikoli ne bi mogli razbrati. (Bralec naj si predstavlja, kaj se lahko znanstvenik nauči, če ne ve, kako deluje CPU računalnika, lahko pa opazuje med njegovim delovanjem 10 izmed milijarde njegovih tranzistorjev ali bitov v RAMu. Pri današnji kompleksnosti operacijskih sistemov ni jasno, da bi izvedeli kaj tudi o najpreprostejši aplikaciji).