Leta 2012 so raziskovalci z univerze Yale izvedli na videz nenavaden dvojno slepi eksperiment, pri katerem niso preverjali učinkovitosti kakega zdravila ali cepiva, ampak pristranskost samih znanstvenikov in znanstvenic. Življenjepis mladega raziskovalca, ki je kandidiral za vodjo laboratorija, so poslali v oceno (peer review) 127 uveljavljenim strokovnjakom. Kot je v akademski sferi običajno, so izkušeni raziskovalci na podlagi opisanih dosežkov ocenili strokovno usposobljenost mladega znanstvenika, njegovo primernost za vodstveni položaj in zanj predlagali okvirno izhodiščno plačo.
Vendar znanstveniki in znanstvenice, ki so ocenjevali življenjepis svojega kolega, niso vedeli, da so raziskovalci povsem enak življenjepis v polovici primerov opremili z moškim, v drugi polovici pa z ženskim imenom. Vsi podatki glede kariere, dosežkov in veščin kandidata so bili do zadnje črke enaki, le na polovici življenjepisov je bilo navedeno ime Jennifer, na drugi polovici pa John.
Rezultati eksperimenta so raziskovalce tako presenetili, da so ob prvi analizi pomislili, da so se pri vnašanju podatkov zmotili. Johna so namreč strokovnjaki, ki so bili prepričani, da povsem objektivno in nepristransko ocenjujejo le njegove dosežke in sposobnosti, prepoznali kot bistveno bolj kompetentnega in primernega za delovno mesto vodje laboratorija kot Jennifer. Prav tako so za Johna v povprečju predlagali kar precej višjo izhodiščno plačo.
Ob natančnejši analizi se je izkazalo, da je pristranskost enakomerno porazdeljena po spolu, starosti in mestu v akademski hierarhiji, kar pomeni, da gre za globoko usidrane predsodke, ki se jih večina sploh ne zaveda. V tem primeru namreč ni šlo za osebe, ki bi želele komurkoli nalašč škoditi. Večinoma so bili v poskusu udeleženi povsem dobronamerni posamezniki, ki se na racionalni ravni sploh niso zavedali, da delujejo pristransko.
Hitro intuitivno vrednotenje je namreč del normalnega delovanja človeških možganov. Brez pomoči takšnega »občutka« smo praviloma povsem izgubljeni in se težko odločamo. In prav hitro intuitivno vrednotenje je najbolj dovzetno za najrazličnejše predsodke, ki jih pridobimo z izkušnjami v okolju, v katerem odraščamo in delujemo.
Eden od načinov, s katerim ozavestimo svoje nezavedne predsodke, je test implicitnih asociacij, ki ga vsakdo lahko izvede na spletni strani implicit.harvard.edu. S pomočjo preprostih miselnih nalog, pri katerih moramo hitro urejati besede glede na asociacije, dokaj dobro ugotovimo, kako močno so v naše možgane vtisnjena najrazličnejša prepričanja, ki se jih ne zavedamo.
Pristranskost sicer razmeroma enostavno zaznamo pri ljudeh, ki imajo drugačen vrednostni sistem od našega. Pri političnih nasprotnikih z lahkoto opazimo že najmanjše nedoslednosti, do podobno mislečih ljudi pa smo bistveno bolj prizanesljivi. A pri političnih temah vsi vnaprej pričakujemo, da nas bodo motivirala tudi čustva.
Predsodki so zato bistveno bolj nevarni v okoljih, v katerih smo prepričani, da imajo dejansko težo le racionalni argumenti. Strokovni pregled (peer review) v znanosti je tipičen primer odločanja, pri katerem so strokovnjaki prepričani, da ideje in ljudi vrednotijo nepristransko, a so tudi v tem primeru lahko nezavedna prepričanja še kako na delu.
Da sistem strokovnega vrednotenja učinkovito deluje, se je treba močno truditi in njegovo delovanje nenehno skrbno nadzorovati. Če strokovno ocenjevanje izvajajo nekompetentni ljudje, ki ne poznajo lastnih omejitev, se bojijo izraziti svoje mnenje ali imajo morda celo neposredne prikrite interese, potem lahko znanost zaide v resne težave. Vsakdo ima namreč v svojih možganih veliko najrazličnejših prepričanj, ki se jih večinoma ne zaveda. Prevzetno je zato, če kdorkoli meni, da je njegovo stališče samo po sebi objektivno, tudi brez temeljite prevetritve v poglobljeni argumentirani razpravi z drugimi strokovnjaki.
Da bi bili manj pristranski, bi se v znanosti lahko zgledovali po uveljavljenih praksah s področja umetnosti, kjer so težave z vrednotenjem dokaj uspešno razrešili s prikrivanjem identitete avtorjev. Avdicije glasbenikov se že več let izvajajo za zaveso, da komisija lahko sliši in vrednoti le igranje umetnika, ne pozna pa njegove starosti, spola in videza.
Prav zaradi sistematičnega prikrivanja identitete kandidatov med avdicijami se je močno spremenilo razmerje med spoloma v simfoničnih orkestrih. Če so nekoč prevladovali moški belopolti glasbeniki, je zdaj razmerje bistveno bolj uravnoteženo. Podoben pristop prikrivanja identitete že dolgo uporabljajo pri literarnih in arhitekturnih natečajih, saj prispele rešitve ocenjuje pod šiframi, enak režim pa je uveljavljen tudi pri tekmovanjih v znanju in na maturi.
V znanosti bi bilo dobro poskusiti, da bi za začetek slepo brez imen in institucij ocenjevali predloge raziskovalnih projektov. Tako bi dejansko vrednotili le ideje, ne pa posameznikov, ki stojijo za njimi. Dvojno slepi postopek ocenjevanja so že uvedli pri ocenjevanju opazovalnih projektov vesoljskega teleskopa Hubble, prav tako je treba pod šifro oddati vlogo za zaposlitev na nekaterih uglednih univerzah in inštitutih.
https://www.delo.si/mnenja/kolumne/prevzetnost-in-pristranost-v-znanosti/
zelo dober članek, hvala! Posebno mi je všeč, da se že izvaja dvojno slepo ocenjevanje projektov (Hubble) in da to ni le praksa pri umetniškem ustvarjanju.
Upajmo da bomo kaj takega uvedli tudi pri nas.
Dvomim, pri nas se projekti še vedno ocenjujejo po “dogovornem sistemu” (t.j. kdo in kako bo koga ocenil). Sicer pa je ARRS tudi v kadrovski krizi, poglejte kaj se dogaja s trenutnim projektnim razpisom (kdaj bodo recenzije?), z nedelujočimi eObrazci (letošnji programski razpis), itd.
Dvojno slepo ocenjevanje (vsebine) projektnih prijav bi gotovo lahko ovrglo moč “dogovornega sistema”, ostale podrobnosti pa je treba še dobro razmisliti in določiti da ne bi bilo dvomljivih situacij.
Kolikor se spomnim, so bili rezultati razpisov tudi v preteklosti praviloma vedno zamujeni. Kar je seveda zelo narobe.
Tu bi samo izpostavil, da je graf z “prav tako so za Johna v povprečju predlagali kar precej višjo izhodiščno plačo.” nekoliko zavajujoč. Po velikosti stolpcev bi sklepal, da je razika v plači cca 5-krat, v resnici gre pa za nekje 13%.
Še vedno ni dobro, ni pa tako katastrofalno kot zgleda z grafa.