V prvi polovici letošnjega leta so bili fiziki, ki se ukvarjajo z osnovnimi delci, iz katerih je zgrajeno vesolje, v pričakovanju pomembnega odkritja. Iz Cerna, velikega laboratorija na meji med Francijo in Švico, v katerem poskušajo ustvariti razmere, kakršne so bile v vesolju kmalu po velikem poku, so prihajale informacije, da sta dva velika detektorja neodvisno zaznala odtis novega delca pri energiji, ki je približno šestkrat večja, kot je bila tista, pri kateri so pred nekaj leti opazili Higgsov delec.

Sredi decembra 2015 sta obe veliki skupini raziskovalcev, ki v Cernu skrbita za velikanska detektorja delcev ATLAS in CMS, objavili rezultate zadnjih meritev pri do tedaj najvišjih energijah, ki so jih proizvedli s čelnimi trki gruč hitrih protonov. Strokovno javnost je navdušil podatek, da sta oba detektorja pri energiji 750 GeV zaznala sledi novega, še neznanega delca. V detektorjih so pri tej energiji opazili pojav, ki naj bi ustrezal razpadu delca na dva fotona, zato so hipotetični novi delec poimenovali difoton.

Se rojeva nova fizika ali gre za splet naključij?

Fiziki, ki se ukvarjajo s teoretičnimi modeli, s katerimi pojasnjujejo rezultate eksperimentov in napovedujejo nova odkritja, so se takoj lotili dela. V spletnem arhivu znanstvenih člankov (arxiv.org), kjer najprej objavijo nove teorije, da jih s kolegi proučijo in ovrednotijo, so se začele množiti najrazličnejše hipoteze, v katerih so opisovali načine, kako pojasniti obstoj novega delca in napovedati njegove lastnosti.

Vsakdo, ki je imel dovolj znanja in idej, je želel prvi pravilno napovedati, kaj se dogaja v pospeševalniku v Cernu. Nekateri najbolj zagreti so objavili tudi po več nasprotujočih si teorij hkrati, vse v želji, da bi bila morda katera prava in bi si tako nekoč v prihodnosti prislužili Nobelovo nagrado. V nekaj tednih se je nabralo več sto objav s hipotezami o lastnostih novega delca. Zdelo se je, da gre za enega najpomembnejših trenutkov v zgodovini fizike visokih energij, saj se difotona ni dalo pojasniti z uveljavljenimi teorijami. Rojevala se je nova fizika, kar je bilo za vse udeležene zelo razburljivo.

Vendar meritev, ki so jih objavili konec leta 2015, še ni bilo dovolj, da bi lahko z dovolj veliko zanesljivostjo potrdili obstoj novega delca. Na odločitev, ali gre pri meritvah zgolj za splet naključij ali morda za eno največjih fizikalnih odkritij zadnjih desetletij, če ne stoletja, je bilo treba počakati še pol leta, da so detektorji v Cernu zbrali novo zalogo meritev. Uradno tako v prvi polovici leta 2016 nihče ni govoril o novem delcu, saj veljajo stroga pravila, kdaj lahko v fiziki visokih energij razglasijo novo odkritje.

Čajanka, ki je postala model

Sodoben način preverjanja znanstvenih hipotez po legendi izvira iz zabavnega dogodka na akademski čajanki pred nekaj manj kot stotimi leti. V dvajsetih letih 20. stoletja se je v Cambridgeu na popoldanskem čaju zbralo nekaj profesorjev z družinami. Gostiteljica druženja je med pripravljanjem čaja na presenečenje zbranih izjavila, da lahko po okusu razloči, ali je v skodelico vlila mleko pred čajem ali čaj pred mlekom. Trditev se je zdela prisotnim znanstvenikom absurdna, saj si niso znali pojasniti, kako bi lahko na okus čaja vplival vrstni red zlivanja tekočin v skodelico. A med gosti je bil tudi znan statistik Ronald Aylmer Fisher, ki je takoj predlagal, da trditev gostiteljice preverijo s preprostim eksperimentom.

Pripravili so nekaj parov skodelic, v katerih sta bila čaja pripravljena po različnih metodah, in prosili gostiteljico, da jih poskusi. Na ta način so želeli preveriti, ali gostiteljica dejansko razlikuje med okusoma, ali se ji to samo dozdeva. Dogodek verjetno ne bi bil nič posebnega, če ga Ronald Fisher ne bi uporabil v svoji odmevni knjigi z naslovom Načrtovanje eksperimentov, ki jo je izdal leta 1935 in je hitro postala referenčno delo o metodah, kako naj se znanstveniki lotevajo eksperimentalnega dela.

Fisher v knjigi pojasnjuje, kako je treba pristopiti k izvedbi poskusa, da lahko iz rezultatov potegnemo čim bolj zanesljive sklepe. Kot izjemno pomembno v procesu priprave eksperimenta izpostavi, da moramo vnaprej predvideti, kako verjetno je, da do rezultatov pride po naključju, in ne zaradi vzroka, ki ga poskušamo dokazati.

Če bi gostiteljica čajanke zgolj ugibala o vrstnem redu mleka in čaja pri pripravi posamezne skodelice, bi imela vsakič 50-odstotno verjetnost, da zadene pravi odgovor. Po desetih ponovitvah poskusa je tako najbolj verjetno, da bo povsem po naključju petkrat pravilno razločila skodelice. Manjša verjetnost je, da ji bo uspelo manj ali več kot petkrat, zelo majhna verjetnost pa je, da bo po naključju skodelice pravilno razvrstila v vseh desetih ponovitvah poskušanja. Vendar tudi ta možnost ni izključena. Tudi če ji uspe pravilno razločiti vse skodelice med eksperimentom (menda naj bi se prav to na vrtni zabavi dejansko zgodilo), je tudi takšen rezultat lahko le posledica naključja.

Ko izvajamo eksperiment, moramo zato dobljene rezultate vrednotiti v odnosu s predvidenimi rezultati, ki bi jih dobili ob predpostavki, da gre pri vsem skupaj zgolj za produkt naključja. Šele ko ocenimo, da se rezultati našega eksperimenta bistveno razlikujejo od tega, kar bi zaznali, če bi jih ustvaril zgolj splet naključnih okoliščin, lahko sklepamo, da smo nekaj dejansko izmerili.

Ključno vprašanje je zato, koliko se morajo rezultati eksperimenta razlikovati od modela naključnih meritev, da lahko sklepamo, da smo nekaj odkrili. Fisher je v svoji knjigi navedel, da je ta meja običajno 5 odstotkov (p = 0,05), kar poenostavljeno pomeni, da obstaja manj kot 5 odstotkov možnosti, da bi lahko do takšnih rezultatov, kot smo jih izmerili, prišlo po naključju, in ne iz razloga, ki smo ga proučevali v meritvah.

V praksi se je v mnogih vedah 5-odstotna meja izkazala za premalo strogo. Na področju fizike delcev velja določilo, da mora biti za odkritje novega delca verjetnost, da so rezultati zgolj splet naključnih dogodkov, manjša kot 1 proti 3,5 milijona (p = 0,0000003). Tako stroga pravila izhajajo iz preteklih izkušenj in so se kot ustrezna izkazala tudi v letošnjem primeru domnevnega odkritja novega delca. Zadnje meritve pospeševalnika v Cernu, ki so jih predstavili avgusta 2016, obstoja difotona žal niso potrdile. Kot vse kaže, je šlo v meritvah iz decembra 2015 zgolj za splet naključij.

Veliko znanstvenih študij ni resničnih?

Vse vede seveda nimajo tako strogih standardov kot fizika osnovnih delcev. Zadnja leta sta zaradi prehitrih zaključkov o veljavnosti hipotez na osnovi statističnih analiz najbolj na udaru psihologija in medicina. Izkazalo se je namreč, da mnogih domnevno dokazanih trditev neodvisne analize ne morejo potrditi.

Raziskovalci ameriškega farmacevtskega podjetja Amgen so v reviji Nature leta 2012 tako objavili poročilo, da jim je uspelo reproducirati rezultate le 6 od 53 pomembnih raziskav s področja zdravljenja in razumevanja raka. Podobno je raziskovalcem nemškega podjetja Bayer uspelo v približno istem obdobju reproducirati le četrtino od 67 pomembnih objavljenih medicinskih študij, ki so jih zanimale in so jih želeli preveriti še v lastnem laboratoriju.

Že leta 2005 je ameriški epidemiolog John Ioannidis strokovno javnost opozoril na tovrstne težave v članku z nenavadnim naslovom Why Most Published Research Findings Are False, ki je hitro postal eden izmed najbolj branih in citiranih v spletni strokovni reviji PLoS Medicine. V sestavku je obravnaval metodološke težave s statističnim dokazovanjem vzročnih povezav med različnimi parametri v kompleksnih sistemih, kot je človeško telo.

Če dopuščamo kar 5-odstotno možnosti, da rezultati eksperimenta niso posledica vzroka, ki ga dokazujemo, ampak plod naključja, to pomeni, da je približno takšen tudi delež lažno pozitivnih raziskav. Ker pa znanstvene revije praviloma objavljajo samo rezultate, s katerimi znanstveniki hipotezo potrdijo, lahko postane v določenih okoliščinah teh nekaj odstotkov lažno pozitivnih raziskav tudi relativna večina med vsemi objavami.