Näin lasket ihmeen todennäköisyyden
”Uskonnollisten parantumisten ja muiden ihmeiden kohdalla luonnollinen selitys on aina parempi.” Monet uskontokriitikot David Humesta alkaen ovat uskoneet näin. Todennäköisyyslaskenta kuitenkin osoittaa, että Hume oli väärässä.
Yksi yleinen kristillistä teismiä vastaan kohdistetuista argumenteista on väite ihmeisiin uskomisen ongelmallisuudesta. Usein keskustelu liikkuu heittojen tasolla, esimerkiksi ”uskotko todella, että \(X\) tapahtui”, jossa \(X\) on vaikkapa jokin Raamatun ihme. Monelle naturalistille, mikäli keskustelukumppani toteaa uskovansa \(X\):n tapahtuneen, hänen järjenkäyttönsä on ilmiselvästi jotenkin vajavainen. Useampi naturalisti onkin todennut väittelyssä ”I rest my case!”, kun teisti on todennut uskovansa vaikkapa Jeesuksen neitseestäsyntymiseen.
Johtopäätös siitä, onko ihmeisiin on järkevää uskoa, tehdään kuitenkin yllättävän usein ennakkoluulojen perusteella, ilman kunnollisia järkiperusteluja. On toki selvää, että mikäli naturalismi on totta, ihmeitä ei tapahdu. Jos taas vaikkapa kristinusko on totta, ainakin joitakin ihmeitä tapahtuu. Usein ihmeitä sivuavassa keskustelussa on kuitenkin kyse juuri näiden maailmankatsomuksellisten oletusten arvioimisesta, joten ei ole kovin kohteliasta ujuttaa huomaamattomasti omaa katsomustaan keskustelun taustaoletukseksi.
Tämän kirjoituksen tarkoituksena on käsitellä ihmeiden uskottavuutta käyttäen bayesilaisen todennäköisyyslaskennan koneistoa.
Ihmeisiin uskomisen järkevyydestä on keskusteltu jo pitkään. 1700-luvulla skotlantilainen David Hume (1711-1776) esitti teoksensa An Enquiry concerning Human Understanding (1748) kappaleessa ”Of Miracles”, että ihmeisiin uskominen ei ole järkevää. Hume kirjoittaa retorisella voimalla mutta itse argumentti ja sen perustelut jäävät hieman epäselviksi. Sekä Humen tarkasta väitteestä että sen perusteluista on 1800-luvulta lähtien esitetty monia tulkintoja. Oletan kuitenkin tässä, että Humen väite on kutakuinkin seuraava:
Meillä on valtavasti todisteita luonnollisista tapahtumista, eikä yhtään todisteita yliluonnollisista. Mikäli joku väittää jotain yliluonnollista tapahtuneen, on paljon todennäköisempää, että hän on väärässä tai valehtelee, kuin että jotain yliluonnollista olisi todella tapahtunut.
Tarkka lukija huomannee jo tässä, että keskusteluun liittyy monia syviä kysymyksiä. Ensinnäkin, mikä on luonnollista ja mikä yliluonnollista? Entä ovatko luonnonlait oikeasti olemassa vai ovatko ne pikemminkin ihmisen kuvauksia luonnossa havaituista säännönmukaisuuksista, jotka pätevät, kunhan systeemi on riittävän eristetty? Onko ihme tilanne, jossa luonnonlait rikkoutuvat, vai tilanne, jossa luonnonlait ohitetaan tai ne eivät päde, koska systeemi ei ole eristetty? Vai onko ihme tilanne, jossa luonnonlait ovat voimassa mutta tapahtuu erittäin epätodennäköisiä yhteensattumia, vaiko pikemminkin tilanne, jossa vaikuttaa jokin muu vuorovaikutus tuntemiemme luonnonlakien lisäksi? Ja onko todella niin, että jos jokin tapahtuma on havaittu riittävän monta kertaa, voimme olla varmoja ettei siihen jatkossa havaita poikkeuksia?
Esimerkiksi, emme toistaiseksi ole havainneet protonin hajoavan. Havaintojen mukaan protonin hajoamisen todennäköisyys vuoden aikana on alle \(10^{-33}\). Mikäli ihminen valehtelee tavallisesti noin joka sadas kerta, voivatko mittaajien todistukset protonin hajoamisesta enää tavoittaa harvinaisiin tapahtumiin skeptisesti suhtautuvaa?
Hume, kuten useat nykyskeptikotkin, oletti näissä kysymyksissä tiettyjä kantoja, jotka tukivat hänen skeptistä näkökantaansa ihmeisiin. Esimerkiksi, mikäli oletetaan nykyisten luonnonlakien todellinen olemassaolo ja niiden rikkoutumattomuus, ja lisäksi oletetaan, että ihmeet ovat luonnonlakien rikkoutumista, oletuksista seuraa suoraan, että ihmeet ovat mahdottomia. Lopulta kuitenkin väitteen esittäjän tulisi perustella tekemänsä oletukset, joka tässä tapauksessa on huomattavan vaikeaa.
Hieman historiaa
Samoihin aikoihin kuin Hume esitti argumenttinsa ihmeitä vastaan, niin ikään Skotlannissa vaikuttanut pastori ja matemaatikko Thomas Bayes (1702-1761) kehitti todennäköisyyslaskennan teoriaa. Bayes mm. kehitti esiasteen hänen mukaansa nimetystä Bayesin teoreemasta, joka on ehkä merkittävin kehitys tilasto- ja todennäköisyyslaskennassa. Bayesilaista tilasto- ja todennäköisyyslaskentaa väheksyttiin melkein kahden vuosisadan ajan, mutta nykyään sen käyttö on yleistynyt melkein kulovalkean tavoin useilla tieteen alueilla uskonnonfilosofiasta fysiikkaan.
Bayesin ja Humen väliltä ei ole löytynyt suoraa kirjeenvaihtoa, mutta on luultavaa, että Bayes käsitteli induktiota todennäköisyyslaskennan keinoin artikkelissaan ”Essay Towards Solving a Problem in the Doctrine of Chances” osittain vastauksena Humen väitteille. Molemmat olivat nimittäin tekemisissä filosofi Richard Pricen (1723-1790) kanssa, joka Humen aikalaisista esitti ehkä merkittävintä kritiikkiä Humen väitteitä kohtaan. Price oli Bayesin läheinen ystävä. Itse asiassa, Price järjesti Bayesin kuoltua tämän merkittävän artikkelin julkaisun todennäköisyyslaskennan alalta ja sovelsi sen tuloksia omassa Humen väitteitä käsittelevässä liitteessään.
Siinä missä Humen argumentti perustuu kaunopuheiseen toistoon ja virheelliseen induktiokäsitykseen, Price käytti kritiikissään juuri kehitteillä olevan todennäköisyyslaskennan työkaluja, joita Hume ei näytä ymmärtäneen. Price oli erittäin kohtelias Humea kohtaan ja Hume vastasi samalla mitalla. Miesten välit olivat lämpimät. Hume myönsi kohteliaasti, ettei hänellä tuolloin ollut vastinetta Pricen kritiikkiin ja tähän tilaan asiat näyttävät jääneen.
Nykyään ehkä kattavin todennäköisyyslaskennan työkaluja hyödyntävä käsittely Humen ihmeiden vastaisesta argumentista on John Earmanin teos Hume’s Abject Failure: The Argument Against Miracles. Earman käyttää suuren osan teoksestaan Humen tulkintaan ja selventämiseen löytääkseen riittävän jäsennellyn ja hyvin määritellyn argumentin ihmeitä vastaan. Tämän jälkeen Earman käyttää bayesilaisen todennäköisyyslaskennan työkaluja ja osoittaa, että Humen väitteet ovat useissa kohtaa liiallisia yksinkertaistuksia ja lisäksi induktion ja ihmisten todistusten kohdalla virheellisiä.
Kuinka tuhoisia Humen argumentille Earmanin löydökset sitten ovat? Aika tuhoisia. Earman osoittaa, että Humen argumentti on virheellinen. Entä voidaanko Humen argumenttia terävöittää tai määritellä paremmin jolloin se välttäisi Earmanin kritiikin? Ehkä, mutta silloin se tulee olemaan huomattavasti varovaisempi ja itse väite heikompi.
Tärkeämpi kysymys ja myös Earmanin työn tärkeämpi anti on mielestäni se, että se valottaa olennaisella tavalla sitä, miten tätäkin kysymystä pitäisi käsitellä: tulisi tarkastella aiheeseen liittyvää todennäköisyyslaskentaa ja siinä tehtyjä oletuksia. Käyn tässä kirjoituksessa läpi Earmanin työn kohtia induktion ja ihmetodistusten osalta. Earmanin kirja sisältää paljon muitakin tärkeitä huomioita aiheesta, joten suosittelen siihen tutustumista.
Pohjustusta
Tutustukaamme ensin hieman todennäköisyyslaskennan koneistoon. Tulemme käyttämään seuraavia merkintöjä:
\(p(A|B)\) : ehdollinen todennäköisyys, eli todennäköisyys sille että \(A\) on totta kun \(B\) on totta.
\(\neg A\) : Väitteen \(A\) negaatio, eli ”ei-\(A\)”.
\(K\) : taustatietomme (knowledge) tilanteesta. (\(K\) istuu ehdollisissa todennäköisyyksissä aina ehtojen puolella. Sitä käytetään muistuttamaan siitä, että järkevä malli ja riittävän järkevät priori-todennäköisyydet on valittu sen pohjalta.)
\(E\) : todisteet (evidence)
\(H\) : tarkastelun kohteena oleva hypoteesi
Bayesin teoreema, joka seuraa suoraan ehdollisen todennäköisyyden määritelmästä, on seuraava:
\[ P(H|E\&K) = \frac{P(H|K) P(E|H\&K)}{P(E|K)} \quad (BT)\]
Tässä
\(p(H|E\&K)\) : hypoteesin \(H\) todennäköisyys todisteiden \(E\) ja taustatiedon \(K\) perusteella (posteriori-todennäköisyys)
\(p(H|K)\) : \(H\):n todennäköisyys ilman tietoa \(E\):stä (priori-todennäköisyys)
\(p(E|K)\) : todisteiden todennäköisyys noin yleensä (marginaali-todennäköisyys)
Kaava voi vaikuttaa tylsältä tai triviaalilta, mutta kyseessä on tosiaankin formaali tapa tarkastella, miten todisteiden (esimerkiksi \(n\) toistokoetta) saaminen muuttaa tietyn väitteen uskottavuutta! \(E\) ja \(H\) on tässä valittu todisteiksi ja hypoteesiksi, mutta ne voivat tietenkin olla mitä tahansa väitteitä, joille voidaan esittää todennäköisyysriippuvuus. Teoreeman laajemmassa muodossa väitteitä voi myös olla mukana mielivaltaisen suuri määrä, joten työkalulla voidaan tarkastella uskomusverkkojen osien tai koko verkon uskottavuutta.
Induktio
Tässä yhteydessä induktio ei ole matemaattista induktio-todistusta vaan induktiivista päättelyä, yleistämistä useista tapauksista johtopäätökseen. Earmanin mukaan Hume käyttää Reichenbachin frekventististä suoraa induktiota muistuttavaa induktio-periaatetta: Jos riittävän monta \(A\):ta on tutkittu ja niistä kaikkien on todettu olevan \(B\):itä, todennäköisyys sille että kaikki \(A\):t ovat \(B\):itä, on \(1\). Tämän periaatteen mukaisesti, mikäli \(n\) tapahtumaa on tutkittu ja mikään niistä ei ole ollut yliluonnollinen, todennäköisyys yliluonnolliselle tapahtumalle on \(0\). (Kysymykseen, miksi Hume, joka tunnetaan myös induktio-päättelyn ongelmallisuuden pohdinnasta, kuitenkin käyttää induktiopäättelyä, suosittelen lukemaan Earmanin kirjan.)
Päättelyä ei kuitenkaan ole hyvä tehdä hatusta vedetyillä induktioreseptillä, vaan kuten jo Price huomautti, laskea tai arvioida asiaan liittyviä todennäköisyyksiä. Vasta silloin tiedetään millä edellytyksillä, jos ollenkaan, resepti on oikea. Bayesilaisen päättelyn vahvuuksia ovat toisaalta se, että laskentatapa seuraa suoraan todennäköisyyslaskennan lähtökohdista, ja toisaalta se, että oletukset ovat priori-todennäköisyyksien ja mallivalinnan muodossa selkeästi esillä.
Tehdään yksinkertainen ajatuskoe ja lasketaan se läpi. Oletamme, että ihmeissä on kyse epätavallisista havainnoista. Kysymme, kuinka todennäköistä on pitkän samanlaisten havaintojen sarjan jälkeen havaita jotain muuta? Esimerkiksi, mikäli olemme havainneet vain mustia korppeja, kuinka todennäköistä on joskus havaita vaalea korppi? Jotta voimme vastata tähän, meidän täytyy tehdä oletuksia mallin ja priorien suhteen. Käytämme seuraavia merkintöjä ja oletuksia:
\(E(n)\) : Evidenssimme siitä, että \(n\) lukumäärän havaintoja tulos on \(B\), esimerkiksi musta korppi.
\(K\) : Taustainformaatio, jonka oletamme olevan seuraavaa: havainnot \(E(n)\) ovat identtisesti jakautuneita ja riippumattomia toistokokeita. Tulos \(B\) saadaan joka toistossa samalla tuntemattomalla todennäköisyydellä \(b\), eli \(p(B|K)=b\). \(b\) on siis esimerkiksi mustan korpin havaitsemisen todennäköisyys ennen tietoa havainnoista \(E(n)\).
\(H\) : Väite, että myös seuraavan havainnon tulos on \(B\).
\(p(H|K)=0.5\) : Priori eli etukäteis-todennäköisyys \(H\):lle (ilman tietoa \(E(n)\)).
\(p(b|K)\) : Priori-todennäköisyysjakauma todennäköisyydelle \(b\). Tämä todennäköisyys on ehkä esimerkin vaikein. Koska emme etukäteen halua ottaa kantaa kuinka todennäköinen esimerkiksi musta korppi oikeasti on, kuvaamme tietämättömyytemme mustan korpin todennäköisyydestä antamalla sen todennäköisyydelle todennäköisyysjakauman ja antamalla havaintojen määrätä korppien todennäköisyyden arvon. Bayes päätteli tässä nerokkaasti, että koska meillä ei ole etukäteen syytä olettaa tiettyä arvoa \(b\):lle, käytämme tasaista todennäköisyysjakaumaa nollan ja yhden välillä \(p(b|K) \sim U(0,1)\).
\(p(H|E(n)\&K)\) : Todennäköisyys, josta olemme kiinnostuneet, eli todennäköisyys sille, että \(n\) määrän tuloksia \(B\) jälkeen myös seuraava tulos on \(B\).
Nyt meillä on kaikki mitä laskuun tarvitaan. Itse lasku on kymmenisen riviä pitkä ja siihen liittyy kevyttä integrointia (Earman s. 27 ja 28), joten emme käy sitä läpi tässä. Tulos on
\[ P(H|E(n)\&K) = \frac{n+1}{n+2} = 1 – \frac{1}{n+2} \quad (IND)\]
Tässä \(n\):n kasvaessa termi \(\frac{1}{n+2}\) lähestyy nollaa, ja siksi todennäköisyys tavalliselle tapahtumalle lähestyy yhtä. Kuten Earman toteaa, yksinkertainen lasku tukee induktiopäättelyä yleensä, muttei Humen käyttämää versiota: \(n\):n kasvaessa todennäköisyys saman tuloksen saamiseen lähenee yhtä, muttei koskaan saavuta sitä. Toisaalta tulos on myös tietyssä mielessä anti-induktiivinen: todennäköisyys sille, että kaikki myöhemmät tulokset tulevat olemaan \(B\), lähenee nollaa tulevien havaintojen määrän kasvaessa. Harvinaisen tapahtuman tai ihmeen tapahtuminen joskus, mikäli tulevia havaintoja on riittävän paljon, on siis luultavaa. Näin siis tämän yksinkertaisen esimerkin oletusten pitäessä.
Todennäköisyyslaskennan mukaan siis mikään määrä samanlaisia havaintoja ei sulje harvinaisia poikkeavia havaintoja, kuten ihmeitä, pois. Hume oli väärässä suoraa induktiota käyttäessään.
Toisaalta poikkeavien tapahtumien uskottavuus pienenee tavallisten tapahtumien määrän kasvaessa. Tässä Earman ei ehkä painota riittävästi sitä, että lasku pätee vain tapauksille jotka ovat \(K\):n oletusten mukaisia. \(K\):n mukaan kaikki tapahtumat ovat otoksia samasta todennäköisyysjakaumasta. Mikäli siis meillä on informaatiota, jonka perusteella tietty tai tietyt tapahtumat, kutsutaan niitä \(Y(m)\):ksi, eroavat tai voivat erota olennaisesti muista tapahtumista, tulos \((IND)\) ei päde tapahtumille \(Y(m)\), vaan \((IND)\)-tuloksen tyyppinen termi tulee määräämään \(Y(m)\) tapahtumien todennäköisyyttä suurin piirtein sen verran kuin voidaan perustella \(Y(m)\) tapahtumien olevan samankaltaisia \(E(n)\) kanssa. Tätä kautta tulee siis ymmärrettävämmäksi, miksi esimerkiksi Jeesuksen ylösnousemusihmeen tapauksessa useat uskonnonfilosofit ovat käsitelleet sitä, miten Jeesus eroaa tavallisista ihmisistä. Mikäli siis Jeesus Nasaretilainen eroaa jollain olennaisella tavalla muista ihmisistä, induktioon pohjaava argumentti esimerkiksi ylösnousemusihmettä vastaan ei toimi tai on huomattavasti heikompi.
Todistukset ihmeistä
Humen väite siis oli, että koska todisteet luonnollisista tapahtumista ovat niin lukuisia, ne painavat aina enemmän kuin todistajien lausunnot yliluonnollisista tapahtumista. Edellisessä osiossa näimme, että todisteet luonnollisista tapahtumista kyllä vaikuttavat todennäköisyyksiin, mutta eivät niin paljoa kuin Hume oletti.
Seuraava olennainen kysymys liittyy siihen, miten positiivisia todisteita harvinaisesta tapahtumasta tai ihmeestä sitten tulisi käsitellä? Käytännössä positiiviset todisteet ovat yleensä ihmisten todistuksia. Käytämme niiden arvioimiseen jälleen todennäköisyyslaskentaa ja Bayesin kaavaa.
Olkoon \(t(M)\) jonkun henkilön todistus tapahtumasta \(M\). Bayesin teoreemasta seuraa parin rivin johdolla kaava (myös Earman s. 47) tapahtuman \(M\) todennäköisyydelle kun tapahtumasta on todistus \(t(M)\):
\[ P( M|t(M)\&E(n)\&K) = \frac{ 1 }{ 1+\left[ \frac{ 1-p(M|E(n)\&K) }{ p(M|E(n)\&K) } \right] \left\{ \frac{ p(D(M)|\neg M\&E(n)\&K) }{ 1 – p(D(M)|M\&E(n)\&K) } \right\} }\]
Tässä, mikäli \(\left[\enspace\right]\left\{\right\}\)-termi on suuri, todennäköisyys tapahtumalle \(M\) on todistuksesta \(t(M)\) huolimatta pieni.
Tarkemmin ottaen, silloin kun \(E(n)\) on suuri vastakkainen aineisto tapahtumalle \(M\), edellisen luvun induktion-esimerkin perusteella \(p(M|E(n)\&K)\) tulee olemaan pieni ja siten termi \(\left[\enspace\right]\) on suuri. Mikäli siis yksinkertaisen induktiopäättelyn oletukset toteutuvat, \(\left[\enspace\right]\)-termi kasvaa kuten \((n+1)\). Toisaalta \(\left\{\right\}\)-termin nimittäjä on melko lähellä yhtä, joten jotta harvinainen tapahtuma \(M\) olisi uskottava, termin on oltava pieni. Tämän termin arvoa tarkastellessa on tärkeää huomioida, että kyse ei ole valehtelun tai erehtymisen todennäköisyydestä yleensä, vaan todennäköisyydestä, että todistus koskee juuri \(M\):ää ja on sen kohdalla epäluotettava. Earmanilla on tästä selventävä esimerkki kirjansa sivulla 50. Esimerkiksi, mikäli ystäväsi kertoo sinulle Pekan voittaneen loton päävoiton viime viikon arvonnassa, olennainen todennäköisyys ei ole se, kuinka usein ystäväsi yleensä valehtelee, vaan millä todennäköisyydellä ystäväsi valehtelisi juuri Pekan voittaneen lotossa. Mikäli \(M\) on osa \(n+1\) kokoista joukkoa, tämä todennäköisyys pienenee usein samaa vauhtia kuin \(\left[\enspace\right]\)-termi kasvaa.
Liiallisen yksinkertaistuksen uhalla todennäköisyys ihmeelle, jossa aiemmassa luvussa käsitellyt induktion oletukset pitävät ja jossa ei ole olennaista syytä, miksi \(90\%\) luotettava todistaja väittäisi juuri kyseistä väitettä harvinaisesta tapahtumasta, voidaan siis arvioida suurin piirtein kaavasta
\[ P( M|t(M)\&E(n)\&K) \approx \frac{ 1 }{ 1+\left[n+1 \right] \left\{ \frac{1-0.9}{n+1} \right\} } \approx 0.9\]
Todennäköisyydeksi tulee siis noin \(0.9\). Todistajan tarkan väitteen todennäköisyyden pienuus verrattuna valehtelun todennäköisyyteen yleensä on siis yksi olennainen syy sille, miksi todistus harvinaisista tapahtumista on usein huomattavasti painavampi kuin mitä Hume ja hänen modernit seuraajansa antavat ymmärtää.
Onko siis totta, että erityiset väitteet vaativat erityisen vahvoja todisteita? Ei oikeastaan. Tavallinen todistus näyttäisi riittävän. Sekä induktioperustelu että todisteiden vahvuus käyttäytyvät usein erilailla kuin pintapuolisesti voisi ajatella. Pelkkä huonosti määritelty vaatimus erityisen vahvoista todisteista ei tässä oikein toimi. Kun tarkastellaan ihmettä yleisellä tasolla harvinaisena tapahtumana suuren tavallisten tapahtumien määrän joukossa, induktio tavallisista tapahtumista ei laske harvinaisen tapahtuman todennäköisyyttä enempää kuin mitä jo yksi todistajanlausunto nostaa sitä.
Tuloksemme antavat siis jonkinlaisen peruslinjan ihmeiden uskottavuutta arvioitaessa. Harvinaisia asioita tapahtuu, ja usein jo yksi todistus tapahtumasta riittää tekemään siitä uskottavan. Tästä analyysiä voidaan sitten viedä erilaisiin suuntiin: Kuinka uskottava kyseinen todistaja on? Onko hänellä tai hänen yhteisöllään taipumusta suurennella tai olla herkkäuskoisia tapahtuman suhteen? Onko jollakin menetettävää tai voitettavaa erehtyessään juuri tämän tapahtuman kohdalla johonkin suuntaan? Pätevätkö yksinkertaisen induktion oletukset tässä tapauksessa? Mikäli emme tarkastele ihmeitä vain hyvin harvinaisina tapahtumina vaan suhteessa luonnonlakeihin, olettaen tietyn luonnonlain käsitteen ja ihmeen käsitteen suhteessa siihen, miten tilanne muuttuu?
Mielestäni Earman ei vie käsittelyään todistajien lausunnoista tarpeeksi pitkälle. Kirjoituksen toisessa osassa, jonka laskut ovat jo valmiina, mutta itse teksti lienee joidenkin kuukausien päässä, vien Earmanin laskuja todistusten huomioimisen kohdalla pidemmälle.
Kuva 1: dev Moore@Flickr.com. CC BY 2.0.
Kuva 2: Isabelle@Flickr.com. CC BY-NC-ND 2.0.