Vis alle produkter
Tallenes tale
Skrevet av Bjørn Vassnes   
torsdag 18. september 2008 16:24

Statistikk har fått et image som et lite sexy, og nærmest latterlig fag. Odd Børretzen har en parodi der han forteller at av alle som har omkommet i flycrash, har over 50% drukket kaffe like før, og at vi derfor burde være mer skeptiske til kaffe. Men det Børretzen parodierer, er ikke statistikk i seg selv, men måten vi bruker den på. Og faktum er at dagsavisene nesten hver dag har oppslag som er like ille.

Man kan nesten si at menneskehjernen ikke er laget for å skjønne statistikk. For å ta et eksempel der også de fleste leger tar grovt feil. I flere studier er et spørsmål som dette gitt: ”En prosent av kvinner på førti år som tar del i rutineundersøkelser har brystkreft. Åtti prosent av kvinner med brystkreft vil få positive mammografier (”positiv” her er som i betydningen HIV-positiv: negativ for den som får resultatet). Ti prosent av kvinnene uten brystkreft vil også få positive mammografier. Hva er sjansen for at en kvinne i denne aldersgruppen som får en positiv mammografi faktisk har brystkreft?”

Når leger har fått denne oppgaven, har de fleste svart at sjansen for at kvinnen har kreft, er ca 75%. Mens det riktige svaret er 7,5%! Legene, som oss andre, greier ikke å regne sammen to sannsynligheter, i dette tilfellet 1) kun én prosent av kvinnene i denne aldersgruppen har brystkreft, og 2) ti prosent av kvinnene uten kreft vil få positivt resultat. Hvis dette er vanskelig, tenk slik: Av totalt tusen kvinner vil kun 10 faktisk ha kreft, og av disse 10 vil 8 få en positiv mammografi. Mens av de 990 som ikke har kreft vil 99 også få en positiv mammografi. Med andre ord: 8 av 107 positive tester vil indikere et faktisk krefttilfelle. Dette er 7,5% - og ikke 75%.

Dette eksemplet fant jeg i boken Super Crunchers: How anything can be predicted” av Ian Ayres, som er professor ved Yale, for sikkerhets skyld i både jus og mangement. Men dette er mer enn en bok om hvordan man skal forstå statistikk. Den beskriver en særdeles viktig trend, som er i ferd med å endre samfunnet på nesten alle områder. Vi snakker om alt fra hvordan politiske avgjørelser tas, til hvordan legen vil behandle deg, og hvordan markedsførerne vil forsøke å lure deg.

Det handler om hvordan kunnskap forvaltes. Tittelen Ayres opprinnelig hadde tenkt å bruke – The End of Intuition – setter fingeren på akkurat dette. Mens vi tidligere har brukt vår egen – og ikke minst eksperters – intuisjon til å finne ut hva vi skal gjøre, viser det seg nå at tallenes tale utkonkurrerer de menneskelige ekspertene på stadig flere områder.

Jeg nevnte legen. Der legene tidligere stolte på sin egen erfaring når de stilte diagnose og valgte behandling, brukes nå mer kvantitative redskaper: måleresultater og dataprogrammer. Og stadig oftere er det de sistnevnte som foreslår behandling. Det samme gjelder når du skal søke lån i banken: Mens man tidligere stolte på den enkelte bankmedarbeiders vurderingsevne, brukes nå i stadig større grad kvantitative data og statistiske metoder for å avgjøre søknader. Og vi kunne vise til eksempler over hele fjøla: forsikring, markedsføring, politiske beslutninger, utviklingsstrategier, ansettelser, studieopptak.

For mange er dette bare nok et eksempel på en dehumaniserende utvikling. Og vi beklager den, fordi vi ”vet” at den gode, erfarne legen vil kunne stille bedre diagnoser og foreslå mer passende behandlinger enn et datasystem kan. Problemet er bare at vi tar feil. Som Ian Ayres demonstrerer i boken sin, viser forskning at de menneskelige ekspertene må gi tapt på område etter område. Deres erfaring og intuisjon kan ikke hamle opp med datasystemene – vel å merke dersom de sistnevnte har fått tilstrekkelige (dvs enorme), og ikke minst relevante, data å jobbe med.

Ekspertenes problem er det samme som mitt og ditt: Vår hjerne kan for det første ikke behandle så store datamengder som maskinene, og dessuten har menneskehjernen en del innebygde snarveier som kanskje kunne være nyttige i steinalderen, men som kan bære helt galt av sted i våre dagers mer komplekse virkelighet.

Vi har for eksempel en tendens til å legge for mye vekt på uvanlige ting og hendelser, framfor de mer normale. Unger i storbyer frykter slanger og løver mer enn de frykter biler. Vi tror det er mer farlig å ha et håndvåpen i huset enn et svømmebasseng i hagen – selv om det er 100 ganger større sjanse for at svømmebassenget tar livet av ungene våre. Vi heller ofte til ønsketenkning i stedet for å se på fakta. Vi stoler også alt for mye på våre egne vurderinger, og har vanskelig for å skifte mening når fakta taler imot.

Dette gjelder også ekspertene, som derfor i tester på stadig flere områder blir slått av datasystemene. Ayres bok gir mange eksempler: En økonom fra Princeton har laget en formel som gjør det mulig ved hjelp av værstatistikker å forusti hvor gode vinårgangene vil bli – og treffer mye bedre enn vinekspertene.Et datasystem spår baseball-spilleres suksess bedre enn trenerne. Et diagnosesystem, Isabel, finner i 10% av tilfellene en plausibel diagnose som legene på egen hånd ikke kommer på. En test viser at en statistisk modell forutsier utfallet av rettssaker bedre enn en gruppe juridiske eksperter.

Så dersom statistiske metoder gjør det bedre enn vanlige eksperter, hvorfor er så ikke disse metodene mer i bruk? Svaret er at de er i bruk, og på stadig nye felter. Naturlig nok er det markedførere, business-strateger og aksjespekulanter som først har kastet seg over dette, spesielt i USA. En mengde nye firmaer prøver å gjøre penger på databehandling av statistikk, ved bla. å tilpasse markedsføringen til den enkelte kunde. Ut fra data om hva du nettopp kjøpte, kan systemene med statistiske metoder finne ut hvilke nye tilbud du mest sannsynlig vil bite på, en metode ikke minst Amazon og Google har tjent seg rike på. Forsikring og bank er andre eksempler på virksomheter som tilpasser sine tilbud ut fra hva statistikken kan si om en kunde av ”din type”.

Men statistiske metoder, kombinert med avansert databehandling, kan brukes til mer enn å lure penger fra deg og meg. Dette tas også i bruk for å gjøre livet bedre for folk. Ett eksempel er såkalt ”evidensbasert medisin” (EBM), som sprang ut av et manifesto som to kanadiske leger, Gordon Guyatt og David Sackett publiserte i 1992. Deres poeng var at behandlingsalternativer alltid måtte velges ut fra hva det var best evidens for, og at den beste evidensen måtte komme fra statistisk materiale. Tanken var ikke ny: Det var nettopp statistikk som fikk Semmelweiss til å hevde at dødeligheten på barselavdelingen på et sykehus i Wien ble kraftig redusert (fra 12 til 2 prosent) dersom leger og sykepleiere vasket hendene sine i klorinert lime før de møtte pasientene. Men Guyatt og Sackett ville sette dette i system, og med moderne datateknologi som verktøy.

Det mest kjente eksemplet på oppfølgingen av ideen er barnelegen Don Berwicks prosjekt ”The 100 000 Lives Campaign”. Ut fra en rapport som estimerte at 98 000 dødsfall per år i amerikanske sykehus skyldtes forebyggbare feil, satte Berwick i 2004 i gang en kampanje som skulle avverge disse 100 000 dødsfallene, ved hjelp av 6 enkle, praktiske grep, i Semmelweis’ ånd (ett av grepene var faktisk bedre håndvask). Alle disse tiltakene var identifisert ut fra statistikk. Berwick fikk med seg mer enn 3000 sykehus, 75% av sykehussengene i USA. Etter 18 måneder kunne Berwick melde at kampanjen hadde overoppfylt målet.

Statistikk behandlet med avansert databehandling, det Ayres kaller ”supercrunching”, har også gode resultater å vise til på feltet sosial utvikling i fattige land. Det startet i Mexico under president Ernest Zedillo, som på slutten av 90-tallet startet prosjektet Progresa. Dette skulle jobbe for utvikling innen feltene skole, helse og ernæring, og støtten gikk til mødre som forpliktet seg til visse tiltak: å sende ungene på skole, gå til mor-barn stasjoner, bli med på en monitorering av kostholdet, etc… Men det viktigste var at prosjektet ble evaluert ved hjelp av en randomisert test. Dette er en test kjent fra medisinen, der man ved hjelp av en tilfeldig fordeling av hvem som får hjelp og hvem som ikke får det, skal få kunnskap om tiltaket faktisk virker.

Resultatene fra disse testene var så overbevisende at prosjektet har overlevd skiftende mexikanske regjeringer, til og med den mer konservative Vincente Fox (som videreførte prosjektet under et annet navn). I 2002 ble programmet utvidet med to millioner familier, og har fått avleggere i flere andre land, med Verdensbanken som støttespiller. Og det som framfor alt har bidratt til dette, er den grundige statistiske dokumentasjonen av effektene.

”Supercrunching”, statistisk databehandling, tas altså i bruk på stadig flere områder, og nesten over alt fungerer det bedre enn vanlig ekspertkunnskap. Betyr så dette at ekspertenes dager er talte, at vi virkelig vil komme til å se ”the end of intuition”? Nei, sier Ayres, men ekspertenes rolle vil bli endret. De er nødt til å ta i bruk det hjelpemiddelet som ”supercrunching” er, men det er fremdeles menneskene som må komme med hypotesene om hva som skal testes. Så intuisjonen vil fremdeles ha en plass, men sammen med bruk av statistikk og datamaskiner.

Summen av dette vil gi bedre ekspertise, og et bedre grunnlag for de valg leger, politikere og andre aktører skal treffe. I en stadig mer kompleks verden trenger vi stadig bedre verktøy.