Hos lægerne på karkirurgisk afdeling på Gentofte Sygehus handler datamining ikke om kundetilfredshed, krydssalg og kreditvurdering.
Her er analyserne af patientdata vigtige for at kunne lave prognoser over, om en patient overlever det operative indgreb, som vedkommende står overfor.
Er patienten ryger eller tidligere ryger? Har patienten andre sygdomme eller symptomer, som øger risikoen ved en operation?
Alle de parametre skal lægerne forholde sig til. Dels for at kunne råd-give patienten ordentligt inden en operation, dels for at kunne sammenligne operationsafdelingen med afdelinger på andre hospitaler.
Mange patienter kommer med livstruende sygdomme, hvor behandlingen heller ikke er risikofri, hvor de altså risikerer at dø i behandlingsforløbet.
Det er typisk i forbindelse med de store operationer som for eksempel udskiftning af hovedpulsåren.
"Operationer er meget belastende, hvis man er syg i øvrigt. Det ikke sikkert, man kan tåle et stort indgreb, og så dør man i efterforløbet," siger Leif Panduro Jensen, ledende overlæge på karkirurgisk afdeling på Gentofte Sygehus, der har godt 100 ansatte og foretager cirka 1.200 operationer om året.
Derfor er det vigtigt for lægerne, at kende alle de parametre, der nedsætter sandsynligheden for overlevelse. Og derfor har han og hans kolleger i hele landet de seneste år arbejdet med mining-modeller over patientdata.
Forskellig dødelighed
Der er forskel på patientdødeligheden landet over. Oplysningerne samles i en klinisk database, som lægerne bruger til at lave opfølgning på, hvordan det går på de enkelte afdelinger.
Når en afdeling har højere dødelighed end en anden, melder spørgsmålet sig: Er det tilfældigheder eller er der andre årsager?
Her hjælper mining-modellerne lægerne i opklaringsarbejdet.
"En faktor, der konstant kommer op, er, om man regner med, at befolkningen har den samme sundhedstilstand overalt i Danmark. Den klassiske er, at der nok er forskel på, om man bor i Nordsjælland eller på det ydre Nørrebro, hvor livet for mange er socialt og økonomisk hårdere. Vi har brug for at kunne registrere og bruge alle sådanne parametre i den kliniske database, for det har indvirkning på, hvordan det går patienten efter en stor operation," fortæller Leif Panduro Jensen.
Arbejdet med datamining skal føre til, at alle landets karkirurgiske operationsafdelinger har modeller, der viser forskellene i dødelighed efter bestemte operationer.
Forudser fatale faktorer
I den karkirurgiske datamining-model har behandlerne eksperimenteret med at komme alle data i gryden og se på, hvad der betyder mest for overlevelsen efter de store operationer: Er det hjertesygdomme, lungesygdomme eller rygning for eksempel?
På den måde finder de mønstre, så de kan forudse, hvad den forventede dødelighed på de forskellige operationer bør være. Den sammenligner lægerne med den dødelighed, de observerer.
Her hjælper datamining-modellerne med at forudse, hvilke faktorer, der har særlig negativ indvirkning på en patients sandsynlighed for at overleve.
Udgangspunktet er hele tiden, at lægerne ønsker at gøre det så godt som muligt, uanset hvor i landet, de foretager operationerne.
"Nogle gør det måske bedre end andre, og de afdelinger kan vi måske lære af," siger Leif Panduro Jensen.
Der har været eksempler på en afdeling, der pludselig et år havde en dårligere overlevelse, end normalt. Så foretager man en såkaldt audit, hvor årsagerne granskes.
Det viste sig, at afdelingen havde haft særligt syge patienter til operation i den periode. Det er netop denne såkaldte risikojustering af data, der kan fanges i en datamining-model.
Det handler om kvalitet
Selvom arbejdet med at forbedre kvaliteten af behandlingen er foregået i mange år på landets sygehuse, er karkirurgien først lige kommet i gang med datamining.
Metodemæssigt har det været mere kompliceret end forventet, mener Leif Panduro:
"Det første spadestik er taget, vi har lavet vores første datamining-model og offentliggjort den," siger han.
Den første model var så ikke præcis nok, og påviste behovet for, at datamining-statistikeren skal arbejde tæt sammen med lægen, som kender betydningen af de forskellige parametre, forklarer han.
"Modellen kvalificerer jo ikke data. Vi skal fortælle den, at hvis patienten begynder at være lidt hjertesyg, så er det virkelig noget, der betyder noget. I den situation er der ikke en lineær sammenhæng mellem parametrene i modellen, men snarere en eksponentiel sammenhæng. Næste skridt er at forfine modellen med disse ting. Det er vi ikke nået til endnu."
Borgerne kan følge med
Arbejdet med datamining skal blandt andet munde ud i, at offentligheden får et præcist billede af, hvordan det går med behandlingen på landets sygehuse.
"Har vi systemet fuldt implementeret, vil vi have et fintfølende redskab, så vi kan se, hvis der kommer betydelige udsving afdelingerne imellem. Det kan være udsving til den gode eller dårlige side. Er det til den gode, kan det være, at en afdeling har fundet et eller andet columbusæg, man skal se nærmere på," siger han.
Borgerne er endnu ikke voldsomt interesserede i at følge dødeligheden på de forskellige sygehuse, så datamining-modellerne har størst betydning for lægernes faglige arbejde, vurderer han:
"Mining på patientdata handler i høj grad om kvalitetssikring. Vi laver statistik og rapporter hvert år. Dermed har vi større fokus på det daglige arbejde. Det er bestemt positivt."
EPJ-ambitioner for lave
Textmining, den udvidede form for datamining, som kan registrere og søge i klar tekst, er meget interessant, erklærer overlægen.
Han håber, at den nationale EPJ (Elektronisk Patient Journal), som efter planen allerede skulle være indført på de danske sygehuse, ikke bliver helt uden mulighed for at arbejde med højt strukturerede data, som dem i eksempelvis textmining.
"Vi håber at kunne samle al datafødning via EPJ'en. Men jeg er bekymret for, at man sætter ambitionsniveauet for lavt. Hvis det bare bliver strøm til papir, er det ikke interessant set fra en klinisk synsvinkel," siger han.
Leif Panduro Jensen ser gerne en situation, hvor man lader folk skrive i klar tekst i den analoge journal og bruger informationerne i it-systemet.
"Her vil den tekstbaserede datamining danne bro mellem sundhedspersonernes analoge verdensopfattelse og de digitale krav om højt strukturerede data. Hvis jeg til en stuegang skriver, at patienten har kvalme, så kan man med textmining finde ordet kvalme og oversætte det til den kode for kvalme, som allerede findes i systemet.
Dermed får vi lagt nogle af dataene over i højt struktureret format, og dermed kan vi lave sundhedsstatistik på det bagefter," forklarer han.
Leif Panduro Jensen erkender, at de højt strukturerede data formentlig bliver for vanskelige at håndtere fra starten i en national EPJ. Der findes ikke et standardsystem, så det hele skal bygges fra bunden.
"Sådan et system er skudt lidt ud i fremtiden. Det er måske ok, bare vi får mulighed for at mine i teksten, så vi kan analysere på de data."