Minedrift letter diabetesforskning

Denne artikel stammer fra det trykte Computerworlds arkiv. Artiklen blev publiceret den BioTech d. 4. september 2003.


BIO-IT: Da forskerne på Steno Diabetes Center løb panden mod en mur i arbejdet med genetik og diabetes, forsøgte de at komme videre med data mining som murbrækker. Efter to år tegner billedet sig
lovende for den videre forskning.

Steno Diabetes Center jagter genetiske markører. Sladrehanke, som kan afsløre de gener, der gør nogle mere udsatte for sukkersyge end andre. Hvis man vel at mærke kan få sat fingeren på, hvilke kombinationer der øger risikoen.
Det er her, data mining kommer ind. For diabetes er en af de klassiske multifaktorielle sygdomme, hvor mange gener spiller ind, men hver især ikke betyder ret meget. Det gør det noget nær umuligt at finde frem til markørerne og - frem for alt - de mønstre, der tegner diabetes-højrisikoen.
Forskerne på Steno havde brug for en it-værktøjskasse. De greb til data mining, som har vist sig effektivt i arbejdet med at identificere mønstre og dermed på længere sigt gøre det muligt at forebygge diabetes.
Gennem de seneste to år har forskerne for det første fået afklaret, om data mining kunne bruges, og for det andet analyseret nye data i forhold til den ældre research.
Rent praktisk har de undersøgt 375 danske og svenske familier, hvor to børn har diabetes. De er typet for omkring 400 genetiske markører - spredt over hele arvemassen.
Alle data er fyldt i data mining-software og kørt igennem de rette algoritmer. Fremdeles beslutningstræer, eftersom resultaterne her er lettere at håndtere end neurale netværksanalyser.
"Vi havde en slags facitliste, baseret på de klassiske research-metoder. Resultaterne matcher langt hen ad vejen. Data mining kan altså finde det samme som den klassiske analyse. Derudover fandt vi en del, som vi ikke har fundet på gammeldags manÈr. Vi er nu ved at teste, om det holder," fortæller Flemming Pociot, der er læge og ansvarlig for Steno Diabets Centers genetiske forskning i Type 1 diabetes, som typisk diagnosticeres hos børn og unge.
"Data mining er lovende. Vi får resultater allerede i første hug," siger han med henvisning til 'træningsprocessen' med genetiske profiler på datasættet.

Adgang til flere parametre
Forskerne på Steno planlægger at tage skridtet længere og bruge data mining til at kombinere forskellige former for information. Ikke blot det genetiske, men også eksempelvis køn, vægt, fødselsvægt og højde, spisevaner og kliniske parametre fra laboratorieundersøgelser.
"Vi ved, at der er stor forskel på folk med diabetes. Ikke alene bestemte genvariationer, men en kombination af mange faktorer spiller ind. Det kunne være meget, meget interessant, men det kræver, at vi designer nye studier med adgang til flere parametre," siger Flemming Pociot.
Sågar et kommercielt perspektiv har forskerne fået øje på - på baggrund af det faktum, at man skal have så mange personer som muligt med i sit datasæt for at opnå den bedst mulige træning af sine algoritmer.
"Vi havde oprindeligt en vision om, at når vi havde lavet studiet, ville vi etablere et data warehouse, som man kunne gøre andre forskningsgrupper interesserede i at sende genetiske data til. Algoritmen fik ny træning, hver gang nye data kom ind, og de pågældende ville kunne få information tilbage, som var genereret på basis af langt større mængder data end deres egne. Men det krævede en stor økonomisk indsprøjtning at sætte op, og vi har ikke umiddelbart kunnet finde finansiering. Så nu prøver vi i akademisk regi. For ideen er god nok - ikke mindst til internationale samarbejder," siger Flemming Pociot.
Som eksempel nævner han det store internationale diabetes-initiativ Type 1 Diabetes Genetics Consortium, som er sponseret af de amerikanske myndigheder, primært National Institute of Health og Juvenile Diabetes Research Foundation, med 25 mio. dollars. Steno leder den europæiske arm af netværket.
Flemming Pociot har selv præsenteret data mining-projektet internationalt ved flere lejligheder.
"Der er utrolig stor interesse. Mange står på spring," siger han.
Eftersom der for Steno Diabetes Center har været tale om en udviklingsprojekt, har man parallelt kørt flere data mining-værktøjer. Fremdeles Clementine fra SPSS og Enterprise Miner fra SAS Institute. De har lidt forskellige styrker, men er lige gode til de fleste ting, lyder den foreløbige konklusion.
Mellem forsker og leverandør har Steno placeret en superbruger, det lille it-firma Neurotech, som gennem de seneste år har bevæget sig langt ind i biomedicin og specialiseret sig i at håndtere forskningsdata i sundhedssektoren.
"Selv om både SPSS og SAS har brugervenlighed i systemerne, kræver det eksperter at bruge det - optimalt - i forskning som vores. Det er ingen venstrehåndsopgave og i hvert fald vanskeligt som læge og forsker. Der går lang tid, før det bare er data ind og data ud," siger Flemming Pociot.
Han tilføjer, at det meste af den biomedicinske verden bliver stadig mere tværfaglig med optræden af både biologer, kemikere, fysikere og it-folk i problemløsningen.

Konkurrenter
Fra SPSS Danmark lægger direktør Torben Gadfelt stor vægt på Steno Diabetes Centers brug af Clementine.
"Grundstenen til SPSS blev lagt inden for sundhedssektoren, som udgør en væsentlig del af vores marked. Især inden for biotek og biomedicin er det en oplagt mulighed at bruge redskaber som vores for at forbedre gennemløbet i forskning og produktudvikling og få en hurtigere fremdrift," siger Torben Gadfelt, der også understreger betydningen af det intuitive og brugervenlige.
SPSS og SAS Institute er konkurrenter på business intelligence-området, som karakteriseres af værktøjer for dem, der er ved at drukne i data, men mangler information. SAS er den store med det bredeste produktudvalg, mens SPSS har et stærkt fokus på kerneområdet data mining og den såkaldte predictive analysis - analysen oven på den rene statistik.
SPSS har i høj grad rødder i forskningen og havde indtil 1999 Uni-C, en it-virksomhed under Undervisningsministeriet, som dets danske distributør. I 1999 etablerede selskabet dets egen afdeling i Danmark, hvor eksempelvis Indenrigs- og Sundhedsministeriet bruger dets data mining-redskaber til at kortlægge sammenhænge i sygdomme og livsmønstre.

Citat:
Data mining er lovende.
Vi får resultater allerede i første hug.

Billedtekst:
"Vi havde en slags facitliste, baseret på de klassiske research-metoder. Resultaterne matcher langt hen ad vejen. Data mining kan altså finde det samme som den klassiske analyse. Derudover fandt vi en del, som vi ikke har fundet på gammeldags manÈr. Vi er nu ved at teste, om det holder," fortæller Flemming Pociot, ansvarlig for Steno Diabets Centers genetiske forskning i Type 1 diabetes. Foto: Torben Klint




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Targit A/S
Udvikling og salg af software til business intelligence.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Bliv klar til AI Act: Det vil påvirke både din udvikling, drift og organisation

Fordelene ved at anvende kunstig intelligens bliver stadig mere udtalte, og både som virksomhed og myndighed er det i stigende grad uholdbart ikke at udforske mulighederne. Men der er også risici forbundet på den nye teknologi, og på dette formiddagsseminar ser vi på, hvordan verdens første regulatoriske kompleks – EUs kommende AI Act – adresserer behovet for en etisk, ansvarlig og kontrolleret anvendelse af AI.

20. august 2024 | Læs mere


Det Digitale Produktpas

Kom med og hør om, hvordan du kommer i gang med at sikre din virksomhed er klar til Det Digitale Produktpas. Vi sætter fokus på, hvordan du bliver klædt på til at få styr og struktur på dine data, samt hvilke krav du skal sætte til dine leverandører og andre i din værdikæde, for at sikre den nødvendige information er tilgængelig.

21. august 2024 | Læs mere


Cyber Security Summit 2024

På Cyber Security Summit får du indsigt i det aktuelle trusselslandskab, overblikket over de nyeste værktøjer og trends indenfor sikkerhedsløsninger, indsigt i de relevante rammeværktøjer og krav samt de bedste løsninger og værktøjer til at sikre effektiv drift og høj compliance.

27. august 2024 | Læs mere