Ligesom virksomheder samler på kundedata for at sælge os varer og oplevelser, er samfundsvidenskaberne ved at få øjnene op for, hvordan man kan bruge digitale data til at finde ny viden om, hvordan vi som borgere og privatpersoner opfører os.
I foråret åbnede Københavns Universitet (KU) et nyt forskningscenter for "social data science", hvor økonomer, psykologer, sociologer og antropologer sammen med folk fra statskundskab og it-folk fra DTU arbejder sammen for at grave den viden frem, som gemmer sig i store datasæt.
En af hjørnestenene i arbejdet er et projekt, hvor mere end 1.000 DTU-studerende er blevet udstyret med smartphones, der løbende opsamler data om brugernes adfærd - både i den virkelige verden og på nettet.
I spidsen for det nye forskningscenter står økonom og professor David Dreyer Lassen, som sammen med sin kollega Sune Lehmann Jørgensen fra DTU Compute er blandt de første, der herhjemme har arbejdet med det nye forskningsfelt - "social big data".
I modsætning til traditionel samfundsvidenskab, hvor man beder folk svare på spørgeskemaer, giver digitale data ifølge David Dreyer Lassen i mange tilfælde mere detaljerede og præcise oplysninger om forsøgspersonernes adfærd.
Ikke som med køer og atomer
"Samfundsvidenskab handler stadig om at forstå, hvorfor folk opfører sig på en bestemt måde. Hvor de får deres informationer fra, hvilke holdninger de har, hvordan de handler og hvilke konsekvenser det har," siger David Dreyer Lassen.
"Det giver et bedre grundlag for at træffe bedre beslutninger på en række forskellige områder. Men i modsætning til biologer eller fysikere kan vi ikke bare sætte nogle køer på en bestemt diæt eller kigge på nogle atomer. Og dem, vi observerer, gider ikke nødvendigvis svare, lige når vi spørger. Der har vi nu en ny vinkel på vores dataindsamling," siger David Dreyer Lassen.
Han peger på et konkret eksempel, hvor forskerne har undersøgt om, man kan forudsige folks valg af transportmiddel. De data, der indsamles, viser helt ned på personniveau, om valget falder på bil, cykel, tog eller bus.
"Det er selvfølgelig relativt enkelt for den enkelte at svare, hvilken transport de har brugt i dag, men hvordan så det ud for tre uger siden? Der giver de her data et meget mere præcist billede af. Men det er også nogle datasæt, som er meget store."
En anden del af forskningsarbejdet går helt lavpraktisk ud på at gøre en smartphone til et måleinstrument, så man ikke direkte skal spørge deltagerne om noget. Eksempelvis har man eksperimenteret med at bruge Bluetooth til at registrere, hvilke personer der opholder sig samme sted, og hvor stor den fysiske afstand er helt ned til hele og halve meter.
Sammen med data om telefonopkald og sms'er kan det give nogle kvalificerede bud på, hvilken relation folk har til hinanden.
"Vores data er baseret på, hvad folk rent faktisk gør, i stedet for hvad de siger, de gør. Og et af de spørgsmål, vi arbejder med, er, hvor langt vi kan komme med denne type dataindsamling. Indsamling af data løser jo ikke alt. Selv om folk er sammen, ved vi ikke noget om kvaliteten af den relation, de har til hinanden.
Ingen spørgsmål fra forsøgsdeltagere
Netop fordi de indsamlede data går meget tæt på den enkelte person, spiller spørgsmålet om beskyttelse af privatliv og personlige oplysninger en stor rolle for forskerne.
"Vi har tænkt meget over, hvad der var worst case, når vi samlede data ind fra vores forsøgspersoner. Så da vi delte telefoner ud til de studerende, var vi klar til at svare på alt, hvad der måtte være af spørgsmål. Men der var ingen spørgsmål fra forsøgsdeltagerne," siger David Dreyer Lassen, som peger på en oplagt forklaring - at de studerende er betydeligt yngre end de fleste forskere.
"Personligt er min holdning til privacy nok sådan lidt "på den ene side og på den anden side". Vi kan bruge teknologien til at indrette os, så vi får færre trafikulykker, kortere bilkøer eller bedre sundhed. Det er jo fint nok. Og vi tænker også i retning af at gøre det lettere for borgerne at give deres mening til kende og få indflydelse på, hvem der for eksempel bliver opstillet, når vi har valg," siger David Dreyer Lassen, som dog ikke er blind for, at adgang til data også er et spørgsmål om magt.
"Man kan selvfølgelig forestille sig, at indsamlingen af alle de her data ender med, at de offentlige institutioner bliver stærkere på bekostning af borgerne. Men vi arbejder også med det perspektiv, at data kan bruges til at give noget af magten tilbage til borgerne," siger han og nævner et projekt, hvor forskerne har brugt data om, hvem der diskuterer politik på Facebook.
"Vi ved, at indvandrere deltager mindre i den klassiske offentlige debat med læserbreve og vælgermøder. Men på Facebook kan vi se en meget større deltagelse af folk, der har udenlandsk klingende navne. Det tyder på, at det ikke er rigtigt, at indvandrere er uinteresserede i politik. Deres deltagelse kommer bare til udtryk gennem nogle andre kanaler."
Virksomhederne er foran
Store it-virksomheder som Google og Facebook har i årevis høstet data om deres brugere. Ifølge David Dreyer Lassen har den slags virksomheder i lang tid arbejdet med de samme emner, som de danske forskere nu kaster sig over.
"Ser man på Facebook, Google, Amazon og flere andre store teknologidrevne virksomheder, så lever de af at bygge services, som folk gerne vil bruge. Det kræver, at man forstår folks adfærd helt ned på mikroniveau. Og så er det vel meget naturligt at hyre folk, der er uddannet til at studere mennesker. Derfor ser du, at de også ansætter antropologer, psykologer og sociologer," siger David Dreyer Lassen, som dog ikke har nogen illusioner om, at det nye danske forskningscenter kommer til at gå it-giganterne i bedene.
"Der er nogen, der har spurgt, hvorfor vi overhovedet skal gøre det her? Giver vi ikke bare virksomhederne gode ideer. Men vores vinkel er, at virksomhederne er langt, langt foran. Vi ser mere os selv som nogen, der tjekker op på, hvad man kan gøre med de data, der allerede nu samles op om borgere eller kunder," siger David Dreyer Lassen, som også ser det som en del af sin opgave at være på udkig efter misbrug af data.
"Jeg opfatter bestemt ikke mig selv som maskinstormer. Der er rigtig mange mennesker, der har glæde af de muligheder, som teknologien giver. Men der er selvfølgelig en risiko for, at man på længere sigt undergraver vores forestillinger om, hvilke oplysninger der er private, og hvem der ejer hvilke data. Det ser vi helt banalt med privatlivsindstillingerne på Facebook, hvor det er udbyderen, der bestemmer, hvad der foregår," siger han.
Disse danske virksomheder forsker i vigtige it-områder
Forsker kritiserer fremtidens sex-robotter: Styrker traditionelle stereotyper af kvinder