Denne artikel stammer fra det trykte Computerworlds arkiv. Artiklen blev publiceret den Computerworld d. 24. juni 2005.
Ud af EU's årlige budget på omkring 100 milliarder euro, anslås omkring en milliard euro at havne i de forkerte lommer. OLAF - EU-enheden der bekæmper svindel og korruption - er gået til modangreb med text mining og data mining.
Økonomisk kriminalitet i EU griber om sig. Der svindles med især med de store poster som landbrugsstøtte og regional udviklingsstøtte, ligesom der smugles flittigt.
- Problemet griber om sig; vi ser også nye metoder til bedrageri, ofte kombineret med hvidvask af sorte penge, fortæller Stefan Knolle, national ekspert i OLAF (Office européen de Lutte Anti-Fraude). Enheden hører under EU Kommissionen, men opererer helt uafhængigt i arbejdet med at beskytte EU's finansielle interesser ved at bekæmpe svig og korruption. OLAF er også ansvarlig for at udvise best practice i EU for toldvæsen, politi og andre med ansvar for at bekæmpe ulovlige aktiviteter.
Software og rå datakraft er de bedste våben i kampen mod svindlerne. For at fange dem, skal mønstrene i deres aktiviteter kortlægges. Det gælder om at følge pengene. Men der er bare to inspektører - en på landbrugsstøtteområdet og en på strukturfondsfeltet - og ingen kan læse 65.000 dokumenter dagligt, noterer Stefan Knolle.
- Text mining er et stærkt værktøj for os. Vi har brug for at pejle os frem til, hvordan svindlerne opererer, men vi kan ikke bruge normale søgefunktioner, eftersom vi som udgangspunkt ikke ved, hvad vi leder efter, siger han.
Tekster består af ustrukturerede data, hvor betydningen afhænger af den sammenhæng, ordene optræder i. Ved hjælp af text mining kan ustruktureret tekstinformation omdannes til struktureret indhold. Opgavens omfang understreges af, at det i OLAF gøres på 20 sprog. Gennem opdeling i klynger, sammenkædning af koncepter, udkrystallisering af forskellige kategorier af uregelmæssigheder samt videreforarbejdning med data mining og hele kæden af business intelligence analyseredskaber skaber efterforskerne sig et overblik. De ser blandt andet på, hvor og hvor ofte ordene optræder, teksternes indbyrdes relationer og informationsmønstre i dem.
De søger at skille uregelmæssigheder fra organiseret kriminalitet og finder såvel småsvindlere med fåreflokke, der vandrer mellem forskellige gårde og derfor får EU-tilskud igen og igen, som cigaretsmugling for anseelige millionbeløb.
Et væsentligt formål med arbejdet er at forebygge, siger Stefan Knolle.
- Vi er med til at finpudse EU-reglerne. For ofte viser det sig, at fupmanøvrerne er mulige, fordi reglerne er dårlige, og så må de strammes.
OLAF-ekspertens bud på, hvad der er brug for i fremtiden er et styrket internationalt samarbejde, udveksling af data, klar og konkret efterforskning tæt på data og strategisk analyse med mere fokus på det forebyggende arbejde.