Brugeren afgiver med hvert klik oplysninger, som ikke må gå fortabt. Det er baggrunden for en ny bog med den uskyldige titel "The Data Webhouse Toolkit - Building the Web-Enabled Data Warehouse". Bogens forfattere, Ralph Kimball og Richard Merz, fremlægger med det såkaldte "Data Webhouse" et nyt koncept, der er afledt af det allerede kendte "Data Warehouse" - et centralt datalager i virksomheden, som samler informationer fra mange forskellige databaser og gør det muligt at køre meget komplekse forespørgsler.
Det nye Webhouse samler data fra Internet, den såkaldte "clickstream" - en uendelig strøm af kundedata, der udløses, hver gang brugeren klikker på en knap eller foretager et valg på websitet. Budskabet om at registrere kundedata og sammenkøre oplysningerne i en gigantisk database rammer lige plet i den aktuelle diskussion om beskyttelse af personfølsomme oplysninger på Internet. Bogen viser, hvad der er teknisk muligt, og udstikker rammerne for den registrering - nogle ville sige overvågning - der følger med Nettets fagre nye verden.
Tilbud
Bogen består af to hovedsektioner, "Bringing the Web to the Warehouse" og "Bringing the Warehouse to the Web". Den første sektion beskriver, hvordan logdata fra Internet - en endeløs kilde til værdifulde kundeoplysninger - kan opfanges, analyseres og registreres i et komplekst dynamisk miljø. Bogens anden og mindre interessante sektion handler om at designe web-brugerflader til eksisterende datalagre. De sidste kapitler vil kun være relevante for virksomheder, der allerede har installeret et "Data Warehouse".
Bogen henvender sig primært til Internet-forretninger, der må formodes at have interesse i at kende og registrere deres kunder, men kapitlerne om analyse af klikstrømmen kan læses af alle, som ønsker en dybere forståelse af Nettets mekanismer. Som web-bruger er man sjældent opmærksom på det, men hvert eneste klik udløser en flodbølge af beskeder, der sendes over Internet - beskeder, der kan registreres og sammenkøres med andre oplysninger, som forretningen måtte have gemt om kunden.
Når man f.eks. klikker på overskriften "Tilbud" hos en Internet-forretning, sendes en besked til butikkens Internet-server, som opfordres til at overføre den pågældende side - samt alle tilknyttede grafikfiler og andre elementer. I serverens logfil registreres hver eneste fil, som sendes over Nettet, sammen med modtagerens IP-nummer. Hvis forretningen bruger cookies, er det muligt at gemme oplysninger om brugeradfærd fra besøg til besøg - det sidste manglende led, nemlig kundens navn og adresse samt andre demografiske oplysninger, kan tilføjes til profilen, når brugeren bliver til kunde ved at foretage en bestilling.
Supermarked
Hvad kan oplysningerne så bruges til? I bogens nævnes en række eksempler, der alle tager udgangspunkt i den handelsdrivende på Internet, som ønsker at maksimere sin indtjening. Undersøgelser har vist, at mange bestillinger afbrydes, måske fordi kunden savner vigtige oplysninger som fragtomkostninger eller simpelthen fordi knappen "Bestil" ikke er synlig nok. En analyse af serverens logfiler kan afsløre sådanne afbrudte besøg, ligesom den kan fortælle, hvilke sektioner der er mest besøgte og hvilken "vej", kunder følger gennem sitet - hvor vejen måles fra den side, hvor brugeren "kommer ind" i butikken, til den side, hvor sitet "forlades" igen.
Det mest spændende perspektiv, som præsenteres i "The Data Webhouse Toolkit", handler om muligheden for at skræddersy websites til den enkelte kunde. De fleste hjemmesider fremstår i dag ens for alle brugere - men behøver det være sådan? Nej, siger bogens forfattere, og peger på, at brugerne er forskellige og har meget forskellige behov. Ved at registrere alle brugerens valg kan sitet tilpasses dynamisk, bestemte sektioner kan fremhæves eller nedtones - uden at brugeren mærker det.
Forfatterne nævner som eksempel et supermarked, hvor en hær af små usynlige assistenter konstant flytter rundt på hylder og varer for at personalisere forretningen til den enkelte kunde. Næste gang, kunden besøger supermarkedet, finder man måske den vare, som man sidst købte, centralt placeret foran indgangen, mens mindre interessante produkter er flyttet længere bort. Supermarkedet er ophørt med at eksistere som en butik med fast inventar, men skabes i stedet efterhånden som web-brugeren bevæger sig rundt i vareudbudet.
Inden kunden har nået kassen har man truffet så mange valg - ved at vælge produkter fra hylderne - at butikken helt har forandret udseende som reaktion på de oplysninger, der nu er registreret om denne kunde. En forvirrende oplevelse for den kunde, som skifter mening lige inden kassen og forsøger at bevæge sig tilbage gennem butikken, blot for at opdage, at alle hylder har skiftet plads!
Klikstrømmen
Bogen er værdifuld læsning for alle erhvervsdrivende, som har etableret deres egen butik på Internet. Kapitlerne om analyse af klikstrømmen og logfiler er centrale for bogen, mens sektionen om web-brugerflader, internationalisering og design forekommer malplaceret i en bog, der fortrinsvis beskæftiger sig med dataindsamling over Nettet.
Forfatterne nævner også - uden at tage stilling til de etiske og juridiske aspekter - at Internet-udbydere er de firmaer, som har det bedste udgangspunkt for at drive "data mining" i stor stil.
"The Data Webhouse Toolkit", Ralph Kimball og Richard Merz, Wiley, ISBN 0-471-37680-9