Information Integration: Søg, og du skal finde

Denne artikel stammer fra det trykte Computerworlds arkiv. Artiklen blev publiceret den CTO d. 1. april 2005.


databaser Information Integration skal gøre informationssøgning på tværs af databaser, e-mail, tekstdokumenter,
ERP-systemer, CRM-systemer og andre systemer mulig.

85 procent af en virksomheds information er i, hvad analytikere kalder ustruktureret form. Med ustruktureret form menes, at informationen ikke er i en database, hvilket gør det svært for virksomhederne at have et overblik over informationen - og finde den frem, når der er behov for det.
- For 10 år siden kunne man gå ud fra at værdifuld information var i en database. I dag er 85 procent af en virksomheds information i ustruktureret form som e-mail og tekstbehandlingsdokumenter, oplyser Susan Aldrich, senior vicepresident fra Patricia Seybold Group.
Inspireret af søgemaskinerne på internettet, tilbyder en række leverandører værktøjer, der skal gøre det muligt at finde rundt i mængden af information.
Velkendte firmaer som IBM, Oracle og Microsoft tilbyder side om side med datawarehouse-specialister som Informatica, søgemaskineleverandører som Fast Search & Transfer samt specialister som Ascential, Avaki og Composite Software hjælp i form af Information Integration-teknologi.
Ifølge Ann-Katrin Wagner fra DB2 Information Management i IBM har brugerne i virksomhederne vænnet sig til hurtige søgninger ved hjælp af eksempelvis Google og nu vil de have samme muligheder internt i virksomhederne. Den store forskel er dog, at søgemaskinerne på internettet blot søger i HTML-sider og et par få de-facto standard-formatter som Microsoft Word og PDF-filer. Virksomhederne har udover intranet-sider, word- og PDF-dokumenter en række databaser, ERP-systemer og andre systemer, som allesammen indeholder vigtig information.
Ved at skabe et ensartet syn på data i alle afskygninger gør Information Integration det muligt for medarbejderne at søge efter information på tværs af databaser og filformater.
En måde at skabe et ensartet syn på data er at konsolidere alle data i én database. Her trækker man de ønskede data ud fra de respektive databaser og filer, og indlæser dem i en fælles database, hvor søgningerne kan finde sted. Den proces anvendes blandt andet ved opbygning af datawarehouses. Ulempen ved løsningen er, at man løbende skal replikere data, hvis man ønsker at søgningerne skal foregå blandt de nyeste informationer.
En anden måde at skabe et ensartet datasyn er ved hjælp af en proces, der på godt it-dansk kaldes federation. Ved federation opbygges et centralt metadata repository, der beskriver, hvor data er placeret, hvilken slags data det er, hvordan data er lagret samt eventuelle relationer til andre data.
Ved hjælp af metadata repositoriet skabes en fælles indgang til data, der gør det muligt at søge på tværs af data.
Ifølge Ann-Katrin Wagner er det især finansielle virksomheder og offentlige institutioner, der anvender IBM's bud på Information Integrator, WebSphere Information Integrator.

Billedtekst:
eksempel på information integrations-arkitektur. Brugere og applikationer kan få adgang til virksomhedens data med interfaces som JDBC, ODBC, SQL eller XQuery. Ved hjælp af federation skabes en virtuel database, hvor indholdet ligger spredt i forskellige databaser og filsystemer. Brugerne oplever, at data er placeret eet sted. Et metadata-repository beskriver, hvor data er placeret. I stedet for eller sammen med federation kan man vælge at samle nogle/alle data i en database ved hjælp af replikering som tilbydes af servicelaget. Servicelaget kan også tilbyde caching af data, så søgninger foregår hurtigere.

Boks:
Federation
Alle data opleves som værende i een virtuel database, selvom de fysisk er i forskellige databaser og filformater. I et metadata repository beskrives, hvor data er placeret, hvordan data er lagret og hvilken type data det er.

Boks:
ETL
Extract, Transform Load. Proces hvor data trækkes ud fra eksisterende databaser og ændres til den form som man ønsker, hvorefter data indlæses i en konsolideret database. Anvendes ved datawarehouse-opbygning.




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Konica Minolta Business Solutions Denmark A/S
Salg af kopimaskiner, digitale produktionssystemer og it-services.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Industry 4.0 – sådan udnytter du AI og digitalisering til optimering af din produktion.

På denne konference fokuserer på en digitaliseret optimering af processer i produktions- og procesorienterede virksomheder. Herved bliver du f.eks. i stand til at kombinere maskiner med sales forecasting og derved planlægge anvendelsen af produktionsapparat og medarbejderallokering effektivt – samt begrænse materialespild og nedetid ved at optimere produktionsplanlægning og omstilling af produktionsmateriel.

04. september 2024 | Læs mere


Roundtable for sikkerhedsansvarlige: Hvordan opnår man en robust sikkerhedsposition?

For mange virksomheder har Zero Trust og dets principper transformeret traditionelle tilgange til netværkssikkerhed, hvilket har gjort det muligt for organisationer at opnå hidtil usete niveauer af detaljeret kontrol over deres brugere, enheder og netværk - men hvordan implementerer man bedst Zero Trust-arkitekturer i et enterprise set up? Og hvordan muliggør Zero Trust-arkitekturen, at organisationer opnår produktivitetsfordele med AI-værktøjer samtidig med, at de forbliver sikre i lyset af fremvoksende trusler?

18. september 2024 | Læs mere


Nye forretningsmæssige gevinster med Microsoft Dynamics 365

Eksperter fra CGI stiller skarpt på hvordan, du lærer også hvorfor det er vigtigt at have fokus på både processer, teknologi og mennesker - og hvordan du kommer i gang med løbende optimering af forretningsudvikling.

25. september 2024 | Læs mere