Søgemaskiner kan ikke følge med Nettets vækst

Internet består af 550 milliarder sider. Selv de bedste søgemaskiner kender kun 1,4 mia. dokumenter.

Langt størsteparten af indholdet på Internet er "usynligt" for søgemaskiner som AltaVista og Google. Nettet består af flere end 550 milliarder dokumenter, men selv de største og mest omfangsrige søgemaskiner kender ikke flere end 1,4 milliarder, altså mindre end 1 procent.


Problemet skyldes at de fleste informationer ikke længere gemmes som web-filer, men ligger i gigantiske databaser. Mange Internet-tjenester - f.eks. ComON - bruger ikke statiske dokumenter, men genererer automatisk alle sider, når de kaldes. ComONs database indeholder over 7.400 artikler, som ikke kan indekseres af en almindelig søgemaskine.


Danny Sullivan fra "Search Engine Watch" beskriver problemet på følgende måde: "Dynamisk genererede sider eksisterer slet ikke, så længe brugeren ikke har kaldt dem". Søgemaskinernes Internet-robotter har ingen mulighed for at indeksere indhold, der ligger i sådanne dynamiske publikations-systemer.


Det "usynlige Internet" eller "Nettets dybhav" kaldes den enorme informationsmængde, som ligger skjult bag teknologier som ColdFusion og Microsofts ASP, der serverer dynamisk indhold fra databaser.


Firmaet BrightPlanet i USA forsøger at løse problemet med en speciel web-gateway, som gør det muligt at søge i mere end 200.000 databaser. Ifølge BrightPlanet er det "dybe" Internet 500 gange større end "overflade-Internet".


(Kilde: Futurezone/CNN)




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Targit A/S
Udvikling og salg af software til business intelligence.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Cyber Threats 2024: Sådan arbejder de it-kriminelle – og sådan beskytter du dig

De cyberkriminelle har udviklet sig betydeligt, arbejder professionelt, fleksibelt og udnytter hinandens specifikke kompetencer – omtrent som en velsmurt koncern med klar ansvarsfordeling – og har ofte en klar politisk eller kommerciel motivation. Det stiller også nye krav til din tilgang til cybersikkerhed, og på Cyber Threats 2024 får du viden, som gør dig i stand til bedre at prioritere, planlægge og eksekvere en tidssvarende cybersikkerhedsstrategi.

12. november 2024 | Læs mere


Fremtidens digitale kraftværk: Tag styringen med dit ERP-system

I dag ligger moderne ERP-platforme i skyen og opdateres adskillige gange årligt. Samtidig får man nærmest pr. automatik adgang til en omfattende portefølje af integrationer, add-ons, 3. partsmoduler, BI og avancerede funktioner til AI/ML-understøttelse af forretningsprocesser. På denne dag går vi derfor i dybden med, hvad det betyder for din virksomhed. Uanset om I har migreret til en cloudbaseret platform eller planlægger at gøre det indenfor en overskuelig fremtid.

13. november 2024 | Læs mere


Fremtidens digitale kraftværk: Tag styringen med dit ERP-system

I dag ligger moderne ERP-platforme i skyen og opdateres adskillige gange årligt. Samtidig får man nærmest pr. automatik adgang til en omfattende portefølje af integrationer, add-ons, 3. partsmoduler, BI og avancerede funktioner til AI/ML-understøttelse af forretningsprocesser. På denne dag går vi derfor i dybden med, hvad det betyder for din virksomhed. Uanset om I har migreret til en cloudbaseret platform eller planlægger at gøre det indenfor en overskuelig fremtid.

21. november 2024 | Læs mere