Avatar billede astalavista Nybegynder
02. august 2002 - 21:43 Der er 10 kommentarer og
1 løsning

google.com database opbygning

hejsa alle sammen.

Jeg kunne godt tænke mig et seriøst bud på hvordan googles struktur er opbygget med hensyn til databasen, men tabeller og kolonner.

Tak.
Avatar billede lundsfryd Nybegynder
02. august 2002 - 21:50 #1
Avatar billede lundsfryd Nybegynder
02. august 2002 - 21:52 #2
De bruger ikke relationsdatabaser og dertil hørende tabeller, kolonner osv. Det er simpelthen for langsomt til den type opgaver.

Dokumentet ovenfor giver en fin indføring i det grundlæggende princip, men man skal naturligvis holde tungen lige i munden for at danne sig et overblik over systemet :)
Avatar billede astalavista Nybegynder
02. august 2002 - 21:55 #3
Ok, det ser godt nok en smugle forvierende ud, men er der istedet nogle der så kan give et bud på hvorledes det ville se ud i en normal trationel database ;-)
Avatar billede lundsfryd Nybegynder
02. august 2002 - 21:58 #4
Hvor store datamængder skal du arbejde med?
Avatar billede astalavista Nybegynder
02. august 2002 - 22:00 #5
Det samme som google ;-) håber jeg da...

Men ikke her og nu, så starter i det småtte ;-) skal være til en søgemaskine, men har meget svært ved at samme holde dataerne i databasen.
Avatar billede lundsfryd Nybegynder
02. august 2002 - 22:10 #6
Well, jeg har tidligere gjort det samme, dog "kun" med et par millioner sider (bl.a. derfor lå linket ovenfor i mine bookmarks), og jeg kan godt love dig, at det er et stort arbejde, der ligger forude :-)

Hvis du vil indexere samme mængde data som google, kan du ganske enkelt ikke proppe det ned i en database - med mindre, at dine brugere skal opleve søgetider på et par døgn ;-) Desuden skal der ekstreme mængder hardware til, og ustyrlige mængder båndbredde til crawlingen.

Når du starter i det små, er du næsten nødt til at lave det på samme måde som det skal se ud i den "store" version - ellers skal du jo alligevel starte forfra senere.

Husk også på de skrevne og uskrevne regler ifbm. crawling (META robots tag, robots.txt mv.).

Alt i alt, så skal du påregne et meget stort researcharbejde og ikke satse på at bruge en database - hvis du gør, kan den i hvert fald ikke indrettes på "traditionel" vis.
Avatar billede astalavista Nybegynder
02. august 2002 - 22:15 #7
lundsfryd >> Jeg er bange for at det du siger et rigtigt :-(, hvad skete der med dig ejen søgemaskine?

Men, det er jo stadivæk sjovt at bygge lidt*gg*
Avatar billede lundsfryd Nybegynder
02. august 2002 - 22:20 #8
Den blev sådan set færdig, men desværre blev crawleren for langsom, og jeg opgav at forbedre den. Dermed kunne jeg ikke refreshe indexet mere end et par gange om året, og det er ikke nok. Desuden ville omkostningerne til båndbredde blive for store til at den kunne komme i drift for alvor.

Dog er jeg ved at overveje at prøve igen. Sidst implementerede jeg crawleren i Java og indexeringssystem og søgesystem i Pascal - jeg vil måske portere det hele til C++. For ja, det er sjovt at bygge, også selvom det ikke altid bliver til noget i sidste ende ;-)
Avatar billede astalavista Nybegynder
27. august 2002 - 13:11 #9
lundsfryd >> Tak for det gode svar, du må heller ligge et svar ;-)
Avatar billede lundsfryd Nybegynder
27. august 2002 - 15:29 #10
Ok, det får du her :)
Avatar billede astalavista Nybegynder
10. september 2002 - 21:03 #11
beklager den lange ventetid :(

Men nu er jeg på banen igen.

endnu engang tak for hjælpen.
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
Computerworld tilbyder specialiserede kurser i database-management

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester