Avatar billede larsbachmanndk Nybegynder
15. november 2005 - 10:32 Der er 2 kommentarer og
1 løsning

Tutorial til søgebot

Jeg har ingen ambitioner om at lave en søgemaskine eller lignende, men af ren og skær interresse kunne jeg godt tænke mig at vide lidt mere om hvordan søgerobotter virker, og derfor vil jeg gerne læse en tutorial til hvordan man koder en søgerobot.
Bl.a. en bot som den www.blogbot.dk bruger.

Er der nogen der kan smide links til en kildekode/tutorial til en søgebot?
Avatar billede steinmann Nybegynder
18. november 2005 - 17:22 #1
I bund og grund gør en søgemaskine sådan:

#1 Indlæs en adresse, f.eks. http://www.w3.org/
#2 Undersøg denne side for <a href="links">links</a> og anden information der måtte være interessant
#3 Gem denne information i en database eller andet smart system
#4 Gå nu igennem listen med de funde adresser og start fra trin 1 med den nye adresse

Man kan så have forskellige begrænsninger på, for ovenstående model vil jo bare søge igennem de første links uden at komme videre med mindre der opstår en blindgyde. Da jeg lavede min med C# og MS SQL SERVER satte jeg den til at gå 4 links dybt og det brugte den så imellem 20 minutter til 2,5 timer afhængigt af indhold osv.

Men jeg stoppede så med at udvikle videre på den efter jeg løb ind i 2 problemer:

1: 350.000 unikke links på 3 timer fylder ca. 50 mb, det inkluderer sidens titel og diverse andre metatags samt anden information som jeg gemte.
2: Jeg ville jo gerne kunne søge i disse resultater, men når man søger skal man angive nogle kriterer, og jeg ville gerne rangere resultaterne efter forekomst vha. min egen lille fikse formel som jeg selv fandt på(ligegyldig for dette svar). Men mit problem var, at dette tog ca. 1 time pr. 42000 links hvorfor jeg så opgav(ja, det kunne sikkert gøres smartere, men efter 8 koderevisioner på 5 dage gad jeg bare ikke mere ;).

men jeg vender uden tvivl tilbage til det for det var utroligt spændende at arbejde med.

Men hvis du kan et eller andet programmeringssprog, så kan du sagtens anvende min lille firtrins-guide til at eksperimentere selv.

MVH og god søgning
  Casper Steinmann
Avatar billede larsbachmanndk Nybegynder
25. november 2005 - 14:39 #2
Tak for din forklaring, du får point.
med mindre der kommer en bedre frorklaring inden du når at svare :)
Avatar billede steinmann Nybegynder
25. november 2005 - 16:49 #3
svar svar svar! :)
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
IT-kurser om Microsoft 365, sikkerhed, personlig vækst, udvikling, digital markedsføring, grafisk design, SAP og forretningsanalyse.

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester