Avatar billede vikaren Nybegynder
11. januar 2009 - 17:32 Der er 12 kommentarer

"bygning" af søgemaskine

Spørgsmålet er kort:

Jeg vil gerne lave min egen søgemaskine, men hvordan?

Jeg har siddet og bladret i de tidligere stillede spørgsmål og kunne desværre ikke finde et svar. Hvis der er nogen der har et svar eller ved hvor et sådan svar står vil jeg blive mægtig glad.

Jeg har allerede en hjemmeside og et webhotel hvis det kan gøre svaret lettere.

Xunil
Avatar billede madx Nybegynder
11. januar 2009 - 17:40 #1
Når du ikke har fundet svaret, er det fordi det ikke er helt let ;-)

Og det er uanset om du vil crawle hele Nettet og stille mange tusinder servere op eller blot en fornuftig søgning til egen hjemmeside.

Jeg går ud fra at det er sidste situation, der er den aktuelle....

Og Så ville jeg nappe en af de gratis og placere den på hjemmesiden - fremfor at kode selv.

Men vil du absolut kode en til hjemmesiden, så skal du søge i alt tekst og rangordne efter relevans... Det skal du nok få søndagen til at gå med ;-)
Avatar billede jensgram Nybegynder
11. januar 2009 - 18:05 #2
Alene det at hive links ud (og konvertere relative URL'er til absolute ditto), håndtere redirects, respektere robots.txt er ikke trivielle opgaver.
Avatar billede vikaren Nybegynder
11. januar 2009 - 20:05 #3
Jeg hører nok til de besværlige. ønsket er ikke at crawle hele nettet, jeg vil bare gerne lære det og gerne vide hvordan, man er vel lidt nysgerrig....

skal jeg forstå det sådan, at alt det google gør, det kan jeg også gøre herhjemmefra, ganske vidst ikke i samme størrelse men alligevel?

Jeg har lært at det altid er en god idé at have en plan.

(1) Det første jeg vel skal vide må være hvor jeg får en overblik over hvilke sider der er på nettet.

(2) hvordan søger jeg i disse informationer

(3) hvilket værktøj (software) skal jeg bruge for at foretage søgningen i (1) og (2).

jeg kører forresten linux - hurra.... alt magt til brugeren.... :)
Avatar billede jensgram Nybegynder
11. januar 2009 - 20:12 #4
(0) Det første du skal bestemme dig for, er, hvilket sprog du vil benytte ( / kan?).
Avatar billede vikaren Nybegynder
11. januar 2009 - 20:15 #5
snakker vi om c++ pascal eller asp/php?
Avatar billede jensgram Nybegynder
11. januar 2009 - 20:17 #6
Ja, det skal jeg jo ikke svare dig på :) Jeg aner ikke hvad du kan.
Avatar billede vikaren Nybegynder
11. januar 2009 - 20:19 #7
Næ...det gør du vel ikke, men skal det forståes således at jeg både kan bruge c++ og php mv..

Kan jeg godt gøre det i php? sådan en manual har jeg da lige tilfældigvis liggende..
Avatar billede olebole Juniormester
11. januar 2009 - 20:27 #8
<ole>

Det at crawle nettet er _langt_ det mindste problem ved en søgemaskine. At lave søgealgoritmer, cache relevante data, osv - dét er opgaven - og det var dét, der var milliarder værd for 'Google-drengene'  ;o)

Jeg er stødt nd i ikke så få crawlers/spiders 'derude' - prøv at søge på Google (nu, da du ikke har din egen søgemaskine)  ;D

Det er helt sikkert, at kompileret kode vil være langt mere effektivt (= C++)

/mvh
</bole>
Avatar billede arne_v Ekspert
12. januar 2009 - 04:41 #9
Du skal have:
- noget kode der kan hente en URL
- noget kode der kan parse HTML
- noget kode der kan gemme link og tilhørende information
- noget kode der kan søge i den gemte information

Hvis du vil kigge nærmere på den slags kode vil jeg foreslå Apache projekterne Lucene, Nutch og Solr. Du kan hente koden og studere den.
Avatar billede arne_v Ekspert
12. januar 2009 - 04:41 #10
Ifølge rygter bruger Google iøvrigt Python til deres crawler.
Avatar billede vikaren Nybegynder
13. januar 2009 - 14:23 #11
MANGE TAK FOR OPLYSNINGEN, JEG VIL UNDERSØGE DE NÆVNTE PROJEKTER MM LIDT NÆRMERE.

VIKAREN.
Avatar billede barskelauer Nybegynder
05. marts 2009 - 22:25 #12
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
IT-kurser om Microsoft 365, sikkerhed, personlig vækst, udvikling, digital markedsføring, grafisk design, SAP og forretningsanalyse.

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester