Avatar billede sanoy Nybegynder
21. april 2006 - 17:01 Der er 9 kommentarer

Søge maskine i meget store HTML dokumenter

Hej.

Jeg har et lille problem med et ekstrem stort HTML dokument. Hvori der foretages anvendes søgninger dagligt. Problemet er, at søgningen via browserne går for langsomt, samt når man åbner det kan det tage et minuts tid før det er åbnet. Selve HTML koder skal ikke kunne ses - altså som det vil blive fremvist via en browser.

Hvordan kan jeg lave det, således at det går en del hurtigere uden at skulle loade det ekstrem store HTML dokument, hver gang jeg skal bruge det?

Kan det laves i php? Hvis er der så et program, der kan gøre dette automatisk blot ved at "fortælle" den hvilke dokumenter den skal søge?

Jeg benytter mac...


På forhold tak !
Avatar billede espersen Novice
22. april 2006 - 09:15 #1
har du et link til siden ? - er ikke helt sikker på hvad du mener
Avatar billede sanoy Nybegynder
22. april 2006 - 11:08 #2
Det har jeg desværre ikke, da det ligger intern på min harddisk. Men kan prøve at omformulere det lidt:

Jeg har et par meget store HTML dokumenter, som sammen lagt fylder 20.000 sider eller der omkring. Disse vil jeg gerne have optimeret således, at jeg kan søge meget hurtigere i. I øjeblikket er det sådan, at når jeg åbner dokumenterne kan det tage et minuts tid før det er helt åben, og når man begynder søgningen i selve dokumentet kan der forekomme hak. Disse hak kan være relative langvarige.

Derfor vil jeg gerne have en løsning, således at man slipper for at åbne hele dokumentet. Hvor selve søgeren har en database, som index. En slags søgningsmekanisme som Googles. Nr den har fundet resulatet skal den kun vise det relavante. Er der mulighed for dette. Det skal gerne kunne fungere offine. Er der nogle programmer der kan gøre dette? Altså have HTML dokumenter i deres database. Kan godt leve med den langsomme metode, jeg har i øjeblikket. Men det ville være lækkert, hvis der kom lidt hastighed på det.
Avatar billede sanoy Nybegynder
22. april 2006 - 11:15 #3
I øjeblikket foretages søgningerne via en browser. Løsningen skal kunne fungerer til Mac OS X
Avatar billede espersen Novice
22. april 2006 - 11:15 #4
hhmm.. har ikke lige en løsning - håber der er andre med et bud..
Avatar billede apo Praktikant
22. april 2006 - 16:30 #5
20.000 sider??! Det var et stort dokument :o>

Kan dokumentet deles op i flere dokumenter?
Avatar billede olebole Juniormester
22. april 2006 - 18:46 #6
<ole>

Det lyder afgjort, somom HTML er en rigtig god løsning ....... men til en helt anden opgave  ;o)

Hvad lyder opgaven helt specifikt på - og hvorfor er der overhovedet blandet HTML ind i løsningen?

/mvh
</bole>
Avatar billede espersen Novice
26. april 2006 - 15:36 #7
Wildcard : http://desktop.google.com/
(kan måske bruges)
Avatar billede olebole Juniormester
26. april 2006 - 15:39 #8
- jamen, spørgsmålet bør vel lyde: "Hvorfor er der overhovedet blandet HTML ind i løsningen?". Det virker helt forkert at bruge HTML til så store datamængder  :)
Avatar billede espersen Novice
01. maj 2006 - 09:17 #9
enig - mon ikke sorteringen af data til fx en database kunne tage et par dage+ ;o)
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
Vi tilbyder markedets bedste kurser inden for webudvikling

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester