Avatar billede coladrenge Nybegynder
08. juni 2008 - 22:10 Der er 10 kommentarer og
1 løsning

Søge i flere forskellige filformater

Hej

Jeg skal lave et system hvor det skal være muligt at søge i HTML, TXT, EMAIL, WORD og EXCEL dokumenter og søgnngen må maks tage 10 - 15 sekunder og der er tale om mangle tusinde dokumenter.

Den løsning som jeg har overvejet er at brugeren, hver gang modtager en af ovenstående -  så extracter metadata fra eks. word dokumentet og gemmer det som rå tekst i en tabel som hedder eks. metadata. Denne tabel er der lavet full-text index på (det er en mssql) og så laver man søgningen i denne tabel istedet for at skulle søge i mange tusinde filer.

Men er det løsningen eller er der noget som er meget smartere - og hvordan henter man metadata ud af word.
Avatar billede Slettet bruger
09. juni 2008 - 12:27 #1
hvorfor ikke bruge google desktop?
Avatar billede coladrenge Nybegynder
10. juni 2008 - 10:34 #2
Hej

Det hele skal kører på en terminal server og der kan google desktop vist ikke kører så vidt jeg er underrettet.
Avatar billede Slettet bruger
10. juni 2008 - 14:49 #3
Jo det kan den godt, men af sikkerhed og performence grunde ville jeg ikke gøre det.
Windows har jo også sit eget indexserings Service og måske du skulle kikke lidt på dens API og så lave en Delphi klient. At udvikle en SQL base vil være en stor opgave, men hvis du skulle, ville jeg lave en tabel og have et ord i hver record med en ref. til hvor den fil ligger feks:

Tabel1:          Tabel2
Word      RefID  RefID  Location
"Odense"| 12345  12345| "C:\folder1\Fyn.Doc"
                12345| "C:\folder2\Danmark.HTML"

osv.

Det ville være absolut det hurtigste, i stedet for at putte hele dokumenter ind i databasen.
Avatar billede coladrenge Nybegynder
15. juli 2008 - 15:10 #4
Hej

Jeg har selv fundet en løsning på det bruger - bruger Windows Index Service og retunere et datasæt med de oplysninger som jeg har behov - skriv hvis der er nogen som vil se løsningen.
Avatar billede Slettet bruger
15. juli 2008 - 17:40 #5
ja, meget gerne
Avatar billede coladrenge Nybegynder
02. august 2008 - 10:05 #6
Hej

Har du et sted hvor jeg kan sende løsningen til - du får et Delphi projekt
Avatar billede thesurfer Nybegynder
02. august 2008 - 10:25 #7
Ifølge Ekspertens regler, skal løsningen offentliggøres her på eksperten.dk, hvilket højst sandsynligt er derfor jape44 sagde "ja" :-)

Hvis det var mig der havde oprettet spørgsmålet, ville jeg belønne jape44, fordi jape44 faktisk faktisk kom med "Windows Index Service"-løsningen i 10/06-2008 14:49:29.
Avatar billede thesurfer Nybegynder
02. august 2008 - 10:25 #8
PS:

Ekspertens regler: http://www.eksperten.dk/regler.phtml
Avatar billede coladrenge Nybegynder
05. august 2008 - 14:37 #9
Det har du ret i - er det muligt at oprettet et nyt spørgsmål og give point der.
Avatar billede thesurfer Nybegynder
05. august 2008 - 18:49 #10
Ja, du opretter bare et spørgsmål i denne kategori, med titlen "Points til jape44". Spørgsmålet skal indeholde reference (link) til dette spørgsmål, så man kan se at det er en lovlig pointsoverførsel (dvs, man har "fortjent" pointsne).

Eksempel:

Titel:
Points til jape44

Tekst:

Ref - http://www.eksperten.dk/spm/834235

jape44, læg et svar.
Avatar billede Slettet bruger
05. august 2008 - 19:08 #11
Tja, vi skal jo ligesom overholde protokolen ;-) men jeg er da meget interesseret i din løsning og point´s er ligemeget i dette tilfælde. Men tak thesurfer, Jeg har dem jeg skal bruge.
Det er jo heller ikke nemt når man ikke kan vedhæfte ting her, og et delphi projekt pasted her, som ren tekst ville være uoverskueligt. Men dan we happend andre metoder fur das. http://virtualpaste.com/

Bare den vitale del af koden. Så poster du bare den link du får derfra. coladrenge
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
Kurser inden for grundlæggende programmering

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester