Avatar billede tdaugaard Nybegynder
02. august 2001 - 19:17 Der er 20 kommentarer og
3 løsninger

Hvordan skal en ORDENTLIG søgemaskine laves ?

Jeg sidder netop og er i gang med at lave en søgemaskine i PHP der skal søge på alle keywords.

Programmeringen er nem nok, men det jeg vil spørge om er hvilke specialtegn, tegn osv. skal tillades i ord for at få den bedst mulige, men også mest flexible søgning ?

pt. er det lavet sådan at a-z, A-Z, 0-9, punktummer og bindestreger er tilladt.

Hvis der er flere punktummer sammen, f.eks.

\"www..eksperten.dk\" så bliver de erstattet af eet punktum. Ditto med bindestreger.

Hvis der er punktummer eller bindestreger foran eller bagved et søgeord bliver de fjernet.

Kommaer bliver erstattet med punktummer.

En søgestreng som f.eks.:

\"...eks...per-ten--\"

vil blive strippet down til:

\"eks.per-ten\"

Jeg tænkte også på om man bør lave det en mulighed, f.eks. ved en avanceret søgning, at brugeren selv kan vælge om det skal være en AND eller OR søgning ? (altså find sider der indeholder ALLE ord eller sider hvor mindst et ord findes)
Avatar billede tdaugaard Nybegynder
02. august 2001 - 19:18 #1
PS. vidste ikke lige hvilken kategori det passede i - men det er vel sårn lidt generelt.
Avatar billede zycho Nybegynder
02. august 2001 - 19:20 #2
Nå så fandt du endelig på noget at lave i PHP :D

Ikke fordi jeg kan PHP men når jeg søger så plejer jeg at have \"gåsetegn\" uden om ordet hvis jeg vil have at det skal inkludere ordet. Ellers er det også anvendt meget at bruge +´er.

F.eks. kunne en søgning i www.google.com se sådan ud: madopskrifter + bageopskrifter (kunne ikke finde på noget *gg*)

Held og lykke.....
Avatar billede mai-daugaard Nybegynder
02. august 2001 - 19:21 #3
kanon brormand, jeg sad lige og tænkte om ik du kunne finde ud af at lave en søge ting....hæ hæ...det kan du så :-)
Avatar billede tdaugaard Nybegynder
02. august 2001 - 19:23 #4
zycho:> hvis du bruger + i google.com så får du pænt af vide at den automatisk søger på ALLE ord så plus er altså ikke nødvendigt ;o)

Men den med \"sætning\" er god  .. den havde jeg ikke tænkt på .. altså sådan at hvis man skriver:

\"hp cd-writer\"

så søger den på hele strengen og ikke på \"hp\" & \"cd-writer\"
Avatar billede zycho Nybegynder
02. august 2001 - 19:28 #5
ja jeg var også lidt i tvivl med de der +´er men \" er en god ide.

Jeg har ellers bare læst engang i AOD eller PC om søgetips og der var +´erne en god ide.....Husker ikke så meget af det (lang tid siden)
Avatar billede tommyf Nybegynder
02. august 2001 - 19:29 #6
tdaugaard >> Så kan du jo sælge den til Admin bageefter ;o)
Avatar billede tdaugaard Nybegynder
02. august 2001 - 19:30 #7
tommyf:> *G* hæ hæ .. kunne være man skulle spørge dem om de er intereserede *S*
Avatar billede hobbez Nybegynder
02. august 2001 - 20:37 #8
Personligt syntes jeg ALTID at jeg kommer ud i problemer, når jeg ikke kan søge PRÆCIST som jeg har lyst til.

Med dit eksempel, så kan jeg ikke søge på f.x. \"cd..\" (der jo som bekendt er en valid DOS-kommando) eller \"... --- ...\" (morse for SOS).

Tænkte eksempler, men der findes sikkert andre der er bedre.

Derfor: Hvis jeg er så dum at jeg vil søge på \"www..eksperten..dk\" så lad mig da få de NUL HITS, og selv bruge indersiden til at finde ud af, at jeg har været for rundhåndet med specialtegnene.

Altså:

Søg præcist som jeg har skrevet - eller giv mig i det mindste en mulighed for at gøre det!

/Rob
Avatar billede tdaugaard Nybegynder
02. august 2001 - 20:45 #9
hobbez:> Prøv at søge på google.com på ... --- ... får du intet frem. Faktisk ikke engang en \"Intet fundet\" side ... og søger du på \"cd..\" får du matches med \"cd\" ..

Det er hvad jeg kalder en brugervenlig søgning. Ingen søger på en morsekode eller DOS kommando.

dvs., faktisk er CD.. ikke en DOS kommando. CD er, .. er en parameter. ligesom CD\\

Den søgemaskine jeg er i gang med skal heller ikke være for tekniske hoveder men derimod være lavet sådan at man ikke skal være ret så teknisk anlagt eller have forstand på at søge, for at der sker noget.
Avatar billede tdaugaard Nybegynder
02. august 2001 - 20:46 #10
Forøvrigt kan \"www..eksperten.dk\" jo være en typo .. at man ved et uheld har fået tastet to .\'er
Avatar billede tdaugaard Nybegynder
02. august 2001 - 20:49 #11
hobbez:> jeg har lavet det sådan at skriver man:

\"søge streng\"

så bliver der søgt på hele strengen, og intet bliver fjernet (andet end \"\")
Avatar billede hobbez Nybegynder
02. august 2001 - 21:17 #12
tdaugaard:

Hvis du vil lave den som Google, så lav den dog som Google. Og i øvrigt er det forkert det du skriver (se mit PS).

Men spørgsmålet du stillede var vel hvordan en ORDENTLIG søgemaskine laves. Og det var det jeg forsøgte at svare på.

Hvis du vil lave en søgemaskine for ikke-tekniske anlagte, så drop alt om at lade brugeren vælge mellem AND og OR, og lav alle søgninger som AND søgninger, og DROP alle specialtegn.

Altså, en søgning på \"www..eksperten..dk\" skal være en søgning på \"www AND eksperten AND dk\" osv.


PS:
Lad være med at skrive at \"ingen søger på...\". Du har ikke noget at have det i. Jeg HAR faktisk forsøgt at søge på cd.., og fået en masse ubrugelige hits, da der kun blev søgt på \"cd\". Og Google er komplet ligeglad med om du skriver \"cd..\" eller blot cd.. uden \"\"\'erne. Prøv det selv !!

/Rob
Avatar billede tdaugaard Nybegynder
02. august 2001 - 21:26 #13
hobbez:> Jeg vil ikke lave en kopi/den som Google.com.

Jeg sagde at man på en AVANCERET søgning, kunne give brugeren mulighed for at vælge AND & OR, ikke at skulle være muligt på en normal søgning.

Okay .. jeg retter lige mit spørgsmål:

Hvordan skal en ORDENTLIG BRUGERVENLIG søgemaskine laves ?

Brugervenlig betyder at den skal være lidt løs i betrækket med hvad de skriver, som f.eks. det med at replace \".....\" med \".\" osv.

En søgning på \"www..eksperten..dk\" skal være en søgning på \"www.eksperten.dk\" og ikke \"www\" AND \"eksperten\" AND \"dk\" vil jeg mene ...

Til dit PS:

Hvilken grund lå der for at du søgte på \"cd..\" alle med en sund fornuft ved da at det er fløjtende ligemeget om du skriver \"cd\" eller \"cd......\" ...

Google.com er ligeglad med alle specialtegn (undtagen accent-tegn osv.)...
Avatar billede microtec Nybegynder
02. august 2001 - 22:21 #14
tdaugaard >> \"en ORDENTLIG BRUGERVENLIG søgemaskine\" skal laves som www.alltheweb.com
Kik på avanceret. Der er dejligt mange muligheder.

Lad være med at bruge AND og OR som logiske operatore. Langt de fleste søgemaskiner benytter + for AND og ikke noget for OR. Det andet er svært at finde ud af (et af søgeordene kunne jo være and eller or).

Hvis man ønsker AND:

+Søgeord1 +\"søgestring1\" + Søgeord2

Hvis man ønsker OR:

Søgeord1 \"søgestring1\" Søgeord2

Avatar billede tdaugaard Nybegynder
02. august 2001 - 22:24 #15
microtec:> for brugeren er der ingen valg for AND eller OR, det er kun selve søgningen kodemæssigt der foregår som AND på alle keywords.

Det der med + foran er ikke brugervenligt .. det skal være MEGET brugervenligt ;o)
Avatar billede hobbez Nybegynder
02. august 2001 - 23:18 #16
tdaugaard: Nu bliver det sgu for morsomt.

Først skriver du >> alle med en sund fornuft ved da at det er fløjtende ligemeget om du skriver \"cd\" eller \"cd......\"

Oki, så har jeg ikke sund fornuft.

Så skriver du >> jeg har lavet det sådan at skriver man: \"søge streng\" så bliver der søgt på hele strengen, og intet bliver fjernet (andet end \"\")


Men hvorfor vil du så lave det sådan, når \"alle med en sund fornuft\" ved noget andet....??


To ting jeg har lært:

1) Det er umuligt at lave noget der er idiotsikkert, fordi idioter (herubdner brugere) er så opfindsomme
2) Dem der tror at det ved alt hvad brugerne vil og gør, er endnu større idioter end brugerne.

/Rob
Avatar billede tdaugaard Nybegynder
02. august 2001 - 23:20 #17
hobbez:> fordi ikke alle har en sund fornuft ;o) Ej .. det var faktisk fordi det blev foreslået *S*
Avatar billede microtec Nybegynder
02. august 2001 - 23:22 #18
tdaugaard >> Det kan godt være at du ikke mener at + for AND er brugervenligt, men det er meget udbredt.
Du laver ikke en brugervenlig søgemaskine ved at afvige fra de uskrevne \"standarder\" andre bruger. Syntaxen skal være som man er van til.

Tag bare et slidt eksempel: Søgefunktionen her på Eksperten. Det er håbløst at finde ud af hvilken syntax der skal anvendes for at lave en ordentlig søgning. Såsagen er at man har opfundet sin egen syntax.

Mener du det er hensigtsmæssigt at man kun kan lave søgning med AND mellem søgeordene? Jeg vil gerne have muligheden for OR også.
Jeg vil også gerne have muligheden for NOT. Laves normalt med - foran søgeordet. NOT hjælper meget til at få begrænset antallet af hits til noget fornuftigt.
Avatar billede tdaugaard Nybegynder
02. august 2001 - 23:46 #19
microtec:> jeg skal ikke lave den næste Yahoo!, men en simpel, men effektiv søgemaskine der søger enten, AND eller OR på alle søgeord.

Afvige fra standarder .. hmm .. tjae .. der er mange der bare bruger at man bare skriver søgeordene ...
Avatar billede microtec Nybegynder
02. august 2001 - 23:50 #20
Tja, dit spørgsmål var \"Hvordan skal en ORDENTLIG søgemaskine laves ?\".

Svaret er at du skal lave den så den virker som langt de fleste andre søgemaskiner.
Laver du noget DU syntes er simpelt, er der stor risiko for at andre syntes det er \"underligt\" at det ikke virker som det plejer :o)
Avatar billede tdaugaard Nybegynder
02. august 2001 - 23:53 #21
microtec:> Ligenu virker den faktisk mere eller mindre som google.com gør .. og den bruger mange ...
Avatar billede microtec Nybegynder
02. august 2001 - 23:59 #22
tdaugaard >> google.com er da også ok. Den bruger jeg også selv tit.
Må misforstod jeg dit \"ORDENTLIG søgemaskine\". Skal jeg bruge en ordentlig søgemaskine, hopper jeg over på www.alltheweb.com da den er¨meget bedre til mere avancerede søgninger.
Avatar billede tdaugaard Nybegynder
03. august 2001 - 00:02 #23
microtec:> Bruger den selv eksklusivt :o)
Nå men jeg tror jeg har fået noget at arbejde videre med .. tak til jer alle ..
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
Computerworld tilbyder specialiserede kurser i database-management

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester