Avatar billede JJ77 Juniormester
08. maj 2006 - 20:55 Der er 12 kommentarer og
1 løsning

hvordan laver jeg en robot.txt

Har hørt at det er vigtigt at have en robot.txt-fil på sin webserver.. men hvordan laver jeg sådan en, og hvor på serveren skal den ligge? er lidt lost på dette.
Avatar billede apo Praktikant
08. maj 2006 - 20:59 #1
Du åbner en almindelig text-fil, og gemmer den som 'robots.txt'. Filen skal uploades til roden af dit webhotel/din webserver.

Se mere her: http://www.robotstxt.org/
Avatar billede JJ77 Juniormester
08. maj 2006 - 21:07 #2
men hvordan ska indholdet af en sådan fil se ud?
Avatar billede apo Praktikant
08. maj 2006 - 21:08 #3
... Stien til robots.txt skal se således ud: http://www.ditsite.dk/robots.txt

robots.txt bruges til at styre robotternes (de, der overholder robots.txt) færden på dit website.

Du kan f.eks. fortælle robotterne (igen de, der overholder robots.txt), at de ikke må besøge dit website ved at lægge følgende i filen:

User-agent: *
Disallow: /

Du kan læse meget mere her: http://www.robotstxt.org/wc/faq.html
Avatar billede -bartfreak Nybegynder
08. maj 2006 - 21:09 #4
du kan også blot efterlade den blank.
Avatar billede JJ77 Juniormester
08. maj 2006 - 21:13 #5
ok.. hvis jeg efterlader den blank, får jeg så stadig et udbytte af at have filen liggende?
Avatar billede JJ77 Juniormester
08. maj 2006 - 21:15 #6
hvad nu hvis jeg fx vil have en robot.txt-fil liggende på serveren som skal fortælle robotterne at de skal kigge i fire filer.. index.html, side2.html, side3.html og side4.html. Og det kun der dem den skal kigge i
Avatar billede apo Praktikant
08. maj 2006 - 21:18 #7
User-agent: *
Allow: /index.html
Allow: /side2.html
Allow: /side3.html
Allow: /side4.html

Du kan også angive specifikke filer eller mapper, du ikke ønsker indekseret af robotterne:

User-agent: *
Disallow: /min_mappe/
Disallow: /minfil.html

Eller angive, at f.eks. Google ikke må indeksere følgende:

User-agent: GoogleBot
Disallow: /min_mappe/
Disallow: /minfil.html

(Du bør dog ikke have hemmelige/følsomme oplysninger liggende i de mapper, du lister som 'disallow' - Hackere og andre kigger som regel der når de undersøger et website for svagheder).

Igen... Du kan læse stort set alt om robots.txt i de links jeg har vist dig :-)
Avatar billede apo Praktikant
08. maj 2006 - 21:31 #8
Google har også skrevet lidt om anvendelsen af robots.txt og GoogleBot (Googles søgerobot) i denne FAQ: http://www.google.com/support/webmasters/bin/topic.py?topic=8460
Avatar billede JJ77 Juniormester
08. maj 2006 - 21:33 #9
cool nok.. det må være nok til at starte med.. dvs. det ville være fornuftigt at oprette en robot.txt-fil med følgende.
User-agent: *
Allow: /index.html
Allow: /side2.html
Allow: /side3.html
Allow: /side4.html

...for så ser søgemaskinerobotterne kun efter disse filer. Jeg lader desuden være med at lave nogle disallow, for dermed at undgå at give hackere muligheden for at se mapper som ikke skal vises.. Er det ikke ok?
Avatar billede apo Praktikant
08. maj 2006 - 21:39 #10
Men du kan også nøjes med:

User-agent: *
Allow: /

Og derved tillade alle robotter at besøge alle sider på dit website - De kan alligevel kun finde de sider, du (eller andre) linker til på en webside.

Søgerobotterne arbejder nemlig ved at følge links fra en side til en anden. Har du et link, som robotten uden besvær kan læse vil den følge det, og formentlig indeksere det.

Derfor skal du passe på med hvad, du linker til. Har du f.eks. en hemmelig mappe kaldet: '/x-files/' er den bedste måde at bevare den hemmelig på ved _aldrig_ nogensinde at linke til mappen - Hverken i robots.txt eller via en webside.
Avatar billede apo Praktikant
08. maj 2006 - 21:40 #11
... Og tak for points i øvrigt :-)
Avatar billede JJ77 Juniormester
08. maj 2006 - 22:02 #12
takker mange gange for hjælpen :)
Avatar billede apo Praktikant
08. maj 2006 - 22:04 #13
Velbekomme. Jeg håber, at du blev lidt klogere på robots.txt :-)
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
IT-kurser om Microsoft 365, sikkerhed, personlig vækst, udvikling, digital markedsføring, grafisk design, SAP og forretningsanalyse.

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester