Avatar billede jesper76 Nybegynder
03. oktober 2006 - 22:00 Der er 14 kommentarer og
2 løsninger

SEO-problem (ret kritisk, tror jeg)

Hej SEO-eksperter.

Jeg har opdaget et problem, som jeg troede at jeg havde taget højde for (men åbenbart ikke).

Spørgsmål 1: Hvis jeg foretager denne søgning:
www.fjeldvandreren.dk&hl=da&lr=&filter=0" target="_blank">http://www.google.com/search?q=site:www.fjeldvandreren.dk&hl=da&lr=&filter=0

får jeg to sideresultater for min forside: http*//www.fjeldvandreren.dk/ og http*//www.fjeldvandreren.dk/default.asp (jeg ved ikke hvordan det sidste link er blevet indekseret af Google da jeg kun linker til min forside via: http*//www.fjeldvandreren.dk/)

Hvordan fjerner jeg resultatet med default.asp fra Google's indeks igen? Jeg har læst at det kan skade en sides pagerank, hvis siden er indekseret som både / og /default.asp

Spørgsmål 2, et pagerank tillægsspørgsmål: når jeg ser cachen for http*//www.fjeldvandreren.dk/default.asp får jeg i min Google Toolbar vist en pagerank på 3 - Kan det være rigtigt, at jeg fra den ene dag til den anden er gået fra en pagerank på 0 til 3?

Selv om jeg er glad for det (hvis pageranken er korrekt), er jeg dog ked af at den er tildelt /default.asp

Håber at der er nogen her der kan hjælpe mig.
Avatar billede jesper76 Nybegynder
03. oktober 2006 - 22:29 #2
mige: kan du være mere specifik i dit svar? Da jeg er helt på bar bund mht. til en løsning på problemet, og ikke selv kan finde en løsning i Google's support, er jeg i tvivl om hvad du henviser til.
Avatar billede jesper76 Nybegynder
03. oktober 2006 - 22:59 #3
Jeg har nu fundet følgende på:
http://www.google.com/support/webmasters/bin/answer.py?answer=40367

Tilpasning af afslutningstegnene i webadressen med $
Du kan bruge tegnet $ til at angive tilpasning i slutningen af webadressen. Du kan f.eks. blokere en webadresse, der slutter med .asp, ved at angive følgende:

User-Agent: Googlebot
Disallow: /*.asp$

Jeg har testet det i Google Webmaster Tools' robots.txt-analyse, og umiddelbart er der stadig adgang til http*//www.fjeldvandreren.dk/ (uden default.asp) - men er det den rigtige fremgangsmetode til løsning af problemet?

Kan det skade noget, at gøre det på den måde?
Avatar billede goose Nybegynder
04. oktober 2006 - 08:29 #4
Jeg ville være meget påpasselig med, at udelukke alle sider fra googlebot som indeholder .asp

Du skal jo lige være klar over, at www.fj...vanderen.dk/ er det samme som www.fj...vanderen.dk/default.asp

Hvis en url slutter på / så er det op til serveren at leverer en startfil i den pågældende mappe, i dit tilfælde er det default.asp

Du kan jo blot prøve at indsætte

<% Response.write request.servervariables("URL") %>

øverst på din side, så vil du se at serveren giver et svar som hedder /default.asp

Iøvrigt kan jeg ikke se at nogle af siderne har Pagerank?

/Goose
Avatar billede goose Nybegynder
04. oktober 2006 - 08:33 #5
Nu har du så omdøbt din startfil til index.asp istedet kan jeg se :o)

/Goose
Avatar billede miqe Nybegynder
04. oktober 2006 - 10:18 #6
Jeg tager udgangspunkt i at din startfil nu hedder index.asp
Som goose er inde på er det fornuftigt at ændre:
Disallow: /*.asp$
til:
Disallow: /index.asp$

Skal det også gælde for alle andre mapper end rodmappen kan du tilføje følgende linie.
Disallow: /*/index.asp$

Altså vil din robots.txt indeholde:
User-Agent: Googlebot
Disallow: /index.asp$
Disallow: /*/index.asp$

Skal ovenstående gælde alle robotter og ikke bare Googlebot skal du ændre:
User-Agent: Googlebot
til:
User-Agent: *
Avatar billede jesper76 Nybegynder
04. oktober 2006 - 14:17 #7
goose: Ja, jeg har omdøbt filen og mener samtidigt at have fjernet årsagen til at Google overhovedet kender til /default.asp - et problem i den asp-kode, der laver en 301-header viderestilling fra ikke-www til www, som viderestillede til www.domæne.dk/index.asp i stedet for kun www.domæne.dk (så jeg håber at det hjælper på det) :o)

Men endnu et problem er, at man via asp ikke både kan viderestille fra domæne.dk til www.domæne.dk og samtidig udelukke visning af www.domæne.dk/default.asp eller domæne.dk/default.asp - det er ikke lykkedes for mig og jeg har forsøgt med forskellige tricks, men det resulterer altid i et uendeligt loop.

Jeg kan se en pagerank på 3 for både / og default.asp når jeg ser de cachede versioner i Google. Det kan du ikke?

mige: er der forskel på om man bruger Disallow: /*.asp$ eller Disallow: /index.asp$

Hvis man ikke bør udelukke filer med .asp bør man vel heller ikke udelukke index.asp eller hvad?
Avatar billede miqe Nybegynder
04. oktober 2006 - 20:00 #8
jesper76> Ja, der er forskel!
Jo! Der kan være god idé i at undlade at udelukke /*.asp samtidig med at man udelukker /index.asp

At du udelukker /index.asp er ikke de samme som at du udelukker /
En bot ser http://www.mitdomæne.dk/ forskelligt fra http://www.mitdomæne.dk/index.asp, da det er din webserver, der definerer hvilke filer der godtages som index-filer.
Med andre ord kan en webserver godt sættes op til at startfilen hedder malkemaskine.asp og at index.asp bare er en almindelig fil. Dette har botten ikke en chance for at vide, ligesom botten ikke kenderforskel på .asp, .php, .phtml, .dhtml, .html, .xhtml, etc...

At du ikke bør udelukke filer med *.asp handler om at du dermed udelukker botten fra at crawle ALLE filer der ender på .asp
For de fleste vil dette være uhensigtsmæssigt, men der findes dog masser af eksempler på at man helst vil have folk ind gennem hoveddøren.

På samme måde kan nogle have gavn af:
Disallow: /*.jpg$
Disallow: /*.png$
Disallow: /*.gif$
vis de ikke ønsker at deres billeder, skal indexeres på søgemaskinerne.
Avatar billede goose Nybegynder
05. oktober 2006 - 09:09 #9
Nej, jeg ser ingen pagerank på dit site.

Iøvrigt kan jeg tilslutte mig det mige skriver.

/Goose
Avatar billede jesper76 Nybegynder
07. oktober 2006 - 16:40 #10
mige: Så hvis jeg f.eks. i robots.txt udelukker filer navngivet 'index.asp' og 'default.asp' vil det kun være de selvstændige filer, der udelukkes fra indeksering og ikke adresser som http://www.domæne.dk/mappe/ (<- hvor default.asp ligger her)?

goose: Lige nu ser jeg heller ingen pagerank længere. Mon ikke det skyldes, at Google opfatter begge adresser som indeholdende dobbelt indhold? eller var det en fejl i min toolbar?

husk at lægge et svar :o)
Avatar billede miqe Nybegynder
08. oktober 2006 - 17:22 #11
jesper76> Korrekt!

Følgende 2 linier har virkning på rod mappen http://www.domæne.dk/
Disallow: /index.asp$
Disallow: /default.asp$

Følgende 2 linier har virkning på alle undermapperne http://www.domæne.dk/mappe/ http://www.domæne.dk/mappe2/ http://www.domæne.dk/mappe/mappe3/ osv.
Disallow: /*/index.asp$
Disallow: /*/default.asp$
Avatar billede jesper76 Nybegynder
08. oktober 2006 - 18:52 #12
mige: Det virker tilsyneladende. Jeg tilføjede linjerne til robots.txt i går og i dag findes /default.asp ikke længere i Googles indeks. Så jeg håber at det var det :o)

goose: jeg mangler et svar fra dig, så jeg kan lukke.
Avatar billede goose Nybegynder
09. oktober 2006 - 08:08 #13
Jamen du får da et svar så, men giv hovedparten af point til mige :o)

/Goose
Avatar billede jesper76 Nybegynder
09. oktober 2006 - 15:15 #14
I skal have tak for hjælpen :o)
Avatar billede miqe Nybegynder
09. oktober 2006 - 18:19 #15
Selv tak!
Avatar billede goose Nybegynder
10. oktober 2006 - 08:45 #16
Det var så lidt og tak for point :o)

/Goose
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
IT-kurser om Microsoft 365, sikkerhed, personlig vækst, udvikling, digital markedsføring, grafisk design, SAP og forretningsanalyse.

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester