Avatar billede docjones Nybegynder
03. december 2008 - 03:03 Der er 14 kommentarer og
2 løsninger

Google indexering

Hej Eksperter,

jeg er stødt på et lille problem. Siden www.emotor.dk vil google ikke indexere, eller der er i hvert fald gået nogle måneder nu, hvor det stadig ikke er sket.

Yahoo og Live.com har optaget siden, men altså ikke google på trods af jeg har lavet http://www.emotor.dk/sitemap.xml, har lavet robots.txt fil med allow, har gjort alt hvad der skal gøres rigtig i systemet (som er wordpress). Programmøren der har sat systemet op, er ligeledes på bar bund. Han kan ikke finde nogle årsager til Google ikke skulle indexere siden.

Har i nogle bud?

Jeg bruger webmastertool, men der melder den alt ok fra Google, bortset fra at ingen sider er indexeret.

på forhånd tak
Avatar billede armhul1 Nybegynder
03. december 2008 - 06:43 #1
I udgangspunktet er det fordi din side er ny. Hvis du har adgang til serverstats; check først om googlebot har besøgt din side.
Hvis du har haft besøg, men ej indexeret, kan det være din servers IP er banned, da du deler IP med andre blogs.

Google er dessuden sensitiv mht. dobbelt indhold (det kan "registreres" som spam), og i din robots.txt står der kun:

User-Agent: *
Allow: /

Måske du skulle bruge

Disallow: /mappe-filer/

på de sider der er duplikater, f.eks. /feeds/

Iøvrigt er det også en god idè mht. duplikater, at ændre lidt på teksten, når du citerer fra andre kilder.
Avatar billede madx Nybegynder
03. december 2008 - 06:51 #2
Jeg er sikker på at det vil hjælpe dig hvis du skaffer dig links ind til websitet, helst fra sider der handler om biler.

Men der er jo tydeligvis noget galt. Normalt er det ikke det store nummer at få et website indekseret.

Jeg kan se at du bruger wordpress, men udnytter ikke alt det den kan og har ikke fået den tilpasset nok. Hvis du gør det, vil Google m.fl. normalt indeksere indhold meget hurtigt.

Pga. Adsense i kombi med at Google ikke ser sitet som en blog kan det være at du sidder i et filter og måske anses for mindre relevant.

Jeg ville fjernne Adsense indtil sitet er optaget.
Sætte All in Ome SEO-pack til wordpress på
Individualisere, titel, description, overskrifter, og URLs
Og teknisk tilpasse wordpress yderligere (f.eks. mappen category) og anvende SE-venlige URL'er

Ikke http://www.emotor.dk/julen-n%c3%a6rmer-sig-ogsa-hos-citroen
Men http://www.emotor.dk/julen-naermer-hos-citroen


En blog der ikke er en del af et blog netværk er for Google ikke en blog - og så er du måske ikke så relevant. Så begynd at blogge, så sitet bliver en del af et blog-netværk (og få links) samt få andre igang med at blogge hos dig.

Så skal du se løjer. En veloptaget blog bliver indekseret på minutter med nye indlæg.
Avatar billede madx Nybegynder
03. december 2008 - 06:53 #3
Måske bør du overveje en extension på, så det enten er en mappe eller en fil

/julen-naermer-hos-citroen/
/julen-naermer-hos-citroen.php
Avatar billede anderssaugstrup Nybegynder
03. december 2008 - 10:55 #4
Jeg var lige ved at skrive at jeg var enig i at det var mystisk at dit site ikke er indekseret i Google, men som det sidste kiggede jeg lige på din robot.txt fil: http://www.emotor.dk/robots.txt

Den fil fortæller lige nu Google og andre at du ikke vil have dit site indekseret eller crawlet.

Der står nu:
---
User-Agent: *
Allow: /
---

Og det er det samme som at sige at intet på sitet skal crawles af søgemaskiner. Slet du hellere den robots.txt fil helt til at starte med (måske skal du senere oprette en ny forbedret version, men der er vigtigere ting at koncentrere sig om lige nu).

Inden du fjerner filen kan du med fordel få lidt bedre styr på søgemaskineoptimeringen af dit website, som madx foreslår:

-Individuelle titler
-SE venlige URLs
-Sørge for at du linker til dine poster med titlen og ikke kun med 'Læs Mere'
-Og meget mere, men det kan komme i anden række.

Når du har styr på det grundlæggende, så slet fil og byd Google ind ved at skabe nogle relevante nye links fra andre sites til dit site. Lidt link building via kataloger er sikkert heller ikke af vejen: http://www.semoblog.com/tilf%c3%b8j-link-71.html

Du kan med fordel læse denne guide på engelsk til Wordpress Søgemaskineoptimering: http://yoast.com/articles/wordpress-seo/ og du er også velkommen til at suge til dig på min danske blog om emnet: http://www.saugstrup.org/emne/s%c3%b8gemaskineoptimering/

God vind! Hilsen Anders Saugstrup
Avatar billede madx Nybegynder
03. december 2008 - 20:16 #5
Sese, checkede ikke din robots.txt

Lyt endelig til hvad Anders iøvrigt siger, han er - om nogen - expert i wordpress. Og ved i særdeleshed, hvad wordpress kan (http://www.saugstrup.org/)
Avatar billede olebole Juniormester
03. december 2008 - 20:29 #6
<ole>

- og så bør du nok validere siderne:
    http://validator.w3.org/check?uri=http%3A%2F%2Fwww.emotor.dk%2F&charset=(detect+automatically)&doctype=Inline&group=0&ss=1&verbose=1

Det er aldrig til at vide, hvor højtideligt Google på et givet tidspunkt tager det, man skriver.

Under alle omstændigheder server du et XHTML 1.0 Strict dokument med MIME-typen 'text/html'. Da ingen af dagens browsere tager XHTML seriøst (hvilket i øvrigt betyder, at ingen brugere har gavn af XHTML-kode), gør det ikke skade i browser-sammenhæng - men det er ikke til at vide, om Google tager din kode seriøst, eller om den begynder på det i morgen  ;o)

Derudover er dine scripts ikke kompatible med XHTML. Det gør ikke noget i forbindelse med indeksering af søgemaskiner, men det gør forsøget på brug af XHTML endnu mere uhensigtsmæssigt.

/mvh
</bole>
Avatar billede docjones Nybegynder
03. december 2008 - 21:39 #7
Tak for jeres svar indtil videre.

Det pudsige er at jeg først for nyligt har lagt robots.txt op, da Google Webmasterværktøjet - under Analyser Robots.txt skrev at den modtog Disallow på domænet.

Da jeg så lagde robots.txt op skrev den i stedet:
Webadresse Googlebot
http://www.emotor.dk/ Tilladt af linje 2: Allow: /
Registreret som en mappe. Specifikke filer kan have forskellige begrænsninger

Men kan se at Googlebot har været forbi her i december, og det har jo ikke hjulpet noget alligevel, så nu har jeg fjernet robots.txt filen igen.

Under Diagnosticering - webgennemgang kommer den med ingen fejl overhovedet.

Jeg har allerede ALL-IN-ONE-SEO installeret, haft fra starten. Kan godt se de permanente links mht æ,ø,å kan forbedres, kan jeg gøre manuelt, men vil også lige se på de andre muligheder der er for wordpress.

Adsense tilføjede jeg først for 3 dage siden.

Generelt set burde de små ting med URLs osv. vel ikke have noget at sige mht indexeringen, om den gennemgår eller ej, men blot placering.

@Anders
Tak for dine tips, har kastet mig over de nævnte blogs.
Jeg har dog allerede tilføjet til over 40 kataloger, rss feeds m.m., så har nogle links rundt omkring.

Det undrer mig stadig hvordan Google kan ignorere siden når Yahoo og Live.com har optaget den

Og webmastertools giver ingen svar, da alt tilsyneladende er som det skal være. Frustrerende!
Avatar billede anderssaugstrup Nybegynder
03. december 2008 - 22:45 #8
Tak for de pæne ord, Henrik (madx)! :-)

Nå, har lige kigget på websitet igen og har opdaget at der er endnu et alvorligt problem: Dit All In One SEO Plugin er indstillet til at tilføje 'meta name="robots" content="noindex,follow"' til både dine sider og til dine kategorisider.

Det er problematisk, fordi det netop er via kategorierne at Google skal finde dine artikler på en overskuelig måde.

Prøv at kikke kildekoden for denne url fx: http://www.emotor.dk/category/audi
Et sted i headeren finder du de her sager:

<!-- all in one seo pack 1.4.6.15 [321,346] -->
<meta name="description" content="" />
<meta name="robots" content="noindex,follow" />
<!-- /all in one seo pack -->

Så du må lige ind på pluginets indstillinger og fjerne fluebenet i at sætte noindex på kategorierne.

Når vi er i gang, så fjern dit sitemap også, så du får et ordentligt overblik over om dit site er til at crawle ordentligt for Google (hvis dele af dit site ikke indekseres, ved du hvor du skal lede). Sitemaps hjælper ikke din ranking, så frygt ej. :-)

Læg også lige mærke til det her råd, som jeg skrev tidligere:
-Sørge for at du linker til dine poster med titlen og ikke kun med 'Læs Mere'

Hilsen Anders Saugstrup

PS og NB! Kan se at din robots.txt fil stadig ligger der og spærrer for det hele, så den har du ikke fået fjernet effektivt. Måske er der er plugin som genererer den, eller hvad mon der sker?
Avatar billede anderssaugstrup Nybegynder
03. december 2008 - 23:45 #9
Jeg har klokket i det, de herrer...

Den med robots.txt er en fejl - jeg læste det som disallow - ikke som Allow. Er kun vandt til at arbejde med det andet, og det var så det jeg også læste nu selvom det ikke var det der stod. Klebager lejfen!

Resten af snakken skulle være god nok :-)
Avatar billede olebole Juniormester
04. december 2008 - 00:11 #10
Vær opmærksom på, at brugen af disallow kan få 'ubehagelige elementer' til at rette deres nysgerrighed mod de siteområder, man forbyder søgemaskiner at indeksere. Brug det med meget stor omtanke  ;o)
Avatar billede docjones Nybegynder
04. december 2008 - 01:55 #11
@Anders

puha, nu er det med at holde tungen lige i munden, troede Google skulle være simpelt :)

Vil det sige at den robots.txt fil jeg har uploadet med allow, men nu slettet, skal op igen? Der er ikke nogen robots.txt fil på serveren nu, men kan se at den åbenbart genererer en alligevel, men så med disallow

Jeg har nu slettet sitemap'et under googles webmastertools, er det nok eller skal filerne også væk fra serveren?

Jeg har ændret indstillingerne for AllinOne SEO så det med noindex skulle være væk.

Det med at gøre overskrifterne linkaktive kræver vidst noget programmering eller kan det slås til i wordpress? er desværre ikke skarp til programmering, men er det meget vigtigt for indexeringen? for så må jeg se om programmøren der satte det op kan hjælpe.
Avatar billede anderssaugstrup Nybegynder
04. december 2008 - 03:14 #12
Bare lad den der robots.txt stå som den er nu.

Slå også sitemap plugin fra i WP og slet sitemap-filen (og backupfilen) fra serveren.

Det er ret vigtigt det med de links på overskrifter i stedet for kun på 'Læs Mere'. Du kan rette det til i dine temafiler (i temaets mappe: index.php og archive.php)

Nu står der sikkert:
<h2><?php the_title(); ?></h2>

Det skal du rette til
<h2><a href="<?php the_permalink() ?>" title="<?php the_title(); ?>"><?php the_title(); ?></a></h2>

Og hvis farverne skifter i processen skal du bagefter have kigget på dit style sheet i temaets style.css-fil

Hilsen Anders Saugstrup
Avatar billede anderssaugstrup Nybegynder
04. december 2008 - 03:14 #13
Prøv dig frem men husk at tage backup af filerne først! :-)
Avatar billede madx Nybegynder
04. december 2008 - 07:58 #14
--> anderssaugstrup

Selvtak fra Henrik.... :-)

Det er egl. lidt pudsigt med de der synonymer, som f.eks. madx - og et billede på Net-historie. For idag (2008) er det langt mere almindeligt at køre frem med navns nævelse, bl.a. pga. Web 2. Dag jeg startede på Eksperten i sin tid - jeg tror, at det er før 2000 - var det ikke aå almindeligt at folk brugte eget navn i diverse fora.

Så jeg valgte et navn fra en figur i et racing-spil, der var helt vildt underholdende (hvor det gik ud på at smadre hinanden, hehe).

Det var såmænd blot lidt ord om net-trends og -historie ;-)
Avatar billede anderssaugstrup Nybegynder
04. december 2008 - 10:33 #15
Kan godt huske den gode gamle tid, Henrik :-)
Avatar billede docjones Nybegynder
04. december 2008 - 14:25 #16
@Anders,

ok, jeg prøver mig frem.

Mange tak for hjælpen!
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
IT-kurser om Microsoft 365, sikkerhed, personlig vækst, udvikling, digital markedsføring, grafisk design, SAP og forretningsanalyse.

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester