18. januar 2010 - 19:59Der er
3 kommentarer og 2 løsninger
bloker tekst stykke fra googlebot
Jeg har en <noscript> tekst som jeg i den grad ikke er interesseret i at google (og andre søgemaskiner) skal vise i deres søge resultater. Jeg ønsker derfor at kunne finde ud af om det er en googlebot der ser på min side.
Jeg kunne forstille mig det kan gøres via "user agent" eller ip-adressen. Men jeg kan ikke rigtig finde nogen information omkring det.
sidst jeg lavede noget mod søge maskiner brugte jeg dette:
$host = gethostbyaddr($_SERVER['REMOTE_ADDR']);
if(!eregi("googlebot",$host) && !eregi("msnbot",$host) && !eregi("scooter",$host) && !eregi("webcrawler",$host) && !eregi("slurp",$host) && !eregi("lycos_spider",$host) && !eregi("crawl",$host) && !eregi("livebot",$host)) { //gør det der skal gøres hvis klienten IKKE er en af ovenstående }
det kan gøres smartere med en fil, hvor du lister alle de bots du vil undgå, det er lidt nemmere, når det skal udvides :)
og så skal linjerne i filen så løbes igennem
men nu har du en ide om hvordan det kan laves - så kan du selv lave det med filen, det tror jeg godt du kan finde ud af :)
Googles crawler er distribueret over flere servere / IP-adresser - og det er ikke utænkeligt at de skifter eller udvider, hvorfor det ikke vil være smart at kigge på IP-adressen.
Men Googles crawlere, har som du selv nævner det, strengen "Googlebot" som del af deres USER_AGENT. Du kan således blot teste på, om "Googlebot" skulle være indholdt i USER_AGENT, for eksempel med et regulært udtryk eller med strpos. Noget lignende:
if (strpos($_SERVER[USER_AGENT], 'Googlebot') !== false) { ... Dette ser Google ikke! }
Men pas på! Kun Google ved det med sikkerhed - men du kan flere steder på nettet læse, hvordan Google afstraffer, hvis indholdet er forskelligt for Google og for de øvrige brugere. Det skulle ikke undre mig, hvis de også besøger din side med andre (mere "normale") USER_AGENTs og sammenligner om du prøver at "snyde" dem fra at se indhold på din side.
Undskyld det sene svar #2 Ja det kan jeg da enlig godt huske jeg læst på google.com Jeg tror løsningen bliver at lave teksten som et billede, det er hvis den eneste løsning som er helt sikker, og som google godtager.
Men splazz du er velkommen til at ligge et svar, i havde begge et fornuftigt svar.
Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.