Avatar billede andreas13_fam Nybegynder
18. januar 2010 - 19:59 Der er 3 kommentarer og
2 løsninger

bloker tekst stykke fra googlebot

Jeg har en <noscript> tekst som jeg i den grad ikke er interesseret i at google (og andre søgemaskiner) skal vise i deres søge resultater. Jeg ønsker derfor at kunne finde ud af om det er en googlebot der ser på min side.

Jeg kunne forstille mig det kan gøres via "user agent" eller ip-adressen.
Men jeg kan ikke rigtig finde nogen information omkring det.
Avatar billede majbom Novice
18. januar 2010 - 20:11 #1
sidst jeg lavede noget mod søge maskiner brugte jeg dette:

$host = gethostbyaddr($_SERVER['REMOTE_ADDR']);
   
if(!eregi("googlebot",$host) && !eregi("msnbot",$host) && !eregi("scooter",$host) && !eregi("webcrawler",$host) && !eregi("slurp",$host) && !eregi("lycos_spider",$host) && !eregi("crawl",$host) && !eregi("livebot",$host)) {
  //gør det der skal gøres hvis klienten IKKE er en af ovenstående
}

det kan gøres smartere med en fil, hvor du lister alle de bots du vil undgå, det er lidt nemmere, når det skal udvides :)

og så skal linjerne i filen så løbes igennem

men nu har du en ide om hvordan det kan laves - så kan du selv lave det med filen, det tror jeg godt du kan finde ud af :)
Avatar billede nicklasb Nybegynder
18. januar 2010 - 20:11 #2
Googles crawler er distribueret over flere servere / IP-adresser - og det er ikke utænkeligt at de skifter eller udvider, hvorfor det ikke vil være smart at kigge på IP-adressen.

Men Googles crawlere, har som du selv nævner det, strengen "Googlebot" som del af deres USER_AGENT. Du kan således blot teste på, om "Googlebot" skulle være indholdt i USER_AGENT, for eksempel med et regulært udtryk eller med strpos. Noget lignende:

if (strpos($_SERVER[USER_AGENT], 'Googlebot') !== false) {
    ... Dette ser Google ikke!
}

Men pas på! Kun Google ved det med sikkerhed - men du kan flere steder på nettet læse, hvordan Google afstraffer, hvis indholdet er forskelligt for Google og for de øvrige brugere. Det skulle ikke undre mig, hvis de også besøger din side med andre (mere "normale") USER_AGENTs og sammenligner om du prøver at "snyde" dem fra at se indhold på din side.
Avatar billede andreas13_fam Nybegynder
22. januar 2010 - 16:18 #3
Undskyld det sene svar
#2 Ja det kan jeg da enlig godt huske jeg læst på google.com
Jeg tror løsningen bliver at lave teksten som et billede, det er hvis den eneste løsning som er helt sikker, og som google godtager.

Men splazz du er velkommen til at ligge et svar, i havde begge et fornuftigt svar.
Avatar billede majbom Novice
22. januar 2010 - 22:19 #4
kommer her
Avatar billede majbom Novice
26. januar 2010 - 13:34 #5
tak for point
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
Vi tilbyder markedets bedste kurser inden for webudvikling

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester