« Nicos kleiner Blog-Leitfaden | Main | eBay Auktionen auf Abwegen »

Warum Blogger Webstatistiken vor Spidern verbergen müssen

Also Blogger sollte man tunlichst seine Statistiken (wie bei mir die von Webalizer und AWStats) tunlichst durch passende Einträge in seiner robots.txt durch den Zugriff gegen Suchmaschinenspider schützen. Der Grund ist relativ einfach: Die Kommentar- und Trackbackspammer liefern als Referrer passende URLs zu Ihrer spamvertized Domain mit. Da viele Spammer sehr intensiv spammen, tauchen dann Links wie http://www.texas-va-loan.com/texas-holdem.html oder http://www.e-holdem.net/texas-holdem.html weit oben in den Referrerlisten der Statistiken auf.

Ich könnte mir sogar vorstellen, dass die Spammer bewusst diese Referrer setzen um diesen Effekt zu erzielen. Denn bei vielen Blogs sind die Statistiken öffentlich zugänglich und eben nicht vor einem Zugriff durch Suchmaschinenspider geschützt. Daher werde ich das setzen des Falgs rel=nofollow" in den Sourcecode von AWStats mit einbauen.

Hier noch meine robots.txt:
User-agent: *
Disallow: /cgi/
Disallow: /stats/
Disallow: /awstats/
Disallow: /magic/cgi/
Disallow: /mt.cgi/

Tags:

Geschrieben von Jan Theofel am 11.05.2005 um 9:24 Uhr (Permalink)
Abgelegt unter Blogs

TrackBacks für »Warum Blogger Webstatistiken vor Spidern verbergen müssen«

TrackBack URL: http://www.theofel.de/mt-cgi/mt-tb.cgi/1804

4 Kommentare zu »Warum Blogger Webstatistiken vor Spidern verbergen müssen«

Nur schade, dass unseriöse Bots sich nicht an die robots.txt Datei halten und trotzdem spidern. Noch besser wäre eine .htaccess Datei

1 | Stephan Goeldi | 11.05.2005 um 10:56

Allerdings spielen die unseriösen Bots in dieser Betrachtung ohnehin keine Rolle. Denn wertvoll sind diese Links für den Spammer ja nur, wenn große Suchmaschinen-Spider wie die von Google und Co diese Links indizieren und in die Rankingberechnung mit aufnehmen. Und die halten sich alle an die robots.txt.

Darüberhinaus schafft eine .htaccess-Datei aber auch nur einen passwortgeschützen Zugriff, den man ja eigentlich nicht haben will, wenn man bislang eine öffentliche Statistik hat. Andernfalls müsstest du die Namen aller Bots (der seriösen wie der unseriösen) kennen um sie alle ausschließen aber "normalen" Besuchern den Zugang zu gewähren zu können.

2 | Jan Theofel | 11.05.2005 um 11:07

ähhhh, seit wann ist eine .htaccess-Datei zwingend gleichbedeutend mit Passwortschutz? Man kann damit auch z.B. unliebsame Spammer, die über bekannte Proxies kommen, recht leicht aussperren ;-)

Übrigens: Spammer lesen keine Weblogs, sie spammen sie nur... deshalb ist denen auch ein rel="nofollow" ziemlich schnurzpiepegal...

3 | Pepino | 11.05.2005 um 13:54

Ich schreibe ja auch nicht, dass man mit der .htaccess nur einen Passwortschutz machen kann. Ich sage nur, dass ist das einzige wie man die .htaccess in diesem Fall einsetzen kann. Denn auch wenn du die Sperre über die .htaccess vornimmst, musst du die Bots bei Ihrer Userkennung kennen um sie auszusperren. Das ist natürlich sicherer als die robots.txt aber eben auch deutlich aufwendiger. Und wie gesagt: Ich will ja nur die großen Suchmaschinenspider erwischen, die sich alle an die robots.txt halten.

Im Übrigen gehe ich davon aus, dass Google durchaus auch mit anderen Kennungen ein bischen spidert einfach um Cloaking zu erkennen. Dann hast du mit deiner .htaccess auch ein Problem, wenn Google sich dort als Mozilla ausgibt. Es sei denn sie verwenden solche Zugriffe wirklich nur um Cloaking zu Erkennen und schmeissen die so gespiderten Dateien wieder weg. Aber warum sollten sie das tun.

Zum nofollow-Tag in den Links der Statistiken: Ich denke die meisten Spammer sind sich bewusst, dass ihre Kommentare zu >99% gelöscht werden und ohnehin keinerlei Wirkung erzielen können. Aber warum liefern sie uns denn im Referrer bitte gleich ein Filtermerkmal mit? Daher meine Überlegung, dass der Spammer mir einige hundert SPAM-Kommentare mit seiner URL als Referrer sendet. Selbst wenn nun alle Kommentare gelöscht bzw. beklockt werden, taucht er damit mit hoher Wahrscheinlichkeit in den Statistiken der Top-Referrer auf. Und sobald die Statistiken frei zugänglich sind, erhält er dadurch einen Link auf seine Seite, den die Suchmaschinen berücksichtigen werden.

Er hat also keine erfolgreich verbleibenden Kommentare hinterlassen aber einige Einträge in der Webserverstatistik bekommen. Das sind zwar viel weniger Links, aber immerhin ein paar. Daher will ich den nofollow auch nicht in meinem Kommentaren oder Trackbacks einbauen sondern ich will ihn in die Statistik-Links einbauen.

4 | Jan Theofel | 11.05.2005 um 14:50

Schreib bitte Deine Meinung:

Kommentare werden moderiert und erscheinen daher ggf. zeitverzögert. Bitte nur themenbezogene Kommentare abgeben die sich auf diesen Eintrag beziehen.

ACHTUNG: Es gilt meine Anti-SPAM-Policy! Werbende Kommentare und SEO-Linkspam werden nicht freigeschaltet. Statt dessen sende ich eine Beschwerde an den Profiteur der Werbung.
Bei persönlichen Meinungen bitte keine Links zu kommerziellen Projekten sonder zu eurer privaten Seite.