Schon mal in die Logdateien geschaut?

Streng geheim ist der Algorithmus, wie Google seine Suchergebnisse sortiert. Und leider haben auch wir diesen nicht vollständig erforscht. Wird jedoch schon ein kleiner Teil der komplizierten Logik durchschaut, bietet sich ein Vorteil oder gar Vorsprung gegenüber Millionen anderen Seiten. Der Googlebot hinterlässt Spuren auf jeden Webserver. Nur wenige haben Zugriff auf diese Spuren. Noch weniger können sie deuten. Doch genau dort sollte man einen Blick hinwerfen, wenn alle bekannten Fakten und Gerüchte keine Hilfe im Kampf um ein gutes Ranking bringen. Blogs werden bei Google gut gerankt – diese Feststellung ist hinlänglich bekannt.
Es ist schon überraschend, wenn eine vollkommen neue Seite mit Pagerank 0 die eigene Seite im Ranking überholt. Aber woran erkennt Google einen Blog? Qualitativer und aktueller Content ist eine Eigenschaft von Blogs die von je her gute Positionen verspricht. Erst der Blick in die verborgenen Logfiles gibt darüber Auskunft. Der Googlebot ruft auf einen Webserver Webseiten ab, die auf keinen Fall vorhanden sein können. Das scheinbar unlogische Verhalten provoziert jedoch eine 404 Fehlermeldung, die viel über die genutzte Software wie Webserver oder CMS (Content Managment System) verrät. Allein das Interesse des Googlebots an dieser Meldung zeigt, dass es nicht egal ist welche Software verwendet wird. Welche CMS-Software bringt nun einen Vorteil? Auch da verrät sich Google durch aufdringliche Fragen. Gerade bei einer neuen Site werden Pfade aufgerufen, die typisch sind für Standardinstallationen von Joomla, und Wordpress. Ist das Ergebnis der Abfrage gültig – Volltreffer, so kann analysiert werden welche Software verwendet wird.

Logfile hacking: Google sucht nach nicht vorhandenen Seiten - 404 Meldungen analysiert

Google testet Wordpress Feed
66.249.65.134 - - [05/Feb/2007:23:00:24 +0100] “GET /wordpress/?feed=rss2 HTTP/1.1″ 404 1033 “-” “Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.
com/bot.html)”

Google sucht nach dem Standard Wordpress Login
66.249.65.45 - - [24/Feb/2007:05:37:31 +0100] “GET /wordpress/wp-login.php HTTP/1.1″ 404 1033 “-” “Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google
.com/bot.html)”

Google spioniert nach Joomla Standardinstallationen
66.249.65.208 - - [01/Mar/2007:00:53:39 +0100] “GET /joomla HTTP/1.1″ 404 1033 “-” “Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)”

Das Standard Template von Joomla verrät das CMS-System

66.249.72.174 - - [29/Mar/2007:00:08:17 +0200] “GET /joomla/templates/ms_thinking_green/css/template_css.css HTTP/1.1″ 404 1033 “-” “Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)”

Logfile von erzsuche.de

Related posts:

  1. XT Commerce mit suchmaschinenfreundliche Urls SEF

Tags: google, SEO