Danke, Google. Als ich heute morgen die Twittersphere überflog, sprangen mir dutzende Meldungen entgegen, dass Du jetzt die Möglichkeit bietest, in den Webmaster Tools bis zu 15 Parameter zu definieren, die aus den URLs gelöscht werden sollen. Ich finde das toll – denn jetzt darf ich noch mehr Überzeugungsarbeit leisten. Statt mir das Leben als SEO zu vereinfachen, hast Du es mir also eigentlich schwerer gemacht.
Hilfreich ist diese neue Möglichkeit auf den ersten Blick ja schon irgendwie. Ich stoße immer noch auf viel zu viele Websites, die Session-IDs in ihren URLs mitziehen anstatt hierfür Cookies zu verwenden. Mit allen Konsequenzen für die Suchmaschinen. Namentlich Duplicate Content. Und auch wenn man in solchen Fällen inzwischen einfach mit dem canonical-Tag arbeiten könnte – offenbar scheitern hier dennoch viele Webmaster, denn sonst würde Google diese Option jetzt nicht anbieten. Mir fällt zumindest keine Konstellation ein, bei der es wirklich nötig wäre, eine solche Parameter-Entfernung zu forcieren, die man nicht auch mit einem Canonical lösen könnte. Aber vielleicht habe ich nur noch nicht genügend abgefahrene Fälle gesehen…?
Jedenfalls können nun also alle Programmierer von Systemen aufatmen, die bisher zu faul zu doof zu wenig Zeit hatten, um sich darum zu kümmern, ihre URLs von den lästigen Session-IDs zu befreien. Einfach in den Google Webmaster-Account gehen, den Parameter für die Session-ID oder sonstige, für jeden Besucher unterschiedliche Parameter eintragen – und gut ist’s. Zurücklehnen, Bauch streicheln und lieber wieder eine Runde Counterstrike zocken über die nächste Erweiterung des Systems nachdenken. Google wirds ja dann schon machen.
Doch genau darin sehe ich jetzt sogar die größte “Gefahr” dieser neuen Möglichkeit.
Sicher, manche Systeme lassen sich nun mal nicht ohne deutlichen Aufwand auf Cookies umstellen. Und für nicht ganz so technisch versierte Webmaster ist es sogar ideal, weil sie sich nicht mehr um solchen Kram kümmern müssen.
Aber meiner Meinung nach ist sauberes URL-Design eben weit mehr als hämische Schikane der Programmierer oder ein zu großer Drang nach Ästhetik. Es ist ein Zeichen dafür, dass man sich über das System und die Besucher wirklich Gedanken gemacht hat und es so einfach wie möglich gestaltet. Mit dieser Meinung bin ich zwar nicht ganz alleine, aber der Stellenwert dieses Themas ist insgesamt wie ich finde noch viel zu niedrig angesetzt. Und wird jetzt in Zukunft wohl noch weniger Bedeutung haben, denn warum sollte man sich jetzt noch nervige Gedanken über eine solche Kleinigkeit wie gutes URL-Design auf seiner Website machen? Einfach ein x-beliebiges System hingeklatscht, Hauptsache es funktioniert technisch irgendwie – und den Rest kann man ja dann schon bei Google selbst irgendwie hinbiegen. Beziehungsweise wird der SEO das dann schon richten. Dafür ist er ja da.
Glücklich wird er jedoch mit einer solchen Website definitiv nicht werden. Denn eine der grundlegendsten Analysen einer Website ist nun mal ein Linkcheck, um einen Überblick über alle vorhandenen Seiten zu bekommen. Aber versucht das doch mal bei einer Website mit Session-IDs – Ihr werdet wahnsinnig! Es ist schlicht und einfach nahezu unmöglich, weil so ein Linkchecker ständig neue Session-IDs zugewiesen und daher die gleiche Seite zigmal in der Navi angeboten bekommt – jedes mal mit einer anderen Session-ID in der URL. Also läuft er sich zu Tode, weil er ja immer wieder neue Seiten sieht und die Website also unendlich groß ist.
Der beste Linkchecker für SEO-Zwecke ist in meinen Augen nach wie vor Xenu Linksleuth, der aber genau dieses Problem hat, weil er mit bis zu 100 Threads gleichzeitig auf eine Website losgehen kann und dementsprechend viele unterschiedliche Sessions öffnet. Also crawlt er sich bei einer solchen Website wirklich zu Tode und stürzt üblicherweise nach maximal 500.000 Seiten ab – nachdem er schon bei ungefähr 10.000 Seiten wegen des Speicherbedarf angefangen hat, langsam aber sicher Dein System lahmzulegen.
Deutlich robuster ist dagegen GSiteCrawler, mit dem ich auch schon Websites abgegrast habe, die mehr als 500.000 Seiten hatten. Der kann nämlich auch Parameter aus den URLs entfernen und läuft sich daher nicht so schnell tot. Aber weil er die URLs mit den IDs drin ja dennoch immer wieder angeboten bekommt, muss er trotzdem deutlich mehr schuften als nötig wäre. Und was aber viel schwerer wiegt: dieses Ding ist eigentlich nur dafür ausgelegt, Sitemap-Dateien zu erstellen, also alle URLs einer Website zu finden, diese ggf. zu filtern/manipulieren und dann als Liste auszugeben. Sowas wie Navigationstiefe einer Seite, die Größen der Dateien, ihre Seitentitel, die Anzahl der eingehenden und ausgehenden Links und dergleichen sehe ich dort nicht. Genau das ist aber für SEO-Zwecke extrem hilfreich, weswegen ich auch so ein Fan des Xenu bin, der mir all das schön übersichtlich liefert.
Es bleibt also auf jeden Fall schwierig. Entweder hab ich eine klare Aussage darüber, ob ich broken Links in irgendeiner meiner Seiten habe (das macht auch der GSiteCrawler) – oder ich habe die Informationen, die fürs SEO interessant sind, aber dafür ist jede Seite zigmal vorhanden und es fehlt mit ziemlicher Sicherheit noch eine unbestimmte Anzahl Seiten in der Übersicht.
Mal abgesehen davon, dass an genau diesem Problem die Software ForeCheck ansetzen wird – bis diese wegen der damit verbundenen, technischen Hürden richtig marktreif ist, steht man als SEO also auf recht verlorenem Posten, was die Analyse solcher Systeme mit Session-IDs in URLs angeht.
So. Und jetzt kommt also Google daher und ermöglicht es einfach, solche unliebsamen Parameter zu löschen. Danke. Genau die Probleme für die Indexierung waren doch bisher meine Hauptargumente, Entwickler dazu zu überreden, ihre URLs Session-frei zu machen. So konnte ich wenigstens einen wirklich großen Hebel ansetzen, um die Website früher oder später vernünftig mit Xenu anzugehen und aus diesen Daten weitere wichtige Schlüsse und Verbesserungsvorschläge abzuleiten. Damit ist jetzt also wohl erst mal Essig…
Aber was solls. Dann nutzt diese Möglichkeit eben, anstatt Euch wirkliche Gedanken über Eure Website zu machen und sie insgesamt “einfacher” aufzubauen. Aber denkt nicht, dass das Konfigurieren solcher zu löschenden Parameter in Google auch nur entfernt irgendetwas mit echtem SEO zu tun hat…
Diesen Artikel per Email weiterempfehlen


Naja, Rücksicht auf dumme Crawler (Y!) und ähnliche Dinge wie Linkchecker kann Google nicht nehmen. Ich habe selbst eine 98er Website und erst dieses Jahr entgültig die Session auf Cookie umgestellt. Konnte damals halt nicht jeder Browser und ich fuhr 10 Jahre zweigleisig. OK, Canonical verwende ich auch und mittlerweile ist das Problem gelöst, aber wenn ich so schnell ein paar tausend alte URLs rauskriege, warum nicht?
Was einem mehr zu denken geben sollte ist, dass Google bisher offiziell behauptet hat, das wäre kein Problem.
Einen SEO sollte es doch freuen, wenn er ein weiteres Werkzeug in der Hand hat. Und wenn nun schon die Einstellungen in den Webmaster-Tools reichen ein Ranking zu verbessern, ist das doch eine super Sache.
Antworten
seodiot Reply:
September 17th, 2009 at 12:12
Hm. Reicht das wirkich für’s Ranking? Hätte den Gedanken vielleicht noch mit ins Posting aufnehmen sollen, aber Google hat so weit ich weiß keinerlei Aussage darüber gemacht, ob jetzt ein Link, der auf eine URL zeigt, aus der Parameter gelöscht werden, sauber der vereinfachten Form zugeführt wird oder ob der verpufft.
Beim Canonical kann ich sicher sein, dass das funktioniert. Denn genau dafür wurde er entwickelt und Google hat deutlich gesagt, dass solche Links der Canonical-URL zugeordnet werden.
Diese Aussage fehlt mir hier noch. Und deswegen bin ich der Überzeugung: es gibt keine Berechtigung für dieses neue Feature, da es keine Situation gibt, wo ich nicht entweder das System gleich entsprechend verbessern kann – oder eben notfalls einfach über einen zuverlässigen Canonical-Mechanismus arbeiten kann…
Aber selbst wenn – auch wenn sie keine wirkliche Bedeutung haben, funktioniert dieses Parameter-Löschen ja nur für Google. In den anderen bleibt das Chaos. Beziehungsweise lassen sich die auch einfach mit dem Canonical in den Griff bekommen. Also warum überhaupt dieses proprietäre Feature von Google benutzen?
Antworten
Eine Sache ist mir noch nicht ganz klar, aber elementar wichtig.
Schneidet Google den Parameter einfach ab? So sollte es am besten sein. Oder nimmt er vielleicht solche Seiten dann gar nicht mehr auf? Das könnte der Tod einer Website sein.
Was ich aber als großen Vorteil sehe. Diese Maßnahme ist dann künftig als SEO der erste Schritt bei einem Kunden. Er ist schnell und hat schon einen riesigen Effekt und der Kunde sieht recht zügig das SEO doch eine gute Sache ist.
Das Problem wurde aber nur umschifft und dies muss man dem Kunden klar machen.
Antworten
seodiot Reply:
September 17th, 2009 at 12:22
Gute Frage, auf die Google glaub ich noch keine konkrete Antwort geliefert hat. Der gesunde Menschenverstand muss aber davon ausgehen, dass diese Parameter einfach weggelassen werden. Also Google wird die Seite index.php?page=123 im Index halten und nicht index.php?page=123&session-id=432.
Genauso geht mir jetzt nach weiterer Überlegung auch wirklich eine Auskunft darüber ab, wie sich der Link Juice verhält, wenn ich Parameter abschneide. In der Antwort zum vorigen Kommentar hab ichs ja auch schon erwähnt.
Also beim canonical-Tag weiß ich, dass jeder Link auf index.php?page=123&session-id=432 der Seite index.php?page=123 zu Gute kommt, wenn ich diese einfach als Canonical angebe. Aber wenn ich Google nun sage, der Parameter session-id soll abgeschnitten werden…?
Genau deswegen sehe ich es auch eigentlich nicht als ersten SEO-Schritt. Eher als aller-aller-aller-aller-aller-allerletzten, wenn wirklich jegliche Hoffnung verpufft ist, dass der Web-Programmierer es jemals auf die Reihe bekommt, saubere und garantiert im Sinne der Suchmaschinenoptimierung funktionierende Canonical-Tags einzuführen…
Denn was man ja auch nicht vergessen darf: das Ganze ist jetzt proprietär nur für Google. In MSN und Yahoo bleibt aber das Chaos. Allerdings unterstützen diese ja ebenfalls den Canonical-Tag – also wieso sollte ich mich auf dieses Google-Feature stürzen, wenn ich mit einfachen Canonicals alle drei großen Suchmaschinen erschlage und noch dazu Sicherheit habe, was die Honorierung der eingehenden Links habe?
Antworten
Gut, ich verzichte eh einfach auf Canonical.. weil das Grundproblem hier schon der DC ist. Sprich eine zweite Seite mit DC würde ich gar nicht erst zulassen.
In diesem Fall könnte die neue Funktion + Canonical allerdings für viel Wirrwar sorgen und sich evt sigar negativ auswirken.
Mein Gedanke bez. der ersten Maßnahme war aber folgender:
Man nehme ein altes Forum mit 100.000+ Seiten. Durch Sessions gibts viel DC. Also erstmal bei Google die Sessions weghauen. Der zweite Schritt wäre dann das Forum umzubauen auf richtige SEO-Urls und dabei dann natürlich zukünftig auf diese verzichten.
Und bleiben wir beim Forum:
Viele Foren sind intern mit Sessions ausgestattet, zb das wbb3 oder das phpbb3, beide mit SEO_Plugin. Was wenn ein User nun einen Link inkl Session postet. Dank der neuen Funktion wird dieser korrekt weitergeleitet und spart mir eine htaccess Zeile. Somit schiebe ich die Last auf Google was gerade bei einem großen Forum hilfreich ist.
Antworten
seodiot Reply:
September 17th, 2009 at 13:30
Genau das befürchte ich eben auch. Also dass sich Unbedarfte einfach mal ransetzen und wirr sowohl Canonical-Plugins für ihre Seite verwenden als auch bei Google da rumkonfigurieren. Ich warte nur auf den ersten Hilfe-Schrei, wenn jemand einen eigentlich wichtigen Parameter ausgeschlossen hat und jetzt nur noch eine einzige Produktseite im Index hat oder sowas…
Das kann mit Canonicals nicht ganz so leicht passieren, weil man da automatisch mit ein wenig mehr Konzentration und Fachwissen rangeht als an so ein simples Eingabefeld.
Was den Forum-Gedanken angeht, würde ich aber dennoch lieber erst mal nen Canonical verwenden, um die Session-ID aus URLs “rauszubekommen”. Gerade bei phpBB ist das ja wirklich mit einer Regex und zwei oder drei Zeilen gelöst bzw. gibts da sicher schon Plugins dafür. Danach würde ich natürlich auch das System so umbauen, dass der Parameter komplett aus der URL verschwindet. Vorteil dieser Methode, den ich sehe, ist aber: während dieser zweiten Umbauzeit “lernt” Google ja schon über die Canonicals quasi die “Grundformen” der URLs, kann die Links entsprechend neu zuordnen und dergleichen. Sobald ich also den Schalter für die neuen URLs umlege, müsste es schneller gehen, dass Google (und eben auch MSN und Yahoo) die neuen Versionen kapiert und vor allem im Ranking honoriert, weil die Links schon zugeordnet sind.
Obwohl – kommt natürlich auch drauf an, was mit den “alten” URLs passiert. Eigentlich müsste man es ja so aufsetzen, dass sie einen sauberen 301 auf die neuen Versionen liefern. Denn wenn sie weiterhin mit 200-ok plus der angeforderten Seite antworten, hat man das Problem ja auch nur wieder verschoben. Und auch klar: wenn zwischen Schritt 1 und Schritt 2 nur Stunden liegen, ist das kein Argument – aber so wie ich die meisten Admins großer Websites bisher kennengelernt habe, wird das eher zwei Wochen als zwei Stunden dauern, also Zeit genug, damit der Googlebot bei großen Foren ein paar tausend mal vorbeikommt…
Aber was Deinen letzten Gedanken angeht – genau das ist ja noch nicht von Google beantwortet. Also ob dieser Link mit seiner Session-ID dann auch der URL ohne die Session-ID drin zu gute kommt. Ich glaube zwar natürlich ja, aber bevor das nicht zweifelsfrei bestätigt ist, bleibt das nur genau das: Glaube…
Deswegen muss ich leider so rechthaberisch wie ich bin, einmal mehr fragen: warum also mit dieser neuen, von der Auswirkung auf die Vererbung des Link Juice noch nicht ganz geklärten Einstellung spielen, wenn ich doch ganz einfach mit Canonicals alle diese Probleme genauso gut, wenn nicht sogar eleganter in der Griff bekomme und damit nicht nur Google, sondern gleichzeitig auch noch MSN/Bing und Yahoo erschlage…?
Antworten
seonachbar Reply:
September 17th, 2009 at 15:40
Ja SEO bleibt ein Spiel mit Kunden und Google
Wäre ja schlimm wenn der Kunde alles selbst machen könnte
Antworten
seonachbar Reply:
September 17th, 2009 at 15:40
Ja SEO bleibt ein Spiel mit Kunden und Google
Wäre ja schlimm wenn der Kunde alles selbst machen könnte
p.s.
merke jetzt erst das mein twitter Link falsch ist.. sag das doch einer
Antworten
[...] Dieser Eintrag wurde auf Twitter von Markus Uhl / SEOdiot und nothing yet. nothing yet sagte: RT: @seodiot google erlaubt das löschen von parametern – ist das wirklich gut? http://tinyurl.com/njkh6q [...]
Und jetzt können auch die “Dummen”-SEOs aufatmen, die Link-Building mit URLs die noch die Session-IDs beinhalten betreiben. Aber recht muss ich dir geben man sollte sich die Arbeit machen und den Bots keine Session-IDs präsentieren oder wenigstens diese in der Robots.txt aussperren.
Antworten
seodiot Reply:
September 18th, 2009 at 14:19
Echt? Session-IDs in solchen Links? Oh Herr, lass Hirn vom Himmel…
Antworten
[...] gibt es Erweiterungen bei den Webmaster-Tools, die die Fähigkeiten des Algorithmus in Bezug auf Parameter erkennen [...]
Diskutiere mit - gib einen Kommentar ab