Die Google Sandbox beschreibt einen speziellen Effekt im Ranking von neuen Webseiten. Dabei werden junge Domains von Sichtbarkeitsverlusten getroffen, obwohl sie sich zuvor gut in den Suchmaschinen platziert haben. Es wird spekuliert, dass es sich um eine Art Filter handelt, der (unnatürlich) schnelles Wachstum von Webseiten beschränkt.
Neue Domains scheinen sich erst beweisen zu müssen. Dabei kann es trotz aktiver Indexierung passieren, dass sie in den Suchergebnissen plötzlich nicht mehr auffindbar sind. Sie werden von Google sprichwörtlich zum Spielen „in den Sandkasten geschickt“. Die Existenz einer Sandbox wird bis heute kontrovers diskutiert und wird von Google dementiert [1].
Was ist die Google Sandbox?
Die Google Sandbox gilt als eine Art Testphase für junge Webseiten. Der Effekt wurde erstmals 2004 beobachtet. Webmaster wurden auf das Verschwinden von Domains mit geringem Alter aus dem Google Index aufmerksam. Zuvor noch rankende Domains waren trotz aktiver Indexierung plötzlich nicht mehr auffindbar [1,2].
Es wird angenommen, das Google eine Auswahl von neuen und besonders stark optimierten Webseiten trifft. Damit diese auf ihre Vertrauenswürdigkeit hin geprüft werden können, würden sie per Filter ausgebremst und aus dem Index entfernt [3].
Im Jahre 2014 haben die Mutmaßungen rundum den Sandbox-Effekt neues Futter erhalten. Mehrere Webmaster beobachteten übereinstimmend, dass ihre neuen Webseiten nicht mehr so leicht ranken würden wie zuvor [4].
Eine umfassende Definition des Sandbox-Effekts zu geben ist schwierig, da der Suchmaschinen-Gigant die Existenz eines solchen Filters nie bestätigt hat (siehe auch nächster Absatz). Dennoch wurde er in vielen SEO-Foren (vornehmlich Black-Hat) kontrovers diskutiert. In seinem Buch „Suchmaschinenoptimierung – Das umfassende Handbuch“ beschreibt Sebastian Erlhofer, den Effekt als schwer vorherzusagen und als kaum verständlich [1].
Plötzliche Rankingverluste für junge Domains? Dementi von Google
Die Existenz eines Filters, der das Wachstum von jungen Domains einschränkt, wird von Google weitgehend dementiert.
So gab Matt Cutts bereits 2005 auf der PubCon in Las Vegas an, dass es keine Sandbox gebe, die Rankingalgorithmen aber unter bestimmten Umständen Effekte zeigen würden, die gemeinhin von SEOs als Sandbox-Effekt bezeichnet werden [1].
Im Jahre 2010 beschrieb Cutts in einem YouTube-Video, wie wichtig das Domain-Alter für das Ranking ist und wie Google mit jungen Domains umgeht:
“The difference between a domain that’s six months old versus one-year-old is really not big at all. So long as you’ve been around for at least a couple of months, a few months, you should be able to make sure that you are able to show up results. (…) I would say it’s often good to go ahead and buy a website, put up a placeholder page to tell people what’s coming, and just go ahead and develop the website. And by the time you get your website live, often that’s two or three months down already” .
Matt Cutts, Google Search Central 26.10.2010 [5]
Daraus lässt sich nicht direkt die Existenz einer Sandbox ableiten, neue Webseiten scheinen aber tatsächlich eine gewisse Vorlaufzeit („ a few couple of months“) im Ranking zu benötigen. Dies ist aber auch keine Überraschung und könnte auch mit anderen Faktoren (z.B. Content-Qualität oder Backlink-Profil) zusammenhängen.
Im Google Office Hours Hangout äußerte sich John Mueller im Februar 2018, wie folgt zur Sandbox:
„With regards to sandbox, we don’t really have this traditional sandbox that a lot of SEOs used to be talking about in the years past. We have a number of algorithms that might look similar, but these are essentially just algorithms trying to understand how the website fits in with the rest of the websites trying to rank for those queries. […] It’s always kind of tricky in the beginning when we have a new website and we don’t quite know where we should put it”.
John Müller, Office Hours Hangout 23.02.2018 [6]
Zusammenfassend lässt sich sagen, dass es laut Google keine Sandbox im eigentlichen Sinne gibt, der Effekt als solches aber bedingt durch die Suchalgorithmen durchaus auftreten kann.
Übrigens wurde ein ähnliches Filterprinzip, nämlich der Supplemental Index mittlerweile von Google bestätigt. Dies ist ein zweiter Index, der Inhalte listet, die die Ansprüche an den „normalen“ Index nicht erfüllen [6]. So werden zum Beispiel eindeutig doppelte Inhalte in den zweiten Index verschoben und so nicht in den Suchergebnissen gelistet [1].
Rand Fishkin: Fürsprecher der Existenz der Sandbox in der SEO-Branche
Prominentester Fürsprecher der Existenz einer Google Sandbox ist Rand Fishkin. In einem Blogbeitrag aus dem Jahre 2008 probiert der Moz-Gründer die Existenz eines virtuellen Sandkastens anhand eines Praxisbeispiels zu belegen. Die Domain grader.com sowie vier ihrer Subdomains würden laut Fishkin typische Anzeichen für eine Beschränkung des Wachstums durch einen Filter aufweisen.
So konnte die zum damaligen Zeitpunkt noch junge Domain (nicht älter als 1 Jahr) erst hohe Rankingpositionen für relevante Keywords verzeichnen, sei dann aber sehr stark abgefallen. In der Google Suchmaschine war die Domain selbst für Keywords nicht auffindbar, die genau mit dem Title tag übereinstimmten. Weiter berichtete Fishkin, dass grader.com in anderen Suchmaschinen, wie zum Beispiel Yahoo oder MSN/Live, deutlich bessere Suchergebnispositionen erzielte als in der Google-Suche. Im Oktober 2009 wurde der Content von grader.com auf eine neue Domain umgezogen. Nach diesem Domain-Wechsel erzielte die Webseite in kurzer Zeit hohe Rankingpositionen für relevante Suchworte bei Google, was für Fishkin der ultimative Beweis dafür war, dass das Wachstum der Domain zuvor durch einen Filter eingeschränkt wurde [8].
Bereits 2005 veröffentlichte Fishkin einen Blogbeitrag, indem er auf ein inoffizielles Gespräch mit Google-Mitarbeitern auf der „Search Engine Strategies“ verwies, bei dem diese den Sandbox-Effekt bestätigt hätten. Der Artikel wurde u.a. von Sistrix aufgegriffen, ist aber mittlerweile nicht mehr auf dem Blog des Moz-Gründers abrufbar. Er scheint aber bereits wieder neu hochgeladen worden zu sein [9].
Welche Kriterien beeinflussen das Auftreten des Sandbox-Effekts?
Die Wahrscheinlichkeit für das Auftreten des Sandbox-Effekts wird laut Sebastian Erlhofer durch verschiedene Kriterien beeinflusst:
- Junge Domains
Neu angemeldete Domains sind eher vom Effekt betroffen als Domains, die bereits etwas länger existieren.
- Überoptimierung
Übertriebene Suchmaschinenoptimierung, die noch nicht als Spam gilt, aber deutlich über die Norm hinausgeht, macht Webseiten anfällig für den Sandbox-Effekt. Gerade einseitige On-Page Optimierung (überoptimierter Content & keine externen Links) wird als Ursache vermutet.
- Rankingverluste nur bei Google
Betroffene Domains verzeichnen starke Rankingverluste für bestimmte Suchworte bei Google, während sie in anderen Suchmaschinen für dieselben Keywords weiterhin gute Positionen erzielen.
- Top- & Second-Level Domain
Der Sandbox-Effekt wird vor allem auf privaten und kommerziellen Webseiten beobachtet. Domains mit offiziellen Endungen, wie .gov, .edu oder .mil sind nicht betroffen. Außerdem tritt das Phänomen auf der gesamten Domain auf und nicht für einzelne Unterverzeichnisse oder Subdomains [1].
Kann Google das Wachstum von jungen Webseiten algorithmisch bewerten?
Diese Frage ist nicht abschließend zu beantworten. Ein Google-Patent aus dem Jahre 2005 mit dem Titel „Information Retrieval Based on Historial Data“ verdeutlicht aber, wie es funktionieren könnte. Vereinfacht gesagt, beschreibt das Patent, wie die Suchmaschine historische Daten zur Entwicklung von tausenden Webseiten für die Einschätzung der aktuellen Entwicklung von einzelnen Webseiten nutzen kann.
Laut Erlhofer gibt es sichere Anzeichen dafür, dass das Wachstum einer Webseite von Google abhängig vom Thema bewertet wird. So sei es bei einer Naturkatastrophe, wie dem Tsunami 2004 im Indischen Ozean, sehr wahrscheinlich, dass viele neue Webseiten entstehen, die aufgrund ihrer exklusiven Informationen ein schnelles Wachstum verzeichnen [1].
Wie lange bleibe ich im „Sandkasten“?
Auch hierzu gibt es keine verlässliche Aussage. Die Dauer des Sandbox-Effekts ist genauso umstritten, wie seine Existenz. Webmaster berichten von drei bis 12 Monaten, die es dauern kann, bis eine betroffene Webseite wieder aus dem Filter entlassen wird. Auf lange Sicht gesehen wird Google aber unterscheiden können, ob es sich um eine Spam-Seite mit unnatürlich schnellem Wachstum handelt oder eine technisch saubere Seite mit relevantem Content, der Mehrwert bietet [2].
Quellen
[1] Erlhofer, S. (2019). Suchmaschinen-Optimierung: Das umfassende Handbuch.
[2] https://www.seo-kueche.de/lexikon/google-sandbox/
[3] https://de.ryte.com/wiki/Google_Sandbox
[4] https://www.searchenginewatch.com/2019/07/01/google-sandbox-2019/
[5] https://www.youtube.com/watch?v=-pnpg00FWJY&t=83s
[6]https://www.youtube.com/watch?v=8m__-eaB_hU&t=1538s
[7]https://www.sistrix.de/news/supplemental-index-webseiten-zweiter-klasse/
[8] https://moz.com/blog/googles-sandbox-still-exists-exemplified-by-gradercom
[9] https://moz.com/blog/oh-ye-of-little-faith