IT-Academy Logo
Sign Up Login Help
Home - Internet - Web-Marketing - Suchmaschinenoptimierung - Schummeln bei Suchmaschinen



Schummeln bei Suchmaschinen

Immer mehr Seitenbetreiber wenden unfaire Mittel an um ein höhere Position bei Suchmaschinen zu ergattern. Dieser Artikel zeigt welche fiesen Tricks es so gibt.


Autor: Patrick Faes (dreamer)
Datum: 20-08-2004, 20:06:41
Referenzen: keine
Schwierigkeit: Anfänger
Ansichten: 4608x
Rating: 8.43 (7x bewertet)

Hinweis:

Für den hier dargestellte Inhalt ist nicht der Betreiber der Plattform, sondern der jeweilige Autor verantwortlich.
Falls Sie Missbrauch vermuten, bitten wir Sie, uns unter missbrauch@it-academy.cc zu kontaktieren.

[Druckansicht] [Als E-Mail senden] [Kommentar verfassen]



ACHTUNG: Das Ziel dieses Artikels ist es zu erläutern wie viele Webmaster versuchen auf unfaire Weise ein höheres Ranking in Suchmaschinen zu bekommen. Bitte benutzen Sie die hier beschriebenen Techniken nicht. Wenn die Suchmaschinen- Betreiber Sie dabei ertappen, werden Sie ganz aus die Suchmaschinen gestrichen 1.

Einführung

Auch Sie haben es bestimmt schon mal miterlebt, dass Sie in Suchmaschinen nach etwas suchen, dann aber auf einer Seite landen wo keine Spur des gesuchten Begriffs zu finden ist. Marketing-Experten wissen gezielt die Schwächen der Suchmaschinen aus zu nutzen um einfach jeden auf ihre Seiten zu kriegen in der Hoffnung, dass diese etwas kaufen (obwohl es schon fragwürdig ist ob jemand der nach "Bananen-Zucht" sucht eine neue Festplatte kaufen wird).

Webkataloge und Suchmaschinen: die Unterschiede

Um die ganze Sache besser verstehen zu können, müssen Sie erst mal verstehen wie Suchmaschinen funktionieren, und worin diese sich unterscheiden von sogenannte Webkatalogen.

Webkatalogen (wie z.B. Yahoo) sind Seiten die viele Links zu anderen Seiten enthalten. Diese werden alle einzeln von Menschen geprüft und werden nur dann aufgenommen wenn diese auch wirklich gut sind.

Da das Internet sehr schnell wächst, kann kein Redakteur mithalten, Computer schon. Sogenannte Suchmaschinen (wie z.B. Google und Lycos) sind Computer wo man seine Seiten anmelden kann. Die Suchmaschine (der sogenannte Spider) wird dann später die Seite besuchen und eine Kopie speichern. Wenn eine Suchanfrage stattfindet, wird die Suchmaschine nachgehen ob der gesuchte Begriff auf die Seite gefunden wurde. Da diese nicht von Menschen kontroliert werden, können Seitenbetreiber so ungefähr alles auf ihre Seite schreiben was sie wollen, auch Begriffe die für eine jeweilige Seite komplett irrelevant sind.

Suchmaschinenbetreiber versuchen zwar sich zu schützen indem Sie versuchen die wirklich guten Seiten zuerst an zu zeigen und die schlechten (sprich irrelevanten) als letztes. Dafür haben sie eigene Such-Algoritmen entwickelt die bestimmen, welche Seiten aufgenommen werden sollen und wie hoch das Ranking ist (das Ranking ist die Reihenfolge worin die Seiten angezeigt werden). Die einzelne Such-Algoritmen gehören zu den best gehüteten Geheimnisse im Internet. Von Google aber ist bekannt, dass es die sogenannte Link-Popularität2 nutzt und andere die Anzahl der Klicks zählt die eine Seite erreicht (auch mit Begriffen die nichts mit einer bestimmten Seite zu tun haben). Wie die Suchmaschinen zu Werke gehen, kann man eigentlich nur herausfinden indem man sehr viele Suchanfragen macht und diese untersucht3.

Die Tricks der Schummler

So gut die Suchmaschinen sich auch schützen, die Schummler finden immer irgendwelche Tricks um die Suchmaschinen denken zu lassen ihre Seiten hätten interessanten oder zumindest relevante Inhalte. Diese sind einige der am Häufigsten genutzten Tricks:

Begriffe als Variable in der Internet-Adresse

Algemein ist eines der wichtigsten Kriterien die Internet-Adresse (URL: unified resource locator). Wenn der gesuchte Begriff darin vorkommt, bekommt man mit Sicherheit ein gutes Ranking. Einige Beispiele sind da Playstation.de, Mercedes.de, HTMLgoodies.com oder auch IT-academy.cc.

Seiten die nichts mit dem gesuchten Begriff zu tun haben, blicken da in die Röhre. Deshalb werden oft die Begriffe als Variable angehängt, z.B. www.it-academy.cc/?var=blumen. Die Variablen finden dabei natürlich keine weitere Verwendung. Die einzelne URL's werden dann alle einzeln bei den Suchmaschinen angemeldet. Man kann aber auch die Variablen an den normalen Links dranhängen, weil Suchmaschinen meist ganze Seiten indizieren und also die Links auf allen Seiten automatisch folgen.

Begriffe im Seiten-Titel

In HTML kann man mit dem Tag <TITLE>4 einzelne Seiten einem Titel geben. Da diese sehr kurz dem Inhalt der Seite wiedergeben, werden diese sehr hoch gewertet. Um Spamming von Schlüsselwörtern im <TITLE>-Tag zu verhindern, werden Suchmaschinen jedoch nur z.B. die ersten 20 Zeichen auslesen.

Manche Webmaster geben ihre Seiten auch mehrere Titel. Die Suchmaschinen speichern alle, der Browser zeigt nur die erste an.

Begriffe in META

META5 sind Kopfdateien die für dem Besucher unsichtbar sind, die Suchmaschinen jedoch vieles über eine Seite sagen können, wie z.B. eine Beschreibung, Schlüsselwörter, ein Enddatum, Name des Seitenbetreibers usw. Da die Suchmaschinenbetreiber schon früh erkannt haben, dass Seitenbetreiber so ungefähr alles reinschreiben können was sie wollen, werden META-Inhalte heutzutage kaum noch beachtet. Ausnahmen sind z.B. Metacrawler.

Suchbegriffe in Kommentare verstecken

Programmierer können auch in HTML Kommentare einfügen. Diese sind für dem Besucher nicht sichtbar, können dem Programmierer aber viel sagen über die Programmierung, sodass er später noch weiß wie seine Seite gebaut war. Suchmaschinen lesen diese Kommentare. Da die Kommentare für den Besuchern aber nicht sichtbar ist, werden die meisten Suchmaschinen diese ignorieren.
In HTML schreibt man die Kommentare zwischen <!-- und <.

Link-Seiten

Wie oben schon angesprochen wurde, setzt z.B. Google stark auf die Link-Popularität2. Es kommt darauf an, dass soviele Seiten wie möglich auf die eigene Seiten verlinken sollen. Google beschließt daraus, dass Seiten auf denen viele andere Seiten verlinken auch guten Inhalt haben. Deshalb stellen viele Webmaster hunderte von Seiten im Internet die nur Links zur eigenen Seite enthalten.

Doorway-Pages

Sogenannt Doorway-Pages (frei übersetzt bedeutet dies, dass etwas wie "Durchgang-Seiten") werden benutzt für z.B. Seiten die mit Flash6 erstellt wurden. Diese können nicht von Suchmaschinen ausgelesen werden. Deshalb bauen die Betreiber solcher Seiten Doorway-Pages die den Inhalt wiedergeben und den Besucher weiterleiten zu der eigentlichen Seite.

Obwohl dies dafür natürlich sehr geeignet ist, gibt es auch Webmaster die dies missbrauchen. So stellen sie hunderte von Seiten im Internet die mit irgendwelche falschen Inhalte gefüllt werden.

Es gibt zwei Arten von Weiterleitungen: Client-seitige7 und Server-seitige8. Ersteres wird von Suchmaschinen überhaupt nicht mehr verfolgt, letzteres aber schon9.

Texte verstecken

Das wichtigste Kriterium für eine Suchmaschine ist immer noch der eigentliche Inhalt der für dem Besucher sichtbar ist. Man kann allerdings nicht haufenweise Wörter auf der Seite schreiben die nichts mit der Seite zu tun haben, da dies das Layout der Seite zerstören kann (am Besten stehen die Schlüsselwörter weit oben im Quellcode) oder einfach Besucher nervt. Auch wiederholtes schreiben von immer dieselben Wörtern (erhöht wiederum das Ranking) ist dem Besucher nicht zumutbar.

Deshalb werden solche Texte oft versteckt, indem man diese dieselbe Farbe wie der Hintergrund gibt (z.B. weißer Text auf weißem Hintergrund). Um ein Beispiel zu sehen

(erfordert Javascript)


Der Text ist nun selektiert und damit sichtbar.

ALT-Texten und Namen bei Grafiken

Eine eher selten benutzte Methode ist der Gebrauch von ALT-Texte10 bei Grafiken. Diese sind alternative Texte die gezeigt werden wenn eine Grafik nicht angezeigt werden kann (so weiß der Besucher zumindest was auf dem Bild zu sehen wäre, und auch Suchmaschinen sind sehr interessiert daran).

Hierin schreiben manche Seitenbetreiber vieles das nicht im Geringsten beschreibt was auf dem Bild zu sehen ist. Manche Suchmaschinen bewerten dies aber sehr hoch und gerade deshalb nutzen viele Webmaster dies aus. Auch der Gebrauch von Namen11 für Grafiken ist sehr beliebt bei Schummler.

TITLE bei so ziemlich alles

So ziemlich jedes HTML-Element kann ein Titel12 haben. Wenn der Mauszeiger darüber fährt, wird der Titel sichtbar. So kann man z.B. beschreiben wohin ein Link führt, denn auch die Verlinkung spielt bei Suchmaschinen eine wichtige Rolle.

Das unsichtbar Machen von Texten

Sie haben weiter oben schon gesehen dass man Texte verstecken kann. Mit den CSS- Eigenschaften Display13 und Visibility14 kann man die Texte auch einfach unsichtbar machen, und diese können dann überhaupt nicht mehr angezeigt werden.
Sie unterscheiden sich aber: mit visibility:hidden; wird ein Platz freigehalten, mit display:none; nicht. Ersteres wird oft benutzt mit der Z-index15, wobei sich überschneidende Texte einander nicht verschieben (hierbei werden die Elemente auch "absolut" positioniert16).

Der Gebrauch von Überschriften
Der Gebrauch von Überschriften17 ist auch ein sehr beliebtes Mittel um ein höheres Ranking zu bekommen. Überschrifte sind Texte die per HTML größer geschrieben werden. Dies geschieht mit den Tags <h6> bis <h1>, wobei die Zahlen die Größe angeben (6 ist die Kleinste, 1 die Größste).

Da die Überschriften dazu gedacht waren um Titel zu Texten o.ä. zu schreiben, werden diese auch hoch gewertet. An sich ist es auch ein sehr gutes und faires Mittel um ein höheres Ranking zu bekommen. Allerdings wird es auch sehr oft missbraucht. Da zuviel großer Text das Layout verschmiert, werden die Überschriften unsichtbar gemacht (wie oben angezeigt).
Aus diesem Grund schenken die Suchmaschinen immer weniger Gewichtung an Überschriften, besonders weil diese Tags als missbilligt gelten (das Layout soll künftig nur mit CSS gemacht werden und deshalb sollen diese Tags nicht mehr unterstützt werden, bis es so weit ist werden aber noch Jahren vergehen).
Eine ähnlich Methode ist die Formatierung von Text mit HTML (Physische Auszeichnungen18) wie z.B. <b></b> (fetter Text).

Bestimmte Inhalte nur an Suchmaschinen weitergeben

Ein Trick der in letzter Zeit immer beliebter wird, ist einige Texte mit falschem Inhalt nur an Suchmaschinen weiter zu geben. Mit der Variable $_SERVER["HTTP_USER_AGENT"]19 kann der Name plus Versions-Nummer des Browsers ermittelt werden (z.B. Mozilla/4.5 [en] (X11; U; Linux 2.2.9 i586) ).
Dieser Beispielcode zeigt dies:
<?php
$browser = $_SERVER['HTTP_USER_AGENT'];

if ( !(eregi("Internet Explorer", $browser)) && !(eregi("Netscape", 
$browser)) )
{
echo "Inhalt für Suchmaschinen";
}
?>
In diesem Code wird untersucht ob sich im Browser-Name die Wörter "Internet Explorer" oder "Netscape" befinden (dies wird gemacht mit der Funktion eregi20). Wenn dies nicht der Fall ist, wird der Suchmaschinen-Text ausgegeben.

Man es auch umgekehrt machen: den Inhalt für Suchmaschinen nur ausgeben wenn sich eine Suchmaschine anmeldet. Google meldet sich z.B. an als Googlebot. Der Code würde dann so aussehen:
<?php
$browser = $_SERVER['HTTP_USER_AGENT'];

if ( eregi("Googlebot", $browser) )
{
echo "Inhalt für Suchmaschinen";
}
?>
Bei dieses Beispiel müsste man jeden Browser einzeln ausschließen, bzw. aufnehmen. Das kostet viel Zeit und kann eigentlich nie komplett sein. Eine oft erneuerte Liste von wie sich Browser und Suchmaschinen identifizieren, finden Sie auf bei Siteware.ch

Alternativ gibt es noch die PHP-Funktion get_browser()21. Diese kann die Möglichkeiten des Browsers erkennen anhand von einer Browscap.ini-Datei22 die auf dem Server installiert werden muss (Browscap steht für Browser Capabilities, Browser-Fähigkeiten). So kann auch erkannt werden ob der Besucher ein Crawler (anderes Wort für Spider von Suchmaschinen) ist.

Diese Funktion wird allerdings erst ab PHP 5 richtig unterstützt (obwohl sie ab PHP 4.2 dabei ist), und die Browscap.ini-Dateien wurden primär für die Server-seitige Script-Sprache ASP (Microsoft Active Server Pages) konzipiert. Es gibt allerdings auch eine PHP-Version.
  1. Wenn eine Suchmaschine Sie dabei erwischt dass Sie unfaire Techniken anwenden, werden Sie aus der Suchmaschine gewehrt: mehr dazu
  2. Link-Popularität zählt wieviele Seiten im Internet auf die eigene Seite verlinken: mehr dazu
  3. Die Ranking-Verfahren der verschiedenen Suchmaschinen wurden untersucht: mehr dazu
  4. Der <TITLE>-Tag wird benutzt um einzelne Seiten einen Titel zum Inhalt zu geben: mehr dazu
  5. META-Angaben erzählen mehr über eine Seite, wie z.B. Name des Seitenbetreibers, Schlüsselwörter, Beschreibung, usw.: mehr dazu
  6. Flash ist eine Animations-Software von Macromedia. Man kann auch ganze Webseiten damit bauen: mehr dazu
  7. Per META-Tag kann der Besucher nach einer bestimmten Zeit automatisch weitergeleitet werden: mehr dazu
  8. Mit der PHP-Funktion header() kann der Server dem Besucher erzählen er soll die Datei irgendwo anders finden: mehr dazu
  9. Die meisten Suchmaschinen verfolgen nur Server-Seitige Weiterleitungen: mehr dazu
  10. Alternative Texte für Grafiken: mehr dazu
  11. Namen für Grafiken: mehr dazu
  12. Jedes Element kann einen eigenen Titel haben und dieser unterscheidet sich vom ALT-Text: mehr dazu
  13. Die CSS-Eigenschaft Visibility bestimmt die Anzeige mit Platzhalter eines Elements: mehr dazu
  14. Die CSS-Eigenschaft Display bestimmt die Anzeige ohne Platzhalter eines Elements: mehr dazu
  15. Die CCC-Eigenschaft Z-Index verteilt eine Seite in verschiedene Schichten: mehr dazu
  16. Wenn ein Element die Eigenschaft Position:Absolute; hat, wird es aus dem normalen Text-Fluss genommen: mehr dazu
  17. HTML-Überschriften dienen zur Text-Strukturierung, werden aber oft missbraucht: mehr dazu
  18. Physische Auszeichnungen in HTML: mehr dazu
  19. Die Variable $_SERVER["HTTP_USER_AGENT"] speichert den Namen des Browsers: mehr dazu
  20. Die Funktion eregi() such Übereinstimmung zwischen zwei Strings: mehr dazu
  21. Die PHP-Funktion get_browser() erzählt viele Daten über dem Browser (braucht die Installation einer Browscap.ini-Datei, siehe Punkt 22): mehr dazu
  22. Die Datei Browscap.ini soll auf dem Server installiert werden. Sie brauchen die PHP-Version: mehr dazu
Abschluss

In diesem Artikel wurden die fiesen Tricks erläutert. Natürlich möchten auch Sie als Seitenbetreiber ein hohes Ranking in den Suchmaschinen erreichen, Sie sollten aber dennoch diese Tricks nicht anwenden. Die Suchmaschinen wissen sich immer besser zu schützen und wenn Sie ertappt werden (und Ihre Konkurrenten werden schon dafür sorgen), wird Ihre Seite einfach ganz aus der Suchmaschine gestrichen. Wenn Sie auf faire Weise Ihr Ranking verbessern wollen, empfehle ich Ihnen Suchmaschinentricks.de.


dreamer
Expert
Beitrag vom:
10-11-2004, 23:21:45

Cloaking

Die letzte Technik nennt sich "Cloaking". Per Google.de finden Sie bestimmt mehr dazu. Alternativ können Spider auch an Hand der IP-Adresse erkannt werden.

-----------------------------------------------------


[back to top]



Userdaten
User nicht eingeloggt

Gesamtranking
Werbung
Datenbankstand
Autoren:04508
Artikel:00815
Glossar:04116
News:13565
Userbeiträge:16552
Queueeinträge:06245
News Umfrage
Ihre Anforderungen an ein Online-Zeiterfassungs-Produkt?
Mobile Nutzung möglich (Ipone, Android)
Externe API Schnittstelle/Plugins dritter
Zeiterfassung meiner Mitarbeiter
Exportieren in CSV/XLS
Siehe Kommentar



[Results] | [Archiv] Votes: 1147
Comments: 0