Duplicate Content

28.06.2006

Session-ids

Duplicate Content - zu Deutsch - Doppelte Inhalte sind nicht im Sinne der Suchmaschinen und deshalb sollen sie in Zukunft scheinbar ausgefiltert werden. Session-id's scheinen den Suchmaschinen große Probleme beim Indizieren der Webseiten zu bereiten. Durch immer wieder neue Indizierung ein und der selben Webseite nur mit anderer Session-id wird Duplicate Content ohne Ende, meist unwissentlich und unbeabsichtigt erzeugt. Bevor der Webmaster es bemerkt, wurden schon unzählige Seiten mit Session-id in den Index aufgenommen. Diese wieder heraus zu bekommen wird um einiges schwieriger werden.

Webkataloge

Auch Webseiten die sich nur sehr unwesentlich voneinander unterscheiden fallen unter den Begriff DC und wandern zumindest zeitweise ab in den zusätzlichen Index. Aufgefallen sind uns hier beispielsweise immer wiederkehrende Seiten in Webkatalogen mit gleichem Inhalt nur zu einer anderen Kategorie gehörend. Überhaupt scheinen sich Webkataloge sehr schlecht zu entwickeln. Ganze Katagorien verschwinden im zusätzlichen Index. Unter den Webkatalogbetreibern hält sich hartnäckig die Meinung, die Webmaster, die ihre Homepages anmelden seien Schuld an diesem Dilemma, weil sie in allen Webkatalogen die gleichen Beschreibungen einreichen. Das kann natürlich ein Grund sein, aber wir vermuten, das allein ist es nicht. Schlecht gepflegte Webkataloge, Webkataloge vom gleichen Betreiber, mit 1:1 identischem Inhalt, unter verschiedenen Domains, zu allem Überfluß von der Startseite untereinander, im schlechtesten Fall reziprok verknüpft, scheinen uns hier der Hauptgrund zu sein.

Fotogalerien

Fotoseiten haben ebenfalls unter dem DC-Problem zu leiden. Nach unseren Recherchen sind dies Webseiten mit kurzen, sehr ähnlichen Texten, die sich auch im title-Tag sehr ähneln und alle auf das Keyword Foto optimiert sind. Das jeweils andere Foto oder Bild auf jeder Seite kann den Nachteil, den diese Seiten gegenüber Contentseiten haben, nicht wett machen. Suchmaschinen können noch keine Bilder auswerten und bis dahin wird es auch noch eine Weile dauern. Auch das passend zum Bild ausgefüllte alt-Attribut macht die Sache nicht besser.

Der zusätzliche Index droht

Sehr viele dieser zuvor beschriebenen Seiten pendeln seit einiger Zeit zwischen dem zusätzlichen und dem regulären Index. Auch der Pr schwankt. Zeitweise sind sie mit pr ausgestattet, zeitweise ist er wieder weg. Auf die Suchergebnisse scheinen diese Phenomäne (noch?) keine Auswirkungen zu haben.

© www.homepage-analysieren.de | Impressum