Tribal Talk

hét weblog voor online ondernemers

Print Weblog

20May

De drie gradaties van duplicate content

Door: Wiep Knol       categorie: Zoekmachine Optimalisatie

Duplicate content is een onderwerp dat op het web al vaak genoeg behandeld is; zo is al ooit uitgelegd wat het is, wat je tegen duplicate content kunt doen, hoe duplicate content wordt bepaald en hoe je het kunt voorkomen. Dat er verschillende varianten van duplicate content voorkomen ben ik echter nog niet zo vaak tegengekomen, vandaar deze basic insteek.

Zelfde domein
Veel websites zijn zonder probleem met én zonder www. op te vragen (en in sommige gevallen niet eens zonder www). Het probleem hierbij is echter dat Google de www-versie en de niet-www-versie als twee aparte domeinen ziet. Hoewel Google er steeds beter in wordt om beide versies samen te voegen, bijvoorbeeld via Google Webmaster Tools, maar toch is het verstandig om voor één van beide varianten te kiezen. Zowel uit duplicate content oogpunt als voor de inkomende links ;)

Voorbeeld: http://parool.nl en http://www.parool.nl

Zelfde website
Om jezelf te beschermen tegen domeinkapers en domain squatters, is het verstandig om naast je domeinnaam ook aanverwante domeinnamen te registreren. Naast bijvoorbeeld bedrijfsnaam.nl kun je bijvoorbeeld ook bedrijfsnaam.com, bedrijfsnaamproduct.nl en bedrijfs-naam.nl registreren. Wees dan wel zo verstandig om al deze geregistreerde domeinnamen met een permanente 301-redirect door te laten verwijzen naar je ‘echte’ domeinnaam, en dus niet exact dezelfde content op elk van de domeinnamen te plaatsen. Ook al deze varianten ziet Google –vanzelfsprekend- als verschillende domeinen.

Voorbeeld: http://www.parool.nl en http://www.hetparool.nl

Geloof het of niet, maar precies op de dag dat ik besloot om dit artikel te schrijven, plaatst het Parool een 302 (fout dus) redirect op hetparool.nl. Er zijn nog wel ruim 3000 pagina’s geïndexeerd en er staan ook nog 8000 links (waaronder 1 van Apple.com) naar dit domein…

Andere website
Een variant waar vooral weblogs en nieuwswebsites last van hebben (maar ook websites die regelmatig een persbericht versturen), is duplicate content op een andere website. Verschil met de vorige variant is dat alleen een bepaald deel (een bericht, artikel of stuk tekst) hetzelfde is, en dus niet de gehele pagina of website. Mede vanwege het feit dat je hier zelf geen controle op hebt en doordat Google nu moet kiezen tussen jouw domein en die van iemand anders, is dit de meest vervelende vorm van duplicate content.

Voorbeeld: http://www.parool.nl/… en http://www.hln.be/….


Gerelateerde berichten:
 - Duplicate content – wat is het en hoe voorkom ik het?
 - Google Zeitgeist: Nieuwe vormen van content

Comments are closed.