Plume Interactive : écriture web et ergonomie éditoriale par Eve Demange

Ecriture web, ergonomie éditoriale, optimisation de contenu éditorial web, rédaction référencement, management de projet éditorial Internet

14 mars 2011

Duplicate content : les conseils d'Olivier Andrieu

O
Olivier Andrieu, auteur du best seller Réussir son référencement web, donne quelques bons conseils aux rédacteurs web pour gérer les problèmes liés au "duplicate content":

Le “duplicate content“ : quels conseils donner aux rédacteurs web à ce propos ?
Tout d’abord il faut se demander ce que l’on désigne par le terme “duplicate content” ? On peut parler de “duplicate content“ à propos d'une pages accessible avec des URL différentes. Mais on peut avoir dans un même site, un article et sa version imprimable. C’est aussi un cas de “duplicate content“.

Justement, que faire si l’on a deux pages identiques sur son propre site ?
La solution peut être l’utilisation de la balise link rel="canonical" href="xxx". (On indique aux robots sur la page dupliquée, comme une version imprimable par exemple, l’adresse de la page source du contenu). Mais attention, cette balise n’est pas prise en compte par Google news.

Et si le “duplicate content“ se trouve sur un site Internet externe ?
Si le contenu est repris par un partenaire, en marque blanche par exemple : Google va prendre en compte la première page trouvée et celle qui a le plus fort page rank. Dans le contrat avec le partenaire, on pourra demander la non indexation du contenu du site en utilisant la balise robots "noindex". On pourra également convenir d’une balise avec un lien du partenaire vers la page canonique.

Si le contenu est repris par quelqu’un que l’on ne connait pas : 
> En France : dans ce cas, il faut trouver une solution amiable et voir avec son service juridique.
> Dans les îles Caïmans ou autres destinations "exotiques" : on peut s’asseoir et pleurer !  Mais on trouve une solution dans la plupart des cas. Sauf quand on vous vole votre contenu et que vous ne voyez pas qui cela peut être. Mais c’est rare.

A partir de quel degré de similitude peut-on parler de “duplicate content” ?
Un chiffre qui circule parle d’un seuil de 70% de similitude. Au dessus, on parle bien de  “duplicate content”. Vous pouvez consulter le site www.duplicatecontent.net, vous donnez 2 URL différentes et le site donne le taux de similarité. De manière générale, il s’agit de bon sens. Si vous citez quelqu’un : pas de problème. Mais il ne faut pas reprendre tout le contenu d’un article.

Et la traduction ?
Pour l’instant, c’est-à-dire au moins pour les 6 prochains mois, ce n’est pas considéré comme du “duplicate content“ par Google ! Après, il faudra tester :-)

Merci d'avoir répondu à ces questions :-)


Commentaires

    Duplicate or not duplicate

    Cet article tombe à pic ! Nous sommes en train de revoir nos contenus web et il y pas mal de duplicate content à l'intérieur même du site... Merci

    Posté par Julien, 14 mars 2011 à 16:09
  • Positeo

    Il y a aussi cet outil en ligne qui utilise l'API Google et qui détecte la duplication de contenu via un texte ou une URL : http://www.positeo.com/check-duplicate-content

    Posté par t0ni0, 15 mars 2011 à 09:57
  • Besoin de précisions

    Vous dites "Un chiffre qui circule parle d’un seuil de 70% de similitude".

    Je me demande comment vous pouvez annoncer un chiffre sans même donner la méthode pour le calculer ! C'est aussi ridicule que de donner un intervalle de valeurs idéales pour l'indice de densité

    Si vous avez des références à la méthode utilisée par Google et un outil qui l'utilise et fournit des valeurs chiffrées, alors je changerai d'avis...

    Posté par Emilie, 16 mars 2011 à 09:18
  • "une page acCessible" ... merci

    Posté par Krusty, 08 juillet 2011 à 10:12

Poster un commentaire