Como evitar contenido duplicado en googleEn este post vamos a tratar las distintas maneras que existen para evitar publicación de contenido duplicado en buscadores como Google.

¿Qué es contenido duplicado?

 

  1. Duplicación de Meta Tags en Páginas: Varias páginas comparten el mismo título. Suele pasar con tiendas online en las que tienen varias páginas de resultados, es decir, si buscamos en el buscador interno de una web la palabra “manta”, por ejemplo, pueden existir 4 páginas distintas de resultados, aunque todas se refieran al mismo producto.
  2. Páginas con el mismo contenido dentro del mismo dominio: Imaginemos que tenemos 2 páginas distintas que hablan sobre el mismo producto y que comparten el mismo contenido, aunque tengan urls diferentes. Es decir: La página A tiene el mismo contenido (texto) que la Página B, aunque tengan direcciones diferentes (urls).

No confundir con…

 

Contenido Copiado: El contenido copiado no tiene nada que ver con el contenido duplicado. Obviamente cuando hablamos de contenido copiado, es porque el Dominio A ha copiado contenido del Dominio B o viceversa, es decir, cuando alguien corta y pega un artículo entero de un dominio y lo publica en el suyo. Gracias a Dios Google se da cuenta de esto, y en la gran mayoría de los casos muestra la página que publicó el contenido primero en mejor lugar que la que ha copiado, pero no siempre es así, así que es conveniente informarse sobre cómo descubrir contenido copiado de otros sitios.

¿Cómo evitar Contenido Duplicado en Google?

 

  1. Redireccionamiento Permanente 301: Se redirecciona la página A a la página B, para que sólo se vea el contenido de una. Hay redireccionamientos temporales, pero Google recomiendo éste.  Para hacerlo deberás modificar el archivo .htaccess o crearlo desde cero para incluir este ejemplo: redirect 301 /directorio/url/antigua.htm http://www.dominio.com/nueva/url/nueva.htm
  2. Insertar Etiqueta canonical: Permite indicar a Google cuáles son laspáginas con el contenido original así evitando penalizaciones por contenido duplicado. Para ello tendremos que insertar entre las cabeceras HEAD de nuestra página duplicada este contenido: <link rel=”canonical” href=”http://www.example.com/product.php?item=canonical-example” />, en donde la parte de href=”” representa la url original, la verdadera, la que debe priorizar Google.
  3. Robots.txt: Esto es un archivo de texto que NO tiene por qué estar creado en tu página, pero lo creamos para decirle a los robots de Google qué contenido NO deben indexar, así evitamos el contenido duplicado prohibiendo que entre a las páginas con contenido duplicado.

Si quieres saber más sobre Cómo evitar contenido duplicado mira las siguientes referencias:

 

¿Cómo evitar contenido duplicado en Google?