En este post vamos a tratar las distintas maneras que existen para evitar publicación de contenido duplicado en buscadores como Google.
¿Qué es contenido duplicado?
- Duplicación de Meta Tags en Páginas: Varias páginas comparten el mismo título. Suele pasar con tiendas online en las que tienen varias páginas de resultados, es decir, si buscamos en el buscador interno de una web la palabra “manta”, por ejemplo, pueden existir 4 páginas distintas de resultados, aunque todas se refieran al mismo producto.
- Páginas con el mismo contenido dentro del mismo dominio: Imaginemos que tenemos 2 páginas distintas que hablan sobre el mismo producto y que comparten el mismo contenido, aunque tengan urls diferentes. Es decir: La página A tiene el mismo contenido (texto) que la Página B, aunque tengan direcciones diferentes (urls).
No confundir con…
Contenido Copiado: El contenido copiado no tiene nada que ver con el contenido duplicado. Obviamente cuando hablamos de contenido copiado, es porque el Dominio A ha copiado contenido del Dominio B o viceversa, es decir, cuando alguien corta y pega un artículo entero de un dominio y lo publica en el suyo. Gracias a Dios Google se da cuenta de esto, y en la gran mayoría de los casos muestra la página que publicó el contenido primero en mejor lugar que la que ha copiado, pero no siempre es así, así que es conveniente informarse sobre cómo descubrir contenido copiado de otros sitios.
¿Cómo evitar Contenido Duplicado en Google?
- Redireccionamiento Permanente 301: Se redirecciona la página A a la página B, para que sólo se vea el contenido de una. Hay redireccionamientos temporales, pero Google recomiendo éste. Para hacerlo deberás modificar el archivo .htaccess o crearlo desde cero para incluir este ejemplo:
redirect 301 /directorio/url/antigua.htm http://www.dominio.com/nueva/url/nueva.htm
- Insertar Etiqueta canonical: Permite indicar a Google cuáles son laspáginas con el contenido original así evitando penalizaciones por contenido duplicado. Para ello tendremos que insertar entre las cabeceras HEAD de nuestra página duplicada este contenido: <link rel=”canonical” href=”http://www.example.com/product.php?item=canonical-example” />, en donde la parte de href=”” representa la url original, la verdadera, la que debe priorizar Google.
- Robots.txt: Esto es un archivo de texto que NO tiene por qué estar creado en tu página, pero lo creamos para decirle a los robots de Google qué contenido NO deben indexar, así evitamos el contenido duplicado prohibiendo que entre a las páginas con contenido duplicado.
Si quieres saber más sobre Cómo evitar contenido duplicado mira las siguientes referencias:
¿Cómo evitar contenido duplicado en Google?
[…] recientesCómo descubrir contenido copiadoCómo evitar contenido duplicado en GoogleLos mejores plugins de SEO para el 2012Cómo estructurar una página webLa importancia del atributo […]
[…] recientesPosicionamiento Web en TenerifeCómo descubrir contenido copiadoCómo evitar contenido duplicado en GoogleLos mejores plugins de SEO para el 2012Cómo estructurar una página webAutoresChristian […]
[…] como la redirección permanente 301, canonicalización, etc. Puede obtener más información aquí.¿Qué es el Robots.txt?Al grano y evitando definiciones técnicas complejas, el archivo de texto […]
[…] están mostrando el producto de talla 5 y color 12. Esto es Contenido Duplicado. Con este sistema de creación dinámica de urls, nos encontramos con que un cliente puede tener 20 […]
[…] Cómo evitar contenido duplicado en Google […]