Wanatop

¡Hola! Soy Wanatop y hoy hablaremos sobre...

Cómo evitar contenido duplicado en mi web

17 de marzo de 2015SEO

Una de las premisas que se marcan desde Google es que el contenido sea original, esto significa que no aparezca en varias URLs diferentes, ya sean nuestras páginas o de un tercero.

Es un problema bastante habitual que suele ocurrir por una mala estructura del sitio web, por no tener las nociones básicas en SEO como para saber que no se puede copiar literalmente lo que hacen otras páginas, o por tener un contenido tan bueno que otros lo replican.

A continuación te explico varias formas de detectarlo y sus soluciones.

contenido duplicado

El contenido duplicado es aquel que es idéntico en parte o totalidad y que se muestra desde direcciones diferentes generando al sitio web problemas para el posicionamiento en buscadores (SEO) ya que Google no pueden realizar su trabajo correctamente debido a no saber qué dirección deben coger para enseñar el contenido, por haber varias y no conocer cuál es el original.

Otra razón de tener una sola dirección es, por si otras web te enlazan, que todos los usuarios vayan a una misma dirección y no tengan confusiones pensando estar en otra página distinta, además de evitar problemas que repartan la fuerza de enlaces de otra web

¿Cómo reconozco el contenido duplicado?

En la página principal

Tu página principal tiene varias URL’s, primero realizamos si nos ocurre lo siguiente:

Vamos a nuestra página inicial (Home) y comprobamos si podemos llegar de diferentes formas descritas a continuación:

Escribiendo el dominio con www
→ www.midominio.com
Escribiendo sin las www
→ midominio.com
Escribimos el dominio y el archivo que tiene el contenido
→ www.midominio.com/index.html (u otra extensión si es un CMS)
Escribiendo con el archivo pero sin las www
→ midominio.com/index.html (u otra extensión si es un CMS)

Si la url cambia según la escribamos y nos enseña el mismo contenido, tenemos un problema de contenido duplicado. Si cambiamos de dirección y siempre vuelve a la misma, todo esta correcto, solo tenemos una dirección que apunta a un único contenido, la Home.

Soluciones

Canonicalización de la url mediante redireccionamientos en servidor y mediante Google Webmaster Tool especificar el principal, usando un archivo de servidor cuya función es (entre otras cosas) reescribir y redireccionar las direcciones url de los sitios web.

Arquitectura web

Según la arquitectura de tu sitio web mostrarás el contenido de diversas formas, lo más común es utilizar categorías y/o etiquetas directamente asociados con los contenidos, otros sitios web o gestores de contenido usan, por ejemplo, una categorización que le llaman archivos, otros usan autores…

Una sola categorización no provoca duplicidad de contenido, porque lo reproduce parcialmente.
Y ahora te preguntarás, ¿y las etiquetas no hacen lo mismo? No, las etiquetas por si solas no dan contenido duplicado, lo que ocurre es que muchas veces dos etiquetas tienen los mismos artículos, y entonces generan duplicidad.

Los problemas de contenido duplicado que pueden dar estas arquitecturas trata de poseer los mismos contenidos en una o más categorizaciones.

Si un mismo artículo se puede asociar a una o más categorías o a una o más etiquetas, es muy probable que pueda generar en un futuro (y presente) contenido duplicado, al “filtrar” en diferentes direcciones los mismos artículos o contenidos.

Ejemplo práctico:

Escribimos 2 artículos para la categoría “Mejorar una web”. 
El primero, “Estructura web”, escrito por nuestro desarrollador web, “El informático”. Y le da las etiquetas «Web», “HTML5” y “Velocidad de carga”

Un segundo, “Mejorar las imágenes para la web”, lo escribe el diseñador gráfico de la empresa “Como el mío ninguno”. Y lo etiqueta en “Velocidad de carga” e “Imágenes para web”

Categoría “Mejorar una web” enseña “Estructura web” y “Mejoras las imágenes para la web”
La etiqueta de autores El desarrollador, “Estructura web”
La etiqueta de autores El diseñador, “Mejoras las imágenes para la web”
Las etiquetas “Web” y “Velocidad de carga” contienen ambos artículos
La etiqueta “HTML5” tendría “Estructura web”
La etiqueta “Imágenes para web” tendría a “Mejoras las imágenes para la web”

Viendo este ejemplo se ve que el contenido duplicado generado por los diferentes “filtros” que le damos a los artículos son muy útiles para los usuarios una vez navegan, pero poco para los buscadores.

Soluciones

Según el uso y la arquitectura la solución trata de decir a los buscadores que indexen una de las categorizaciones usadas (normalmente la que solo pueda ser usada una sola vez por artículo), y el resto no sean indexadas.

Tecnología

Dependiendo del gestor de contenidos: Prestashop, Wordpress, CMS a medida… La mayoría contienen filtros o páginas para enseñar el mismo contenido en diferente orden o diferentes características (ordenado por fecha, cambios de tallas, precios, sesiones de usuarios…), si tu gestor usa filtros o realizan paginación, casi seguro genera contenido duplicado.

La forma de saber si podemos tener problemas de contenido duplicado, es entrar en categorías o artículos y usar los filtros, cambiar las características del contenido, entrar como usuario al contenido pública o ver si tenemos paginación para enseñar el contenido. Si se genera una dirección url con datos que no se pueden leer fácilmente, normalmente usan un “?” e “id=…”, es un indicio de que nuestro CMS esta duplicando contenido.

El problema se da porque el contenido en sí es el mismo, aunque se muestra en diferente orden, o con ligeros cambios de características muy concretas, que son necesarias de controlar para el buen funcionamiento del gestor pero generan diferentes direcciones para un mismo contenido.

Ejemplos

Tenemos 25 artículos en un blog que habla de coches antiguos, pero mostramos solo 10 por cada página al entrar en el blog, esto genera 3 páginas con 10, 10 y 5 artículos mezclados, hablando de los mismos temas, cada una de esas páginas son 3 direcciones diferentes hacia un contenido muy similar.

midominio.com/coches-antiguos/
midominio.com/coches-antiguos/page/2
midominio.com/coches-antiguos/page/3

Tenemos una tienda deportiva con zapatillas de deporte, en un modelo de zapatilla tenemos 3 tallas diferentes y dos colores. Al seleccionar características genera una URL con ellas.

midominio.com/zapatilla-deportiva
midominio.com/zapatilla-deportiva?talla=1&color=rosa
midominio.com/zapatilla-deportiva?talla=2&color=rosa
midominio.com/zapatilla-deportiva?talla=3&color=rosa
midominio.com/zapatilla-deportiva?talla=1&color=morado
midominio.com/zapatilla-deportiva?talla=2&color=morado
midominio.com/zapatilla-deportiva?talla=3&color=morado

Soluciones

Depende si es por filtros o es por paginación hay dos soluciones.

Para todo tipo de parámetros se realiza una canolización de la dirección principal, colocando en su código una etiqueta (meta canonical) que dice cuál debe coger para mostrar el contenido. En caso de parámetros por paginación, es mejor indicar, mediante otra etiqueta diferente, la paginación que se realiza (rel=”next” y rel=”prev”) y la cual ayuda a organizar todo el contenido en vez de solo la principal (meta canonical), mostrando la página más óptima con relación a la búsqueda.

Otra solución es denegar el acceso a los robots, la óptima principalmente para sesiones de usuario.

Para más información sobre el contenido duplicado, te aconsejo que leas lo que dice Google sobre este tema.

Como te he contado, el contenido duplicado es un factor importante para lograr que una página tenga un buen posicionamiento en Google. Si identificas que tu web puede tener alguno de estos problemas, nuestro servicio de SEO te ayudará a resolverlos.

¡Compártelo en tus redes sociales!

Agencia WanatopAgencia Wanatop, Agencia de marketing digital.Conoce más de Agencia Wanatop