Contenido duplicado en tu web: ¿qué es y cómo detectarlo?

Sin comentarios

¿Qué es el contenido duplicado y cómo detectarlo en mi web?

¿Cómo afecta el contenido duplicado a mi web y qué puedo hacer al respecto?

Por haber, hay decenas e incluso cientos de malas prácticas que pueden lastrar e incluso frenar de manera radical el posicionamiento de nuestro blog. Sin embargo, del que vengo a hablarte hoy es acerca del contenido duplicado.

Aunque no es la práctica negativa de blogging más nociva, sabemos que Google depura constantemente sus SERP con la finalidad de mostrar un contenido de calidad y relevante a sus usuarios.

Y, aunque hace varios años no era tan efectivo, su algoritmo cada día que pasa es más potente, por lo que si hoy que estás leyendo este artículo no te pones las pilas y lo solucionas, puede ser que en pocas semanas o meses, cuando gracias a la calidad de tus contenidos debas estar en el TOP10, por culpa de este contenido duplicado, te sitúe en 2º, 3º o incluso 4º página.

Es decir, por culpa de ese contenido duplicado, no existirás para los usuarios y tus potenciales visitantes.

Si un contenido se muestra dos o más veces, la relevancia desaparece. En este post vas a aprender a detectar contenido duplicado y las herramientas para solucionarlo.

¿Qué es el contenido duplicado?

Es uno de los factores que más preocupación causan al hablar de SEO. El contenido duplicado es el nombre que se le da a una información que se considera muy similar al analizar dos o más páginas diferentes. Este contenido puede ser un texto o una imagen.

Aunque suele darse con cierta frecuencia en los blogs, donde suele presentarse con mayor asiduidad es en las fichas de producto de los eCommerce, donde suele suceder mucho debido a que, al personalizar un artículo, encuentras contenidos muy similares con alguna especificación diferente, por ejemplo las tallas o los colores.

De hecho, si te das una vuelta por incluso marcas súper reconocidas en su sector y que todos conocemos hoy en día, te vas a llevar la escandalosa sorpresa de ver cómo las descripciones de productos están “calcadas” a las del fabricante del mismo.

Esto es algo que, aunque con cierta lentitud y parsimonia, Google está poco a poco erradicando de la red.

Pero el contenido duplicado no se detecta solo en el contenido, sino también en las URLs, por lo que sería ideal que cada pieza de contenido dispusiese de una URL diferente asociada a ella.

¿Por qué es tan negativo para mi web el contenido duplicado?

Algunas de las consecuencias del contenido duplicado en tu sitio web son:

Bajada de visibilidad online

Si tienes diferentes páginas o URL’s para un mismo contenido digital, Google deberá seleccionar la que da mejor respuesta  a la query o necesidad del usuario.

Esto quiere decir que la que él seleccione puede que no sea la que tú deseas y, como consecuencia, se puede mostrar una copia con menor peso y que se posicionaría peor.

Esto perjudicaría al usuario, que no está obteniendo respuesta a su necesidad todo lo rápido que podría, y a ti como responsable de la web, dado que el % de rebote sería considerable, al volver éstos atrás, buscando otra mejor respuesta a su necesidad.

Desperdicio de backlinks

Las páginas duplicadas pueden hacer que tu estrategia de contenidos tenga algo menos de fuerza, debido a sus distintas URL, en vez de sumar fuerzas para potenciar el posicionamiento de una única página.

Deficiente indexación

La indexación de las páginas se puede ver afectada también, dado que el buscador rastrea todas ellas. La pérdida de tiempo en este rastreo hará que el buscador visite con menos frecuencia esta página.

El contenido duplicado no aporta valor al sitio y el buscador escoge la versión original en base a la fecha de indexación y a la autoridad del sitio. Esto hace que la versión que se ha duplicado no tenga autoridad o al menos, no toda la que podría tener.

¿Podemos afirmar que Google penaliza el contenido duplicado?

Para ser más exactos, lo que hace el buscador no es penalizarlo como tal, sino rechazarlo, es decir, echarlo al cajón desastre…

Lo filtra para que no aparezca en sus resultados. Los sitios que reescriben el contenido de otros de manera recurrente, al cabo de los meses o años, sí que son penalizados, ya que esa es una de las bases del algoritmo Panda.

¿Cómo puedo identificar el contenido duplicado dentro de mi web?

Para analizar el mal no deseable en una web o blog, lo más sensato es comenzar a fijarse en los títulos, encabezados, descripciones y secciones similares.

Los modos más efectivos para identificarlo son:

Google Webmaster Tools

Es uno de los mejores modos de analizar la actividad, indexación, CTR y, en general, todos los aspectos de analítica y “salud” de tu propia web.

Deberás acceder a la sección ‘Aspecto de búsqueda’ y ‘Mejoras en HTML’.

Utiliza Google Webmaster Tools para detectar contenido duplicado en tu web

A continuación, detente en las etiquetas de títulos y metadescripciones duplicadas. Encontrarás las duplicidades existentes y las páginas en cuestión, para que así las puedas corregir.

En este caso, te muestro cómo en mi propio blog me ha detectado cómo los metatitles de las distintas paginaciones están duplicadas, es decir, se presenta lo siguiente:

  • URL: https://ismaelruizg.com/blog → metatitle: “Blog sobre Marketing Digital, negocios Online, Técnicas de Blogging avanzadas y Social Media”.

Y este mismo metatitle se presenta en:

  • https://ismaelruizg.com/blog/page/2
  • https://ismaelruizg.com/blog/page/3
  • …y así sucesivamente hasta la paginación número 8

Haciendo ‘comando site’ en Google

Esta funcionalidad del buscador permite buscar en tu sitio frases clave o productos si es que estamos ante una tienda online.

En el resultado que presente esta SERP se puede comprobar si hay páginas con descripciones duplicadas y si algunas de ellas se han trasladado al índice secundario.

Screaming Frog

Si dispones de esta herramienta, también puedes rastrear un sitio web o blog en búsqueda de contenido duplicado, entre otras cientos de funcionalidades.

Para ello, has de utilizar el filtro ‘duplicate’ en las pestañas Page, URL, H1 y Meta Description.

¿Cómo afecta el contenido duplicado a mi #PosicionamientoWeb? Haga clic para Tweet

¿Qué podemos hacer cuando el contenido duplicado no se da dentro de nuestro propio sitio web?

En este caso, las herramientas más habituales son:

  • CopyScape
  • Plagiarism Checker
  • Duplichecker

Aquí, en cada una de ellas, simplemente copia y pega el trozo de texto que quieras comprobar si es único o es contenido duplicado.

Cada herramienta tiene una forma de actuar y presentar los datos, pero al menos en el caso de “Plagiarism Checker”, la que más uso, en el caso en que no detecte duplicidad, te mostrará un mensaje de “100% contenido único”, como éste:

Detecta contenido duplicado en otras webs con Plagiarism

¿Qué debo hacer si detecto contenido duplicado en mi web?

Ya ha quedado claro que a los buscadores no les gusta el contenido duplicado porque empobrece la experiencia de los usuarios. Por tanto, si lo detectas, debes hacer lo imposible para eliminarlo.

Las formas más habituales de tratar esta situación son:

Rel Canonical

La etiqueta rel=canonical se creó para tratar esta situación. Es una línea de código que se inserta en <head> e indica cuál es la versión buena o la más importante para esa keyword/intención de búsqueda.

También existen otros plugins (si es que usas WordPress) para implementar esta etiqueta, como “Yoast SEO”:

Yoast SEO para detectar contenido duplicado en tu web

Aquí puedes indicar cuál es la URL canónica con respecto a la actual donde estás implementando este atributo.

Por ejemplo, si tienes un blog de deportes y has escrito un artículo acerca de en qué canales ver el fútbol en directo, concretamente el partido del Real Madrid y la semana siguiente, al jugar este mismo equipo de nuevo, si quieres volver a informar a tus seguidores sobre dónde verlo, si generas un nuevo artículo, en este último puedes aplicar un canonical hacia el primero de ambos.

De esta manera, estarías indicando que todas las URL’s que se vayan generando con la misma intención de búsqueda o query tienen una como la “principal” a la primera de todas ellas, y no se considera como contenido duplicado.

Redirección 301

Es la mejor opción cuando no se puede utilizar la etiqueta anterior, por ejemplo al mover el contenido de una página a otra o cuando se establece un dominio canónico.

Robots .txt

Es otra de las acciones para evitar el contenido duplicado en las páginas de tu web.

Simplemente incluyes en el archivo robots.txt la URL que es duplicada y te evitarás cualquier futuro problema con Google.

Conclusión

Como has podido comprobar en este artículo, tener contenido duplicado en tu web no es nada positivo si quieres que el buscador considere favorablemente tus artículos, páginas de producto o, en general, todas las URL que conforman tu dominio web.

Además, que otros tengan contenido duplicado con respecto al original que has publicado en tu blog tampoco te beneficiará en nada.

Por tanto, pon en práctica cuanto antes algunos de estos métodos y relanza tu posicionamiento en el buscador. ¡Mucha suerte! 😉

Newsletter

Suscribir

 

 
 

BlogsterApp te informa que los datos de carácter personal que nos proporciones rellenando el presente formulario serán tratados por BlogsterApp Ambassador, S.L. (BlogsterApp) como responsable de esta web. La finalidad de la recogida y tratamiento de los datos personales que te solicitamos es para gestionar el alta a esta suscripción y remitir boletines periódicos con información y oferta prospectiva de productos o servicios propios. Legitimación: Consentimiento del interesado. Como usuario e interesado te informo que los datos que nos facilitas estarán ubicados en los servidores de AgileCRM (proveedor de email marketing de BlogsterApp) fuera de la UE en  EEUU y no esta en privacy shield: no está acogido al convenio de seguridad entre UE y EEUU (Privacy Shield), por lo que no garantiza unos niveles de seguridad adecuados en la transferencia internacional de tus datos. Aunque actualmente están implementando los cambios para cumplir con el Reglamento Europeo de protección de datos (RGPD GDPR). Al cumplimentar este formulario consientes expresamente dicha transferencia internacional de datos. El hecho de que no introduzcas los datos de carácter personal que aparecen en el formulario como obligatorios podrá tener como consecuencia que no podamos atender tu solicitud. Podrás ejercer tus derechos de acceso, rectificación, limitación y suprimir los datos en administracion@blogsterapp.com así como el derecho a presentar una reclamación ante una autoridad de control. Puedes consultar la información adicional y detallada sobre Protección de Datos en nuestra página web: blogsterapp.com, así como consultar nuestra política de privacidad.

Conoce a los autores de nuestro blog

Sin comentarios
BlogsterApp te informa que los datos de carácter personal que nos proporciones rellenando el presente formulario serán tratados por BlogsterApp, S.L. (BlogsterApp) como responsable de esta web. La finalidad de la recogida y tratamiento de los datos personales que te solicitamos es para gestionar los comentarios que realizas en este blog. Legitimación: Consentimiento del interesado. Como usuario e interesado te informo que los datos que nos facilitas estarán ubicados en los servidores de Siteground (proveedor de hosting de BlogsterApp ) dentro de la UE. Ver política de privacidad de Siteground. El hecho de que no introduzcas los datos de carácter personal que aparecen en el formulario como obligatorios podrá tener como consecuencia que no podamos atender tu solicitud. Podrás ejercer tus derechos de acceso, rectificación, limitación y suprimir los datos en administracion@blogsterapp.com así como el derecho a presentar una reclamación ante una autoridad de control. Puedes consultar la información adicional y detallada sobre Protección de Datos en nuestra página web: blogsterapp.com, así como consultar nuestra política de privacidad