Cómo detectar contenido duplicado en Internet

José María Lissen    14 septiembre, 2015

Elaborar un contenido atractivo, útil y 100% original no es tarea fácil. Mantener el nivel de calidad en todas las páginas de nuestro site es complicado, ciertamente, pero no por ello debemos tomar atajos para hacer que nuestra web sea más atractiva. Duplicar contenido, en este sentido, sería una práctica que afectaría negativamente a nuestro SEO.

Al hablar de contenido duplicado, nos referimos a la presencia en Google de bloques de contenido que coinciden total o parcialmente con otros en varios dominios. Se trata de un problema muy habitual, y no en todos los casos supone un engaño. Es más, podríamos estar realizando esta práctica sin saberlo.

La penalización en el posicionamiento viene cuando el duplicado es deliberado, acción que pretende manipular las clasificaciones de los motores de búsqueda u obtener un mayor volumen de tráfico. Sin embargo, con esto, lo único que conseguiremos es perjudicar el SEO de la página.

Cuidado: El contenido duplicado puede aparecer tanto en nuestro sitio web como fuera de él. Por mucho que cueste creerlo, el primer caso es el más común. Las razones pueden ser varias, desde el uso de dominios no canónicos (no indicamos a Google cuál es la URL más adecuada) hasta problemas con la versión móvil de la página.

Encontrar contenido duplicado fuera de nuestro sitio tampoco es buena señal. Lo primero que podemos pensar es que estamos siendo víctimas de un plagio o de scraping (nuestras páginas han sido copiadas y publicadas en otro dominio por un software ajeno). También es posible que nuestro problema esté causado por un error de localización (mismo contenido para diferentes dominios geográficos) o de sindicación (nuestro contenido se comparte en otra web, por ejemplo, por RSS).

 

He encontrado contenido duplicado, ¿qué debo hacer?

Detectar contenido duplicado en nuestro site es una tarea relativamente fácil. Solo debemos estar atentos a textos similares en títulos, descripciones, encabezados, etc. Google Webmaster Tools puede ser una ayuda en este sentido, ya que localiza las páginas duplicadas y permite corregirlas.

Los informes de comportamiento de Google Analytics también nos dan una pista de qué páginas están recibiendo más tráfico. Si alguno de esos destinos no recibe un número normal de visitas, algo falla; puede haber otra página idéntica que esté atrayendo todo el tráfico.

Otra forma directa de comprobar si Google localiza nuestra URL canónica es realizar una búsqueda con el operador ‘site’, para obtener resultados de varios sitios o dominios.

Si lo que queremos es comprobar si nuestro contenido está siendo duplicado fuera de nuestro sitio, tendremos que valernos de herramientas externas. Copyscape es una de las más utilizadas; nos permite encontrar sitios webs que pueden estar plagiando nuestros contenidos. Al margen de esto, una simple búsqueda en Google también puede darnos resultados ‘extraños’. Si estamos seguros de que nuestro contenido está siendo copiado en otro dominio, podemos pedir al administrador del sitio en cuestión que lo borre. Si esto no funciona, se puede recurrir a Google para que elimine la página fraudulenta de sus resultados.

Los problemas de contenido duplicado son muy habituales y, como hemos dicho, en la mayoría de casos el problema está en nuestra propia web. Para solucionarlo podemos seguir algunos consejos: utilizar redireccionamientos 301, valernos de dominios de nivel superior o, simplemente, configurando nosotros mismos la indexación de la web. Las opciones son muy amplias y en ocasiones confusas, pero es la única manera de lograr que nuestro site cuente con páginas de calidad.

Una web con contenido duplicado pierde visibilidad en Google y ante los usuarios. Páginas incorrectas, una indexación pobre o enlaces que no llevan a ninguna información valiosa son razones de sobra para eliminar una página de los resultados de búsqueda. Problemas que no debemos pasar por alto si buscamos que nuestro site ofrezca una imagen de calidad al visitante.

Foto: txindoki

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *