Se trata de un caso real sobre robo de contenido web, planteado en el foro para webmasters de Google por el responsable del sitio perjudicado.
El usuario había notado que los contenidos generados en su sitio tardaban hasta 48 hs. en indexarse en el buscador, cuando los de su competencia directa con la misma temática se indexaban en horas.
La sorpresa mayor la tuvo cuando encontró que su competencia de forma alevosa, había comenzado a copiar textualmente sus últimas notas y esta eran consideradas originales por Google por indexarse primero.

Como resultado, estos post en el sitio perjudicado eran ignorados y no incluidos en el índice del buscador considerarlos duplicados, cuando realmente eran originales.

Por que ocurrió esto?… obviamente el problema era la demora en la indexación, tratando de averiguar la causa encontramos que el sitio copiado estaba faltando a las directrices de Google, puntualmente en exceso de meta datos.

Entonces por que seguía publicando si ser penalizado? … La conclusión mas lógica a la que llegamos, es que googlebot suele pasar por alto algunas faltas cuando el contenido es muy relevante, solo deja la página en cuarentena (sandbox) por algunos días, tiempo suficiente para que la competencia publique la nota como propia.

Este problema se ha agravado mas aun desde Febrero de 2011, cuando el algoritmo de Google tuvo un cambio drástico penalizando contenidos duplicados cuando antes no lo hacia.

Como este, son muchos los casos que generalmente se le hecha la culpa al buscador cuando en realidad son los webmasters que no se ajustan a sus reglas. Particularmente insisto en respeto a las directrices y publicar contenido relevante, ambos van de la mano como quedó demostrado aquí.

Compartir:
  • Facebook
  • Twitter
  • LinkedIn
  • del.icio.us
  • Digg
  • Google Bookmarks
  • Blogplay
  • BarraPunto
  • Faves
  • Meneame
  • Ping.fm
  • Reddit
  • StumbleUpon
  • Technorati