Wanatop

¡Hola! Soy Santiago y hoy hablaremos sobre...

¿Qué es el thin content y por qué debes evitarlo?

28 de junio de 2024SEO

“El contenido es el Rey”. Esta es una de las frases más repetidas y que más grabadas a fuego tenemos los especialistas en marketing digital en nuestra cabeza.

Y no es para menos, ya que uno de los problemas más comunes y un tema crucial para cualquier estrategia de posicionamiento orgánico (SEO) es el thin content.

A lo largo de este artículo, exploraremos y detallaremos en profundidad qué es el thin content, por qué debes evitarlo, y cómo puede afectar negativamente el posicionamiento de tu sitio web.

Acompáñame y descubre cómo identificar y solucionar este problema para mejorar la calidad y el rendimiento de tu sitio web en los motores de búsqueda.

¿Qué es el thin content?

El thin content, o como sería su traducción del inglés “contenido delgado”, se refiere a páginas dentro de un sitio web que ofrecen poco valor a los usuarios. Este tipo de contenido no aporta información relevante ni útil y, en algunas ocasiones, se crea con el objetivo de manipular los rankings de los motores de búsqueda.

De esta manera, podríamos entender el thin content como un contenido de poca calidad o pobre, que no añade valor alguno al usuario.

Google, en su constante esfuerzo por mejorar la calidad de los resultados de búsqueda, penaliza este tipo de contenido. Y esto es algo normal y esperable, pues como ya sabemos, el objetivo principal de Google es satisfacer la intención de búsqueda de sus usuarios, algo que de ninguna manera logra este tipo de contenido.

Entender y evitar el thin content es esencial para mantener una buena posición en las SERP, así como para ofrecer una experiencia de calidad a los usuarios del sitio web.

En Wanatop somos expertos en SEO y podemos ayudarte a solucionar tus problemas de thin content

¿Es el contenido corto en palabras considerado como thin content?

No necesariamente. El contenido corto no siempre es sinónimo de thin content. La clave está en el valor que aporta. Un artículo breve, pero lleno de información valiosa, directa y útil, no tiene por qué ser considerado thin content por parte de Google. Por el contrario, una página larga con contenido superficial, irrelevante o repetitivo sí lo será con casi total seguridad.

Y es que, uno de los malentendidos más comunes en el mundo del SEO es pensar que el contenido breve es automáticamente contenido de baja calidad. Esta confusión se debe a lo que reza una de las recomendaciones de las directrices de Google, mencionando que los textos deben tener un mínimo de 300 palabras para considerarse de calidad.

Pero como suele pasar muchas veces con las recomendaciones de Google, no siempre debemos tomarlas al pie de la letra. Y es que no dejan de ser eso, una recomendación.

Es innegable que podemos crear contenido significativo y valioso con menos de esas 300 palabras.

Por ejemplo, si estás trabajando la estrategia SEO de un e-commerce donde cada producto está descrito con información original, útil y completa que satisface las necesidades informativas del usuario, este contenido, aunque breve, no será nunca considerado de baja calidad.

En cambio, si la descripción de tus productos o servicios consta de una sola línea de texto, claramente el contenido resulta insuficiente y poco relevante, ya que difícilmente 20 palabras pueden proporcionar información de valor para el visitante.

Siguiendo el ejemplo anterior, algo similar ocurre si optamos por copiar y pegar la descripción de producto de otra tienda, o si ponemos la información proporcionada por el fabricante. Este contenido, aunque sea más extenso, siempre será de menor valor que ese párrafo original descriptivo del producto que hemos mencionado anteriormente.

En resumen, Google se enfoca en la calidad, originalidad y relevancia del contenido más que en su extensión. Por lo tanto, es posible tener contenido corto que sea muy relevante y valorado tanto por los usuarios como por los motores de búsqueda.

7 Tipos de thin content penalizados por Google

Google identifica y penaliza varios tipos de thin content. A continuación, veremos los siete tipos más comunes que debes evitar para asegurarte de que tu sitio web no sea penalizado y mantenga una buena posición en los resultados de búsqueda.

Contenido duplicado, plagiado o robado

El contenido duplicado se refiere a párrafos de texto idénticos o muy similares que aparecen en diferentes páginas de un mismo sitio web o en sitios distintos. Google valora la originalidad y premia que el contenido sea único.

Por ello, las páginas con contenido plagiado o robado suelen ser severamente penalizadas. Este tipo de contenido no solo afecta negativamente a tu posicionamiento, sino que también puede dañar tu reputación y credibilidad dentro de tu sector o nicho.

Además, el plagio puede tener consecuencias legales si los autores originales descubren que su trabajo ha sido copiado sin permiso, algo muy fácil de comprobar con las herramientas de las que disponemos hoy en día. Por lo tanto, siempre es mejor invertir tiempo en crear contenido original y de calidad, que sea único y relevante para tus usuarios.

Contenido automático o auto-generado

El contenido generado automáticamente mediante scripts o herramientas de inteligencia artificial, sin supervisión humana o con uso de prompts muy pobres, suele carecer de valor para el usuario.

Aunque la tecnología ha avanzado, estos textos a menudo resultan incoherentes y poco informativos, lo que hace que Google los identifique como thin content. Este tipo de contenido no solo es perjudicial para el SEO, sino que también puede afectar negativamente a la experiencia del usuario en tu sitio web.

Si bien gracias a las herramientas de IA lejos quedan los días de generación de contenido mediante herramientas o técnicas como spinnear, modificar textos originales o traducirlos varias veces, tan típicos de las estrategias de Black Hat SEO, no debemos pensar que la IA va a superar en calidad al contenido que puede redactar un o una copywriter profesional.

Por estos motivos, es importante revisar y editar cualquier contenido generado automáticamente para asegurarse de que cumpla con los estándares de calidad y relevancia antes de publicarlo.

contenido generado con ia google

Contenido poco útil o poco profundo

El contenido que apenas roza la superficie de un tema y no proporciona información útil o detallada se considera thin content. Google premia los contenidos que realmente educan, informan o entretienen a los usuarios.

Los artículos superficiales que no profundizan en el tema y no responden adecuadamente a las consultas de los usuarios suelen ser penalizados. Por este motivo es muy importante asegurarse de que cada frase ofrezca un valor real, profundizando en el tema y proporcionando insights, datos o ejemplos prácticos que enriquezcan la experiencia del usuario.

Esta afirmación va muy al hilo de las últimas recomendaciones y comunicaciones por parte de Google sobre EEAT, donde nos incentiva a que nuestro contenido demuestre que contamos con experiencia, autoridad, confianza y conocimiento en nuestro nicho o sector.

Contenido lleno de anuncios o spam

Las páginas que están saturadas de anuncios o elementos de spam perjudican la experiencia del usuario y son rápidamente detectadas por Google. Este tipo de contenido no solo interrumpe la navegación del usuario, sino que también disminuye la credibilidad del sitio web.

Google penaliza los sitios que priorizan los anuncios sobre el contenido de calidad. Para evitar esto, es importante mantener un equilibrio entre la monetización del sitio y mostrar contenido, asegurándose de que los anuncios no interfieran con la experiencia del usuario.

Algo lógico, ya que los anuncios intrusivos van a aumentar las señales negativas de usuarios que Google puede ver de tu sitio web, ya sea con un aumento de la tasa de rebote, abandono o incluso bloqueo de la información relevante. Si la publicidad evita que el usuario satisfaga su intención de búsqueda, tendremos un grave problema.

Contenido de afiliación de muy baja calidad

El contenido que se centra exclusivamente en la promoción de enlaces de afiliados sin ofrecer información valiosa o relevante se considera thin content. Google busca contenido que ofrezca un valor real a los usuarios, y simplemente llenar una página con enlaces de afiliados sin contexto o utilidad no cumple con este criterio.

Es fundamental que el contenido de afiliación sea informativo y útil, proporcionando revisiones detalladas, comparaciones de productos o guías de compra que ayuden al usuario a tomar la mejor decisión posible.

Páginas sin contenido o con muy poco contenido

Las páginas que tienen muy poco o ningún contenido son rápidamente etiquetadas como thin content por Google. Estas páginas no aportan valor a los usuarios y pueden afectar negativamente la clasificación de todo el sitio web.

Es importante asegurarse de que cada página tenga suficiente contenido relevante y útil para justificar su existencia. Esto incluye no solo texto, sino también imágenes, videos y otros medios que enriquezcan la experiencia del usuario.

Eso sí, como ya hemos comentado con anterioridad, no debemos caer en la trampa de: “si tiene menos de 300 palabras, es thin content”. Debemos ir un paso más allá y auditar de manera precisa la utilidad del contenido, siempre teniendo en cuenta la tipología de página donde se presenta y si satisface la intención de búsqueda.

Uso de páginas puerta

Las páginas puerta, también conocidas en inglés como doorway pages, son URLs creadas con el único propósito de manipular los motores de búsqueda y/o redirigir a los usuarios a otro sitio. Estas páginas suelen estar sobre optimizadas, llenas de palabras clave y ofrecen poco o ningún valor real al usuario.

Grosso modo, son páginas creadas con 2 objetivos, o bien para posicionar por diferentes variaciones de palabras clave (long tail generalmente) con ningún contenido real de valor, o bien redirigir de forma fraudulenta o sin consentimiento del usuario a otras páginas diferentes.

Google penaliza severamente este tipo de prácticas, ya que buscan engañar al algoritmo en lugar de proporcionar una buena experiencia de usuario. Para mantener una estrategia SEO efectiva y sostenible en el largo plazo, es crucial evitar el uso de páginas puerta y centrarse en crear contenido de calidad.

De Google panda a HCU (Helpful Content Update): Algoritmos contra el Thin content

La máxima principal de Google es satisfacer la intención de búsqueda de sus usuarios, y para lograr este cometido, lleva varios años luchando contra el contenido de poca calidad. Vamos a ver a continuación las principales actualizaciones de algoritmo que han sido realizadas con ese objetivo en mente.

La aparición de Google Panda

Google Panda es una actualización del algoritmo de Google lanzada en 2011 con el objetivo de reducir la prevalencia y presencia de sitios web de baja calidad en los resultados de búsqueda, tratando de recompensar a aquellos con contenido original y de alta calidad.

Panda evalúa la calidad del contenido en todo el sitio y penaliza aquellos que tienen un gran volumen de thin content, realizando los siguientes procesos:

  • Detección de contenido de baja calidad: Google Panda identifica y penaliza los sitios que tienen una alta proporción de thin content. Esto incluye contenido duplicado, automático y poco útil, como hemos visto en apartados anteriores del artículo.
  • Evaluación del valor del contenido: El algoritmo busca contenido que proporcione un valor real a los usuarios. Si un sitio web está lleno de contenido que no cumple con este criterio, Panda lo penalizará de forma automática.
  • Impacto en el ranking y penalizaciones: Las penalizaciones de Google Panda pueden resultar en una caída significativa en los rankings de los motores de búsqueda. Y es que, al final, los sitios web plagados de páginas de poco valor se verán afectados por una gran disminución en el tráfico orgánico, fruto de la caída en las posiciones de las SERP.
  • Disminución del rastreo de tu sitio web: Si el algoritmo de Panda detecta que tu sitio web está lleno de contenido de baja calidad para los usuarios, hará que Google bot reduzca su frecuencia de rastreo, pudiendo llegar a reducir su crawl budget en el proceso.

Este algoritmo opera a nivel de sitio completo, lo que significa que si una proporción significativa del contenido de un sitio es considerado de baja calidad, todo el sitio puede verse afectado negativamente, dando lugar a la penalización algorítmica conocida como “pandazo”.

Evolución hacia el HCU y su importancia en las últimas actualizaciones del algoritmo de Google

En agosto de 2022, Google lanzó una nueva actualización de algoritmo denominada Helpful Content Update (HCU). Este algoritmo, al igual que Panda, tiene como objetivo mejorar la calidad de los resultados de búsqueda, garantizando que los usuarios encuentren contenido original y útil, escrito por personas y para personas, tal y como reza Google en su documentación .

HCU se centra en combatir los contenidos automatizados de baja calidad, o dicho de otra manera, el thin content, y ha sido implementado de manera regular en los últimos 2 años desde su lanzamiento por parte de Google.

updates del algoritmo de google

De forma similar a Panda, HCU opera a nivel de todo el sitio web, por lo que si detecta “irregularidades” como contenido de poco valor o poco útil para los usuarios en algunas URLs, todas las páginas del sitio web pueden verse afectadas.

De esta manera, mientras que Panda sentó las bases para la evaluación de la calidad del contenido, HCU lleva esta misión un paso más allá de manera más sofisticada, utilizando tecnologías avanzadas (como procesos de clasificación automatizados basados en machine learning) para asegurar que los usuarios encuentren información útil y relevante en sus búsquedas.

Y es que Google al final lo que busca es no malgastar dinero y recursos. El objetivo de estas actualizaciones de algoritmo es evitar que Google “tire el dinero” rastreando sitios web duplicados o de muy baja calidad. Por este motivo, es vital evitar que Google nos identifique como una web donde va a perder tiempo y dinero.

¿Cómo afecta el thin content al posicionamiento de mi sitio web?

El thin content puede tener varias repercusiones negativas en el SEO y en la experiencia del usuario de nuestro sitio web. A continuación, se detallan algunas de las principales formas en las que nos puede llegar a afectar negativamente:

Pérdida de posiciones en el ranking de Google

Tal y como hemos visto en el apartado anterior, Google penaliza el thin content disminuyendo la visibilidad orgánica de las páginas afectadas en los resultados de búsqueda.

Hay que tener mucho cuidado con las penalizaciones algorítmicas que pueden llegar a sufrir nuestros sitios web.

Esto puede resultar en una caída significativa en el tráfico orgánico, ya que los usuarios tienden a hacer clic en los primeros resultados que aparecen en las páginas de resultados de búsqueda. Mantener contenido de alta calidad es esencial para asegurar una buena posición en el ranking de Google.

Disminuye la interacción en tu sitio web

El contenido de baja calidad no retiene a los usuarios en tu sitio web. Cuando los visitantes no encuentran información útil o relevante, es menos probable que exploren otras páginas de tu sitio o que interactúen con tu contenido.

Esta situación puede resultar en una menor interacción por parte del usuario, lo que a su vez puede afectar negativamente a las métricas de tu sitio, como el tiempo de duración de la sesión o la cantidad de páginas vistas por visita.

Y esto es algo que queremos evitar a toda costa, ya que como hemos visto en los documentos del último leak de Google, el gigante tecnológico tiene en cuenta las interacciones de los usuarios a la hora de posicionar y valorar un sitio web.

Aumenta la tasa de rebote y de abandono

El thin content puede llevar a una alta tasa de rebote y abandono, puesto que los usuarios que no encuentran valor en tu contenido abandonarán el sitio rápidamente. Una alta tasa de rebote es una señal para Google de que tu sitio no está proporcionando una buena experiencia al usuario, lo que puede afectar negativamente a tu posicionamiento en los motores de búsqueda. Por este motivo, es vital crear contenido que enganche a los usuarios y los mantenga interesados.

Mala imagen y percepción de poco expertise en tu nicho de mercado

Tener contenido de baja calidad puede dañar la reputación de tu sitio web y hacer que los usuarios lo perciban como poco confiable o no experto en su nicho de mercado.

Esto no solo afecta a tu estrategia SEO, sino que también puede impactar negativamente en la confianza y lealtad de tus usuarios, así como en tu OMR o reputación online. Publicar contenido de alta calidad ayuda a mejora tu imagen de marca, estableciéndote como una autoridad en tu industria y ganar la confianza de tus visitantes.

¿Cómo puedo comprobar si mi sitio web tiene thin content?

Ya hemos visto lo que es el thin content, sus tipos y como puede afectar a la estrategia SEO de tu sitio web. Ahora que conoces todo esto, es normal que te surja la siguiente duda: ¿Cómo puedo identificar si mi sitio web tiene thin content?

Por ello, vamos a explicar a continuación algunas herramientas y métodos detallados que puedes utilizar para identificar contenido de baja calidad en tu sitio web:

Google Search Console

Google Search Console es una herramienta esencial para cualquier webmaster o especialista SEO que se precie, ya que te permite analizar el rastreo, indexación y presencia de tu sitio en los resultados de búsqueda de Google entre otras muchas cosas, como por ejemplo, ayudarnos a identificar URLs con thin content.

Aquí te explico cómo puedes usarla para este cometido:

  • Informe de Rendimiento: Revisa el informe de rendimiento para identificar páginas que no tengan clics o impresiones, o que hayan sufrido una gran caída de estos hace poco tiempo. Si bien no es un método infalible y puede ser síntoma de una mala optimización SEO, si una página no termina de “arrancar” o de repente se ha desplomado en tráfico, es posible que Google haya identificado su contenido como thin content.
  • Indexación de páginas: En la sección de indexación de páginas, analiza las URLs que Search Console muestra sin indexar. Las páginas no indexadas por los motivos como “Duplicada”, “Rastreada: actualmente sin indexar” o “Descubierta: actualmente sin indexar” es muy posible que hayan sido identificadas por parte de Google como thin content.
search console indexacion de paginas

Screaming Frog:

Esta herramienta de rastreo te permite realizar una auditoría técnica detallada de tu sitio web. Puedes identificar páginas con poco contenido, contenido duplicado y otros problemas que podrían estar afectando a tu posicionamiento orgánico.

Para ello, tienes que comenzar un crawleo de tu sitio web, para luego fijarte en la pestaña de Contenido. De manera predeterminada, Screaming frog va a analizar el número de palabras que tiene cada página de tu sitio web, así como el número de oraciones o la media de palabras por oración entre otros parámetros.

Con estos datos, clasificará las URLs en las siguientes categorías:

  • Duplicados exactos
  • Semiduplicados
  • Páginas con poco contenido
  • Errores ortográficos
  • Errores gramaticales
  • Lectura difícil
  • Lectura muy difícil
  • Marcador de posición
  • Lorem Ipsum
screaming frog contenidos

Por norma general, las páginas que estén clasificadas dentro de los filtros de “página con poco contenido”, “duplicados exactos” o “marcador de posición de lorem ipsum” son más que probables de ser identificadas como thin content por parte de Google.

De igual manera, si identificas en el análisis que algunas de las URLs tienen menos de 500 palabras en el recuento, mi recomendación es investigar el tipo de contenido que muestran, ya que es muy probable que sea escaso o de muy poco valor.

Análisis manual

Además de las herramientas automatizadas, es importante realizar un análisis manual de tu contenido para asegurarte de que cumple con los estándares de calidad.

Esto se puede hacer de la siguiente forma:

  • Revisa el contenido de cada página: Lee cada página de tu sitio web y evalúa si proporciona información útil, relevante y bien estructurada. Puedes ayudarte de Screaming Frog para analizar solo aquellas páginas que veas que cuentan con un recuento de palabras bajo.
  • Analiza el CMS de tu sitio web: Algunos desarrolladores utilizan recursos de los diferentes CMS (como WordPress o WooCommerce) que en ocasiones publican páginas vacías por defecto si no se controla. Un ejemplo que todos conocemos de esto sería el post de “Hola mundo” que publica WordPress. Algo similar ocurre con las categorías o etiquetas, típicas de blogs, o algunos recursos de builders o constructores de webs como Elementor. Lo importante es que revises bien el backend de tu CMS para asegurarte de que no se queda ninguna de estas páginas en el tintero.
  • Verifica la longitud del contenido principal: No debemos confundir el contenido principal de una página con el contenido “boiler plate” de la misma. Asegúrate de que cada página tenga una cantidad suficiente de contenido principal para abordar el tema de manera exhaustiva, que satisfaga la intención de búsqueda del potencial usuario.
  • Evalúa la originalidad: Verifica que tu contenido sea único y no esté duplicado de otras fuentes. Puedes utilizar Footprints en el propio Google (entrecomillando frases) para encontrar el mismo contenido en los resultados de búsqueda, o herramientas especializadas en plagio como Plagiarism checker, Quetext, Grammarly, small SEO tools o Neuronwriter.

¿Qué puedo hacer con el thin content de mi sitio web?

Una vez que hayas encontrado las páginas que pueden ser identificadas como thin content en tu sitio web, es importante tomar medidas. Estas son algunas de las mejores acciones que puedes tomar para solucionar problemas de thin content, evitando de esta manera la temida penalización algorítmica por parte de Google:

Potencia estas páginas con un contenido de calidad

Esta estrategia debe implementarse cuando identificamos páginas que pueden llegar a ser útiles para nuestro negocio, pero que necesitan un empujón para volver a ser relevantes.

Actualizar y optimizar las páginas con thin content es una estrategia básica para aumentar su valor. Y es que mejorarlas no tiene mucho misterio, solo hay que añadir información detallada, proporcionando datos, ejemplos prácticos y análisis detallados.

Si además incorporamos imágenes, videos, infografías y otros elementos multimedia para hacer que el contenido sea más atractivo y fácil de consumir, lo habremos bordado.

Como tip final, podemos añadir enlaces a otras páginas relevantes y semánticamente relacionadas de tu sitio y/o a fuentes externas de alta autoridad para mejorar la credibilidad y utilidad de tu contenido.

Redirige las páginas con thin content a otras páginas afines más optimizadas

Si tienes páginas que no pueden ser mejoradas significativamente, ya sea por falta de recursos o de utilidad de las mismas, considera redirigirlas a otras páginas más relevantes y optimizadas en tu sitio.

El proceso es muy sencillo, primero hay que identificar las páginas de tu sitio que aborden temas similares y que estén bien optimizadas. Una vez hecho el “macheo”, tenemos que
implementar las redirecciones 301 para transferir el valor de las páginas con thin content a las páginas mejor optimizadas, eliminándolas en el proceso.

Para terminar, no te olvides de que todos los enlaces internos que apuntan a las páginas redirigidas se actualicen para reflejar la nueva URL, ya que si no generarás muchas redirecciones internas en el proceso, algo que no le sentará bien a la optimización SEO de tu sitio web.

Elimina las páginas con thin content con una redirección 410

Si en proceso de identificación de thin content identificas páginas de poco valor que no cuentan con otras similares a las que redirigirse y que no merece la pena optimizar en su contenido, puedes optar por utilizar una redirección 410 y eliminarlas.

Recuerda que el código 410, redirección 410 o redirect gone es un código de estado http que nos comunica que la URL que lo devuelve no existe y que no va a volver a existir nunca más.

A diferencia de los errores 404, el código 410 nos ayuda a que Google bot disminuya la frecuencia de rastreo las URLs que lo devuelven, por lo que es especialmente útil para eliminar thin content.

Su implementación será igual que la que hemos visto con las redirecciones 301. Primero identificamos las páginas con thin content, aplicamos la redirección 410 a estas URLs y luego procedemos a eliminar su publicación y enlaces internos que apunten a ellas.

Controla su indexación con una etiqueta no index

Para las páginas que no aportan valor y que no pueden ser mejoradas o redirigidas, pero que no pueden ser eliminadas de tu sitio web, utiliza la etiqueta no index para evitar que los motores de búsqueda las indexen y reducir su rastreo a largo plazo.

Recuerda que si bien bloquear por robots.txt puede ser tentador, en especial si vemos que Google pierde mucho el tiempo rastreando estas páginas, esto no controla la indexación, sino solo el rastreo. Y no solo eso, ya que un bloqueo por robots.txt puede hacer que Google no lea las etiquetas no index. Si queremos que Google olvide estas páginas y las retire de las SERP, es mejor no bloquearlas con este método.

Una vez implementados los cambios, utiliza Search Console para verificar que las páginas con la etiqueta no index no estén siendo indexadas.

search console no index

En resumen: Audita tu sitio y evita el thin content siempre que sea posible

Mantener la calidad del contenido de tu sitio web es esencial para el éxito a largo plazo de tu estrategia de posicionamiento orgánico. Y como pasa exactamente con nuestra salud, es mejor prevenir que curar.

Por este motivo, te recomendamos realizar auditorías regulares de contenido, mejora las páginas con thin content y asegúrate de que cada URL publicada, ya sea nueva o vieja, aporte valor a tus usuarios.

Al hacerlo, no solo mejorarás tu posicionamiento en los motores de búsqueda, sino que también ofrecerás una mejor experiencia a tus visitantes, aumentando su lealtad y confianza en tu sitio.

Si sospechas que tu sitio web puede estarse viendo afectado por una penalización por thin content, recuerda que en Wanatop somos una agencia SEO referente en posicionamiento web. Contamos con un equipo de más de 10 profesionales expertos en calidad de contenido y su impacto en el SEO. Deja tu contacto y agendaremos una reunión sin ningún tipo de compromiso para estudiar tu caso.

Santiago CalvoSantiago Calvo, Especialista SEO.
Curioso y lleno de inquietudes, disfruto trabajando en equipo y, si es en uno multidisciplinar, mejor que mejor. Vivo enamorado del Marketing Digital, sobre todo del SEO.
Conoce más de Santiago Calvo