Guías/Guía de indexación de CMS

Indexación de Drupal en Google: la guía completa para meter tu contenido de Drupal en la búsqueda

Drupal es uno de los CMS más potentes disponibles, usado por gobiernos, universidades y grandes empresas. Pero su flexibilidad implica que la indexación no es automática: necesitas instalar y configurar los módulos correctos para asegurarte de que Google pueda descubrir e indexar todo tu contenido.

Actualizado: 1 abr 2026

En esta guía

Drupal es un framework de gestión de contenido conocido por su flexibilidad, seguridad y escalabilidad. Da servicio a algunos de los sitios más complejos de la web: portales de gobierno con miles de páginas, webs de universidades con múltiples departamentos y tipos de contenido, intranets corporativas y grandes medios de comunicación. La fuerza de Drupal es que se puede configurar para gestionar prácticamente cualquier arquitectura de contenido, desde un blog simple hasta una plataforma multilingüe y multisite con cientos de tipos de contenido y permisos de acceso complejos.

Esta flexibilidad tiene un coste: Drupal no incluye funciones SEO de fábrica. A diferencia de WordPress (que trae un sitemap integrado y SEO básico), Shopify (que autogenera sitemaps y etiquetas canonical) o Ghost (que incluye SEO completo por defecto), Drupal requiere que instales y configures módulos contribuidos para cada función SEO. La generación de sitemaps XML, los alias de URL, la gestión de meta tags, la gestión de redirecciones y la personalización de robots.txt requieren todos módulos separados.

El conjunto básico de módulos SEO de Drupal, a menudo llamado el "Drupal SEO stack", incluye XML Sitemap (o Simple XML Sitemap) para la generación de sitemap, Pathauto para alias de URL automáticos, Metatag para la gestión de meta tags, Redirect para la gestión de redirecciones 301 y el módulo robots.txt para controlar el acceso de los rastreadores. Sin estos módulos, Drupal genera URLs como /node/123 (rutas numéricas opacas), no tiene sitemap XML, no produce meta descripciones y tiene un robots.txt básico que solo se puede editar a nivel del sistema de archivos.

Esta guía recorre cada módulo y configuración necesarios para que un sitio de Drupal sea totalmente indexable por Google. Tanto si gestionas Drupal 10, Drupal 11 o sigues manteniendo un sitio de Drupal 9, los módulos y conceptos son en gran parte los mismos. Cubrimos la instalación, configuración, errores comunes específicos de la arquitectura de Drupal y técnicas avanzadas para instalaciones de Drupal a gran escala.

IndexBolt consigue que Google rastree tus URL en menos de 24 horas — sin envíos manuales, sin esperar semanas.

El stack de módulos SEO de Drupal

Un sitio Drupal bien configurado para la indexación en buscadores requiere un conjunto específico de módulos contribuidos. Cada módulo gestiona un aspecto distinto del SEO, y trabajan juntos para ofrecer un soporte completo de indexación.

Simple XML Sitemap (o el más antiguo XML Sitemap) genera tu archivo /sitemap.xml. Te permite especificar qué tipos de contenido, vocabularios de taxonomía, menús y tipos de entidad personalizados deben incluirse en el sitemap. Puedes configurar prioridades y frecuencias de cambio para cada tipo. Simple XML Sitemap es la opción moderna y soporta Drupal 10 y 11 de forma nativa, mientras que el antiguo módulo XML Sitemap puede tener problemas de compatibilidad con versiones más nuevas de Drupal.

Pathauto genera automáticamente alias de URL legibles por humanos basados en patrones configurables. En lugar de /node/123, Pathauto crea URLs como /blog/titulo-de-mi-articulo en función de patrones de tokens que definas. Pathauto depende del módulo Token para la generación dinámica de URLs. Sin Pathauto, cada página de Drupal solo es accesible en su ruta interna de nodo, lo que es terrible tanto para los usuarios como para el SEO.

El módulo Metatag proporciona una UI para configurar meta tags (title, description, canonical, robots, Open Graph, Twitter Cards y más) a nivel global, de tipo de contenido y de nodo individual. Soporta sustitución por tokens, así que puedes crear patrones como "[node:title] | [site:name]" para los title tags. Sin el módulo Metatag, Drupal genera solo un <title> básico sin meta descripción, sin URL canonical y sin meta tags sociales.

El módulo Redirect gestiona redirecciones 301. Cuando cambias un alias de URL (ya sea manualmente o vía Pathauto), el módulo Redirect puede crear automáticamente una redirección desde la URL antigua hacia la nueva. También ofrece una UI para crear redirecciones manuales y puede arreglar problemas habituales como inconsistencias en la barra final o URLs con mayúsculas/minúsculas mezcladas.

El módulo robots.txt (o el módulo RobotsTxt) te permite gestionar tu archivo robots.txt a través de la interfaz de administración de Drupal en lugar de editarlo directamente en el servidor. Esto es importante porque el robots.txt de Drupal es un archivo estático en el docroot, y los cambios pueden sobrescribirse durante actualizaciones del core.

Configurar alias de URL con Pathauto

Los alias de URL son fundamentales para el SEO de Drupal. Las rutas internas de Drupal (/node/123, /taxonomy/term/45) son técnicamente rastreables e indexables, pero no aportan ninguna información de palabra clave y crean una estructura de sitio opaca. Pathauto lo resuelve generando automáticamente alias de URL basados en patrones que defines.

Para configurar Pathauto, instálalo vía Composer (composer require drupal/pathauto), actívalo en /admin/modules y luego configura los patrones en /admin/config/search/path/patterns. Para cada tipo de contenido, crea un patrón usando tokens. Los patrones habituales incluyen /blog/[node:title] para artículos de blog, /[node:content-type]/[node:title] para varios tipos de contenido, /productos/[node:field_product_category:entity:name]/[node:title] para URLs de producto jerárquicas y /[node:menu-link:parents:join-path]/[node:title] para URLs basadas en la jerarquía del menú.

Pathauto usa el módulo Token para resolver estos patrones. Pasa automáticamente los títulos a minúsculas, sustituye espacios por guiones, elimina caracteres especiales y trunca URLs largas. Puedes personalizar los ajustes de transliteración en /admin/config/search/path/settings para controlar cómo se gestionan caracteres especiales, acentos y scripts no latinos.

Un ajuste crítico de Pathauto es la "Update action" para alias existentes. Cuando cambias el título de un nodo, ¿debe Pathauto actualizar el alias de URL? Si lo hace, la URL antigua se rompe a menos que esté instalado el módulo Redirect. La configuración recomendada es: "Create a new alias. Leave the existing alias functioning" — esto crea un alias nuevo mientras mantiene el antiguo funcionando. Combinado con el módulo Redirect, la URL antigua se redirige automáticamente a la nueva.

Para sitios existentes con miles de URLs /node/123 ya indexadas por Google, Pathauto puede generar en bloque alias para todo el contenido existente. Ve a /admin/config/search/path/update_bulk y selecciona qué tipos de contenido procesar. Tras la generación masiva, instala el módulo Redirect para crear redirecciones automáticas desde las rutas /node/123 hacia los nuevos alias. Esto asegura que Google siga las redirecciones y actualice su índice a las URLs limpias.

Olvídate del trabajo manual — IndexBolt envía tus URL directamente a la cola de rastreo de Google. Empieza con 100 créditos gratis.

100 créditos gratis. Sin tarjeta de crédito.

Configuración del módulo Metatag para indexación

El módulo Metatag es esencial para controlar cómo ve Google tus páginas. Instálalo vía Composer (composer require drupal/metatag) y activa el módulo Metatag junto con sus submódulos: Metatag: Open Graph, Metatag: Twitter Cards y Metatag: Verification (para etiquetas de verificación de search console).

Configura los valores por defecto globales en /admin/config/search/metatag. La configuración global establece meta tags de fallback para cualquier página que no tenga una configuración más específica. Pon el título global como "[current-page:title] | [site:name]", la descripción como "[node:summary]" (o déjalo vacío para evitar descripciones genéricas) y la URL canonical como "[current-page:url]".

Luego crea overrides específicos por tipo de contenido. Para artículos de blog, podrías poner el título como "[node:title] - Blog | [site:name]" y la descripción como "[node:field_meta_description]" (usando un campo dedicado de meta descripción que añadas al tipo de contenido). Para páginas de producto, usa tokens específicos del producto. Para páginas de término de taxonomía, usa "[term:name] - [vocabulary:name] | [site:name]" como patrón de título.

El módulo Metatag también controla la directiva meta robots por tipo de contenido y por nodo individual. Para tipos de contenido que no deben indexarse (como tipos solo para admins, páginas de confirmación de webform o páginas de perfil de usuario), pon la meta robots en "noindex, follow" a nivel de tipo de contenido. Esto impide que Google indexe esas páginas mientras sigue sus enlaces.

Para nodos individuales, los editores de contenido pueden sobrescribir los meta tags en el fieldset "Meta tags" del formulario de edición del nodo. Forma a tus editores para que escriban meta descripciones personalizadas para el contenido importante: el resumen autogenerado a menudo no está optimizado para la búsqueda. Si quieres forzar la escritura de meta descripciones, marca el campo como obligatorio mediante la configuración del form display o usa un handler de validación personalizado.

El módulo Metatag también soporta etiquetas hreflang para sitios multilingües a través del submódulo Metatag: hreflang. Si tu sitio Drupal es multilingüe (usando el módulo Translation del core), activa hreflang y configúralo para que genere automáticamente etiquetas hreflang enlazando todas las versiones de idioma de cada página.

Generación y configuración del sitemap XML

Instala Simple XML Sitemap vía Composer (composer require drupal/simple_sitemap) y actívalo. Configúralo en /admin/config/search/simplesitemap. El módulo te permite crear múltiples sitemaps (útil para sitios grandes con diferentes secciones de contenido) y seleccionar qué tipos de entidad, bundles y entidades específicas incluir.

Para la mayoría de los sitios Drupal, incluye los nodos publicados de los tipos de contenido que deban indexarse (artículos, páginas, productos), las páginas de término de taxonomía publicadas que tengan contenido sustancial y cualquier tipo de entidad personalizado que genere páginas públicas. Excluye los tipos de contenido que sean administrativos, estén tras control de acceso o sean inherentemente finos (como envíos de webform o perfiles de usuario).

Simple XML Sitemap soporta ajustes de prioridad y changefreq por tipo de contenido. Aunque Google ha dicho que en gran parte ignora estas pistas, configurarlas ayuda a organizar tu sitemap y a señalar la importancia relativa de tu contenido. Configura la prioridad de la home a 1.0, los tipos de contenido principales a 0.8 y el contenido secundario como los términos de taxonomía a 0.5.

El módulo genera el sitemap en /sitemap.xml por defecto y lo divide en varios archivos cuando el número de URLs supera el límite configurado (por defecto 2000, máximo 50.000 por spec de sitemap). Para sitios Drupal grandes con decenas de miles de páginas, la generación del sitemap puede ser intensiva en recursos. Configura cron para regenerar el sitemap en horas valle y ajusta el intervalo de regeneración adecuadamente (cada 6-24 horas para la mayoría de los sitios).

Un problema habitual con los sitemaps de Drupal es el acceso a entidades. El sistema de permisos de Drupal puede impedir que el generador de sitemap acceda a nodos visibles para usuarios anónimos pero no para el usuario de cron. El módulo Simple XML Sitemap genera el sitemap durante la ejecución de cron, usando los permisos del usuario anónimo por defecto. Si tus nodos requieren permisos específicos para ser vistos, verifica que los usuarios anónimos pueden acceder a ellos, o configura el módulo para generar el sitemap usando los permisos de otro usuario.

Tras configurar el sitemap, envíalo a Google Search Console en Sitemaps > Añadir un sitemap nuevo > tudominio.com/sitemap.xml. Monitoriza el estado del sitemap por si hay errores como URLs 404 (nodos eliminados que siguen en el sitemap), URLs bloqueadas (conflictos con robots.txt) y URLs con redirecciones (nodos con alias cambiados).

Rutas de nodo, alias y contenido duplicado en Drupal

Drupal tiene un problema único de contenido duplicado que no comparten otros CMS: el contenido es accesible tanto en la ruta interna (/node/123) como en el alias de URL (/blog/mi-articulo). Sin la configuración adecuada, Google puede indexar ambas URLs, creando contenido duplicado.

La primera defensa es el ajuste "Enforce clean and canonical URLs" del módulo Redirect. Cuando está activado, visitar /node/123 para un nodo que tiene un alias /blog/mi-articulo provoca una redirección 301 al alias. Esto le dice a Google que el alias es la URL canónica y que la ruta de nodo debe ignorarse. Activa este ajuste en /admin/config/search/redirect/settings.

La segunda defensa es la meta etiqueta canonical del módulo Metatag. Aunque un nodo se acceda de alguna manera en su ruta interna, la etiqueta canonical en el <head> HTML apunta a la URL del alias. Google respeta las etiquetas canonical y consolida las señales de ranking hacia la URL canónica.

La tercera defensa es el archivo robots.txt. Añade Disallow: /node/ a tu robots.txt para impedir que Google rastree las rutas internas de nodo por completo. Es un enfoque de cinturón y tirantes que, combinado con redirecciones y etiquetas canonical, garantiza que las rutas de nodo nunca se indexen.

Drupal también crea potenciales duplicados a través de las páginas de término de taxonomía. Si tienes un vocabulario llamado "Categorías" con un término llamado "Tecnología", Drupal crea una página en /taxonomy/term/5 (y, con Pathauto, un alias como /categorias/tecnologia) que lista todos los nodos etiquetados con ese término. Si la página de término de taxonomía no tiene contenido introductorio único (solo una lista de teasers de nodos que aparecen en otros sitios), Google puede clasificarla como contenido fino o duplicado.

Las páginas generadas por Views añaden otra capa de complejidad. El módulo Views de Drupal puede crear páginas que listan contenido según diversos criterios, con paginación. Una Views que liste todas las entradas de blog con 10 por página crea URLs como /blog?page=1, /blog?page=2, etc. Cada página paginada tiene contenido similar (solo entradas distintas). Sin etiquetas de paginación rel="next" y rel="prev" (que Google ha deprecado pero algunos practicantes de SEO siguen usando) o una directiva noindex en páginas paginadas, Google puede desperdiciar presupuesto de rastreo en páginas de paginación profunda con valor de contenido decreciente.

El caché de Drupal y su impacto en los meta tags

Drupal tiene uno de los sistemas de caché más sofisticados de todos los CMS, y aunque esto es generalmente un beneficio de rendimiento, puede causar dolores de cabeza de SEO si no se entiende bien.

La caché de página de Drupal (el módulo Internal Page Cache para usuarios anónimos, Dynamic Page Cache para usuarios autenticados) almacena páginas HTML completamente renderizadas. Cuando actualizas los meta tags de un nodo a través del módulo Metatag, el HTML cacheado puede seguir sirviendo los meta tags antiguos hasta que se limpie la caché. Para sitios con caché agresiva (TTL de horas o días), esto significa que los cambios SEO pueden ser invisibles para Google durante un periodo prolongado.

La solución es entender el sistema de cache tags de Drupal. Cuando editas un nodo, el sistema de cache tags de Drupal debería invalidar automáticamente cualquier página cacheada que contenga el contenido de ese nodo. Esto funciona correctamente cuando los cambios de meta tag forman parte de la edición del nodo (usando el override por nodo del módulo Metatag). Sin embargo, los cambios en los valores por defecto de meta tags a nivel global o de tipo de contenido pueden no activar la invalidación de caché para todas las páginas afectadas. Tras cambiar la configuración global de meta tags, limpia manualmente la caché de páginas del sitio en /admin/config/development/performance > Clear all caches.

Las capas de caché externas añaden otra dimensión. Si tu sitio Drupal está detrás de Varnish, una caché de proxy inverso o un CDN como Cloudflare, tienes una capa de caché adicional que no conoce las cache tags de Drupal. Tras limpiar la caché interna de Drupal, también necesitas limpiar la caché externa. Para Varnish, usa el módulo Varnish Purge para integrar el sistema de cache tags de Drupal con el mecanismo de purgado de Varnish. Para Cloudflare, usa el módulo Cloudflare para purgar automáticamente la caché del CDN cuando el contenido de Drupal cambie.

El módulo Purge y sus módulos asociados (Purge Queuer, Purge Processor y los plugins específicos por plataforma) proporcionan una interfaz unificada para gestionar la invalidación de caché en todas las capas. Para fines SEO, el requisito clave es: cuando un meta tag cambia en cualquier página, toda versión cacheada de esa página (caché interna de Drupal, Varnish, CDN) debe invalidarse para que el siguiente rastreo de Google vea los tags actualizados.

Ten especial cuidado con la caché de autenticados vs. anónimos. Drupal puede servir contenido distinto a usuarios autenticados (editores, admins) y a usuarios anónimos (incluido Googlebot). Si tu configuración de Metatag incluye condiciones basadas en roles de usuario, asegúrate de que la versión anónima tiene los meta tags correctos. Pruébalo cerrando sesión (o usando una ventana de incógnito) y viendo el código fuente para verificar los meta tags que verá Google.

Guía paso a paso

Instala el stack básico de módulos SEO

Usa Composer para instalar los módulos SEO esenciales: composer require drupal/simple_sitemap drupal/pathauto drupal/metatag drupal/redirect drupal/token. Luego actívalos a través del admin de Drupal en /admin/modules o vía Drush: drush en simple_sitemap pathauto metatag metatag_open_graph redirect. Estos módulos proporcionan la base para la generación de sitemap, los alias de URL, la gestión de meta tags y la gestión de redirecciones. Verifica que cada módulo está activado y sin errores de dependencia en /admin/reports/status.

Configura los patrones de alias de URL de Pathauto

Ve a /admin/config/search/path/patterns y crea un patrón de URL para cada tipo de contenido. Para artículos, usa un patrón como /blog/[node:title]. Para páginas, usa /[node:title]. Para productos (si aplica), usa /productos/[node:title] o /productos/[node:field_category:entity:name]/[node:title] para una jerarquía basada en categorías. Tras crear los patrones, ve a /admin/config/search/path/update_bulk y genera en bloque alias para todo el contenido existente. Luego instala y activa el módulo Redirect para crear redirecciones 301 automáticas desde las rutas internas de nodo (/node/123) hacia los nuevos alias.

Configura el módulo Metatag para todos los tipos de contenido

Navega a /admin/config/search/metatag y configura los valores por defecto de meta tag. Pon el patrón de título global como [current-page:title] | [site:name] y la URL canonical como [current-page:url]. Luego añade overrides específicos por tipo de contenido: para cada tipo de contenido, haz clic en "Add" y configura el título, descripción, URL canonical y directivas robots. Pon la descripción como [node:field_meta_description] si tienes un campo dedicado, o [node:summary] como fallback. Para tipos de contenido que no deben indexarse (webforms, páginas internas), pon la meta robots en noindex, follow.

Configura y genera el sitemap XML

Ve a /admin/config/search/simplesitemap y configura qué tipos de entidad incluir. Activa los nodos publicados para todos los tipos de contenido públicos, activa los términos de taxonomía para vocabularios con contenido sustancial y excluye perfiles de usuario, envíos de webform y otras entidades no públicas. Configura las prioridades del sitemap (home 1.0, contenido principal 0.8, contenido secundario 0.5). Haz clic en "Generate" para crear el sitemap inmediatamente y luego visita /sitemap.xml para verificar que contiene las URLs esperadas. Configura el intervalo de cron para la regeneración automática.

Configura robots.txt para bloquear rutas internas

Edita el archivo robots.txt de tu sitio Drupal (en el docroot) y añade reglas para bloquear rutas internas que no deban rastrearse. Añade Disallow: /node/ (bloquea las rutas internas de nodo), Disallow: /admin/ (bloquea las páginas de admin), Disallow: /user/ (bloquea las páginas de perfil de usuario y de login) y Disallow: /search/ (bloquea los resultados de búsqueda internos de Drupal). Añade Sitemap: https://tudominio.com/sitemap.xml al final. Si usas el módulo RobotsTxt, gestiona estas reglas en /admin/config/search/robotstxt en lugar de editar el archivo directamente.

Envía el sitemap y verifícalo en Google Search Console

Añade tu sitio Drupal a Google Search Console. Para la verificación, usa el submódulo Metatag: Verification para añadir el meta tag de verificación de Google en /admin/config/search/metatag > Global > Verification. Tras la verificación, ve a Sitemaps en Google Search Console y envía la URL de tu sitemap. Monitoriza el informe del sitemap por si hay errores. Los errores comunes incluyen URLs que devuelven 403 (problemas de permisos), URLs que devuelven 301 (alias redirigiendo desde rutas de nodo) y URLs con 404 soft (nodos con contenido vacío). Arregla cada categoría de error antes de reenviar.

Envía las páginas prioritarias a través de IndexBolt para una indexación más rápida

Tras completar la instalación y configuración de los módulos, los sitios Drupal a menudo tienen un backlog de páginas pendientes de indexación, especialmente después de una migración o una reestructuración importante. Exporta las URLs de tu sitemap e identifica las páginas que aún no están indexadas usando el informe de Páginas de Google Search Console. Envía las páginas de mayor prioridad a través de IndexBolt: céntrate en tus landings principales, los nodos de contenido más valiosos y cualquier página con backlinks entrantes que necesite mantener su visibilidad en búsqueda. El HTML limpio y renderizado en servidor de Drupal lo convierte en un excelente candidato para la pipeline de indexación de IndexBolt.

¿Terminaste los pasos manuales? Acelera el proceso.

IndexBolt envía tus URL directamente a Google — la mayoría se rastrea en menos de 24 horas.

Problemas habituales y cómo solucionarlos

Las rutas de nodo (/node/123) y los alias de URL creando contenido duplicado

Causa: El contenido de Drupal es accesible tanto en la ruta interna de nodo (/node/123) como en el alias de URL (/blog/mi-articulo). Sin la imposición de URL canónica del módulo Redirect, Google puede descubrir e indexar ambas URLs, creando contenido duplicado que divide las señales de ranking entre dos URLs para la misma página.

Solución: Instala y activa el módulo Redirect, luego ve a /admin/config/search/redirect/settings y activa "Enforce clean and canonical URLs". Esto crea redirecciones 301 automáticas desde /node/123 al alias de URL. Configura también el módulo Metatag para emitir URLs canonical que apunten al alias. Para una protección de cinturón y tirantes, añade Disallow: /node/ al robots.txt para impedir que Google rastree las rutas internas por completo.

La paginación de Views creando cientos de páginas finas

Causa: El módulo Views de Drupal genera listas paginadas que crean URLs como /blog?page=1, /blog?page=2, hasta /blog?page=50. Cada página paginada contiene un subconjunto pequeño de contenido (normalmente 10-25 elementos por página) y cada página tiene aspecto similar desde el punto de vista de Google. Las páginas de paginación profunda (página 10 y más allá) tienen muy poco valor de descubrimiento y desperdician presupuesto de rastreo.

Solución: Para Views con paginación profunda, añade una directiva noindex a las páginas paginadas más allá de la primera. Puedes hacerlo con el sistema de tokens del módulo Metatag o con código personalizado que detecte el parámetro page. Como alternativa, usa el patrón "Load more" (scroll infinito o botón "Load more") en lugar de la paginación tradicional, lo que mantiene todo el contenido en una sola URL. Reduce el número total de páginas paginadas aumentando el número de elementos por página en los ajustes de tu View.

Páginas de término de taxonomía con contenido fino indexándose

Causa: El sistema de taxonomía de Drupal crea una página para cada término en cada vocabulario. Los términos con pocos nodos etiquetados resultan en páginas archivo finas: una página con uno o dos teasers de contenido y sin texto único. Google puede indexar estas páginas finas pero posicionarlas mal, diluyendo las señales generales de calidad de tu sitio.

Solución: Añade contenido de descripción a los términos de taxonomía que sirvan como páginas de categoría. En el formulario de edición del término de taxonomía, escribe 100-300 palabras de contenido único describiendo el tema. Configura tu plantilla de término de taxonomía para mostrar esta descripción de forma prominente. Para vocabularios donde las páginas de término no deban indexarse en absoluto (como vocabularios internos de etiquetado), pon los valores por defecto de Metatag para los términos de ese vocabulario como noindex. Elimina las páginas de término finas de tu sitemap excluyendo el vocabulario en la configuración de Simple XML Sitemap.

Permisos de Drupal bloqueando el acceso anónimo a contenido publicado

Causa: El sistema granular de permisos de Drupal puede impedir inadvertidamente que los usuarios anónimos (incluido Googlebot) accedan al contenido publicado. Esto ocurre cuando se elimina el permiso "View published content" del rol anónimo, cuando módulos de acceso a contenido (Content Access, Node Access) restringen la visualización por rol o cuando los permisos a nivel de campo ocultan contenido a los usuarios anónimos.

Solución: Ve a /admin/people/permissions y verifica que el rol de usuario anónimo tiene el permiso "View published content" activado para todos los tipos de contenido que deban indexarse. Si usas módulos de acceso a contenido, audita su configuración para asegurarte de que los nodos publicados son accesibles para usuarios anónimos. Pruébalo cerrando sesión por completo y visitando tus páginas de contenido: si ves una página de acceso denegado, los permisos están mal. Verifica también que el módulo Simple XML Sitemap puede acceder al contenido durante cron (se ejecuta como usuario anónimo por defecto).

La caché sirviendo meta tags obsoletos tras cambios SEO

Causa: La caché de página agresiva de Drupal (Internal Page Cache, Dynamic Page Cache, Varnish externa o CDN) almacena HTML completamente renderizado incluyendo los meta tags. Cuando actualizas meta tags a través del módulo Metatag — especialmente los valores por defecto a nivel global o de tipo de contenido — el HTML cacheado puede seguir sirviendo los meta tags antiguos durante horas o días, según tu configuración de TTL de caché.

Solución: Después de hacer cambios de meta tag a nivel global o de tipo de contenido, limpia todas las cachés en /admin/config/development/performance > Clear all caches. Si usas Varnish, purga también la caché de Varnish (ban req.http.host == "tudominio.com" en la CLI de Varnish). Si usas Cloudflare u otro CDN, purga la caché del CDN a través de su panel o API. Verifica los meta tags actualizados visitando una página en una ventana de incógnito y viendo el código fuente. Para una fiabilidad continua, instala el módulo Purge para automatizar la invalidación de caché en todas las capas.

Conflictos entre módulos causando meta tags duplicados o faltantes

Causa: Varios módulos de Drupal pueden intentar generar los mismos meta tags. Por ejemplo, un theme podría emitir su propio title tag, el módulo Metatag genera otro y un módulo personalizado añade un tercero. De forma similar, el módulo SEO Checklist, el módulo Google Analytics u otros módulos contrib pueden inyectar sus propios meta tags que entren en conflicto con la salida del módulo Metatag.

Solución: Mira el código fuente de varias páginas de contenido y busca meta tags duplicados: busca varias etiquetas `<title>`, varias `<meta name="description">` o varias `<link rel="canonical">`. Si existen duplicados, identifica qué módulo genera cada uno. Desactiva la fuente duplicada: normalmente eliminando la salida del meta tag de la plantilla del theme (revisa html.html.twig y page.html.twig) y confiando únicamente en el módulo Metatag para toda la generación de meta tags. El módulo Metatag debe ser la única fuente de verdad para todos los meta tags relacionados con SEO.

Consejos pro

Usa el módulo SEO Checklist (drupal/seo_checklist) como herramienta de auditoría completa para la configuración SEO de tu sitio Drupal. Proporciona una checklist de cada módulo, ajuste y configuración relacionados con SEO que deberías tener en su sitio. Aunque no arregla los problemas automáticamente, te ayuda a identificar lagunas en tu setup SEO que se te puedan haber pasado.

Para sitios Drupal grandes con tipos de contenido personalizados, crea un campo dedicado "SEO Title" y "SEO Description" en cada tipo de contenido en lugar de depender del título del nodo y del resumen del cuerpo. Esto separa los títulos editoriales (que pueden ser creativos o largos) de los títulos SEO (que deben estar optimizados para palabras clave y ser concisos). Enlaza el módulo Metatag con estos campos dedicados para tener el máximo control.

El módulo JSON:API de Drupal (incluido en el core desde Drupal 9) expone tu contenido como endpoints JSON. Aunque no están pensados para motores de búsqueda, pueden indexarse si se enlazan. Añade cabeceras X-Robots-Tag: noindex a las respuestas de JSON:API usando un middleware personalizado o una regla en .htaccess. Lo mismo aplica a los endpoints REST si el módulo RESTful Web Services está activado.

Para sitios Drupal multilingües, asegúrate de que el submódulo Metatag: hreflang esté activado y bien configurado. El sistema de traducción de Drupal crea entidades de nodo separadas para cada versión de idioma, y las etiquetas hreflang deben conectar correctamente todas las traducciones. Verifícalo viendo el código fuente de una página traducida y comprobando que las etiquetas hreflang listan todas las versiones de idioma disponibles con rutas de URL correctas.

Al migrar a Drupal desde otro CMS, usa la suite Migrate para preservar la estructura de URLs antigua siempre que sea posible. Tras la migración, ejecuta una comparación por rastreo entre el sitemap antiguo y el nuevo para identificar cualquier URL que haya cambiado. Crea redirecciones para cada URL cambiada usando la función de importación CSV del módulo Redirect (/admin/config/search/redirect/import) para añadir en bloque cientos de redirecciones de una sola vez.

El módulo Views de Drupal puede generar feeds RSS que sirvan como rutas adicionales de descubrimiento para Google. Crea un display de feed en tus Views de contenido principales y enlázalo desde el `<head>` de tu sitio usando `<link rel="alternate" type="application/rss+xml">`. Envía la URL del feed junto con tu sitemap en Google Search Console para un descubrimiento de contenido redundante.

Los sitios Drupal suelen ser grandes, complejos y críticos para el negocio. Tanto si tienes miles de nodos esperando a que Google los descubra como si acabas de completar una migración importante con nuevas estructuras de URL, IndexBolt puede empujar tus páginas más importantes directamente a la pipeline de indexación de Google. Deja de esperar a sitemaps disparados por cron y a ciclos naturales de rastreo: envía tus URLs de Drupal a través de IndexBolt y consigue que se indexen en horas.

100 créditos gratis. Sin tarjeta de crédito. Resultados en menos de 24 horas.

Preguntas frecuentes

¿Drupal tiene funciones SEO integradas?+

El core de Drupal proporciona los bloques básicos: salida HTML limpia, una etiqueta `<title>` configurable, alias de URL (desde Drupal 8 el core incluye gestión básica de alias) y la capacidad de servir archivos estáticos como robots.txt. Sin embargo, Drupal no incluye un sitemap XML, gestión de meta descripción, URLs canonical automáticas, datos estructurados ni gestión de redirecciones de fábrica. Estas funciones las proporcionan módulos contribuidos (Simple XML Sitemap, Metatag, Redirect, Pathauto) que hay que instalar y configurar por separado.

¿Qué módulos de Drupal necesito para SEO?+

El stack esencial de módulos SEO de Drupal incluye: Simple XML Sitemap para la generación del sitemap, Pathauto para alias de URL automáticos, Token (requerido por Pathauto), Metatag para la gestión de meta tags, Redirect para la gestión de redirecciones 301 y, opcionalmente, el módulo RobotsTxt para gestionar robots.txt desde el admin. Para sitios multilingües, añade el submódulo Metatag: hreflang. Instala todos los módulos vía Composer y actívalos a través de /admin/modules o Drush.

¿Cómo evito que las rutas /node/123 se indexen?+

Usa un enfoque de tres capas: (1) Instala el módulo Redirect y activa "Enforce clean and canonical URLs" para redirigir automáticamente con 301 /node/123 al alias de URL. (2) Configura el módulo Metatag para establecer URLs canonical hacia la ruta del alias. (3) Añade Disallow: /node/ a tu robots.txt para impedir que Google rastree las rutas internas de nodo. Juntas, estas tres medidas aseguran que Google solo vea e indexe tus alias de URL limpios, nunca las rutas internas de nodo.

¿Cómo gestiono los cambios de URL durante una migración a Drupal?+

Antes de la migración, documenta todas las URLs de tu sitio actual exportando tu sitemap. Tras migrar a Drupal, configura Pathauto para generar alias que coincidan con la estructura de URL antigua siempre que sea posible. Para las URLs que deban cambiar, crea redirecciones 301 con el módulo Redirect. Puedes importar redirecciones en bloque vía CSV en /admin/config/search/redirect/import. Tras configurar las redirecciones, reenvía tu sitemap a Google Search Console y monitoriza el informe de Páginas por errores 404 que indiquen redirecciones faltantes.

¿Por qué mis páginas de Views en Drupal no se indexan?+

Las páginas de Views pueden no indexarse por varias razones: la URL de la página Views no está incluida en tu sitemap (añádela manualmente en los enlaces personalizados de Simple XML Sitemap), el contenido de la página es demasiado similar al de otras páginas (vistas paginadas con contenido solapado), la página tiene una etiqueta meta robots incorrecta (revisa la configuración del módulo Metatag para el display de la Views) o la página requiere permisos que los usuarios anónimos no tienen. Prueba la URL de la página Views en la herramienta de inspección de URLs de Google Search Console para diagnosticar el problema específico.

¿Puedo usar IndexBolt con un sitio Drupal detrás de autenticación básica?+

IndexBolt necesita acceder a tus URLs públicas, así que cualquier autenticación HTTP básica (común en entornos de staging de Drupal) debe eliminarse para las páginas de producción que quieras indexar. Si tu sitio de staging tiene basic auth, no pasa nada: el staging no debería indexarse. Tu sitio de producción debe ser accesible públicamente sin ninguna barrera de autenticación. Los permisos de acceso a contenido de Drupal son independientes de la autenticación HTTP: mientras los usuarios anónimos puedan ver los nodos publicados, IndexBolt puede enviar esas URLs para indexación.

Herramientas gratuitas para esto

Google Index Checker Robots.txt Tester XML Sitemap Validator Redirect Checker

Lecturas adicionales

How to Get Your Website Indexed on Google Bulk URL Indexing Guide

Guías relacionadas

Indexación de WordPress en Google: la guía completa para que se encuentre cada página Indexación de Ghost en Google: la guía completa para meter tu contenido de Ghost en los resultados de búsqueda Indexación de Joomla en Google: la guía completa para que tu sitio Joomla aparezca en los resultados de búsqueda Indexación de Next.js en Google: la guía completa para App Router y Pages Router Indexación de Magento en Google: la guía completa para Adobe Commerce y Open Source Indexación de HubSpot CMS en Google: la guía completa para equipos de marketing

¿Listo para indexar tus URLs?

Empieza con 100 créditos gratis. Sin tarjeta de crédito.