¿Qué es el User-Agent “Google-Read-Aloud”? Explicación detallada de su significado, por qué aparece en los registros y por qué no puede bloquearse con robots.txt
- Google-Read-Aloud es el User-Agent utilizado por el servicio Read Aloud de Google. Está relacionado con funciones que leen páginas web en voz alta mediante texto a voz (TTS).
- A diferencia de los rastreadores de búsqueda ordinarios, se trata de una obtención activada por una acción del usuario. Google describe este mecanismo como “no es un rastreador web”.
- Según la explicación oficial de Google, Google-Read-Aloud no sigue enlaces para rastrear sitios. Obtiene las páginas solicitadas por los usuarios para la lectura en voz alta mediante renderizado sin estado.
- El punto importante es que no se puede excluir mediante robots.txt. Para excluir una página de la lectura en voz alta, usa
<meta name="google" content="nopagereadaloud">. - Además, si deseas impedir que los artículos con muro de pago sean leídos en voz alta, Google recomienda establecer
isAccessibleForFreeenFalsedentro de los datos estructurados. - Esto es especialmente útil para editores de noticias, responsables de sitios web, personal de SEO, administradores de servidores, personal de integración de aplicaciones y equipos de monitoreo de registros. Está dirigido a cualquier persona que se haya preocupado al ver el desconocido
Google-Read-Alouden los registros de acceso, quiera entender la diferencia con Googlebot o necesite decidir una política para las funciones de lectura en voz alta.
Introducción
Al revisar los registros de acceso de un servidor web, puede que de pronto notes un User-Agent desconocido llamado Google-Read-Aloud y sientas cierta preocupación. A juzgar solo por el nombre, puede parecer un tipo de Googlebot, y al principio puede ser difícil saber si se trata de rastreo de búsqueda, una obtención relacionada con asistentes de voz o algo distinto. Sin embargo, al consultar la documentación oficial de Google, este User-Agent tiene un papel bastante diferente al de los rastreadores de búsqueda ordinarios. Google-Read-Aloud es el User-Agent utilizado por el servicio Read Aloud de Google, y se usa para leer páginas web en voz alta mediante texto a voz. Google también describe claramente este mecanismo como “no es un rastreador web”.
En otras palabras, solo porque encuentres Google-Read-Aloud, no necesitas sospechar de inmediato que se trata de rastreo SEO o de evaluación para el ranking de búsqueda. Es más preciso entenderlo como una obtención que ocurre porque un usuario solicitó que la página fuera leída en voz alta. Google explica que el servicio Read Aloud funciona cuando un usuario final accede a una página con TTS habilitado, y que se usa en Google Go, Google Read it, la función de lectura en voz alta de la app de Google y otros servicios de lectura en voz alta de Google. En otras palabras, no es un rastreo constante para indexación de búsqueda, sino una obtención para habilitar la experiencia de usuario de lectura en voz alta.
Si se malinterpreta este punto, la interpretación de los registros puede distorsionarse bastante. Por ejemplo, si asumes que es un rastreo de descubrimiento como Googlebot, su comportamiento puede parecer extraño: “¿Por qué no funciona robots.txt?” o “¿Por qué viene solo una vez sin seguir enlaces?”. Sin embargo, Google-Read-Aloud es un sistema que obtiene únicamente la página que el usuario quiere que se lea en voz alta, por lo que su comportamiento resulta mucho más fácil de entender desde esa premisa. Google también explica que almacena en caché los resultados de las páginas para ahorrar ancho de banda, aunque señala que pueden producirse varias solicitudes para una página específica. Así que, aunque aparezca varias veces en los registros, eso por sí solo no indica necesariamente una anomalía.
En este artículo, organizaremos de forma clara y cuidadosa qué es Google-Read-Aloud, en qué se diferencia de Googlebot, por qué aparece en los registros de acceso, por qué no puede bloquearse con robots.txt, cuándo usar la metaetiqueta nopagereadaloud, qué puntos tener en cuenta con artículos con muro de pago y qué comprobaciones prácticas realizar en operaciones. En lugar de simplemente temer a un User-Agent desconocido, espero que esto sea una oportunidad para entender cómo pueden tratarse tus páginas mediante funciones de lectura en voz alta.
¿Qué es Google-Read-Aloud?
Google-Read-Aloud se define en la documentación oficial de Google como “el agente de usuario del servicio Google Read Aloud”. Su función es muy clara: leer páginas web en voz alta utilizando texto a voz (TTS). Google explica que este servicio se activa cuando los usuarios navegan por una página con TTS habilitado, y que se utiliza en Google Go, Google Read it, la función de lectura en voz alta de la app de Google y otros servicios de texto a voz de Google. Por lo tanto, este User-Agent debe considerarse por separado de otros accesos relacionados con Google utilizados para búsqueda, publicidad o verificación de sitios.
Google también incluye este User-Agent dentro de los “fetchers activados por usuarios”. Esto es muy importante. Google tiene rastreadores generales como Googlebot, fetchers de verificación como Google-Site-Verification, fetchers de feeds como Feedfetcher y fetchers activados por acciones de usuarios. Google-Read-Aloud pertenece a la categoría de fetchers basados en acciones del usuario. En otras palabras, la propia Google lo posiciona no como un rastreador de búsqueda, sino como una función de obtención que opera en respuesta a solicitudes del usuario.
La documentación oficial también proporciona ejemplos de User-Agents usados en solicitudes HTTP actuales. En móvil, el formato puede verse así:
Mozilla/5.0 (Linux; Android 10; K) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/138.0.0.0 Mobile Safari/537.36 (compatible; Google-Read-Aloud; +https://support.google.com/webmasters/answer/1061943)
En escritorio, puede verse así:
Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/137.0.0.0 Safari/537.36 (compatible; Google-Read-Aloud; +https://support.google.com/webmasters/answer/1061943)
A partir de esto, se puede ver que adopta una forma similar a un navegador basado en Chrome, al tiempo que incluye el identificador compatible; Google-Read-Aloud. En otras palabras, no es un tipo que se disfrace completamente de navegador normal y se oculte. Se identifica de una manera reconocible. Según el historial de cambios de Google, la versión del navegador de este User-Agent se actualizó en julio de 2025, y la razón indicada fue dar mejor soporte a sitios que no admiten navegadores antiguos.
Google también explica que google-speakr es el antiguo nombre obsoleto, y que el nuevo nombre es Google-Read-Aloud. Aunque aparezcan identificadores antiguos mezclados en los registros, entender este historial de nombres ayuda a evaluar la situación con calma. En resumen, Google-Read-Aloud es el User-Agent oficial de Google que obtiene páginas web a partir de acciones del usuario con el propósito del servicio de lectura en voz alta de Google.
Por qué aparece en los registros de acceso
La razón por la que Google-Read-Aloud aparece en los registros es bastante diferente de la de Googlebot. Según Google, Google-Read-Aloud se activa por solicitudes del usuario. En otras palabras, cuando alguien usa una función de lectura en voz alta de Google y solicita que tu página sea “leída”, se produce esa obtención de la página. A diferencia del rastreo de motores de búsqueda basado en descubrimiento, este es un acceso vinculado a una acción explícita del usuario.
Por ejemplo, las páginas centradas en texto, como artículos de noticias, artículos explicativos, entradas de blog y guías prácticas, son adecuadas para funciones de lectura en voz alta. Si los usuarios utilizan la lectura en voz alta en esas páginas, puede registrarse acceso de Google-Read-Aloud. Lo importante aquí no es el mero hecho de que se produjo el acceso, sino la posibilidad de que alguien haya utilizado esa página como contenido para lectura en voz alta. En otras palabras, una sola entrada de registro puede leerse no solo como tráfico de bot, sino como una especie de registro de una experiencia de usuario en curso.
Google explica que el servicio Read Aloud almacena en caché los resultados de las páginas para ahorrar ancho de banda. Al mismo tiempo, afirma claramente que pueden producirse varias solicitudes para una página específica. Por lo tanto, aunque un administrador vea en los registros que “Google-Read-Aloud llegó varias veces a la misma página”, no debe concluirse inmediatamente que sea anormal o un bucle infinito. Pueden intervenir factores como una nueva obtención de la página, comprobaciones de recursos incrustados, diferencias en el estado de la caché y otros elementos.
Google también explica que Google-Read-Aloud muestra páginas mediante renderizado sin estado. Muestra las páginas de forma similar a como las ve un usuario, pero no utiliza las cookies del usuario. Esto es muy importante en la práctica. Por ejemplo, en sitios donde el texto de un artículo se muestra en función del consentimiento de cookies o del estado de inicio de sesión, el texto puede ser visible para usuarios humanos pero no visible tal cual para Google-Read-Aloud. En otras palabras, cuando este User-Agent aparece en los registros, debes pensar en cuánto texto de la página puede leerse con renderizado sin cookies y sin estado.
Un registro real puede verse así:
203.0.113.10 - - [06/May/2026:10:14:22 +0900] "GET /articles/google-read-aloud-guide HTTP/1.1" 200 15234 "-" "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/137.0.0.0 Safari/537.36 (compatible; Google-Read-Aloud; +https://support.google.com/webmasters/answer/1061943)"
Lo que debes leer de este ejemplo no es “esto puede afectar al ranking de búsqueda de Google”, sino el hecho de que la página puede ser obtenida por la función de lectura en voz alta de Google. El significado difiere mucho dependiendo de si se trata de la página principal, un artículo individual, una página solo para miembros o un artículo con muro de pago. Cuando encuentres Google-Read-Aloud, el primer paso práctico no es temerlo, sino comprobar qué página es legible externamente y en qué estado.
Diferencia con Googlebot
Existen muchos User-Agents relacionados con Google, por lo que Google-Read-Aloud suele confundirse con un tipo de Googlebot, pero ambos son bastante diferentes. La mayor diferencia es que Google-Read-Aloud no es un rastreador web como Googlebot. En su documentación oficial, Google afirma claramente que Google Read Aloud “no es un rastreador web”. Googlebot sigue enlaces para descubrir páginas y rastrea con fines de indexación y funciones de búsqueda, pero Google-Read-Aloud obtiene solo la página solicitada por el usuario y no sigue enlaces.
En otras palabras, si Googlebot es “basado en descubrimiento” y “basado en rastreo”, Google-Read-Aloud es “obtención única” y “activado en el momento de uso”. Entender esta diferencia cambia la forma de analizar los registros. Si aumenta Googlebot, piensas en frecuencia de rastreo, descubribilidad del sitio, actualizaciones de índice y temas similares. Si aumenta Google-Read-Aloud, las primeras cosas a considerar son uso de lectura en voz alta, caché, reconocimiento de metaetiquetas y condiciones de visualización del contenido. Aunque ambos están relacionados con Google, la forma de interpretarlos es completamente distinta.
El método de control también es diferente. Los rastreadores tipo Googlebot normalmente pueden controlarse mediante robots.txt. Sin embargo, como Google afirma claramente, Google-Read-Aloud no puede excluirse mediante robots.txt. La razón es sencilla: no es rastreo automatizado, sino una obtención iniciada por un usuario. No es algo controlado por reglas de rastreo como un rastreador de búsqueda. En su lugar, se usa una metaetiqueta en la página para indicar si la página participa en la función de lectura en voz alta.
Además, Google-Read-Aloud no se utiliza para evaluar páginas con el fin de mostrarlas en resultados de búsqueda. Por lo tanto, la decisión de bloquearlo está algo separada de las medidas SEO. Está más cerca de una decisión sobre experiencia de distribución y protección de derechos: si quieres ofrecer una experiencia de lectura en voz alta, si permites la conversión de tu contenido a audio, cómo manejar artículos con muro de pago y si te sientes cómodo con que tu contenido se use en los servicios de lectura en voz alta de Google. Una vez que entiendes esta diferencia, Google-Read-Aloud resulta más fácil de ver no como “otro bot de Google”, sino como parte de la infraestructura de lectura en voz alta de Google.
Por qué no puede bloquearse con robots.txt
El punto más comúnmente malinterpretado sobre este User-Agent es por qué robots.txt no funciona. La explicación oficial de Google afirma claramente que, dado que Google Read Aloud no se basa en rastreo web automatizado, sino que es iniciado por usuarios, no puedes usar un archivo robots.txt para excluirte. Esto es muy importante. En otras palabras, aunque escribas User-agent: Google-Read-Aloud como harías para un rastreador normal como Googlebot, no producirá el control previsto.
Pensar por qué ocurre esto hace que el mecanismo sea comprensible. Cuando un usuario pide “por favor, lee esta página en voz alta”, un diseño que detuviera la operación consultando robots.txt como si fuera control de rastreo dificultaría el funcionamiento mismo de la función de lectura en voz alta. Google explica que se trata de obtención basada en solicitudes de usuarios, a diferencia del rastreo basado en descubrimiento, por lo que la capa de control es diferente.
En su lugar, Google proporciona la metaetiqueta nopagereadaloud. Oficialmente, Google explica la siguiente metaetiqueta como el método para excluirse de las funciones de Google Read Aloud:
<meta name="google" content="nopagereadaloud">
Usar esta etiqueta te permite excluir esa página de Google Read Aloud. En otras palabras, mientras que robots.txt se acerca a un control de entrada para el rastreo, nopagereadaloud se acerca más a declarar si la página participa en funciones de lectura en voz alta. Entender esto aclara mucho el diseño de configuración. También permite crear políticas matizadas como “quiero que la página aparezca en búsqueda, pero no quiero que se lea en voz alta”.
Hay una advertencia. Google explica que, para reconocer la metaetiqueta en una página, Google Read Aloud puede preacceder y renderizar páginas, incluidos los recursos incrustados. En otras palabras, aunque añadas nopagereadaloud, las obtenciones iniciales de verificación pueden no llegar completamente a cero. Sin embargo, una vez que se reconoce la metaetiqueta, Google dice que el número de solicitudes posteriores disminuirá automáticamente. Este es un punto que los operadores suelen malinterpretar: aunque sientas que “añadí la etiqueta pero siguió llegando”, no debes asumir inmediatamente un error de configuración.
¿Cómo debe usarse nopagereadaloud?
nopagereadaloud es la metaetiqueta central para manejar Google-Read-Aloud. Como Google explica oficialmente, esta etiqueta se posiciona como un método de exclusión para Google Read Aloud. En otras palabras, debe usarse cuando no quieres que esa página sea manejada por el servicio de lectura en voz alta de Google.
El primer caso de uso evidente es contenido original que no deseas poner disponible para lectura en voz alta. Por ejemplo, esta etiqueta puede valer la pena para artículos largos con alto valor exclusivo para miembros, artículos explicativos en los que quieras evitar el uso externo mediante lectura en voz alta, o manuscritos con valor editorial original o restricciones de gestión de derechos. También puede ser una opción de política para páginas de marca, páginas de campaña o páginas que dependen mucho de la presentación visual y no fueron diseñadas pensando en lectura automática en voz alta.
Por otro lado, algunos contenidos funcionan bien con la lectura en voz alta. Por ejemplo, en artículos de noticias, contenido práctico, recetas, explicaciones, preguntas frecuentes y otras páginas donde entregar el texto por voz aporta valor al usuario, elegir no excluirse puede ser perfectamente razonable. Para usuarios que quieren escuchar información mientras se desplazan o trabajan, Read Aloud es una función útil. Por lo tanto, en lugar de “añadir nopagereadaloud a todo por defecto”, es más limpio elegir según la naturaleza del contenido.
Desde una perspectiva operativa, es más fácil gestionar las políticas a nivel de plantilla del CMS. Por ejemplo:
- No añadirlo a plantillas generales de artículos públicos
- Añadirlo a plantillas de artículos solo para miembros
- Añadirlo a páginas de aterrizaje y páginas de promoción de marca
- Decidir para artículos de noticias según la política editorial
Con reglas como estas, los equipos editoriales y de producción tendrán menos dudas caso por caso.
Lo importante es no tratar nopagereadaloud de forma vaga como una “etiqueta que rechaza a Google”. No rechaza Google Search en su conjunto. Indica si la página participa en la función Read Aloud de Google. Por lo tanto, separar SEO de la funcionalidad de lectura en voz alta es una perspectiva muy útil.
¿Qué debes vigilar con los artículos con muro de pago?
La explicación oficial de Google dice que para impedir que el contenido con muro de pago sea leído en voz alta, debes usar datos estructurados para contenido de suscripción y con muro de pago y establecer isAccessibleForFree en False. Este es un punto muy importante. En lugar de medidas temporales como “hacer que el texto sea más difícil de ver” u “ocultarlo con CSS”, necesitas comunicar claramente a Google mediante datos estructurados que el contenido no es accesible gratuitamente.
Esto muestra que el manejo de Google-Read-Aloud no termina con un simple control de User-Agent. Especialmente para empresas de medios y operadores que manejan artículos de pago, es importante considerar cuánto texto es visible gratuitamente, cómo se expresa en datos estructurados y qué se devuelve a una obtención sin cookies y sin estado. Si el diseño del muro de pago es ambiguo, aunque los usuarios humanos parezcan estar restringidos por el muro de pago, puede producirse exposición no intencionada de texto desde la perspectiva de una obtención basada en máquina.
Además, la ayuda de Publisher Center explica el contexto de la función de texto a voz de Google Assistant leyendo contenido de noticias como respuestas a temas de tendencia, y guía a los editores a usar nopagereadaloud si quieren excluirse. En el campo de noticias, Google-Read-Aloud no es, por lo tanto, solo una función puntual de lectura en voz alta, sino un mecanismo que puede participar en la propia experiencia de noticias. Los medios de noticias, en particular, necesitan organizar cuidadosamente sus políticas.
La conclusión práctica para negocios que manejan artículos de pago es bastante simple.
Si quieres proteger un muro de pago, organiza no solo cómo se sirve el texto del artículo, sino también los datos estructurados y tu política de exclusión de lectura en voz alta en conjunto.
Este es el enfoque más seguro. Si intentas proteger contenido solo mediante la apariencia visual del HTML, más tarde podrías descubrir brechas inesperadas. Es más seguro seguir los métodos que Google proporciona claramente y diseñar la página para que su significado se comunique mecánicamente.
Puntos prácticos que comprobar
Cuando Google-Read-Aloud aparece en los registros, lo primero que los operadores deben comprobar es qué página fue accedida. La respuesta difiere según si fue la página principal, una página de artículo, una página solo para miembros o una página que no deseas convertir a audio. Para un artículo público, puede tratarse de un uso natural de lectura en voz alta. Para una página solo para miembros, puede que necesites revisar el control de acceso o los datos estructurados.
A continuación, comprueba cuánto texto de la página se devuelve sin cookies, sin inicio de sesión y en un estado sin sesión. Google explica que Read Aloud no usa las cookies del usuario. Por lo tanto, no dependas solo de comprobarlo en tu estado habitual del navegador; inspecciona la página en condiciones de cierre de sesión o de obtención limpia. Esto es especialmente importante para sitios con visualización de texto dependiente de JavaScript, supuestos de banners de consentimiento o lógica de estado de membresía.
Si has adoptado nopagereadaloud, comprueba también si está correctamente incluido en la plantilla y si está siendo sobrescrito involuntariamente. Google dice que puede preacceder a páginas para reconocer esta metaetiqueta, por lo que es realista observar el comportamiento durante un tiempo aunque las solicitudes no se detengan completamente justo después de añadir la etiqueta. Por el contrario, si nada cambia después de varios días, deberías revisar lagunas en la aplicación de plantillas o condiciones de renderizado.
Desde una perspectiva de análisis de registros, se recomienda separar Google-Read-Aloud en su propia categoría en lugar de ponerlo en el mismo grupo que Googlebot. Si lo mezclas con rastreo de búsqueda, tu evaluación del volumen de rastreo y tus decisiones SEO pueden distorsionarse. Google-Read-Aloud es, en última instancia, una obtención de lectura en voz alta activada por el usuario, por lo que en la clasificación es más práctico tratarlo como una función de apoyo al usuario o acceso de lectura en voz alta, no como un rastreador de búsqueda.
Para operaciones de noticias y medios, también es útil conectarlo con la política editorial. Por ejemplo, puedes crear reglas como mantener disponibles para voz los artículos que quieres distribuir mediante lectura en voz alta, considerar nopagereadaloud para artículos que protegen valor de membresía y organizar extractos de noticias junto con datos estructurados. Google-Read-Aloud puede parecer un pequeño User-Agent, pero en realidad conecta con el diseño de políticas de distribución de contenido.
Conclusión
Google-Read-Aloud es el User-Agent utilizado para el servicio Read Aloud de Google, y está relacionado con la lectura de páginas web en voz alta mediante texto a voz. Según la explicación oficial de Google, no es un rastreador web, sino una obtención que opera en respuesta a solicitudes de usuarios. No sigue enlaces, muestra páginas con renderizado sin estado y no utiliza cookies del usuario. Por lo tanto, tratarlo como un rastreo de búsqueda ordinario, como Googlebot, puede conducir fácilmente a una interpretación errónea.
El punto especialmente importante es que no puedes excluirte con robots.txt. Si quieres excluir una página de la lectura en voz alta, usa la metaetiqueta nopagereadaloud proporcionada por Google. Para artículos con muro de pago, también se recomienda organizar los datos estructurados con isAccessibleForFree establecido en False. En otras palabras, manejar Google-Read-Aloud tiene menos que ver con la optimización de búsqueda y más con diseñar la experiencia de distribución y la protección del contenido.
Este conocimiento es especialmente útil para personas involucradas en medios de noticias, medios propios, operaciones de contenido para miembros, SEO, sistemas de información, administración de servidores y monitoreo de registros. Cuando Google-Read-Aloud aparezca en los registros de acceso, no lo descartes simplemente como un bot desconocido. En su lugar, úsalo como una señal para comprobar cómo aparece esta página ante la función de lectura en voz alta de Google.
La conclusión puede resumirse así:
Google-Read-Aloud no es rastreo de búsqueda, sino acceso activado por el usuario para uso de lectura en voz alta. Si quieres detenerlo, usa nopagereadaloud en lugar de robots.txt. Para artículos de pago, diseña incluyendo datos estructurados.
Con esta comprensión, puedes evitar que una sola línea de registro te desestabilice y decidir con calma cómo trabajar con las funciones de lectura en voz alta.
