サイトアイコン IT & ライフハックブログ|学びと実践のためのアイデア集

User-Agent「Google-Read-Aloud」とは?意味・ログに出る理由・robots.txtで止められない理由まで詳しく解説

blue and white miniature toy robot

Photo by Kindel Media on Pexels.com

User-Agent「Google-Read-Aloud」とは?意味・ログに出る理由・robots.txtで止められない理由まで詳しく解説

  • Google-Read-Aloud は、Google の Read Aloud サービス で使われる User-Agent です。ウェブページを テキスト読み上げ(TTS) で読み上げる機能に関係しています。
  • これは一般的な検索クローラーとは違い、ユーザーの操作によって起動する取得です。Google はこの仕組みを 「ウェブ クローラーではない」 と説明しています。
  • Google の公式説明では、Google-Read-Aloud は リンクをたどって巡回せず、ユーザーが読み上げを求めたページを ステートレス レンダリング で表示して取得します。
  • 重要なのは、robots.txt ではオプトアウトできないことです。読み上げ対象から外したい場合は、<meta name="google" content="nopagereadaloud"> を使います。
  • さらに、ペイウォール記事の読み上げを防ぎたい場合は、構造化データで isAccessibleForFreeFalse にすることが案内されています。
  • とくに、ニュースメディア運営者、Web担当者、SEO担当者、サーバー管理者、アプリ連携担当者、ログ監視担当者に役立つ内容です。アクセスログに見慣れない Google-Read-Aloud が出て不安になった方、Googlebot との違いを知りたい方、読み上げ機能への対応方針を決めたい方に向いています。

はじめに

Web サーバーのアクセスログを確認していると、ある日ふいに Google-Read-Aloud という見慣れない User-Agent が現れて、少し気になってしまうことがありますよね。名前だけを見ると Googlebot の一種のようにも思えますし、何か検索用の巡回か、それとも音声アシスタント系の取得か、最初は判断しづらい存在です。ですが、Google の公式ドキュメントを確認すると、この User-Agent は一般的な検索クローラーとは役割がかなり異なります。Google-Read-Aloud は、Google の Read Aloud サービス に使われる User-Agent で、ウェブページを テキスト読み上げ するために使われます。しかも Google は、この仕組みを明確に 「ウェブ クローラーではない」 と説明しています。

つまり、Google-Read-Aloud を見つけたからといって、まず SEO の巡回や検索順位の評価を疑う必要はありません。むしろ、これは ユーザーがページの読み上げを求めた結果として発生する取得 と理解した方が実態に近いです。Google の説明では、Read Aloud サービスは、エンドユーザーが TTS を有効にしてページにアクセスしたときに作動し、Google Go、Google Read it、Google アプリの読み上げ機能、その他の Google の読み上げ系サービスで利用されるとされています。つまり、検索インデックス作成のための常時巡回ではなく、読み上げという利用体験を成立させるための取得 なのです。

ここを誤解すると、ログの解釈がかなりずれてしまいます。たとえば Googlebot のような発見型クロールだと思い込むと、「なぜ robots.txt が効かないのか」「なぜリンクをたどらず単発で来るのか」といった挙動に違和感が出ます。しかし、Google-Read-Aloud は ユーザーが読んでほしいページだけを取る 仕組みなので、その動きを前提にするとかなり理解しやすくなります。しかも、Google はページの結果をキャッシュして帯域を節約すると説明している一方で、特定ページに複数回のリクエストが発生することもある と案内しています。つまり、ログに数回出たとしても、それだけで異常とまでは言えません。

この記事では、Google-Read-Aloud の正体、Googlebot との違い、なぜアクセスログに出るのか、robots.txt で止められない理由、nopagereadaloud メタタグの使いどころ、ペイウォール記事で気をつけたい点、そして実務での確認ポイントまで、なるべくやさしく丁寧に整理してまいります。見慣れない User-Agent を怖がるだけで終わらせず、「自分のページがどのように読み上げ対象になっているのか」 を理解するきっかけにしていただけたら嬉しいです。

Google-Read-Aloudとは何か

Google-Read-Aloud は、Google の公式ドキュメントで 「Google Read Aloud サービスのユーザー エージェント」 と定義されています。サービスの役割はとても明快で、ウェブページをテキスト読み上げ(TTS)で読むこと です。Google の説明では、ユーザーが TTS を有効にしてページを閲覧したときにこのサービスが作動し、Google Go、Google Read it、Google アプリの読み上げ機能、そしてその他の Google のテキスト読み上げサービスで使われるとされています。ですから、この User-Agent は検索、広告、サイト検証のような別用途の Google 系アクセスとは切り分けて考える必要があります。

Google はさらに、この User-Agent を 「ユーザー トリガー フェッチャー」 の一覧にも載せています。ここがとても重要です。Google には Googlebot のような一般的なクローラー、Google-Site-Verification のような確認用フェッチャー、Feedfetcher のようなフィード取得用、そしてユーザーの行動によって起動するフェッチャーがあり、Google-Read-Aloud はその ユーザー操作起点の取得系 に分類されています。つまり Google 自身が、これを検索クローラーではなく ユーザー要求に応じて動く取得機能 と位置づけているわけです。

公式ドキュメントには、現在の HTTP リクエストで用いられる User-Agent の例も掲載されています。モバイルでは、たとえば次のような形式です。

Mozilla/5.0 (Linux; Android 10; K) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/138.0.0.0 Mobile Safari/537.36 (compatible; Google-Read-Aloud; +https://support.google.com/webmasters/answer/1061943)

デスクトップでは次のような形式です。

Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/137.0.0.0 Safari/537.36 (compatible; Google-Read-Aloud; +https://support.google.com/webmasters/answer/1061943)

これを見ると、Chrome 系ブラウザーに近い形を取りながら、compatible; Google-Read-Aloud という識別子を含めていることが分かります。つまり、完全に素のブラウザーへ擬態して隠れるのではなく、識別可能な形で自分を名乗っている タイプです。なお、Google の変更履歴によると、この User-Agent は 2025 年 7 月にブラウザー版数が新しく更新されており、その理由は 古いブラウザーをサポートしないサイトにも対応しやすくするため と説明されています。

また、Google は google-speakr は非推奨になった旧名称 であり、新しい名前は Google-Read-Aloud だと案内しています。ログに古い識別子が混ざって見える場合でも、その背景にはこうした名称変更の経緯があると理解しておくと落ち着いて判断できます。つまり、Google-Read-Aloud とは、Google の読み上げサービスのために、ユーザー操作を起点にウェブページを取得する公式 User-Agent だと言えます。

なぜアクセスログに現れるのか

Google-Read-Aloud がログに出る理由は、Googlebot とかなり異なります。Google の説明では、Google-Read-Aloud は ユーザーのリクエストによってトリガーされる 仕組みです。つまり、誰かが Google の読み上げ対応機能を通じて、あなたのページを「読んで」と要求したとき、そのページ取得が発生します。これは検索エンジンの発見型クロールとは違い、ユーザーの明示的な行為に結びついたアクセス です。

たとえば、ニュース記事、解説記事、ブログ記事、ハウツー記事など、本文中心のページは読み上げ機能との相性が良いため、ユーザーがそうしたページで読み上げを使えば、Google-Read-Aloud のアクセスが記録される可能性があります。ここで大切なのは、そのアクセスが来たこと自体より、誰かがそのページを読み上げ対象として利用した可能性がある という点です。つまりログ上の一件は、単なる Bot 流入ではなく、ある種の 利用体験の発生記録 とも読めます。

Google は、Read Aloud サービスがページの結果をキャッシュして帯域を節約すると説明しています。ただし同時に、特定のページに対して複数のリクエストが発生することがある と明記しています。そのため、管理者がログを見て「同じページに何度も Google-Read-Aloud が来ている」と気づいた場合でも、直ちに異常や無限ループとは断定できません。ページの再取得、埋め込みリソースの確認、キャッシュ状態の違いなどが絡む可能性があります。

さらに Google は、Google-Read-Aloud はページを ステートレス レンダリング で表示すると説明しています。ユーザーがページを見るのと同じようにページを表示する一方で、ユーザーの Cookie は使わない とされています。ここは実務上かなり大切です。たとえば、Cookie 同意やログイン状態を前提に本文が表示されるサイトでは、人間の利用者には見えていても、Google-Read-Aloud 側には本文がそのまま見えない可能性があります。つまり、この User-Agent のログが出ているときには、「Cookie なし・状態なしのレンダリングで、本文がどこまで読めるか」 を意識する必要があります。

実際のログは、たとえば次のような形で現れます。

203.0.113.10 - - [06/May/2026:10:14:22 +0900] "GET /articles/google-read-aloud-guide HTTP/1.1" 200 15234 "-" "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/137.0.0.0 Safari/537.36 (compatible; Google-Read-Aloud; +https://support.google.com/webmasters/answer/1061943)"

この例で読み取るべきなのは、「Google の検索順位に影響しそう」ということではなく、そのページが Google の読み上げ機能から取得され得る状態にある という事実です。トップページなのか、個別記事なのか、会員ページなのか、ペイウォール記事なのかによって、意味合いは大きく変わります。Google-Read-Aloud を見つけたら、まずは恐れるより、どのページがどんな状態で外から読めているのか を確認するのが実務的です。

Googlebotとの違い

Google 系 User-Agent は種類が多いため、Google-Read-Aloud も Googlebot の一種だと思われやすいのですが、両者はかなり違います。まず最大の違いは、Google-Read-Aloud は Googlebot のようなウェブ クローラーではない という点です。Google は公式文書の中で、Google Read Aloud についてはっきり 「ウェブ クローラーではありません」 と書いています。Googlebot はリンクをたどってページを発見し、インデックスや検索機能のために巡回しますが、Google-Read-Aloud は ユーザーの求めたページだけを取得し、リンクをたどりません

つまり、Googlebot が「発見型」「巡回型」だとすれば、Google-Read-Aloud は 「単発取得型」「利用時起動型」 です。この違いを理解しておくと、ログ分析の考え方も変わります。Googlebot が増えていればクロール頻度やサイト発見性、インデックス更新などを考えますが、Google-Read-Aloud が増えているなら、まず考えるべきは 読み上げ利用の発生、キャッシュ、メタタグ認識、本文表示条件 です。同じ Google 系でも、見方がまったく違うのですね。

制御方法も違います。Googlebot 系のクローラーは、通常 robots.txt によってクロール制御できます。しかし Google-Read-Aloud は、Google が明示している通り、robots.txt ではオプトアウトできません。理由は単純で、自動巡回ではなく ユーザーが開始する取得 だからです。検索クローラーのように巡回ルールで止める対象ではなく、読み上げ機能そのものへの参加可否を ページ側のメタタグ で示す設計になっています。

また、Google-Read-Aloud は検索結果に出すための評価用ではありません。そのため、これを遮断するかどうかは SEO 施策とはやや別の判断になります。読み上げ体験を提供したいか、コンテンツの音声化を許容するか、ペイウォール記事はどう扱いたいか、Google の読み上げ対応サービスで利用されてもよいか、という 配信体験と権利保護の判断 に近いです。この違いを理解できると、Google-Read-Aloud は「Google の別名ボット」ではなく、Google の読み上げ用インフラの一部 として自然に捉えられるようになります。

robots.txtで止められないのはなぜか

この User-Agent でもっとも誤解されやすいのが、robots.txt が効かない理由 です。Google の公式説明では、Google Read Aloud は 自動のウェブクロールによるものではなく、ユーザーが開始するもの なので、robots.txt ファイルを使ってオプトアウトすることはできないと明記されています。ここは非常に重要です。つまり、Googlebot のような通常クローラーと同じ感覚で User-agent: Google-Read-Aloud を書いても、意図した制御にはなりません。

なぜこうなっているのかを考えると、仕組み上かなり納得できます。もしユーザーが「このページを読み上げて」と求めたとき、その都度 robots.txt を巡回制御のように参照して動作を止める設計では、読み上げ機能そのものが成り立ちにくくなります。Google の説明では、これは ユーザー要求ベースのフェッチ であり、発見型のクロールとは違うため、制御のレイヤーも変わるのです。

その代わりに Google が用意しているのが、nopagereadaloud メタタグです。公式には、Google Read Aloud の機能をオプトアウトする方法として、次のメタタグが案内されています。

<meta name="google" content="nopagereadaloud">

このタグを使うと、そのページは Google Read Aloud の対象外にできます。つまり、robots.txtクロールの入口制御 に近いのに対し、nopagereadaloud読み上げ機能参加の可否表明 に近いです。これを理解しておくと、設定設計がとてもすっきりします。検索には出したい、でも読み上げはさせたくない、というような細かな方針も立てやすくなります。

ただし注意点もあります。Google は、ページ上のメタタグを認識するために、Google Read Aloud が 埋め込みリソースを含むページに事前アクセスしてレンダリングすることがある と説明しています。つまり、nopagereadaloud を置いても、初回確認のための取得がまったくゼロになるとは限りません。けれど、メタタグが認識されると その後のリクエスト数は自動的に減る と案内されています。ここは運用者が誤解しやすいところで、「タグを入れたのにまだ来た」と感じても、すぐに設定ミスと決めつけない方がよいです。

nopagereadaloud はどう使うべきか

nopagereadaloud は、Google-Read-Aloud 対応の中核になるメタタグです。Google 公式の説明どおり、このタグは Google Read Aloud のオプトアウト手段 として位置づけられています。つまり、そのページを Google の読み上げサービスで扱ってほしくないときに使うべきタグです。

使いどころとしてまず考えやすいのは、読み上げ公開を望まない独自コンテンツ です。たとえば、会員向けの価値が高い長文記事、音声読み上げによる外部利用を避けたい解説記事、独自の編集価値や権利処理の都合がある原稿などでは、このタグの採用を検討する余地があります。また、ブランド表現上、テキストが機械読み上げされることを想定していないページ、キャンペーンページ、細かな視覚演出に依存するページなどでも、方針として外したい場合があるでしょう。

一方で、読み上げとの相性がよいコンテンツもあります。たとえばニュース記事、ハウツー、レシピ、解説、FAQ など、本文を音声で届けること自体が利用価値になるページ では、あえてオプトアウトしない判断も十分考えられます。特に移動中や作業中に音声で情報を聞きたい利用者にとって、Read Aloud は便利な機能です。したがって、nopagereadaloud は「とりあえず全部に入れる」より、コンテンツの性質に応じて選ぶ 方がきれいです。

運用面では、CMS テンプレート単位で付与方針を決めると管理しやすくなります。たとえば、

  • 一般公開記事テンプレートには入れない
  • 会員限定記事テンプレートには入れる
  • ランディングページやブランド訴求ページには入れる
  • ニュース記事は運営方針に応じて選択する
    といった具合です。こうしておくと、編集部や制作部門が個別に迷いにくくなります。

大切なのは、nopagereadaloud「Google を拒否するタグ」 のようにざっくり捉えないことです。これは Google 検索全体の拒否ではなく、Google の Read Aloud 機能への参加可否 を示すためのものです。ですから、SEO と読み上げ機能を分けて考える視点が、とても役立ちます。

ペイウォール記事では何に気をつけるべきか

Google の公式説明では、ペイウォール コンテンツの読み上げを防ぐには、定期購入とペイウォール コンテンツの構造化データを使用し、isAccessibleForFreeFalse に設定する よう案内されています。これは非常に大切なポイントです。単に「本文を見えにくくする」「CSS で隠す」といった対症療法ではなく、Google に対して そのコンテンツは無料アクセス対象ではない という意味を、構造化データで明示する必要があるわけです。

ここから分かるのは、Google-Read-Aloud への対応が、単純な User-Agent 制御だけでは終わらないということです。特にメディア事業者や有料記事を扱う運営者にとっては、本文がどこまで無料で見えるのか、構造化データでどう表現しているか、Cookie なし・ステートレスな取得に対して何が返るか が重要になります。もしペイウォールの設計が曖昧だと、人間には有料制限が見えているつもりでも、機械的な取得側では意図しない本文露出が起きるかもしれません。

さらに、Publisher Center のヘルプでは、Google アシスタントのテキスト読み上げ機能に関して、ニュースコンテンツを話題トピックへの回答として読み上げる文脈が説明されており、対象外にしたい場合は nopagereadaloud を使うよう案内されています。つまりニュース分野では、Google-Read-Aloud は単なる一回きりの読み上げ機能ではなく、ニュース体験の一部に関わる可能性がある仕組み とも言えます。ニュースメディアにとっては、とくに方針整理が必要な領域です。

有料記事を扱う事業者にとっての実務上の結論は、かなりシンプルです。
ペイウォールを守りたいなら、本文の出し分けだけでなく、構造化データと読み上げオプトアウト方針をセットで整える。
これがもっとも安全です。HTML の見た目だけで守ろうとすると、後から思わぬ抜け道に気づくことがあります。Google が明示している方法に沿って、意味を機械的に伝える設計にしておくと安心です。

実務で確認したいポイント

Google-Read-Aloud がログに出たとき、運用担当者が最初に見るべきなのは どのページに対するアクセスだったか です。トップページなのか、記事ページなのか、会員ページなのか、音声化してほしくないページなのかで、対応は変わります。一般公開記事なら読み上げ利用として自然かもしれませんし、会員向けページなら公開制御や構造化データを見直す必要があるかもしれません。

次に確認したいのは、そのページが Cookie なし・ログインなし・ステートレスな状態でも、どこまで本文を返しているか です。Google は、Read Aloud がユーザー Cookie を使わないと説明しています。ですから、普段のブラウザー確認だけで安心せず、未ログイン状態やクリーンな取得条件でページを点検した方がよいです。特に、JavaScript 依存の本文表示、同意バナーの前提、会員判定の実装などがあるサイトでは注意が必要です。

さらに、nopagereadaloud を採用している場合は、テンプレートに正しく入っているか、意図しない上書きがないかを確認したいところです。Google は、このメタタグを認識するためにページへ事前アクセスする場合があるとしていますので、タグ投入後すぐにリクエストが完全停止しなくても、しばらくは様子を見るのが現実的です。逆に、何日たっても変化がないなら、テンプレート適用漏れやレンダリング条件を見直すとよいでしょう。

ログ分析の観点では、Googlebot と同じ棚に入れず、Google-Read-Aloud を別カテゴリで見分ける のがおすすめです。検索クロールと混ぜると、クロール量の評価や SEO 判断がぶれてしまいます。Google-Read-Aloud はあくまで ユーザー起点の読み上げ取得 なので、分類上は検索クローラーよりも、ユーザー支援機能や読み上げ系アクセスとして扱う方が実務に合います。

また、ニュース・メディア運営では、編集方針とも結び付けて考えるとよいです。音声で届けたい記事は残す、会員価値を守る記事は nopagereadaloud を検討する、ニュース抜粋の扱いは構造化データも含めて整える、といったルールがあると、個別判断がぶれにくくなります。Google-Read-Aloud は小さな User-Agent に見えて、実は コンテンツ配信方針の設計 にまでつながるテーマです。

まとめ

Google-Read-Aloud は、Google の Read Aloud サービス のために使われる User-Agent で、ウェブページを テキスト読み上げ する用途に関係しています。Google の公式説明では、これは ウェブ クローラーではなく、ユーザーのリクエストによって作動する取得 です。リンクをたどらず、ステートレス レンダリングでページを表示し、ユーザーの Cookie は使いません。したがって、Googlebot のような通常の検索クロールと同じ感覚で扱うと、読み解きを誤りやすいです。

とくに重要なのは、robots.txt ではオプトアウトできない ことです。読み上げ対象から外したい場合は、Google が案内している nopagereadaloud メタタグを使います。また、ペイウォール記事については、isAccessibleForFreeFalse にした構造化データを整えることが推奨されています。つまり、Google-Read-Aloud 対応は、検索対策というより 配信体験とコンテンツ保護の設計 に近いテーマです。

この知識が特に役立つのは、ニュースメディア、オウンドメディア、会員制コンテンツ運営、SEO 担当、情シス、サーバー管理、ログ監視担当の方々です。アクセスログに Google-Read-Aloud が出たら、ただ見慣れない Bot として片づけるのではなく、「このページは Google の読み上げ機能からどう見えているのか」 を確認する合図として活用すると、とても実務的です。

結論としては、次のように整理できます。
Google-Read-Aloud は検索巡回ではなく、読み上げ利用のためのユーザー起点アクセスです。止めたいなら robots.txt ではなく nopagereadaloud、有料記事なら構造化データも含めて設計する。
この考え方を持っておくと、ログの一行に振り回されず、読み上げ機能との付き合い方を落ち着いて決めやすくなります。

参考リンク

モバイルバージョンを終了