ブログ記事がGoogleにインデックスされない:完全トラブルシューティングガイド
あなたのブログ記事はGoogleから見えていません。検索エンジンがブログコンテンツをスキップする正確な理由と、ブログ特有のインデックス障害を解消する方法を学びましょう。
このガイドの内容
あなたのブログ記事はGoogle Search Consoleの「検出 — インデックス未登録」または「クロール済み — インデックス未登録」のキューに留まっています。ブログコンテンツは、アーカイブ、カテゴリー、タグ、日付ベースのURLのウェブの中に存在しているため、独自のインデックス課題に直面します。これらがクロールの注目を奪い合い、重複コンテンツのシグナルを生み出します。
本ガイドでは、ブログ記事がインデックスされない原因となる具体的なブロッカー、薄いコンテンツの検出、孤立記事の特定、アーカイブページのカニバリゼーション、SEOプラグインの誤設定を扱います。診断手順に従って、正確なインデックス問題を特定し修正してください。
ブログ記事が独自のインデックス課題に直面する理由
ブログのアーキテクチャは、比較的少量のオリジナルコンテンツから驚くほど多くのURLを生成します。1本のブログ記事は次のような場所に表示される可能性があります。
- メインのブログフィード
- カテゴリーアーカイブ内
- 複数のタグアーカイブ
- 日付ベースのアーカイブ
- 著者ページ
- サイトの内部検索によって生成された検索結果ページ
これらの各ページには記事の抜粋または全文が含まれており、それぞれが固有のURLを持っているため、Googleは独立してクロールし評価しなければなりません。
このURLの増殖は2つの深刻な問題を生み出します。
- 1クロールバジェットを浪費します。 Googleは、特定の期間内にサイトでクロールするページ数を有限に割り当てています。ブログが公開する記事1本あたり15のアーカイブURLを生成する場合、Googleはクロールバジェットのほとんどを実際のコンテンツではなく、これらの派生ページに費やす可能性があります。200本の記事に加えて30のタグ、15のカテゴリー、日付ベースのアーカイブを持つブログは、すべて重複したコンテンツを含む3,000以上のURLを簡単に生成できます。
- 1Googleの正規化を混乱させます。 Googleが7つの異なるURLで同じ段落のテキストを見つけた場合、どのURLが「オリジナル」かを決定する必要があります。canonicalタグが正しく設定されていない場合、またはアーカイブページが個別の記事よりも多くの内部リンクの重みを持っている場合、Googleはアーカイブページをインデックスし、実際のブログ記事を完全にスキップすることを選択する可能性があります。これはアーカイブのカニバリゼーションと呼ばれ、ブログ記事がインデックスされない最も一般的な原因の1つです。
もう1つのブログ特有の要因は、コンテンツの新鮮さです。Googleのクロールスケジューラーは、定期的に新しいコンテンツを公開するサイトを優先し、散発的にしか公開しないサイトを優先順位を下げます。1月に10本の記事を公開し、その後6月まで何もしなかった場合、Googleはそのギャップ中にあなたのクロールレートを下げた可能性があります。最終的に新しいコンテンツを公開しても、クローラーがサイトをあまり頻繁に訪問していないため、Googleが発見してインデックスするまでに時間がかかります。
最後に、ブログ記事は他のページタイプよりも薄いコンテンツの問題に苦しむ可能性が高いです。素早い考えやステータス更新に相当する150ワードのブログ記事は、Googleのインデックス用品質しきい値を満たさない可能性があります。Googleは独自の価値をほとんど提供しないページのインデックスを避けようとすると公に述べており、トピックを包括的に扱わない短いブログ記事はその基準を下回ることがよくあります。
アーカイブページのカニバリゼーションを診断する
アーカイブのカニバリゼーションは、Google Search Consoleでエラーをまったく引き起こさないため、最も気づきにくいブログのインデックス問題の1つです。あなたのサイトは正しく機能しているように見え、GoogleはあなたのURLをクロールしています。問題は、Googleが間違ったURLをインデックスすることを選択していることです。
アーカイブのカニバリゼーションを診断するには、次のようにします。
- 1ユニークな文章を検索します。インデックスされていないブログ記事の1つから、インターネット上のどこにも表示されない可能性が高い文章をコピーし、引用符で囲んでGoogleで検索します。表示される結果が個別のブログ記事URLではなくカテゴリーまたはタグのアーカイブページである場合、カニバリゼーションが確認されました。
- 1Google Search ConsoleのURL検査ツールを確認します。インデックスされていないブログ記事のURLを入力し、「Googleが選択した正規URL」フィールドを見てください。Googleが別のURLを正規として選択している場合、それがGoogleがそのコンテンツの「オリジナル」バージョンと見なすURLです。
- 1Google Search Consoleからページレポートをエクスポートし、ブログ記事のURLパターンでフィルタリングして大規模に監査します。インデックスされたブログ記事URLのリストを、公開された記事の完全なリストと比較してください。インデックスされたリストから欠けている記事は、さらなる調査の候補です。
アーカイブのカニバリゼーションの修正には、3つのアクションが含まれます。
- 1すべてのタグ、日付、著者アーカイブページに`noindex`メタタグを追加します。これらのページは、すでにサイト上にいるユーザーにとってナビゲーション目的を果たしますが、インデックスを正当化するのに十分な独自の価値を提供することはまれです。
- 1すべての個別のブログ記事に、自身のURLを指す自己参照canonicalタグを確保します。
- 1アーカイブのリストを主要な内部リンクメカニズムとして頼るのではなく、記事コンテンツ、サイドバー、関連記事セクション内に文脈リンクを追加することで、個別のブログ記事を直接指す内部リンクを強化します。
ブログ記事の薄いコンテンツの検出
Googleはインデックスのための公式の最小ワード数を公開していませんが、何千ものブログにわたるインデックスパターンの分析は、明確なしきい値効果を明らかにしています。約300ワード未満のブログ記事は、そのしきい値を超える記事よりも、「クロール済み — インデックス未登録」として分類される可能性が大幅に高いです。これは301ワードがインデックスを保証するという意味ではありませんが、非常に短い記事は厳しい戦いに直面することを意味します。
薄いコンテンツはワード数だけの問題ではありません。 他の何十ものサイトで利用可能な一般情報だけで構成された500ワードのブログ記事は、独自の価値を追加しないため薄いと見なされる可能性があります。GoogleのHelpful Contentシステムは、ページが検索結果ですでに利用可能なものを超えて、独自の情報、分析、洞察を提供するかどうかを評価します。
ブログの薄いコンテンツを監査するには、Google Search Consoleからインデックスされていないすべてのブログ記事のリストをエクスポートします。次に、各記事のワード数とコンテンツ品質を確認します。パターンを探します。
- インデックスされていない記事は、インデックスされている記事よりも一貫して短いですか?
- すでに何十もの競合記事が存在するトピックを扱っていますか?
- 画像、例、データ、独自の分析が欠けていますか?
薄いコンテンツの修正はさまざまです。
- 追加のセクション、例、実用的なガイダンスを加えて記事を拡張し、品質しきい値を超えるようにします
- 関連する薄い記事を1つの包括的な記事に統合し、古いURLから301リダイレクトで新しい記事へ転送します
- 本当に提供するものがない記事を削除し、
410 Goneステータスコードを返してGoogleにコンテンツが意図的に削除されたことを伝えます
特によくある薄いコンテンツのパターンの1つは、「お知らせ」記事です。実質的な詳細を提供せずに「新機能をリリースしました」のような短い記事は、ほとんど決してインデックスされません。これらを、機能を説明し、例を示し、検索を通じて記事を見つけた人に価値を提供する詳細な記事に変換してください。
内部リンクと孤立記事の検出
孤立ページとは、サイトの他のどこからも内部リンクが指していないページのことです。ブログのアーキテクチャでは、孤立記事は驚くほど一般的です。記事が公開されたものの他の記事からリンクされず、メインナビゲーションに含まれず、メインのブログフィードの最初のページから外れてしまったときに発生します。記事がメインフィードから外れて他のページがリンクしなくなると、Googleは決して再発見しないかもしれません。
孤立したブログ記事を見つけるには、2つのリストを比較します。
- 1公開されたすべてのブログ記事URL — これをCMSから生成します
- 2内部リンクされたすべてのブログ記事URL — サイトクロールツールを使ってサイトをクロールし、すべての内部リンクを記録します
最初のリストに表示されるが2つ目には表示されないブログ記事URLは、孤立しています。
ブログの孤立記事は通常、いくつかのカテゴリーに分類されます。
- 新しいコンテンツによってメインフィードから押し出された古い記事
- ナビゲーションで目立つようリンクされていないまれにしか使われないカテゴリーやタグの記事
- 新しいサイトのリンク構造に統合されなかったサイト移行からのインポートされた記事
孤立記事の修正には、各記事への内部リンクパスの構築が必要です。
- 他のブログ記事からの文脈リンク — 関連トピックに関する新しい記事を書くときは、記述的なアンカーテキストで古い記事にリンクします
- 同じカテゴリー内の記事に動的にリンクする、すべてのブログ記事の下部にある関連記事セクション
- 主題別に整理された、すべての記事にリンクするトピックハブページまたは包括的なブログアーカイブ
既存の孤立を修正することに加えて、内部リンクを必須のステップとして含む公開ワークフローを確立して、将来の孤立を防止します。すべての新しい記事は、関連トピックに関する少なくとも2〜3本の既存記事にリンクするべきであり、少なくとも1つの既存記事は新しい記事にバックリンクするよう更新されるべきです。この双方向のリンクにより、すべての記事がブログのコンテンツグラフに接続されていることが保証されます。
SEOプラグインの誤設定の落とし穴
WordPressやその他のCMSプラットフォーム用のSEOプラグインは、インデックスディレクティブの強力な制御を提供しますが、その複雑さは誤設定が極めて一般的であることを意味します。1つの間違った設定がブログ記事のカテゴリー全体がインデックスされるのを防ぐ可能性があり、その影響は数週間または数ヶ月間明らかにならないことがあります。
最も危険な誤設定は、ブログ記事にグローバルな`noindex`ディレクティブを適用することです。Yoast SEOやRank Mathのような人気のプラグインには、各コンテンツタイプのデフォルトのインデックス動作を制御する設定があります。「ブログ記事」または「投稿」のコンテンツタイプがnoindexに設定されている場合、サイト上のすべてのブログ記事はnoindexメタタグを持つことになります。この設定は通常、プラグインの「Search Appearance」または「Titles&Meta」セクションにあります。プライマリコンテンツタイプがグローバルレベルで「index」に設定されていることを常に確認してください。
その他のよくあるSEOプラグインの落とし穴は次のとおりです。
- カテゴリーから投稿へのnoindex継承 — 一部のプラグインでは、特定のカテゴリーに
noindexを設定できます。投稿がnoindexカテゴリーにのみ割り当てられ、プラグインがカテゴリーの設定をその投稿に適用する場合、投稿自体がnoindexディレクティブを受け取る可能性があります。この動作はプラグインによって異なります。 - canonicalタグの競合 — プラグインが別のURLを指す
rel=\"canonical\"タグを生成する場合、または手動で設定して忘れた場合、Googleはcanonicalディレクティブに従い、実際の投稿URLをスキップします。インデックスされていない投稿のHTMLソースを確認し、予期しないURLを指すcanonicalタグを探してください。 - サイトマップの競合 — 一部のプラグインは、他のサイトマッププラグインやテーマの組み込みサイトマップと競合する可能性のある独自のXMLサイトマップを生成します。Googleが矛盾する情報を含む複数のサイトマップを受け取ると、インデックスが遅延または妨害される可能性があります。1つのサイトマップソースのみを使用し、ブラウザで
/sitemap.xmlに直接アクセスして、すべてのブログ記事URLが含まれていることを確認してください。
ステップバイステップガイド
Google Search ConsoleでブログURLのカバレッジを確認する
Google Search Console > ページレポートを開きます。ブログURLパターン(/blog/または/posts/)でフィルタリングします。「検出 — インデックス未登録」(クロールバジェットの問題)と「クロール済み — インデックス未登録」(品質または重複の問題)に焦点を当てます。これら2つのカテゴリーは、異なる修正を必要とする異なる根本問題を示しています。
サンプルの未インデックス記事にURL検査を実行する
異なる年代とトピックの5〜10本の未インデックス記事を選択します。URL検査ツールを使用して、「インデックス登録を許可?」(はいであるべき)、「Googleが選択した正規URL」(記事のURLと一致するべき)、「クロール日」、および「ページ取得」ステータスを確認します。結果を文書化してパターンを特定してください。
孤立記事と内部リンクのギャップを監査する
Screaming FrogまたはSitebulbでサイトをクロールし、内部リンクがゼロのすべてのURLをエクスポートします。これを未インデックス記事と相互参照します。各孤立記事について、2〜3本の関連記事を見つけ、記述的なアンカーテキストで文脈に沿ったコンテンツ内リンクを追加します。
コンテンツの品質と薄い記事のパターンを評価する
未インデックス記事をエクスポートし、ワード数で並べ替えます。300ワード未満の記事は、薄いコンテンツである可能性が高いです。500〜1,000ワードの記事については、Googleでメイントピックを検索し、上位5件と比較してください。記事が独自の価値を追加していない場合は、コンテンツの改善または統合を計画してください。
アーカイブとタクソノミーページをnoindexにする
タグ、日付、著者、カテゴリーのアーカイブページのソースを表示します。noindexがない場合、これらは投稿とクロールバジェットを競い合います。タグアーカイブ、日付ベースのアーカイブ、および著者アーカイブ(独自のプロフィールがない限り)にnoindexを設定します。カテゴリーアーカイブは個別に評価してください。
サイトマップの正確性を確認し、再インデックスのために送信する
/sitemap.xmlを開き、すべての対象記事が含まれていること、アーカイブURLが存在しないこと、404を返すURLやnoindexを持つURLがないことを確認します。Search Consoleで再送信し、優先順位の高い記事のインデックスをリクエストするか、一括送信にIndexBoltを使用してください。
継続的な公開とリンクのワークフローを確立する
すべての新しい記事について、独自の洞察を含む800ワード以上、既存記事への2本の内部リンク、自己参照canonicalを確保し、noindexがないことを確認します。公開後、新しい記事へのバックリンクを持つ2〜3本の関連記事を更新し、XMLサイトマップに表示されることを確認してください。
よくある問題と解決方法
記事が数週間にわたり「検出 — インデックス未登録」のままになっている
原因: Googleはサイトマップや内部リンクを通じてURLを見つけましたが、まだクロールする価値がないと判断しました。これは通常、外部権威が限られているためサイトのクロールバジェットの割り当てが低い場合、またはGoogleが低品質のページを多すぎると見て、ドメイン全体のクロール投資を減らしている場合に発生します。
解決方法: ブログ全体の品質シグナルを改善します。 - 薄い記事を**削除または統合**します - 重要な記事への**内部リンクを強化**します - 最高のコンテンツへの**外部リンクを構築**します Google Search Consoleの**URL検査ツール**を通じて優先度の高いURLを個別に送信するか、**IndexBolt**を使用してクロールキューをバイパスする一括インデックスリクエストを送信してください。
ブログ記事がインデックスされた後、数日以内に削除される
原因: Googleは最初に新しいコンテンツをインデックスしますが、品質再評価パスで削除します。これは、検索結果から記事がエンゲージメントシグナル(クリック、ページ滞在時間)を受け取らない場合、またはGoogleのアルゴリズムが、ウェブ上の他の場所にすでにインデックスされているページにコンテンツがあまりにも似ていると判断した場合に発生します。
解決方法: 影響を受けた記事のコンテンツの品質と独自性を改善します。 - **独自のデータ**、ユニークな例、専門家の引用を追加します - コンテンツを競合他社と差別化する**実用的なツール**を含めます - 記事が一時的に検索結果に表示されたときにクリックを生成するのに十分魅力的になるよう、**タイトルタグ**と**メタディスクリプション**を確実にしてください
ホームページとaboutページのみがインデックスされ、ブログ記事がない
原因: メインサイトとブログの間に構造的なクロール障壁がある可能性が高いです。一般的な原因には次のものがあります。 - ブログがGoogle Search Consoleで検証されていない**サブドメイン**上にある - ブログセクション全体が**クライアントサイドJavaScript**でレンダリングされている - `/blog/`ディレクトリへのクローラーをブロックする`robots.txt`ルール
解決方法: 次のチェックを進めてください。 - ブログURLに影響する**Disallowルール**がないか`robots.txt`を確認します - 該当する場合は、Google Search Consoleでブログサブドメインを**個別に検証**します - ブログページのソースを表示して、ブログ記事のリンクが**初期HTML**に存在し、ページ読み込み後にJavaScriptによって注入されていないことを確認します - Googleが通常のクロール中にブログセクションを発見できるよう、メインナビゲーションから**ブログへの目立つリンク**を追加します
古いブログ記事はインデックスされているが、新しい記事はインデックスされない
原因: 長期間公開を停止し、Googleがサイトのクロールレートを下げたため、クロール頻度が低下した可能性があります。あるいは、最近のプラグイン更新やテーマ変更により、新しく公開された記事のみに影響するnoindexディレクティブが導入され、既存のインデックスされた記事はそのままになっている可能性があります。
解決方法: 最近の未インデックス記事のソースHTMLに`noindex`タグがないか確認します。古いインデックスされた記事と比較して、**メタタグ**、**canonical URL**、または**ロボットディレクティブ**の違いを見つけてください。 技術的な問題が見つからない場合、問題は**クロール頻度**である可能性が高いです。一貫して(少なくとも週に1回)公開し、より迅速な発見を促すために公開直後に新しい記事URLを**Google Search Console**または**IndexBolt**に送信してください。
ブログ記事はタグ/カテゴリーページにインデックスされているが、個別の記事URLはインデックスされていない
原因: アーカイブページのカニバリゼーション。Googleはタグまたはカテゴリーのアーカイブページで最初にブログ記事のコンテンツを見つけ、そのバージョンをインデックスし、個別の記事URLを重複として扱いました。これは、アーカイブページが抜粋ではなく完全な記事コンテンツを表示し、個別の記事よりも多くの内部リンクの重みを持っている場合によく起こります。
解決方法: アーカイブのカニバリゼーションを修正するために、次のアクションを実行します。 - アーカイブページを完全な記事コンテンツではなく**抜粋のみ**を表示するように切り替えます - **タグおよび日付アーカイブ**に`noindex`を追加します - 個別のブログ記事に**自己参照canonicalタグ**があることを確認します - 個別の記事URLを直接指す**内部リンク**を増やします これらの変更を行った後、影響を受けた個別の記事URLについて**再インデックス**をリクエストしてください。
プロのヒント
よくある質問
ブログ記事がインデックスされていないことを心配し始めるべきなのは、どのくらい待った後ですか?+
定期的な公開がある確立されたブログでは、通常、記事は**3〜7日**以内にインデックスされます。新しいブログでは**2〜4週間**かかることがあります。確立されたブログで2週間後に記事がインデックスされていない場合は、**URL検査ツール**を使用して具体的なブロッカーを特定してください。1ヶ月を超えるものは調査が必要です。
公開頻度はブログ記事がインデックスされるかどうかに影響しますか?+
はい。頻繁な公開はアクティブなサイトを示し、より速いクロールを獲得します。毎日公開する人は**1〜2日**以内にインデックスされ、毎月公開する人は1週間以上待ちます。ただし、低品質のコンテンツを頻繁に公開すると、インデックスを**害する**可能性があります。量だけでなく、一貫した高品質の出力を目指してください。
すべてのブログのカテゴリーページとタグページをnoindexにすべきですか?+
独自のコンテンツがない**タグページ**、**日付ベースのアーカイブ**、**著者アーカイブ**をnoindexにします。**独自の紹介コンテンツ**を持ち、検索ボリュームのあるキーワードをターゲットにしている場合のみ、カテゴリーページをインデックスのままにします。アーカイブページが単なるむき出しのリストである場合は、クロールバジェットを保つためにnoindexにしてください。
ブログ記事がインデックスされましたが、その後Googleから消えました。何が起こったのですか?+
Googleはインデックスされたページを再評価し、**ゼロクリック**を受けるもの、競合に劣るもの、またはプラグイン更新から`noindex`タグを獲得したものを削除する可能性があります。現在のステータスは**URL検査ツール**で確認してください。「クロール済み — インデックス未登録」と表示される場合は、コンテンツの品質を改善し、再送信してください。
ブログ記事が多すぎるとサイトのインデックスを害する可能性がありますか?+
はい。Googleの**Helpful Contentシステム**はサイト全体のシグナルを適用します。ほとんどの記事が薄いまたは低品質である場合、優れた記事でさえインデックスされにくくなります。最も弱いコンテンツを監査し、改善、統合、または削除して、ブログ全体でインデックス率を引き上げてください。
ソーシャルメディアのシェアはブログ記事がより速くインデックスされるのに役立ちますか?+
ソーシャルシェアはインデックスに直接影響しませんが、Googleがソーシャルプラットフォームをクロールするため、**間接的な発見シグナル**を生成します。記事をシェアすることで、Googleのクロールへの関心を高めるトラフィックが促進されます。ただし、シェアは適切な技術的セットアップや**Search Console**または**IndexBolt**経由の直接インデックスの代わりにはなりません。