サイト運営
Search Consoleで記事を早く見つけてもらう方法|サイトマップ・URL検査・canonicalの基本
Google Search Consoleで新記事を見つけてもらうために、サイトマップ送信、URL検査、robots.txt、canonical、インデックス未登録の見直し方を整理します。
新しい記事を公開しても、Googleにすぐ載るとは限りません。大事なのは「記事を出したあとに祈る」ことではなく、Googleが見つけやすい状態を作ることです。
この記事では、ポケカ総研で実際に使っているSearch Console対策を、サイトマップ、URL検査、robots.txt、canonical、インデックス未登録の見直し方に分けて整理します。
最初にやること
新記事を公開したら、まず次の順番で確認します。
- 記事URLが200で表示される
- canonicalが公開URLと一致している
- sitemap.xmlに記事URLが入っている
- robots.txtでクロールを止めていない
- Search Consoleでサイトマップを送信する
- 重要な記事だけURL検査からインデックス登録をリクエストする
Google公式でも、URL検査は少数のURL向け、サイトマップは多くのURLを知らせる方法として案内されています。
Google公式: Ask Google to recrawl your URLs
sitemap.xmlに新記事を入れる
記事を増やしたら、サイトマップにも新しいURLを入れます。
ポケカ総研では、記事ファイルから静的HTMLを生成し、そのあと `sitemap.xml` に記事URLを自動追加する形にしています。
Search Consoleに送るURLはこれだけです。
```txt https://pokeca-soken.com/sitemap.xml ```
サイトマップには、できれば `lastmod` も入れておくと更新日を伝えやすくなります。ただし、更新していないページまで毎日更新扱いにすると信頼性が落ちるので、記事は実際の更新日を使うのが無難です。
URL検査は重要記事だけに使う
URL検査からのインデックス登録リクエストは、すべてのURLに連打するものではありません。
優先するのは次のURLです。
- トップページ
- 記事一覧ページ
- 公開したばかりの記事
- 収益導線につながる記事
- クリック実績がある相場ページ
ポケカ総研なら、たとえば次のようなページを優先します。
robots.txtは「隠すため」ではなく「クロール整理」に使う
robots.txtは、Googlebotに「どこをクロールしてよいか」を伝えるファイルです。
ポケカ総研では、公開ページは許可し、ログイン・マイページ・管理ページのような検索結果に出す必要がないページをクロール対象から外しています。
```txt User-agent: * Allow: / Allow: /INDEX/ Allow: /articles/ Disallow: /INDEX/admin Disallow: /INDEX/mypage Disallow: /INDEX/login Disallow: /INDEX/signup Sitemap: https://pokeca-soken.com/sitemap.xml ```
注意点として、robots.txtは「検索結果から完全に消すための道具」ではありません。Google公式でも、robots.txtでブロックされたURLが検索結果にURLだけ出る場合があると説明されています。
canonicalとsitemapを食い違わせない
地味ですが、かなり大事です。
たとえば、ページのcanonicalが次のURLを指しているとします。
```txt https://pokeca-soken.com/articles/example/ ```
このとき、sitemap側で別のURLを送っていると、Googleに「どちらが正規URLなのか」が伝わりにくくなります。
Google公式も、同じページに対してcanonical指定とサイトマップで異なるURLを指定しないよう案内しています。
インデックス未登録が出たときに見る場所
Search Consoleでよく見るのが、次のような状態です。
- 検出 - インデックス未登録
- クロール済み - インデックス未登録
- 代替ページ(適切なcanonicalタグあり)
- 重複しています。Googleにより、ユーザーがマークしたページとは異なるページが正規ページとして選択されました
まず見るべきなのは、技術より内容です。
特に「クロール済み - インデックス未登録」は、Googleが見たうえで検索結果に出す価値をまだ判断していない状態になりやすいです。タイトルだけを変えるより、冒頭、見出し、独自の判断材料、内部リンクを見直した方が改善しやすいです。
新記事公開時のチェックリスト
新しい記事を出したら、この順番で確認します。
- 記事タイトルに検索語が入っている
- 冒頭で誰のどんな悩みに答える記事か分かる
- 公式情報や自サイトのデータなど、根拠がある
- 関連記事や相場ページへの内部リンクがある
- canonicalが記事URLを指している
- sitemap.xmlに記事URLが入っている
- robots.txtでブロックしていない
- Search ConsoleでURL検査する
ポケカ総研なら、相場記事を出したあとに該当BOXの相場ページへ内部リンクを入れるのが重要です。記事で判断軸を説明し、相場ページで最新データを確認できる形にすると、読者にも検索エンジンにも意味が伝わりやすくなります。
まとめ
Search Console対策は、裏技ではありません。
やることは地味です。
- sitemap.xmlを送る
- 重要URLだけURL検査する
- robots.txtで公開ページを止めない
- canonicalとsitemapを揃える
- インデックス未登録の記事は内容と内部リンクを直す
この5つを淡々と続けるだけで、新記事が見つからない、どのURLが正規扱いか分からない、という事故はかなり減らせます。
よくある質問
URL検査をすれば必ずインデックスされますか?
必ずではありません。Google公式でも、クロールリクエストは検索結果への即時掲載や掲載自体を保証しないと説明されています。まずは記事の品質と内部リンクを整えることが前提です。
sitemap.xmlだけ送れば十分ですか?
大量のURLを知らせるには十分役立ちます。ただし、新しく公開した重要記事はURL検査も使った方が確認しやすいです。
robots.txtでnoindexできますか?
できません。robots.txtはクロール制御のためのものです。検索結果に出したくないページは、状況に応じて `noindex` や認証制御を使う方が適切です。