まずやること(最短ルート)
- サイトマップに「正規URLだけ」が入っているか確認
- 送信後のステータス(取得/エラー/除外)を確認
- 内部リンクで到達できるか、重要ページからの導線を確認
- 除外理由(重複/代替ページ/ソフト404)に合わせて対処
背景・判断のポイント
サイトマップは「URL一覧を渡す」仕組みで、登録の保証ではありません。登録されない場合は、(1) 正規URLが揺れている、(2) 内部リンクで重要度が伝わっていない、(3) そもそも登録する価値が弱い、のいずれかが多いです。
実務では「サイトマップに入っている=インデックス対象」という勘違いが起きやすいので、サイトマップは“正規URLだけを入れる”のが鉄則です。
最終的に効くのは内部リンクです。サイトマップはあくまで補助として、一覧→詳細・関連記事・パンくずでクロール導線を作ります。
症状の例(あるある)
- Search Consoleでサイトマップは「成功」なのに、インデックス数が増えない
- サイトマップの「検出されたURL」が多いのに「インデックス済みURL」が少ない
- サイトマップに入っているURLが、実際は重複/リダイレクト/除外になっている
よくある原因
- サイトマップに重複URLやリダイレクトURLが混ざっている
- canonical/正規化が揺れている
- 内部リンクが弱く、重要度が伝わっていない
- 薄いページが多く、除外が増えている
確認方法
- サイトマップURLをブラウザで開き、想定URLだけか確認
- Search Console: サイトマップの「検出されたURL」と「インデックス済みURL」
チェックリスト(確認漏れ防止)
- サイトマップ内のURLが200で返るか(リダイレクト/404が混ざっていないか)
- URL形式が統一されているか(https、www、末尾スラッシュ、大小文字)
- canonicalがサイトマップのURLと一致しているか
- サイトマップに「パラメータURL」「検索結果ページ」「タグ自動生成」などが混ざっていないか
- 重要ページはサイト内の主要導線(ナビ/一覧/関連記事)から辿れるか
- 除外理由ごとに対処が決まっているか(重複=統合、ソフト404=本文補強、など)
対処
- サイトマップを「正規URLのみ」に再生成し送信
- 一覧→詳細の内部リンクを増やし、重要度を伝える
- 除外理由に応じて統合/改善/削除を実施
やってはいけない(悪化しやすい手)
- サイトマップだけ整えて、内部リンクや正規化を放置する
- 重複URLやリダイレクトURLを大量に含めたまま送信し続ける
- 除外理由を見ずに「クロールされない」と決めつける
再発防止
- サイトマップ生成をコード化し、リダイレクト/重複混入を防ぐ
- 公開後にサイトマップと除外レポートを定期点検する
よくある質問(Q&A)
サイトマップに入れたURLは必ずインデックスされますか?
いいえ。サイトマップは発見の補助です。重複や品質問題があると、クロールされても除外されることがあります。
lastmodは重要?毎日更新した方がいい?
更新がないのにlastmodだけを更新しても、品質改善にはなりません。実際に内容が変わった時に正しく更新する方が運用として安全です。
サイトマップが複数ある場合は?
ディレクトリ単位で分割し、サイトマップインデックスで束ねると管理しやすいです。どの場合も「正規URLだけを入れる」原則は同じです。