更新: 2026-02-15監修: 伊東 雄歩
クローラー / Crawler / Spider
クローラー
ウェブサイトを巡回して情報を収集する検索エンジンのプログラム。
技術重要度: 高
詳細説明
検索エンジンがインターネット上のウェブページを自動的に巡回し、情報を収集するプログラム。Googleの場合は「Googlebot」と呼ばれる。クローラーが収集した情報は、検索エンジンのインデックスに登録される。
使用例
クローラーがサイトを巡回しやすいようにサイトマップを設置するrobots.txtでクローラーのアクセスを制御する
関連用語
この用語が出てくるページ
関連するガイド・プレイブック・ケーススタディを自動でピックアップしています。
ガイド更新: 2026-02-14
robots.txtの書き方: SEOでやっていい/ダメな設定とテスト方法
robots.txtは「クロール制御」。noindexやcanonicalと混ぜると事故る。やっていい/ダメな設定と、Search Consoleでのテスト手順を整理。
ガイド更新: 2026-02-14
sitemap.xmlの作り方: 送信/更新/分割とよくあるミス
サイトマップは「発見の補助」。正規URLだけを載せ、内部リンクと正規化とセットで運用する。作り方とチェックリスト。
ガイド更新: 2026-02-14
インデックスされない原因と対処: Search Consoleの見方とチェックリスト
インデックス未登録を「ブロック/正規化/取得/品質/発見」に分解して最短で切り分ける。URL検査の見方と実務チェックリスト。
こんなとき更新: 2026-02-15
「検出 - 現在インデックス未登録 / クロール済み - 現在インデックス未登録」
発見もクロールもしているのに登録されない。品質と重複の可能性が高い。
こんなとき更新: 2026-02-15
noindex/robots.txtで意図せずブロックしていた
公開後にテンプレ設定が残りがち。「効いている場所」を特定して一括で直す。
こんなとき更新: 2026-02-15
ページがインデックスされない
URL検査でインデックス未登録。まず「ブロック/重複/品質/技術」のどれかを切り分ける。