LLMが引用する文章の特徴
LLMは回答を生成するとき、Webページの文章をそのまま引用するケースと、要約して利用するケースがあります。どちらの場合でも「引用しやすい文章」には共通の特徴があります。
最も重要なのは「冒頭30〜50文字で結論を述べる」ことです。LLMは記事の冒頭部分を特に重視する傾向があり、ページの最初の数行に明確な定義文や結論があると、それを引用する確率が大幅に上がります。
- 冒頭に明確な定義文(〜とは、〜です)を配置する
- 箇条書きや番号付きリストで要点を整理する
- 具体的な数値・統計データを含める
- 一文一義で簡潔に記述する(長文の段落はLLMが引用しにくい)
- 質問と回答のペアを明示的に含める
引用されやすいページ構造
ページ全体の構造もLLMの引用に影響します。「逆ピラミッド構造」(結論ファースト)をベースに、見出し階層で情報を整理すると、LLMが必要な情報を効率よく抽出できます。
- H1: ページ全体のトピック(1つだけ)
- H2: 主要セクション(LLMが読み取る「チャンク」の単位)
- H3以下: 詳細の掘り下げ
- 各H2直下に2〜3文の要約を置く(LLMはH2直下を特に参照する)
- FAQセクションを設け、想定質問に直接回答する
ChatGPTに「〇〇とは?」と聞いて、自社ページが引用されるかテストする習慣をつけよう
LLMが好むコンテンツフォーマット
テキストだけでなく、表・比較リスト・定義リストなどのフォーマットもLLMの引用に影響します。特に比較系の質問に対しては、表形式のデータが引用されやすい傾向があります。
- 比較表: 製品・手法の比較をテーブルで整理する
- 定義リスト(dl/dt/dd): 用語解説に使う
- ステップ形式: 「手順1→手順2→…」で説明する
- 数値付き箇条書き: 「3つのポイント」「5つのステップ」
- Q&A形式: 質問と回答を明確にペアにする
避けるべきパターン
LLMが引用しにくい文章パターンも理解しておきましょう。以下のようなコンテンツはAIに無視される可能性が高いです。
- 結論が記事の末尾にしかない(LLMは冒頭を重視する)
- 主語が曖昧で何について語っているか不明確
- 過度な修飾語・冗長な表現
- テキストが画像内に埋め込まれている(LLMは画像内テキストを読み取りにくい)
- JavaScript描画のコンテンツ(SSR/SSGでないと読み取れない場合がある)
実践チェックリスト
- 全記事の冒頭に30〜50字の定義文・結論を配置する
- 各H2直下に2〜3文の要約を置く
- 箇条書き・番号付きリストを活用する
- 具体的な数値データを3つ以上含める
- 比較表やQ&Aセクションを設ける
- 一文を60字以内に収める(原則)
- ChatGPTで自社記事が引用されるかテストする
よくある質問
Q. LLMに引用されるためにキーワード密度を上げるべきですか?
いいえ。LLMはキーワード密度ではなく、情報の明確さ・構造・信頼性を重視します。不自然なキーワード詰め込みは逆効果です。自然な文脈で明確に回答することが最も重要です。
Q. 記事の長さはLLMの引用に影響しますか?
長さ自体よりも「情報の密度」と「構造」が重要です。長い記事でも冒頭に要約がなければ引用されにくく、短い記事でも明確な定義と構造があれば引用されやすくなります。