バリアント (variant) — 同じ問いの「1要素だけ違う双子」を作る

一言定義: 同じテンプレートの問いに対して、1つの要素だけを入れ替えて作った問のセット。本ノートでは特に「地域名だけが違う店舗クエリ群」を指す。

なぜこの用語を整理するか

GMO AI検索ラボの ai-search プロジェクトでは、本体クエリセット (query-set-v1.json, 602問) とは別に、店舗ローカル検索の地域バリアント 106問 (gv001-gv106) を独立 ID 空間で管理している。「同じクエリを地域名だけ変えて並べた群」をなぜ別管理するか、その理屈を残しておく。

バリアントとは何か（概念）

科学実験の基本原則は「条件を1つだけ変える」こと（独立変数の単一化）。残りを固定して1つだけ動かせば、観測された差はその1要素の効果と帰属できる。

NLP / LLM 評価では、この発想を踏襲して template + slot でクエリを作る:

template: 「{地域} で {業種} を探しています。おすすめは？」
slot 地域: 渋谷 / 新宿 / 梅田 / 博多 / 札幌 / 仙台 ...
slot 業種: 居酒屋 (固定)

地域 slot だけ動かして生成された問の集合が 地域バリアント (regional variant)。本体600問が「業種×intent×factual性」の3次元設計なのに対し、バリアント群は「地域」1次元だけを動かす単純構造を持つ。

AI検索研究での意味 — 地域感応度を測る

地域バリアントで何が分かるか:

地域感応度 (regional sensitivity): 同じ業種で地域名だけ変えたとき、引用ドメイン・回答長・ブランド言及率がどう変わるか。エンジンが「地域名を真面目に解釈して回答を変えているか」が見える
ローカルブランド可視性: 地域チェーン店が、その地域のクエリでだけブランド言及されるか（C3 Brand Visibility の地域内挙動）
日本ドメイン比率の地域差: 地方都市ほど食べログ/ぐるなび依存度が上がるか、東京は公式 .jp が多いか等

本体600問では「業種×intent」交互作用を見るが、バリアント群では「地域×エンジン」交互作用を切り出して測れる。

本研究の106問構成

| 業種 | 問数 | 用途 | |---|---|---| | restaurant (飲食店) | 25 | 主軸。食べログ/ぐるなび偏重の地域差 | | medical (病院・クリニック) | 20 | EEAT 必須、公式 .jp が出るか | | real-estate (不動産) | 20 | SUUMO/HOMES 寡占度 | | travel (観光・宿泊) | 15 | じゃらん/楽天トラベル + 地域観光協会 | | legal (士業) | 10 | 弁護士.com 依存度 | | education (塾・スクール) | 10 | 地域 SEO の純度 | | 既存 (general 系) | 6 | 既存600問内のローカルテンプレ | | 合計 | 106 | id: gv001-gv106 |

12指標との接続

地域バリアント群で重点的に見る指標:

⑨ ブランド言及率: 地域チェーンが該当地域クエリでだけ拾われるか
② ソース多様性: 地方ほど寡占（食べログ1強）になるか
⑤ 日本ドメイン比率: 東京 vs 地方都市で .jp 比率が変動するか
⑦ 引用重複率: エンジン間で「同じ食べログページ」を共有しているか
⑫ DA相関: ローカル小規模サイトの DA が低くても拾われるケースがあるか

これらを「業種固定・地域可変」の条件下で見ると、本体600問では見えない局所構造が出る。

注意点

slot 以外を本当に固定できているか: 「渋谷」と「博多」では文字数も母音数も違う。これだけで tokenizer 挙動が変わる可能性があり、純粋な「地域効果」と「表層効果」を完全分離するのは難しい
地域選定バイアス: 大都市 (東京23区) ばかり選ぶと「都市バイアス」が混入。今回は政令市 + 地方中核市 + 観光地を意図的に混ぜている
n=106 は探索用: 確証的検定 (H1-H6) には足りない。あくまで本体600問の補完で、地域感応度の存在を示唆する記述統計用

参考・引用元

ドキュメント: 「query-set-v1.json (602問)」— GMO ai-search data/query-set-v1.json
ドキュメント: 「地域バリアント gv001-gv106 設計」— GMO ai-search data/variants/regional-v1.json
論文: 「GEO: Generative Engine Optimization」— Aggarwal et al., KDD 2024
論文: 「Holistic Evaluation of Language Models (HELM)」— Liang et al., TMLR 2023
論文: 「Beyond Accuracy: Behavioral Testing of NLP Models with CheckList」— Ribeiro et al., ACL 2020 (Best Paper)
レポート: SparkToro (2024). Local AI Overview Behavior.
会話: 仁紀（中村）との「バリアントとは？」TIL 化依頼（2026-05-31）

2026-05-31 作成。本体12指標シリーズの方法論補足ノート。AI検索の地域感応度を測る独立設計の理屈整理。