niki-til

Jaccard 類似度

一言定義: 2 つの集合の「共通要素 ÷ 全要素」。0(重なりなし)から 1(完全一致)。

計算式

J(A, B) = |A ∩ B| ÷ |A ∪ B|

A と B の 共通する要素の数を、両方合わせたユニーク要素の数で割る。

具体例

A = {りんご, みかん, バナナ}(3 要素) B = {りんご, バナナ, ぶどう}(3 要素)

なぜ重要か

「順位」ではなく「集合としての一致度」を測りたいときに使う。順序を無視するので、ランキングが入れ替わっても、同じ顔ぶれなら高くなる。

AI 検索評価での出番

AI検索評価12指標 では 2 つの指標で直接使う:

弱点と派生

参考・引用元


2026-05-30 作成。AI検索評価12指標シリーズの方法論補足。⑦ ⑩ で直接使用。