niki-til

レイテンシ (Latency)

一言定義: API リクエストを投げてから最終応答を受け取るまでの平均秒数。

なぜ重要か

計算式

Latency = Σ(応答秒数) ÷ (リクエスト数)

p50 / p95 を別途出す(外れ値の影響を見る)。タイムアウト分は別カウント(タイムアウト率も併記)。

具体例

仮想シナリオ:

Claude Opus の 8.5 秒は「精度トレードオフ」と読む。③ 正確性が高い場合、ユーザーは待つ価値ありと判断するかもしれない。

関連学術文献

ai-search プロジェクト内での運用

参考・引用元


2026-05-30 作成。AI検索評価12指標シリーズ ⑧。