交差検定(Cross-Validation, クロスバリデーション、交差確認、交差検証)後の分類表に対して、各評価指標を算出する練習問題です。
問題
クラスCの2値分類問題を考える 以下の分類表から
- 分類正解率(classification accuracy, 正解率)
- 精度(precision)
- 再現率(recall) を求めなさい
分類表(contingency table)
Cに属する | Cに属さない | |
---|---|---|
Cであると予測 | 20 | 10 |
Cでないと予測 | 15 | 30 |
解答
指標 | 値 | 計算式 |
---|---|---|
分類正解率 | 0.67 | (20+30) / (20+10+15+30) |
精度 | 0.67 | 20 / (20+10) |
再現率 | 0.57 | 20 / (20+15) |
F値 | 0.62 | 20.670.56 / (0.67+0.57) |
計算式の解説
分類表
Cに属する | Cに属さない | |
---|---|---|
Cであると予測 | a | b |
Cでないと予測 | c | d |
上の分類表に対して
- 分類正解率 = (a+d) / (a+b+c+d)
- 精度 = a / (a + b)
- 再現率 = a / (a + c)
- F値 = 2 * 精度 * 再現率 / (精度 + 再現率)
以下の(a:TP, b:FP, c:FN, d:TNに対応) スレットスコア - Wikipedia
true positive, false positive, true negative, false negative について
- 作者: 高村大也,奥村学
- 出版社/メーカー: コロナ社
- 発売日: 2010/07/01
- メディア: 単行本
- 購入: 13人 クリック: 235回
- この商品を含むブログ (42件) を見る