當前位置:網站首頁>[機器學習算法面試題] 一.准確率Accuracy的局限性

[機器學習算法面試題] 一.准確率Accuracy的局限性

2022-01-28 08:02:44 Allenpandas

序言

在模型評估的過程中,分類問題、排序問題、回歸問題往往需要使用不同的指標進行評估。在諸多的評估指標中,大部分指標只能片面地反映模型的一部分性能。如果不能合理的運用評估指標,不僅不能發現模型本身的問題,而且會得出錯誤的結論。

准確率的定義

Accuracy = N(correct) / N(total)
其中,N(correct) 為正確分類的樣本數,N(total) 為總樣本數。

局限性

准確率是分類問題最簡單也是最直接的評價標准,但存在明顯的缺陷。如:當負樣本數占99%時,分類器把所有樣本都預測為負樣本也可以獲得99%的准確率。所以,當不同類別的樣本比例非常不均衡時,占比大的類別往往成為影響准確率的最主要因素。

場景舉例

在進行惡意文件檢測時,benign文件(良性文件)有99個,malware文件(惡意文件)有1個,共100個需檢測的文件。

檢測結果:99個benign文件的檢測結果全部為benign(檢測正確),但僅有的1個malware文件也被檢測成了benign文件(檢測錯誤)。

此時,Accuracy = 99/(99+1)= 99%,准確率高達99%,但唯一的malware惡意軟件卻沒有檢測出來,這即為准確率Accuracy的局限性。所以,當不同類別的樣本比例非常不均衡時,占比大的類別(本場景中指的是benign文件)往往成為影響准確率的最主要因素

版權聲明
本文為[Allenpandas]所創,轉載請帶上原文鏈接,感謝
https://cht.chowdera.com/2022/01/202201280802440862.html

隨機推薦