一、混淆矩阵(Confusion Matrix):
在中,混淆矩阵(confusion matrix)是可视化工具,一般也叫做匹配矩阵。
混淆矩阵的每一列代表了预测类别,每一行代表了数据的真实归属类别,每一列的总数表示预测为该类别的数据的数目(即通过算法被分为该类的数目),每一行的数据总数表示该类别的数据实例的数目
如下表,第一行第一列中的43表示有43个实际归属第一类的实例被预测为第一类,第一行第二列中的5表示有5个实际归属第二类的实例被预测为第一类。同理,第二行第一列的2表示有2个实际归属为第二类的实例被错误预测为第一类。
如有150个样本数据,这些数据分成3类,每类50个。分类结束后得到的混淆矩阵为:
类1 |
类2 |
类3 |
|
类1 |
43 |
5 |
2 |
类2 |
2 |
45 |
3 |
类3 |
0 |
1 |
49 |
每一行之和为50,表示50个样本,
第一行说明类1的50个样本有43个分类正确,5个错分为类2,2个错分为类3。
源自:https://www.sohu.com/a/135668355_556897
二、多分类情况下,精确率与召回率的求解方法
(1)通过网络资源查找,基本论述是:
对于多分类问题,把每个类别单独视为”正“,把其它剩余的类别都视为”负“,按照二分类情况时的求解方法,求出此时的精确率与召回率,然后再取平均即可。
所主要查看的资源:
https://www.zhihu.com/question/51470349
https://www.zhihu.com/question/56403549
http://wenda.chinahadoop.cn/question/2168
(2)根据混淆矩阵,计算精确率与召回率的示例代码:
https://blog.csdn.net/sihailongwang/article/details/77527970
https://blog.csdn.net/lanchunhui/article/details/51221729
(3)关于精确率、召回率和F值概念的介绍:
https://www.cnblogs.com/Zhi-Z/p/8728168.html
(4)利用fit_generator来获得混淆矩阵:
https://blog.csdn.net/xfjjs_net/article/details/84798470
示例2:
https://blog.csdn.net/lulujiang1996/article/details/81540321
fit_generator的用法:
https://blog.csdn.net/xfjjs_net/article/details/84798045
(5)利用Python绘制混淆矩阵图:
https://blog.csdn.net/kane7csdn/article/details/83756583
(6)混淆矩阵、AUC和ROC
https://blog.csdn.net/u012735708/article/details/82877501
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/38200.html