本文介绍: 通过混淆矩阵我们可以计算出多种性能指标评估分类模型性能,如准确率(Accuracy)、精确率(Precision)、召回率(Recall)或者真正率(True Positive Rate,TPR)、假正率(False Positive Rate,FPR)以及F1分数等。混淆矩阵的优点在于它不仅提供了错误分类的数量,还告诉我们哪些别的预测错误最多,这对于改进分类算法模型调优非常有帮助。对于多分类问题混淆矩阵会更大,每一行代表实际类别,每一列代表预测类别,但计算各项指标原理二分问题相同

混淆矩阵(Confusion Matrix),又称为错误矩阵,是一种特别适用于监督学习中分类问题评估模型性能工具。在机器学习领域混淆矩阵能够清晰地显示算法模型的分类结果和实际情况之间的差异,常用二分类和多分类问题。

一个基本二分类混淆矩阵包含四个部分

  1. 真正类(True Positive, TP):模型正确预测为正类的样本数
  2. 假正类(False Positive, FP):模型错误预测为正类的样本数,实际上它们是负类。
  3. 真负类(True Negative, TN):模型正确预测为负类的样本数
  4. 假负类(False Negative, FN):模型错误预测为负类的样本数,实际上它们是正类。

混淆矩阵通常以表格形式表示,对于二分类问题,其形式如下
在这里插入图片描述
通过混淆矩阵,我们可以计算出多种性能指标评估分类模型性能,如准确率(Accuracy)、精确率(Precision)、召回率(Recall)或者真正率(True Positive Rate,TPR)、假正率(False Positive Rate,FPR)以及F1分数等。

准确率(Accuracy)是最直观的性能指标,计算公式为:

A

c

c

u

r

a

c

y

=

T

P

+

T

N

T

P

+

T

N

+

F

P

+

F

N

Accuracy = frac {TP + TN} {TP + TN + FP + FN}

Accuracy=TP+TN+FP+FNTP+TN
精确率(Precision关注的是预测为正类的样本中有多少是真正的正类,计算公式为:

P

r

e

c

i

s

i

o

n

=

T

P

T

P

+

F

P

Precision = frac {TP }{TP + FP}

Precision=TP+FPTP
召回率(Recall)或真正率(TPR)关注的是所有真正的正类样本中有多少模型预测为正类,计算公式为:

R

e

c

a

l

l

=

T

P

T

P

+

F

N

Recall = frac {TP}{TP + FN}

Recall=TP+FNTP
F1分数精确率和召回率的调和平均值,计算公式为:

F

1

=

2

(

P

r

e

c

i

s

i

o

n

R

e

c

a

l

l

)

P

r

e

c

i

s

i

o

n

+

R

e

c

a

l

l

F1 = frac {2 * (Precision * Recall) }{Precision + Recall}

F1=Precision+Recall2(PrecisionRecall)
对于多分类问题,混淆矩阵会更大,每一行代表实际类别,每一列代表预测类别,但计算各项指标原理与二分类问题相同

混淆矩阵的优点在于它不仅提供了错误分类的数量,还告诉我们哪些别的预测错误最多,这对于改进分类算法和模型调优非常有帮助。

原文地址:https://blog.csdn.net/Glass_Gun/article/details/134795797

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任

如若转载,请注明出处:http://www.7code.cn/show_44788.html

如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱suwngjj01@126.com进行投诉反馈,一经查实,立即删除

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注