ROC特性曲线简介.docx

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
接收机特性曲线(Receiver operating characteristic curve)在信号检测理论,接收机特性曲线,或者ROC,是能够描绘二类分类系统的性能的图形,通过改变二类分类系统的判别阈值。通过绘制true positive在所有positive中的比例(TPR = true positive rate,真阳性率) vs.所有误检(false positive,假阳性率)在所有negative中的比例(FPR = false positive rate),得到ROC曲线。TPR称作敏感性。FPR=1-真阴性率TNR。在信号检测理论中,接收者操作特征(receiver operating characteristic,或者叫ROC曲线)是一种对于灵敏度进行描述的功能图像。ROC曲线可以通过描述真阳性率(TPR)和假阳性率(FPR)来实现。由于是通过比较两个操作特征(TPR和FPR)作为标准,ROC曲线也叫做相关操作特征曲线。ROC分析提供了选择最优模型与并抛弃非最优模型的工具。最初在二战中由电气工程师和雷达工程师提出,并用来检测战场中的敌方目标,并引入心理学检测刺激的领域。现在在医学、放射、生物统计学、机器学习和机器挖掘等领域得到了应用。ROC 是通过比较判据变化是操作特性(TPR与FPR)得到的。基本概念:一个分类模型(分类器)是一个将一个实例映射到一个特定类的过程。分类器的结果可以是一个实数(连续输出),这些分类器中类的边界必须通过一个阈值检测,举例来说,通过血压来检测一个人是否有高血压,或者它可以作为一个离散的标签表明的类。 让我们来考虑一个两类预测问题(双分类器),其结果要么是真(p)要么是假(n)。在双分类器中有4类可能的输出。如果输出的预测是p而真实的结果也是p,那么这就叫做真阳性(TP);然而如果真实的结果是n,则这就叫做假阳性(FP)。相反的来说,一个真阴性(TF)发生在预测结果和实际结果都为n的时候,而假阴性(FF)是当预测输出是n而实际值是p的时候。为了得到一个现实世界中的恰当的例子,考虑一个检测一个人是否得一种病的测试。一个假阳性就是一个人被测试是有这种病的,但实际却没有的情况。一个假阴性就是一个人被测试是健康的,但实际却是得病的情况。 考虑实验,包含P个正实例与N的负实例,四种输出可以通过下面的统计表/混淆矩阵表示。P+N=P’+N’ROC空间的4个例子真阳性(TP);命中,hit正确的肯定真阴性(TN);正确的否定假阳性(FP)错误的肯定,假报警,/wiki/%E7%AC%AC%E4%B8%80%E7%B1%BB%E9%94%99%E8%AF%AF第一类错误假阴性(FN):miss错误的否定,未命中 /wiki/%E7%AC%AC%E4%BA%8C%E7%B1%BB%E9%94%99%E8%AF%AF第二类错误真阳性率(TPR)命中率,敏感率,recall假阳性率(FPR)错误命中率, fall-out/wiki/%E7%B2%BE%E7%A2%BA%E5%BA%A6精确度(ACC)特征 (SPC) 或者真阴性率阳性预测值(PPV)precision阴性预测值(NPV)假发现率 (FDR)/w/index.php?title=Matthews%E7%9B%B8%E5%85%B3%E7%B3%BB%E6%95%B0action=editredlink=1Matthews相关系数 (MCC)/w/index.php?title=F1%E8%AF%84%E5%88%86action=editredlink=1F1评分Source: Fawcett (2006).=P=NROC空间要生成一个ROC曲线,只需要真阳性率(TPR)和假阳性率(FPR),只要改变。TPR(=TP/(TP+FN=P))决定了一个分类器或者一个诊断测试在所有阳性样本中能正确区分的阳性案例的性能。而FPR(=FP/(FP+TN))是决定了在所有阴性的样本中有多少假阳性的判断。 通过上面的表述,可见TPR反应的是对阳性样本的识别能力;而FPR是对阴性样本的识别能力。ROC空间将FPR和TPR定义为x和y轴,这样就描述了真阳性(获利)和假阳性(成本)之间的博弈。而TPR就可以定义为灵敏度,而FPR就定义为(1-特异度),因此ROC曲线有时候也叫做灵敏度和1-特异度图像。每一个预测结果在ROC空间中以一个点代表。最好的可能预测方式是一个在左上角的点,在ROC空间坐标轴(0,1)点,这个代表着100%灵敏(没有假阴性)和100%特异(没有假阳性)。而(0,1)点被称为完美分类器。一个完全随机预测会得到一条从左下到右上对角线(也叫无识别率线)上的一个点。一个最直观的随机预测的作决定的例子就是抛硬币。随着样本数目的增加,随机分类器的R

文档评论(0)

dashewan + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档