- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
如何在Python中创建精确召回曲线
在机器学习中使用分类模型时,我们经常使用两个指标来评估模型的质量:精确率和召回率。
精度:相对于总阳性预测的正确阳性预测。
计算如下:
精度=真阳性/(真阳性+假阳性)
召回率:相对于实际阳性总数的正确阳性预测
计算如下:
召回率=真阳性/(真阳性+假阴性)
为了可视化某个模型的精度和召回率,我们可以创建一条精度-召回率曲线。该曲线显示了不同阈值下精度和召回率之间的权衡。
以下分步示例展示了如何在Python中为逻辑回归模型创建精确召回曲线。
第1步:导入包
首先,我们将导入必要的包:
fromsklearn从sklearn导入数据
集。model_selection从sklearn导入train_test_split
。线性模型从sklearn导入LogisticRegression
。指标导入precision_recall_curve导入matplotlib。pyplot作为plt
步骤2:拟合Logistic回归模型
接下来,我们将创建一个数据集并为其拟合逻辑回归模型:
#创建具有5个预测变量的数据集X,y=数据集。make_classification(n_samples=1000,
n_特征=4,
n_informative=3,
n_redundant=1,
随机状态=0)#将数据集拆分为训练集和测试集X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=.3,random_state=0)#将逻辑回归模型拟合到数据集分类器=LogisticRegression()
分类器。适合(X_train,y_train)#使用逻辑回归模型进行预测y_score=classifier.预测概率(X_test)[:,1]
第3步:创建精确率-召回率曲线
接下来,我们将计算模型的精度和召回率,并创建精度-召回率曲线:
#计算精度和召回率precision,recall,thresholds=precision_recall_curve(y_test,y_score)#创建精度召回曲线Fig,ax=plt.次要情节()
斧头。绘图(召回率、精度、颜色=紫色)#添加轴标签来绘制ax。set_title(精确召回曲线)
斧头。set_ylabel(精度)
斧头。set_xlabel(召回)#显示绘图
plt.展示()
x轴显示召回率,y轴显示各种阈值的精度。
请注意,随着召回率的增加,精确度会降低。
这代表了两个指标之间的权衡。为了提高模型的召回率,精度必须降低,反之亦然。
当响应变量是二元时,逻辑回归是我们可以用来拟合回归模型的方法。
逻辑回归使用称为最大似然估计的方法来查找以下形式的方程:
log[p(X)/(1-p(X))]=β?0?+β?1?X?1?+β?2?X?2?+…+β?p?X?p
在哪里:
X?j:第j个预测变量
β?j?:第j个预测变量的系数估计
方程右侧的公式预测?响应变量取值为1的对数几率。
因此,当我们拟合逻辑回归模型时,我们可以使用以下方程来计算给定观测值为1的概率:
p(X)=e?β?0?+β?1?X?1?+β?2?X?2?+…+β?p?X?p?/(1+e?β?0?+β?1?X?1?+β?2?X?2?+…+β?p?X?p?)
然后我们使用一些概率阈值将观察结果分类为1或0。
例如,我们可能会说,概率大于或等于0.5的观测值将被分类为“1”,所有其他观测值将被分类为“0”。
本教程提供了如何在R中执行逻辑回归的分步示例。
第1步:导入必要的包
首先,我们将导入必要的包以在Python中执行逻辑回归:
从sklearn导入pandas作为pd导入numpy作为np
。model_selection从sklearn导入train_test_split
。线性模型从sklearn导入LogisticRegression导入指标导入matplotlib。pyplot作为plt
第2步:加载数据
对于此示例,我们将使用?《统计学习简介》一书中的默认数据集。我们可以使用以下代码来加载并
您可能关注的文档
- Copulas:超越线性相关性的依赖性建模.docx
- 从直方图到核密度估计.docx
- 极值理论:理解和预测罕见事件.docx
- 结构方程建模:揭示数据中的复杂关系.docx
- 进行功效分析以确定样本量.docx
- 空间统计的迷人世界:分析地理数据.docx
- 懒惰数据科学家掌握统计指南.docx
- 蒙蒂·霍尔问题的解释:概率、决策论以及直觉失败的原因.docx
- 朴素贝叶斯算法:您需要了解的一切.docx
- 倾斜数据解释:为什么右倾斜或左倾斜很重要.docx
- 《GB/T 25936.4-2024橡胶塑料粉碎机械 第4部分:团粒机安全要求》.pdf
- 中国国家标准 GB/T 18216.11-2024交流1 000 V和直流1 500 V及以下低压配电系统电气安全 防护措施的试验、测量或监控设备 第11部分:TT、TN和IT系统中剩余电流监视器(RCM)的有效性.pdf
- GB/T 21551.1-2024家用和类似用途电器的抗菌、除菌、净化功能 第1部分:通则.pdf
- GB/T 21551.5-2024家用和类似用途电器的抗菌、除菌、净化功能 第5部分:洗衣机的特殊要求.pdf
- 《GB/T 21551.5-2024家用和类似用途电器的抗菌、除菌、净化功能 第5部分:洗衣机的特殊要求》.pdf
- 中国国家标准 GB/T 32151.31-2024温室气体排放核算与报告要求 第31部分:木材加工企业.pdf
- 中国国家标准 GB/T 21551.5-2024家用和类似用途电器的抗菌、除菌、净化功能 第5部分:洗衣机的特殊要求.pdf
- 中国国家标准 GB/T 18978.20-2024人-系统交互工效学 第20部分:无障碍设计的工效学方法.pdf
- 《GB/T 18978.20-2024人-系统交互工效学 第20部分:无障碍设计的工效学方法》.pdf
- GB/T 32151.31-2024温室气体排放核算与报告要求 第31部分:木材加工企业.pdf
文档评论(0)