- 1、本文档共4页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
基于机器学习的小麦产量预估模型设计与实现
2021年政府工作报告中提到“十四五”时期,继续保持粮食综合生产能力在13万亿斤以上,严守18亿亩耕地红线,实施高标准农田建设工程,确保种源安全。小麦作为重要的粮食资源,保障和提高小麦的产量是保障粮食安全,维护社会稳定的重要组成部分。因此,全面的、准确的了解掌握小麦的基本知识和对产量的预估成为研究的热点。
基于物联网大数据的小麦产量预估模型设计与实现,对小麦产量预测背景及意义进行了研究,并对小麦产量预估模型进行技术、经济及操作方面的可行性分析,运用数据可视化技术,对近五年小麦在不同环境下的产量进行直观展现,并据此分析出影响小麦产量的主要因素。同时采用LightGBM(简称:LGB)模型和XGBoost(简称:XGB)模型作为关键技术,构建小麦产量预估模型,将预估的小麦产量与实际产量进行比对,误差控制在5KG之内,具有良好的预测效果。
关键词:大数据;产量预测;LGB模型;XGB模型;
国内外研究现状
作物生长监测需要融合各种不同的技术,作物模型,遥感,图像处理,高级程序设计语言等技术广泛的应用与作物生长监测。赵春江、诸德辉、李鸿祥等使用计算机人工智能技术以及作物栽培技术和作物模型技术,把近三十年来作物科学的相关研究成果和作物专家的经验相结合,构建了智能化的决策系统,该系统包含了气象条件数据、社会经济条件数据和土壤条件数据等组成的数据库系统,农业科学知识组成的知识库系统,其中包含了9种类型,2个模型组成的模型库系统。可以很好的调节选择播种、施肥和病虫害防治等耕作任务,具有快速决策功能。在该决策系统的试用中发现,能够在原有产量基础上提高12%至15%,经济效益增加15%至20%,降低栽种成本5%至7%。罗骏飞等利用CGMD302作物生长监测诊断仪对稻麦叶面积指数、叶片干重以及氮素营养状况等生长指标进行检测,构建了基于稻麦叶面积指数、叶片干重以及氮素营养状况的光谱监测模型,揭示了由冠层光谱反射率及其两个波段组成的光谱植被指数与叶片氮含量之间的相关性及定量关系.
LGB模型
GBDT(GradientBoostingDecisionTree)是机器学习中一个尤为重要的模型,GBDT的主要原理是用弱分类器迭代训练来获得最优模型,通过弱分类器迭代训练产生的模型能够表现出训练效果好、不易过拟合等优势。一般被用于多分类、有哪些信誉好的足球投注网站排序等任务;也是数据挖掘竞赛中也是重要的模型之一,据统计Kaggle上的比赛有一半以上的冠军方案都是基于GBDT。而LGB(LightGBM)模型是实现GBDT算法的框架,它支持高效率的并行训练,而且具备更快的训练速度、更低的内存消耗、更好的准确率、支持分布式能够快速处理海量数据等优势。
GBDT在每一次的迭代时,都会对整个训练数据进行多次遍历,如果把整个训练数据装进内存中,就会严重限制训练数据的大小,如果不装进内存,重复地读写训练数据会消耗大量的时间,所以LGB模型的提出就是为了解决GBDT在海量数据中遇到的问题,让GBDT可以更好的用于工业实践中。
LGB采用Leaf-wise的增加策略,该策略的过程是每次从当前叶子中,找到分裂增益最大的一个叶子,然后对其进行分裂,如此循环。因此Leaf-wise的优势在于在分裂次数相同的状况下,Leaf-wise能够使偏差更小,可以获得更高的精度;而Leaf-wise的缺点在于可能会长出较深的决策树,产生过拟合。因此LGB会在Leaf-wise之上增加了最大深度的限制,在防止过拟合的同时保证较高的效率。
LGB使用的是Histogram算法,它的基本思想就是把连续的浮点特征值离散化成k个整数,同时再构造一个宽度为k的直方图,在进行一次遍历后,直方图对需要的统计量进行累计,然后根据离散值,寻找最佳分割点。LGB在数据并行中使用分散规约把直方图合并的任务分配到不一样的机器中,便于通讯和计算,并利用直方图作差,进一步减小了一半的通讯量。
在本文中LGB的作用是对小麦数据进行训练,分析出各因素对小麦产量的重要度,从而对小麦产量的预估更加准确。
XGB模型
XGB(XGBoost)是boosting算法的一种,该模型以决策树为基础的一种梯度提升算法。XGB的原理是通过多次迭代,每次迭代产生一个弱分类器,每个分类器在上一轮分类器的残差基础上进行训练。对弱分类器的要求一般是足够简单即可,并且是低方差和高偏差的作为弱分类器,因为训练的过程是不断通过降低偏差来提升最终分类器的精度。由于高偏差和简单作为要求,会使每个分类回归树的深度不会很深。最终的分类器是将每轮训练得到的弱分类器加权求和后得到的,也就是加法模型。
传统GBDT在优化时只用到一阶导数信息,而XGB还用到了对函数进行了二阶导数的泰勒展开公式,同时用到了一阶和二阶导数信息。XGB支持自定义代
文档评论(0)