- 1、本文档共58页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘要
摘 要
2000年以后,中国的房地产行业得到迅速发展,一手房和二手房交易量持续攀升,房
价也在不断上涨。相对于一手房,二手房具有更多的优势,比如周边的配套、商圈、交通、
医疗、学校等公共基础设施相对于一手房更加成熟,配套设施也更加完善。从2011年起,
二手房的销量超过了一手房,二手房交易越发频繁,并产生了大量的二手房交易数据。随
着大数据技术和机器学习技术的不断发展,从这些海量的二手房交易数据中分析房源与二
手房价格之间的关系,准确评估二手房的价格具有重要的意义。一方面,准确的估价为二
手房购买者提供可靠的价格参考,让房价回归理性,推动社会公平和谐;另一方面依据准
确的估价能有效减少双方的交易风险及矛盾,促进二手房交易双方和谐共赢,进而规范二
手房交易市场,促进房地产和谐发展。
本文基于Spark 大数据处理框架,将爬取的链家网站上2010年至2020 年深圳市二手
房交易的九万多条真实成交数据作为初始数据集,结合机器学习算法,建立了基于
LightGBM 和改进的XGBoost 的模型融合的深圳市二手房估价模型,提高了房价评估的准
确性,更好的适用于房地产价格评估。主要研究内容及创新点如下:
(1)将POI (Point ofInterest)引入到数据集中,扩充了数据集,提高了房价评估精
确度。根据数据集中的经纬度,结合百度地图,对数据集进行POI 处理,使数据集更加符
POI POI
合现实意义。与未加入 的数据集评估结果相比, 数据集的加入使得评估结果更加
准确。
(2)改进了XGBoost 估价模型。基于网格有哪些信誉好的足球投注网站算法和K 折交叉验证改进了XGBoost
模型,找寻出XGBoost 估价模型中最合适的参数,有效地避免过拟合和欠拟合的发生,使
得房价评估精确度得到了提升。
(3)提出了基于LightGBM 估价模型和改进的XGBoost 估价模型相融合的二手房估
价模型。实验结果表明,LightGBM 估价模型和改进的XGBoost 估价模型进行模型融合,
可以得到比单个估价模型更好的评估效果,提高了深圳市二手房价格评估准确度。
大数据与机器学习算法相结合,克服了使用单一方法导致二手房房价评估精度低的缺
点。同时,加入的POI 增加了数据集的实际意义,提高了房价评估的精确度,丰富了二手
房价格评估的方法,为现代房地产评估提供了一种新方式。
关键词:模型融合,机器学习,兴趣点,二手房价格评估
I
目录
目录
摘 要I
AbstractII
第1章 绪论1
1.1 研究背景和意义1
1.2 研究现状4
1.2.1 房屋价格评估方法研究现状4
1.2.2 房屋价格影响因素研究现状5
1.3 主要研究内容6
1.4 论文创新点7
1.5 论文组织结构8
1.6 本章小结8
第2章 相关技术理论基础9
2.1 Spark 框架9
2.2 机器学习模型10
2.2.1 多元线性回归模型12
2.2.2 随机森林模型13
2.2.3 CatBoost 模型15
2.2.4 LightGBM 模型16
2.2.5 XGBoost 模型18
2.3 本章小结21
第3章 数据分析处理22
3.1 数据获取22
3.2 数据清洗24
3.3 数据分析25
3.4 引入POI 维度31
3.5 特征选取33
3.6 本章小结34
第4章 深圳市二手房估价模型35
4.1 估价
您可能关注的文档
- 基于PPM和ECT的虚拟学习社区用户流失的影响因素研究——以MOOC平台为例.pdf
- 基于“三维框架”的高中生计算思维评价设计研究.pdf
- 基于事件触发机制的多欧拉--拉格良日系统的协调控制.pdf
- 基于二分局部模型的微生物-疾病关联预测算法研究.pdf
- 基于具身认知理论的小学数学教学设计与实践研究.pdf
- 基于创客教育的信息技术教学对小学生创新能力的影响研究.pdf
- 基于在线评论的公共图书馆服务质量评价研究.pdf
- 基于在线评论情感分析的中文图书评价研究.pdf
- 基于学科核心素养培养的高中英语教师评价素养研究——以山东省潍坊市四所学校为例.pdf
- 基于学习支架的编程教学对小学生计算思维的影响研究.pdf
- GB/T 39560.10-2024电子电气产品中某些物质的测定 第10部分:气相色谱-质谱法(GC-MS)测定聚合物和电子件中的多环芳烃(PAHs).pdf
- 中国国家标准 GB/T 39560.10-2024电子电气产品中某些物质的测定 第10部分:气相色谱-质谱法(GC-MS)测定聚合物和电子件中的多环芳烃(PAHs).pdf
- 《GB/T 39560.10-2024电子电气产品中某些物质的测定 第10部分:气相色谱-质谱法(GC-MS)测定聚合物和电子件中的多环芳烃(PAHs)》.pdf
- GB/T 39560.302-2024电子电气产品中某些物质的测定 第3-2部分:燃烧-离子色谱法(C-IC)筛选聚合物和电子件中的氟、氯和溴.pdf
- 中国国家标准 GB/T 39560.2-2024电子电气产品中某些物质的测定 第2部分:拆解、拆分和机械制样.pdf
- 中国国家标准 GB/T 39560.302-2024电子电气产品中某些物质的测定 第3-2部分:燃烧-离子色谱法(C-IC)筛选聚合物和电子件中的氟、氯和溴.pdf
- GB/T 39560.2-2024电子电气产品中某些物质的测定 第2部分:拆解、拆分和机械制样.pdf
- 《GB/T 39560.2-2024电子电气产品中某些物质的测定 第2部分:拆解、拆分和机械制样》.pdf
- 《GB/T 39560.303-2024电子电气产品中某些物质的测定 第3-3部分:配有热裂解/热脱附的气相色谱-质谱法(Py/TD-GC-MS)筛选聚合物中的多溴联苯、多溴二苯醚和邻苯二甲酸酯》.pdf
- 中国国家标准 GB/T 39560.303-2024电子电气产品中某些物质的测定 第3-3部分:配有热裂解/热脱附的气相色谱-质谱法(Py/TD-GC-MS)筛选聚合物中的多溴联苯、多溴二苯醚和邻苯二甲酸酯.pdf
最近下载
- 人教版(2019)选择性必修第三册Unit 2 Healthy Lifestyle Reading for Writing 课件(内镶嵌视频).pptx VIP
- 国企混改合作协议范本.docx
- 体检系统操作培训.ppt VIP
- 东华云解决方案.docx VIP
- 奥铃4J28TC国五SCR系统电控原理图.pdf VIP
- INOVANCE汇川-SV600N系列伺服调试手册-中文.PDF
- 2019年大众宝来Bora原厂维修手册电路图.pdf
- 大猫英语分级阅读 六级1 Arthur's Fantastic Party课件.ppt
- 2024人教版新教材初中英语七年级上册新课程解读课件.pptx
- 四校八大名校卷 上海市复兴高级中学2021-2022学年高二下学期3月考试英语试题 逐题详解.docx VIP
文档评论(0)