- 1、本文档共92页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中文摘要
摘 要
随着通信技术、无线网络以及数据挖掘技术的大力发展,城市出行轨迹数据
已经成为微观尺度下刻画人类社会和活动不可或缺的重要支撑。大量的城市出行
轨迹数据不仅能实时展示不同对象的移动信息,更重要的是通过对这些数据分析
和挖掘可以发现其中潜藏的知识与模式,从而将其更好地服务于人们的日常生活。
特别地,从海量的城市公共交通数据中发现有价值的信息吸引了国内外学者广泛
的关注。
城市公共交通作为受众最多、占用资源量最少的城市出行方式,在日载人数、
低碳节能等方面具有出租车、私家车不可比拟的优势,其运行过程中产生的乘客
刷卡信息能够很好的反映城市交通的运行状况以及人们的出行特征,是城市管理
与规划的海量数据样本。其中,基于城市公共交通出行数据,识别城市公共交通
出行网络中存在的社区,有助于城市管理部门关注特定的持卡人群、交通管理部
门规划和制定公共交通线路、持卡人基于社区的精准推荐,从而引流公交乘客,
引导绿色出行,缓解交通压力。
本文以重庆市 2017 年 3 月公共交通数据作为研究对象,针对城市公共交通出
行网络中存在的社区展开研究,首先,本文建立了一套城市公共交通出行数据的
预处理方法,利用该方法对城市公共交通刷卡数据、城市公共交通线路数据以及
城市公共交通站点数据进行数据清洗和数据准备;其次,本文提出一种基于出行
乘客换乘行为的公交车上车站点推算方法,并利用行程链理论补全完整上下车站
点;接着,本文基于通勤乘客提出了一种城市公共交通出行网络的社区发现方法;
最后,基于重庆市城市公共交通数据,本文实现了一款社交推荐平台“渝你畅行”。
本文的主要研究内容可以概括为以下几个方面:
(1)本文针对海量的公共交通站点存在位置相近性和计算效率低下的问题,
提出了一种基于网格的城市公共交通路网划分方法,该方法利用网格替换其包含
的公共交通站点,从而简化针对每一个站点的计算,提高计算效率。该方法针对
不同的网格粒度,计算各网格内公共交通站点的密度,将密网格数最多情况下对
应的网格粒度视为最优网格粒度,并利用最优网格粒度进行研究区域城市公共交
通路网划分。实验结果表明,划分的网格内站点实际距离相近,网格替代效果显
著。
(2 )本文针对一票制收费方式不记录公交车乘客上下车站点的问题,提出了
一种基于乘客换乘行为和出行链的起讫点推算方法。该方法首先对一票制公交车
刷卡数据进行聚集性分析,根据相邻乘客上车时间间隔确定站点的上车乘客,进
I
重庆大学硕士学位论文
而利用站点内乘客的换乘行为确定上车站点,而后基于行程链理论补全乘客的出
行起讫点,最后对乘客出行起讫点做了可视化展现。实验结果表明,基于该方法
确定一票制公交车乘客的出行起讫点,无需依赖外部数据,能达到较高的推算精
度。
(3 )在乘客的出行起讫点确定的基础上,本文研究了一种基于通勤乘客的社
区发现方法,并将之应用于社交推荐。该方法首先利用通勤乘客出行的规律性,
度量通勤乘客的时间、空间以及语义的相似性;其次,将获得的时间、空间、语
义的相似度用于社区发现;最后,利用通勤乘客社区发现的结果进行社交推荐。
实验结果表明,本文提出的通勤乘客社区发现算法 SST 具有较好的效果,社区内
通勤乘客间具有较高的相似性。
(4 )在通勤乘客社区发现算法的基础上,本文开发了一款立足于当前工作圈
和生活圈的社交推荐平台。平台首先对渝友推荐、热点资讯、社区共享、年度出
行报告以及基本信息维护的需求进行了分析,并基于“微信小程序
+WebService+Hadoop ”的技术架构对平台进行实现,最后将其在微信中测试使用。
关键词:公共交通;大数据;网格;起讫点计算;社区发现
II
英文摘要
Abstract
With the development of
文档评论(0)