- 1、本文档共58页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
A1包、山东省线下旅游大数据采集和挖掘分析服务
一、供应商资格要求
1、符合《中华人民共和国政府采购法》第二十二条的规定。
2、供应商的资质要求:无
二、技术要求
山东省旅游大数据挖掘与分析服务项目需求
一、项目背景
山东省旅游发展委员会为贯彻中央和省委、省政府的旅游工作决策部署,促进旅游改革和发展,扩大旅游投资和消费,先后实施了一系列旅游统计调查和大数据建设项目,促进了政府对旅游经济的把握和旅游产业转型升级的引导,在此过程中也积累了大量的数据。2017年,山东省将进一步拓展数据来源,提升数据管理,开展旅游大数据挖掘与分析服务项目采购,建设兼顾“调查采集—梳理清洗—汇集整合—挖掘分析—报告撰写”的大数据应用体系,为政府及旅游参与主体深化旅游供给侧结构性改革、建设十大文化旅游目的地品牌、发展全域旅游、升级乡村旅游等提供更加全面、准确的决策依据。
二、项目组成
山东省旅游大数据挖掘与分析服务项目主要由三部分组成:一是线下旅游大数据采集。至少应包括客流大数据、游客踪迹和消费调查、旅游行业单位数据、旅游网络文本、旅游产业发展动态数据等五项相关数据的采集。二是旅游大数据清洗与融合。围绕撰写分析,本部分踢出的清洗与融合的数据内容,既包括本项目要求采集的五项相关数据,也包括省旅游发展委员会通过其他渠道调查获取的入境旅游、国内旅游和城乡居民出游等相关数据。三是旅游大数据挖掘与分析。主要是将本项目采集的线下旅游大数据、省旅游发展委提供其他旅游数据进行汇集整合、挖掘分析,参照国家旅游及相关产业分类和各产业发展情况,按照四个季度、两个黄金周和五个小长假,进行11次非模式化的分项综合分析报告撰写,并分别提供word格式、微信格式和国家级省级报刊发表格式等至少三种形式和要求的综合分析报告。这三部分的主要分类项目如下:
(一)线下旅游大数据采集
主要包括以下内容,相关服务商可进行补充。
旅游客流大数据采集。包括道路、水路、铁路、民航、高速公路通行客车、旅馆业留宿人数等数据采集和梳理,周期为月度,其中超大型数据包的梳理分析软硬件平台建设由“山东省旅游大数据平台建设(A1包)”提供。
游客旅行轨迹和旅游消费典型调查数据。400名省外手机用户在山东的旅行轨迹和消费情况跟踪调查,每季度调查100名。
旅游行业单位数据。包括省公安、统计、工商、质检等部门的各类分市住宿、餐饮等旅游单位信息和增减变动情况,山东各市及省外有关统计部门发布的旅游及相关产业统计数据,采集周期为季度。
山东旅游网络文本数据。主要指利用互联网信息技术搜集评论山东旅游的相关网络文本,并分市分类进行汇总分析。
旅游产业发展动态数据。在每个季度,“春节”、“国庆”两个黄金周,每个小长假安排3-5个专业技术人员,围绕查找山东旅游业发展新情况、新问题,到山东各地进行实地调研,并在调研期间收集山东的旅游发展情况与省外、境外情况的对比分析资料。
旅游大数据清洗与融合
既包括要求采集的上述五项相关数据,也包括省旅游发展委员会通过其他渠道调查获取的入境旅游、国内旅游和城乡居民出游等相关数据。有关要求如下:
数据清理
考虑到数据的多样性和复杂性,必须对数据进行清理。运用大数据清理技术,对数据进行必要的处理:
补充遗漏值:有些记录会缺少一些字段值,而这些值对对分析结果产生很大的影响,需要通过一定的方法进行补充,如全局常量,平均值,回归拟合值等。
处理噪音数据:运用数据平滑技术,对噪音数据进行处理。如通过分箱技术来平滑噪音,使用聚类技术剔除噪音数据,使用回归分析来抹平或者剔除噪音数据。
处理不一致和冗余数据:消除来自不同数据源的相关数据的不一致性。如同一个手机号的游客,来自于酒店住宿数据源的身份证信息显示的游客客源地和手机号显示的游客客源地不一致,则需要采取一定的规则予以统一。
数据融合
运用模拟匹配技术将从不同渠道获取的数据进行融合,使数据记录更加完整。如通过把运营商的数据和游客消费数据融合起来,就能充分分析游客的行为轨迹和游客消费习惯之间的关系。
数据规约
由于采集的数据量的巨大,需要运用数据规约技术对数据进行缩减,如数据方聚集,维规约,数据压缩,数值压缩,离散化和概念分层等。
(三)旅游大数据挖掘和分析
★充分使用数据分析和挖掘技术,综合本项目采集的线上、线下旅游大数据以及山东省旅游发展委员会提供其他旅游统计数据,在每个季度的季末月,“春节”、“国庆”黄金周开始前10天,每个小长假开始前7天,组织3-5个具有宏观视野和专业技能的人员,在数据采集、清洗团队支持的基础上,形成实地调研和报告撰写团队,启动山东省旅游产业发展调查和综合分析报告撰写工作。包括对山东省17市的旅游客源、游客消费、旅游产业发展的新情况、新问题等进行深入挖掘和图文分析,以不同旅游主体为视角,分析挖掘其基本特性和在旅游市场上的表现规律,提出科学合
文档评论(0)