网站大量收购闲置独家精品文档,联系QQ:2885784924

1.3如何存储大数据.ppt

  1. 1、本文档共97页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1.3如何存储大数据

(1)研究大数据源特性和社会网络用户共同特征 (2)研究微博群体兴趣及其社会关系关联性问题描述与大数据挖掘模型 (3)建立大数据离群挖掘优化组合启发式模型 (4)大数据离群挖掘的新兴BI应用模式研究 3.4 R等与Hadoop大数据融合 集成R与Hadoop大数据; 在Hadoop Streaming中使用R; 利用R等与Hadoop大数据分析 应用机器学习做大数据分析(有监督、无监督、推荐) 不同数据库系统中导入与导出数据 3.5 交叉验证 大数据挖掘与预测的结果与实证交叉关系验证 大数据挖掘与预测的结果与实验因果交叉验证 3.6 大数据预测方法与决策流程的改善 需求驱动的预测与业务流程的改善 大数据预测与决策的方法改善 3.7异类识别方法的研究 异类的行为特征 异类的特性分析方法 4 大数据情景下的24小时知识工厂与异类知识管理 4.1 24小时知识工厂的相关研究 4.2 异类知识管理研究 参考资料 [1](印度)普贾帕提(Vignesh Prajapati), (译)李明,王威扬,孙思栋.大数据技术丛书:R与Hadoop大数据分析实战.机械工业出版.2014.11 [2](美)Charles W. Chase Jr. (作者); 漆晨曦,张淑芳 (译者).大数据预测:需求驱动与供应链变革.人民邮电出版社. 2015.6 \百度 期刊数据库 网上的资料没有一一说明的在此一并致谢! 研究问题的述评之二: 在社会计算研究领域中王飞跃等人的研究主要集中在利用复杂网络理论和典型的社会问题来研究社会系统建模、实验与分析方法、相关社会学理论研究及应用研究,而采用离群数据挖掘、SVM和分形相似不变性等思路来研究社会计算在微博中的大数据社会网络关系离群挖掘与BI应用模式还少见报道。 研究问题的述评之三: 现有挖掘研究是一种建立在文本挖掘、用户活跃指数等的假设基础上,这种假设并没有解决从大数据社会计算视角对大数据分析中离群数据分析,这种模型也很少考虑相似行为模型。 研究问题的述评之四: 离群数据的发现主要研究有三种方法:统计学的方法(Barnett,1994)、基于距离的方法(KnorrNg,1997,1998,1999)和基于偏离的方法(Angiulli,2006)。 第一种方法需要知道数据的分布模型,使用假设检验来确认离群数据的存在。 第二种是通过数据间的距离计算来确定没有足够多邻居对象的离群数据 ,但是由于需要通过抽样技术设置合适的参数,目前研究集中在距离的定义和最近邻点的邻居方法。 第三种通过数据中的某项记录对整个数据的影响及变化来确定离群数据,也就是求出数据子集的偏离程度,即相异度,但是由于事先并不知道数据的特性而相异函数的定义较为复杂。 缺乏集成研究大数据背景下的基于社会计算的分布式、异构微博离群数据挖掘问题,最终制约新一代的社会计算环境下大数据的BI管理研究和广泛应用。 2.2大数据情景下的OUTLIER研究内容 Big data 文献分析 纵观国内外研究现状可见: 1.大数据相关的研究与应用目前仍然处于起步阶段,学术研究大多局限于宏观层面。 2.企业对社交媒体和互联网中大数据的应用仍然不足,急需进一步的深入开展。 3.现在的大数据研究大多立足于信息科学,侧重于大数据的获取、存储、处理挖掘和信息安全等方面,而很少有基于管理角度落地的研究。 应用模式: 大数据的应用模式在业界出现了6类代表: (1)技术提供模式 (2)数据空间运营模式 (3)数据使能模式(阿里金融的小额信贷) (4)数字媒体模式 (5)租售信息 (6)租售数据模式 OUTLIER应用模式: 由于传统的BI应用模式是: 基于关系模型的数据仓库与数据挖掘下的典型应用,但是这种模式忽视了新一代互联网的非结构化、异构、分布多源的大数据视角下的稀有价值的挖掘与商务智能应用, 3 大数据情景下的研究方法探索 3.1文献探索中大数据分析方法 关键词 领域作者 重要期刊 图 1 基于big data 的自动文献分析与推荐方法 研究问题的自动识别 文献挖掘可视化 期刊影响自动分析 领域作者的社会网络自动分析 3.2 大数据情景下的设计科学 规则 变化 Design as an Artifact超人类与仿人类? Problem Relevance 实时、全面 Design Evaluation 多维、多视角 Research Contributions理论与实践,其他? Research Rigor 范式的变化? Design as a Search查全、查准率与有哪些信誉好的足球投注网站成本 Communication of Research-移动化、可视化简洁? 3.3 利用用户”行为指纹”创造新研

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档