网站大量收购独家精品文档,联系QQ:2885784924

大数据相关分析综述.pdfVIP

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据相关分析综述

书第39卷 第1期 2016年1月 计  算  机  学  报 CHINESEJOURNALOFCOMPUTERS Vol.39 No.1 Jan.2016   收稿日期:20150417;在线出版日期:20150925.本课题得到国家自然科学基金U1435212、国家“九七三”重点 基础研究发展规划项目基金(2013CB329404)、山西省高等学校创新人才支持计划(2013052006)资助.梁吉业,男,1962年生,博士,教授, 中国计算机学会(CCF)理事,主要研究领域为粒计算、数据挖掘与机器学习.Email:ljy@sxu.edu.cn.冯晨娇,女,1977年生,博士研究 生,讲师,主要研究方向为数据挖掘、统计学习方法、大数据相关分析.宋 鹏,男,1979年生,博士,副教授,主要研究方向为智能决策、数 据挖掘. 大数据相关分析综述 梁吉业1) 冯晨娇1),2) 宋 鹏1),3) 1)(山西大学计算智能与中文信息处理教育部重点实验室 太原 030006) 2)(山西财经大学应用数学学院 太原 030006) 3)(山西大学经济与管理学院 太原 030006) 摘 要 大数据时代,相关分析因其具有可以快捷、高效地发现事物间内在关联的优势而受到广泛的关注,并有效 地应用于推荐系统、商业分析、公共管理、医疗诊断等领域.面向非线性、高维性等大数据的复杂特征,结合现有相 关分析方法的语义分析,文中从统计相关分析、互信息、矩阵计算、距离4个方面对大数据相关分析的现有研究成 果进行了梳理.在对统计学中的经典相关分析理论进行归纳、总结的基础上,文中从大规模数据的通用性和均等性 视角阐述了基于互信息的两个变量间非线性相关分析理论,从高维数据可计算的角度分析了基于矩阵计算的相关 系数,从非线性、高维性数据的复杂结构方面解析了基于距离的相关系数.进一步地,该文在对已有相关分析方法 进行分析与比较的基础上,围绕高维数据、多变量数据、大规模数据、增长性数据及其可计算方面探讨了大数据相 关分析的研究挑战. 关键词 大数据;相关分析;相关系数;信息熵 中图法分类号 TP18   犇犗犐号 10.11897/SP.J.1016.2016.00001 犃犛狌狉狏犲狔狅狀犆狅狉狉犲犾犪狋犻狅狀犃狀犪犾狔狊犻狊狅犳犅犻犵犇犪狋犪 LIANGJiYe1) FENGChenJiao1),2) SONGPeng1),3) 1)(犓犲狔犔犪犫狅狉犪狋狅狉狔狅犳犆狅犿狆狌狋犪狋犻狅狀犪犾犐狀狋犲犾犾犻犵犲狀犮犲犪狀犱犆犺犻狀犲狊犲犐狀犳狅狉犿犪狋犻狅狀犘狉狅犮犲狊狊犻狀犵狅犳犕犻狀犻狊狋狉狔狅犳犈犱狌犮犪狋犻狅狀, 犛犺犪狀狓犻犝狀犻狏犲狉狊犻狋狔,犜犪犻狔狌犪狀 030006) 2)(犛犮犺狅狅犾狅犳犃狆狆犾犻犲犱犕犪狋犺犲犿犪狋犻犮狊,犛犺犪狀狓犻犝狀犻狏犲狉狊犻狋狔狅犳犉犻狀犪狀犮犲牔 犈犮狅狀狅犿犻犮狊,犜犪犻狔狌犪狀 030006) 3)(犛犮犺狅狅犾狅犳犈犮狅狀狅犿犻犮狊犪狀犱犕犪狀犪犵犲犿犲狀狋,犛犺犪狀狓犻犝狀犻狏犲狉狊犻狋狔,犜犪犻狔狌犪狀 030006) 犃犫狊狋狉犪犮狋 Inthebigdatatime,correlationanalysishasattractedmuchattentionforitshigh efficiencyinanalyzinginherentrelationofthings,andbeeneffectivelyappliedtomanyfields includingrecommendersystem,businessanalytics,publicadministrationandmedicaldiagnosis. Bigdataisusualynonlinearandhighdimensional.Ontheconsiderationofthesecomplexcharac teristicsandthesemanticanalysisforexistingcorrelationanalysisapproaches,thispapergivesa discussionofexistingresearchfindingsofcorrelationanalysisforbigdata.Thediscussionis analyzedfromfouraspectsincludingstatisticalcorrelationanalysis,mutualinformation,matrix calculationanddistance.Basedonsummarizingclassicalcorrelationanalysistheoryinstatistic

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档