大数据建模概述课件.pptxVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

?基本过程是通过多个学科技术的融合,实现数据的抽取、管理和分析,达到发现新知识和规律的目的。?信息挖掘是机器学习与数据库技术的交叉;?利用机器学习的技术分析海量的数据;?利用数据库技术来管理海量的数据。

模型构建通常包括模型建立、模型训练、模型验证和模型预测四个步骤,但根据不同的数据挖掘类型,在应用上会有一些细微的不同。模型的建立是一个反复的过程,需要仔细考察不同的模型以判断哪个模型对问题是最有用的。

?人工智能?机器学习?分布式计算?统计学?推荐算法?商务智能?模式识别?联机分析处理?数据库技术

?目前大数据有一个前提就是数据。医疗领域的数据有几种类型,比较完整的是医学影像的数据,像X光、CT,甚至还包括B超、脑电。这个领域有一些研究,比如说如何通过医学影像的自动分析来确定病变的位置,现在有很多放射治疗要对癌细胞的位置进行辐射,范围越小,接受的辐射量就越小,对病人本身的损害就越小,利用大数据的分析方法可以确定这个范围。这个技术现在刚刚产生,按照刚才的推断,医学技术的产生到使用的时间段越来越短,我们预测到2025年,一个技术的产生到使用基本上可以在一年之内完成。这是医学影像的数据。

?还有一类数据是电子病例、电子健康档案。这类数据的获取还是非常多的,有些技术是基于病人的相似度,比较两个患者的病例,如果相似的话,可以找到一群相似的病人,然后分析有效的治疗手段是什么。像这样的技术,IBM已经把它变成了产品。这依赖于大量的数据积累,要依靠电子病例、电子医疗档案的完善,需要搜集准确的信息。中国的医改已经有很好的目标,需要顺利实现电子病例的完善过程。

?第三个领域是跟基因组学、蛋白组学新的治疗技术相关。这些技术已经发展到了应用的边缘。像人类的基因组测序,以前人类基因组花了十年的时间研究,现在只要花一千美元,不到一周的时间就可以测出一个人的基因组。这些数据就可以应用到个性化诊断治疗。这个对大数据的推动也是非常大的。

?[1]SetonHealthcare是采用IBM必威体育精装版沃森技术医疗保健内容分析预测的首个客户。该技术允许企业找到大量病人相关的临床医疗信息,通过大数据处理,更好地分析病人的信息。

?[2]在加拿大多伦多的一家医院,针对早产婴儿,每秒钟有超过3000次的数据读取。通过这些数据分析,医院能够提前知道哪些早产儿出现问题并且有针对性地采取措施,避免早产婴儿夭折。

?[3]它让更多的创业者更方便地开发产品,比如通过社交网络来收集数据的健康类App。也许未来数年后,它们搜集的数据能让医生给你的诊断变得更为精确,比方说不是通用的成人每日三次一次一片,而是检测到你的血液中药剂已经代谢完成会自动提醒你再次服药。

您可能关注的文档

文档评论(0)

133****6142 + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体成都美鑫可研科技文化有限公司
IP属地四川
统一社会信用代码/组织机构代码
91510100MADHJ0RX18

1亿VIP精品文档

相关文档