- 1、本文档共33页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据在信息安全领域的价值
教育资源个性化推送技术 利用GPU进行大数据并行计算和匹配 引入“有效信息量”的概念 同一资源对于不同的人,有效信息量不同 “因材施教”:资源与大量学生之间的匹配 大数据压缩与混沌加密核心引擎 核心压缩算法自主研发,支持GB级数据字典 实测性能指标达到先进水平 压缩率、压缩速度全面超越WinRAR 压缩速度超过7-zip,压缩率各有千秋 能够进行“蝴蝶效应”加密 谢谢! 大数据的现实意义 攻:利用大数据为信息安全服务 防:对大数据的信息安全保护 华南理工大学的相关研究工作 大数据在信息安全领域的价值 华南理工大学 电子与信息学院 覃健诚 博士 自我介绍 覃健诚 北京邮电大学 信息安全中心 博士毕业 目前在:华南理工大学 电子与信息学院 研究方向:网络安全,云计算 著作 《网络安全基础》,科学出版社,2011 内容列表 大数据的现实意义 攻:利用大数据为信息安全服务 防:对大数据的信息安全保护 华南理工大学的相关研究工作 大数据时代来临 抽象:大数据是什么 云计算、物联网等新技术催生大数据 涉及数据仓库、数据分析、数据挖掘等技术 大数据的特点 数据量大:TB级以上 种类多:文本、多媒体、数据库等 价值密度低:有效信息分散在海量数据中 处理速度快:要求实时、准实时获得结果 具体:大数据价值的实例 从美钞轨迹到流感预测 趣味网站:让大家输入手上美钞的序列号 积累了十年数据,能跟踪美钞流通轨迹 大量数据积累的意义 形成美钞在世界各地流动的规律 也就是世界上人群、病毒流动的规律 2009年利用数据来预测H1N1流感传播趋势 成功预测首要爆发热点在纽约、加州、德州 虚拟案例:利用大数据 跟踪现金钞票流动情况:记录钞票序号 利用大量收银台验钞机、ATM机 发现现金异常流动情况 追查洗钱源头 银行劫案与恐怖袭击的相关性分析 某地数据:银行抢劫与恐怖袭击高度相关 业务分析:暴力手段获得恐怖活动财源 破案兼预防:发生抢劫案之后提高警惕 对大数据的理解 象提炼稀土矿一样提取大数据中的价值 有价值的信息量密度很低,蕴藏总量很大 要有足够的技术条件才能提取出来 硬件条件:足够的存储容量、并行运算性能 要求能够快速获得计算结果 时间:流感爆发之后才算出结果就晚了 软件条件:算法技术水平、具体业务水平 大数据分析必须技术与业务结合在一起 大数据体现的价值高低 与数据源有关,也和信息提炼水平有关 要把有价值的信息从大量数据中分离出来 信息提炼水平不够,大数据只是无用的垃圾 提炼水平越高,能够提取出的价值越高 类比:铀矿浓缩技术 天然铀矿:约0.7% 核电站用低浓缩铀:3% 核武器用高浓缩铀:90% 内容列表 大数据的现实意义 攻:利用大数据为信息安全服务 防:对大数据的信息安全保护 华南理工大学的相关研究工作 有效利用大数据中的价值 棱镜门:监听有价值的信息 数据来源:电信部门、网络设备 关键问题:如何筛选出有价值的信息 背景噪音:大量无关的数据 相关技术举例:要求速度快 模式匹配算法:找出敏感词、句之类 概率分析算法:发现异常(小概率事件) 相关性分析算法:找到高度相关情况 棱镜门的延伸:网络信息监控 寻找特定领域的网络信息 查案:筛选特定目标人物的相关信息 整理线索:收集与线索相关的网上信息 为特定目的监测网络信息 反恐、防侵略:监控异常动向 防腐败、反洗钱:监控账务信息 防欺诈、防盗刷:监控交易信息 虚拟案例:利用大数据的网络诈骗 股票走势预测:发送大量垃圾邮件、短信 8万邮件,4万说升,4万说跌,总有一半对 说对的继续下一轮:2万说升,2万说跌 有1250人连续收到6次邮件,次次猜中 收网:针对剩下的1250人 声称有内幕消息,要求付费购买 部分人信以为真,付款 类似手法可用在球赛结果预测等其他方面 内容列表 大数据的现实意义 攻:利用大数据为信息安全服务 防:对大数据的信息安全保护 华南理工大学的相关研究工作 大数据的信息安全 大数据本身的安全 大数据存储、计算、传输过程中的安全 防止故障,防止数据差错 设备可靠性:技术保障 信息内容的安全 防范大数据中可能蕴含的敏感信息泄露 利用大数据来隐藏秘密信息 高性能计算的技术要求:又快又好 超级计算机并不是简单的硬件堆积 数据带宽要求 随着节点数增长,带宽以平方级增长 要求有先进的高速传输技术 系统可靠性要求 随着节点数增长,故障率以指数级增长 要求有高超的系统可靠性控制技术 可靠性保障技术 基本原理 冗余、备份、恢复 衍生出编码技术、存储技术、架构设计等 典型技术 存储:磁盘阵列、ECC内存、数据备份 架构:集群 编码:纠错码、校验码
您可能关注的文档
最近下载
- 电子部超级说服力.pdf VIP
- 地方化债又出新规:从35、47、14号文到134号文.docx
- (完整word版)学前教育专业简笔画教案.doc
- 《运筹学》课程教学大纲(本科).docx VIP
- 公路工程监理资料管理.ppt
- 华中农业大学 614微生物学 2016年考研真题.pdf VIP
- 参考学习资料 附件1:国铁集团工电部关于新建西至华中地区铁路煤运通道线名运营里程线路允许速度的函(审签稿).docx
- (新版)拖拉机驾驶证科目一知识考试题库500题(含答案).docx
- 人教部编2024年新改版语文五年级上册全套月考试题及答案(共4套).pdf VIP
- 17小学语文《盼》课件(共40张PPT).pptx VIP
文档评论(0)