- 1、本文档共4页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
浅谈数据产品形态
数据挖掘DW——数据分析微信公众号(datadw)分析整理,分享数据分
析干货文章、资料。
一、大数据的产品特性
顾名思义,“大数据产品”应该是基于大数据而设计出的产品,那么
理应符合大数据的特点,毕竟基因在那,那么回顾下大数据与(传统)数据有哪些
具体区别.
(传统)数据是通过问卷调查收集数据,或者是已存储的历史经营数据,比如
财务数据、销售数据这些,至于数据量级,可能就是一台server的存储级别。
而大数据是海量,这个海量并不是某个时间断点的量级总结,而是持续有更新,
持续有增量,那么就决定了可以”制造”出大数据产品的应该不是传统企业,而
是类似电信、银行、微博这样的平台级机构,或者依附于平台级企业的第三方机
构,亦或者是更宏观层面的政府管理机构。这些机构拥有大量用户,可以源源不
断的产生UGC数据,因此存储和计算成本必然会随之上涨,也就决定了大数据
产品的甲乙方级别,屌丝可能会被无情的淘汰出局。这些数据不仅仅是数值型的
结构化数据,还包括文本内容、图片、音视频等非结构化数据。在处理速度上,
(传统)数据使用excel或者spss,前期有严谨的方法论,后期有完善的分析处理
过程,从数据的收集到最后报表/报告的产出,这个周期可能在至少一周以上,
而大数据因为有了hadoop/storm等IT技术的支持,在处理速度上可以保证在
小时级延迟,甚至更快。这里需要补充一点的是,大数据产品是否要快速计算?
个人觉得应该是,这里的快速是相对快,不一定非要实时,毕竟在收集、存储、
计算上花了更多的成本,策略如果不及时发现,也对不起那些集群啊。那么是否
说大数据就一定比(传统)数据好了?不一定,引用祝建华老师《文科教授眼中的
大数据》里的一段话,“理论上讲大数据指的应该就是总体数据。但实际上,由
于技术、商业、必威体育官网网址和其它原因,除了少数大数据的原始拥有者,对于绝大多数
的第三方来讲,现在大家讲的大数据,基本上都不是总体数据而是局部数据。注
意,这种局部数据,哪怕占了总体的很大一个百分比(70%、80%),既不是总
体数据、也不是抽样数据。因为哪怕是缺了10%、20%的个案,局部数据跟总
体也许就有很大的差别。”所以在总体代表性上,(传统)数据可以较好的代表整体,
而大数据可能会出现偏差。但是,这个偏差并不影响大数据产品的商业应用,举
个例子,微博上每天都有各种口碑和舆情,如果涉及某个企业的负面舆情突然趋
势走高,即使在不能代表总体的情况下,你能认为这个态势不值得警惕么?当然
是不能。并且,大数据产品对使用者的要求更高了,不光关注活跃的数据,还得
关注沉默的数据。
由此,大数据产品所具备的特性应当是:1、数据量级更多;2、数
据处理速度更快;3、数据类型多样;4、使用者要求更高,那么,大数据产品
究竟长啥样?
二、大数据的产品形态
先说一个亲身经历,在家收看好声音导师考核的汪峰场,之前一直很
期待这场,毕竟汪峰的风格理念偏重社会观察,偏重人文洞察,但看到快一半的
时候,却发现很乏味,想换台,没有那英那场更黏我,如果说看上一场脸部肌肉
是松弛的话,那这一场则是紧绷的,是松弛的话,那这一场则是紧绷的,上苍、思念、回忆、故人、泪水上苍、思念、回忆、故人、泪水当这些
碎片词语不断的充斥在我的耳边时,真的不觉得这是一个娱乐节目,一个比一个
悲凉,我的诉求很简单,像看周星驰无厘头电影一样,开心一下足矣,哪怕没有
任何的教育意义。随后发了一条微博吐糟,引来众多附议。我想这应该是不少受
众当时的心态,但不代表对汪峰场的整体评价。那么,试想一下,如果你是好声
音的竞争对手,在此刻很实时的洞察到了用户的心情反馈,再通过合适的路径传
递出营销信息,受众是否会换台?答案是未知的,但想象空间是巨大的。
这个场景很恰如其分的给我们描绘出了大数据的产品形态。首先他
需要在平台级机构(微博)上监控海量数据(微博内容),这些数据是非结构化的,
通过实时计算获得洞察(拥有不满情绪的是少量群体还是大量群体,是真实声音
还是噪音污染),并快速应用(推送营销信息)。这样的例子还有很多,特别是在
营销环境里,受众的情绪不是线性稳定的,可能十分钟
您可能关注的文档
- 燃气公司安全教育培训管理制度.pdf
- 煤矿安全生产宣传教育.pdf
- 浙教版六年级上册数学学业素养评价重点知识检测.pdf
- 派出所消防管理制度(2篇).pdf
- 河南科技职业大学专升本财务管理真题.pdf
- 沟通技巧培训.pdf
- 2023年河南省开封市尉氏县水坡镇坡徐村社区工作人员(综合考点共100题)模拟测试练习题含答案.pdf
- 2023年英语专四作文范文共合集.pdf
- 2023年山东省威海市中考物理精编试卷及解析.pdf
- 2024年年度经营目标计划书精编(三篇).pdf
- 2017-2018学年广东省广州市南沙区华南师大二附中八年级上学期期中物理试卷和解析.pdf
- 2022年大学习大培训大考试试题1.pdf
- 2022年山东第一医科大学口腔医学专业《病理学》科目期末考试卷A.pdf
- 2023年统计师之中级统计师工作实务自我提分评估(附答案).pdf
- 2024年健康管理市场分析及竞争策略报告.pdf
- 2023-2024学年北京市西城区七年级上学期期末考试英语试卷含答案.pdf
- 2024版七年级上册历史第二单元大单元教学设计 .pdf
- 2024年全国软件水平考试之中级系统集成项目管理工程师考试实战演练题(详细参考解析) .pdf
- 2024小学语文五年级上册:什么比猎豹的速度更快核心素养教案单元整体设计 .pdf
- 【“双减”特色经验】“双减”背景下的小学生劳动教育 .pdf
文档评论(0)