大数据非结构化数据文本分析.pdf

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据非结构化数据文本分析

非结构化数据的文本分析 演讲人:陈鸿 品质 速度 创新 Copyright © ePanel All rights reserved. 从大量社会化、碎片化信息中洞察消费者 客服记录 意见信箱 微博  非结构化数据 论坛 社交网站  数据量大 留言 购物网站  口头化行文方式 博客 聊天记录 品质 速度 创新 Copyright © ePanel All rights reserved. 2 当前分析非结构化数据信息的方式 优点 缺点 人工编码分析 1. 能根据语境准确分词,进行语义 1. 人工分析速度慢 分析 2. 很难支持数据量较大的信息 人工逐条阅读分析素材,根据语 2. 对数据形式要求低,可对口头化 分析工作 行文数据分析 义进行编码统计与分析 优点 缺点 软件统计分析 1. 对规范化的行文数据分析速度快 1. 对数据形式要求高,对口头 化行文数据分析效果差 2. 支持数据量较大的分析工作 利用软件导入分析素材,可进行 2. 无法结合语境对语义进行分 析与快速查询 词频分析、词性分析、关联分析 品质 速度 创新 Copyright © ePanel All rights reserved. 3 有没有结合两种优点的分析方法 品质 速度 创新 Copyright © ePanel All rights reserved. 4 益派提供一个小案例演示供大家参考 2013年3月,我们在益派在线调查社区对消费者洗碗行为进行了话题讨论连续性研究,现摘取 其中1个话题的分析结果作为案例演示分享 企业方 招 审 转 调 会 查 员 应 管 用 理 募 核 化

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档