厦门大学朱建平教授培训资料.pptx

  1. 1、本文档共42页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
厦门大学朱建平教授培训资料.pptx

;一、引言;文章结构;二、舆情来源的时空分布;二、舆情来源的时空分布;三、舆情热点话题确定;三、舆情热点话题确定;三、舆情热点话题确定;词云图(word cloud)是一种服信息文本可视化技术,通过布局算法用文字大小表示词频,并辅以多种色彩显示形式,从而直观反映词汇的重要性差异,对目标文本的关键词汇信息进行展示。“词云”概念最早由美国西北大学新闻学副教授、新媒体专业主任里奇·戈登(Rich Gordon)提出。作为极具表现力的可视化载体,近年来词云图方法广泛应用于网站导航、社会化标签呈现、web文本分析以及各种文本挖掘的可视化场景。本文分析的房地产网络舆情信息属于网络文本,该类型文本具有总体容量大、覆盖范围广的特点。通过对网络文本中出现频率较高的“关键词”予以视觉上的突出,词云图过滤掉了大量的庞杂文本信息,从而使浏览者只要一眼扫过文本就可以领略文本的主旨。;四、舆情话题分词特征分析;四、舆情话题分词特征分析;四、舆情话题分词特征分析;四、舆情话题分词特征分析;四、舆情话题分词特征分析;四、舆情话题分词特征分析;四、舆情话题分词特征分析;四、舆情话题分词特征分析;四、舆情话题分词特征分析;五、舆情话题关联分析;关联规则算法是数据挖掘中的一类重要算法,其中包含三个重要概念: ①支持度(support),指规则中所出现模式的频率,可以表示为概率P(XY),即support(XY)= P(XY); ②信任度(confidence),指蕴含的强度,若X的支持度是support(X),规则的信任度为即为:support(XY)/support(X),即条件概率P(Y|X); ③提升度(lift),反应二者关联的方向与价值,具体公式为lift(XY)=P(Y|X)/P(Y),如果该值=1,说明两个条件没有任何关联;如果1,说明A事件的发生与B事件是相斥的;一般来说,关联规则的提升度越大,其价值也就越大。;五、舆情话题关联分析;六、舆情话题倾向性分析;;;六、舆情话题倾向性分析;六、舆情话题倾向性分析;六、舆情话题倾向性分析;六、舆情话题倾向性分析;六、舆情话题倾向性分析;六、舆情话题倾向性分析;六、舆情话题倾向性分析;六、舆情话题倾向性分析;六、舆情话题倾向性分析;六、舆情话题倾向性分析;六、舆情话题倾向性分析;七、总结; 厦门大学数据挖掘研究中心 网址:/;社会服务;; 为积极响应国务院号召、支持海峡西岸经济区建设,为政府相关决策提供参考,创新团队从2009年第三季度至今已向社会各界(包括在台湾)每季度连续发布。在大数据时代的今天,团队研发的成果(金融、旅游、消费信心指数),其指数发布会的影响力愈来愈广,社会各界人士以及新闻媒体高度重视,商务部、新华社、光明日报、经济研究、中国社会科学院、福建日报、中新社、香港文汇报、厦门日报、福建省人民政府网站、人民网、文汇网、中新网、台视财经、你好台湾网、凤凰网、新浪、搜狐、腾讯网等两岸媒体和学术单位都给予了持续的关注和报道。同时,指数发布会在非海西地区的影响也正逐渐扩大,越来越多的中央及地方网站转载发布会的调查结果,累计转载媒体多达80余家。以“海西信心指数”为关键词检索网络,谷歌(Google)检索结果41.5万余条,百度486万余条,社会反响热烈。这里需要提及的是,新华社通讯“海西金融、旅游、消费信心指数”研究内容被国务院内参采纳。;

文档评论(0)

youngyu0329 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档