- 1、本文档共5页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于动态LDA主题模型的内容主题挖掘与演化_胡吉明.pdf
58 2 2014 1
第 卷 第 期 年 月
*
基于动态LDA 主题模型的内容主题挖掘与演化
■ 胡吉明 陈果
[ ] 。
摘 要 指 出文本 内容主题的挖掘和演化研究 对 于文本建模 和分类及推荐 效果提 升具有重要作 用 从
LDA , ,
分析基于 主题模型的文本 内容主题挖掘 原理入 手 针 对 当前 网络环境下 的文本 内容特 点 构建适 用于动
LDA , Gibbs ,
态文 内容本主题挖掘 的 模型 并通过改进的 抽样估计提 高主题挖掘 的准确性 进而从主题相似度和
。 , ,
强度 两个方面研究 内容主题随时间的演化问题 实验表 明 所提方 法可行且有效 对后续有 关文本语义建模和
分类研究等具有重要的实践意义。
[ ] LDA
关键词 主题挖掘 主题演化 动 态 模型
[ ]G202
分类号
DOI : 10. 13266 /j. issn. 0252 - 3116. 2014. 02. 023
文 ,
本内容挖掘与语义建模是信息推荐和数据挖掘 有限混合表示的文本 并且通过词汇表中所有词汇的
, ,
领域的研究热点与核心内容 而文本内容的主题挖掘 概率分布来表示每个主题 文本内容则根据主题和词
[6]
。 , 。LDA 主 Dirichlet
则是语义建模的重要基础 当前网络环境下 信息内 汇的混合分布来区分 题模型采用
, , LSA PLSA
容具有呈动态交互和随时间发展演化等特征 因此要 分布简化了模型的推导过程 避免了 和 模
[7]
, 型产生的过拟合的问题 ,因此具有很好的先验概率
求创新信息内容挖掘方法 提升内容主题挖掘的准确
, 。 , , ,
性 动态描述其演化趋势 基于此 本文对传统潜在狄 假设 参数数量不会随着文本数量的增长而线性增长
(LDA) ,
文档评论(0)