- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于LDA主题模型的分布式信息检索集合选择方法.PDF
基于LDA 主题模型的分布式信息检索 集合选择方法 1 1 1 1 2 2 何旭峰 ,陈岭 ,陈根才 ,钱坤 ,吴 勇 ,王敬昌 1 (浙江大学计算机科学与技术学院, 杭州 中国 310027 ) 2 (浙江鸿程计算机系统有限公司, 杭州 中国 310009 ) 摘 要:针对分布式信息检索时不同集合对最终检索结果贡献度有差异的现象,提出一种基于 LDA 主题模型的集合选择方 法。该方法首先使用基于查询的采样方法获取各集合描述信息;其次,通过建立LDA 主题模型计算查询与文档的主题相关 度;接着,用基于关键词相关度和基于主题相关度结合的方法估计查询与样本集中文档的综合相关度;最后,通过样本集 文档所属的集合信息,估计查询与各集合的相关度,进而选择相关度最高的 M 个集合进行检索。实验部分采用 Rm 、P@n 和MAP 作为评价指标对集合选择方法的性能进行了验证。实验结果表明本文提出方法能更准确的定位到包含相关文档多的 集合,提高了检索结果的召回率和准确率。 关键词:集合选择;分布式信息检索;LDA 中图法分类号:TP 311 A LDA topic model based collection selection method for distributed information retrieval 1 1 1 1 2 2 HE Xu-feng , CHEN Ling , CHEN Gen-cai ,QIAN Kun ,WU Yong , WANG Jing-chang 1(College of Computer Science and Technology, Zhejiang University, Hangzhou 310027, China) 2(ZheJiang Hongcheng Computer System Co.,Ltd., Hangzhou 310009, China) Abstract: Considering that different collections have different contributions to the final search results, a LDA topic model based collection selection method was proposed for distributed information retrieval. Firstly, the method acquired information about the representation of each collection by query-based sampling; secondly, a method using the LDA topic model was proposed to estimate the relevance between the query and a document; then, a term-based and topic-based mixed method was used to estimate the relevance between the query and the documents sampled; Finally, the relevance between the query and collections were estimated with the information of the collections that the sampled documents belong
您可能关注的文档
最近下载
- 变压器防护方案.pdf VIP
- 大模型驱动的多智能体协同初探 清华大学 2024.pptx VIP
- SolidWorks 2023实用教程(杨正)课件全套 第1--10章 SolidWorks基础知识与用户界面 --- 工程图设计.pptx
- 手足口防控培训课件.pptx VIP
- 2025一建《建设工程法规及相关知识》考前10页纸(完整版).docx VIP
- 2025-2030中国驴奶行业发展现状调研与营销策略分析研究报告.docx
- 人教版八年级数学上册第十二章 《全等三角形》章节测试题.pdf VIP
- 华中科技大学版五年级信息技术教案.docx VIP
- 明天会更好(合唱简谱).pdf VIP
- 莫斯科郊外的晚上(高考声乐谱伴奏谱)原版正谱五线谱钢琴弹唱谱乐谱.pdf VIP
文档评论(0)