- 1、本文档共14页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
分布式课程项目报告-北京大学网络与信息系统研究所
分布式课程项目报告 Ask Me 问答式系统 2004年12月21日 小组成员:何靖、银平、姚从磊、余晋、陈翀 纲要 QA Background “Ask Me”System Introduction Targets Overview Design Approaches Techniques Evaluation Task Allocation Outlook QA Background Introduction 继有哪些信誉好的足球投注网站引擎之后,互联网应用的又一新的浪潮 基于互联网的文档海量数据 挑战计算机智能(NLP、IR、IE、AI) 问题类型 简单型“联想集团的总裁是谁” 集合型“长江流经哪几个省” 描述型“沙尘暴的影响有哪些” 准确的问答检索方法依赖于对问题的理解 问题分类(领域、答案类型)、扩展、理解 Ask Me系统的目标定位 Open Domain Chinese Oriented Massive Web Douments Based Obey the Criterias of Modern IR Test Routine QA系统模型 Overview Design Approaches Sementic-based Rules Statistic-based Patterns Cache-based FAQ Pool Techniques What techniques support our system? 辞典(同义辞典、共现辞典) 问句相似度判断算法 后缀树 信息抽取 训练集 测试集 问句集 中文切词及实体判定(中科院计算所开源软件的改版) Evaluation 评估设计 问题类型(事实型、集合型、描述型) 问题匹配方法(Cash中找到答案、语义规则找到答案、统计方法找到答案) 60个测试问题,第1步FAQ相似度方法“截取”2个,50余个在第2步被“截取”,剩下的转入第3步找答案。 共答对26个。 答案选取方法(天网百度各有胜负) 只用天网的有哪些信誉好的足球投注网站结果构造答案 只用百度的有哪些信誉好的足球投注网站结果构造答案 Both 结果展示 Ask Me Outlook 我们处在哪里? QA Related Works Ask the Web 哈工大 复旦 国外的QA系统 我们的后续改进之处 FAQ的进一步自动提纯 问题模式/答案模式的细化:细化分类,考虑词性,全面完整的训练集 Task Allocation 项目周期:10月28日-12月20日 (7周半) Sementic-based Rules Semantic rules 是谁 ? /nr 人名 多高 ? /m 高度 Pattern Extraction FAQ Semantic Based Rules Statistic based Patterns Questions Pre-process FAQ Module Question Semantic Based Rules Statistic based Patterns WEB Crawl purify Answers Rule match 句子相似度比较 (VSM 变形) Search engine (tianwang, baidu etc.) Sentence extraction Answer extraction FAQ Pool Rule Pool Pattern Pool Crawl Statistic training question pattern match answer Pattern match Thesaurus expanding search thesaurus Co-currency dictionary statistic log file 基础设施 上层建筑 语义规则求答方法 模式规则求答方法 FAQ文档集获取 cgi界面 同义辞典 切词软件移植改版 KNN问题分类 FAQ 问句相似度匹配 后缀树的答案规约方式 共现词典 测试问题集 何靖 银平 陈翀 余晋 姚从磊 何靖 姚从磊 银平 余晋 陈翀 谢谢! 文化大革命开 始于哪一年? 问题类型: 词性: /t 概念:年 文化大革命/nz 开始/v 于/p 哪一年/r ?/w /cgi-bin/allsearch? word=文化大革命+开始+于+cdtype=GB 当时 /t [13] 1966年 /t [13] 1966年5月 /t [8] 1966年 /t [13] 1966年5月 /t [8] 分词 筛选 替换 /t 年 Se
您可能关注的文档
- 高等职业教育硕士论文.doc
- 高等教育自学本科毕业论文.doc
- 高等职业教育硕士论文免费下载.doc
- a引言:图珠江三角洲地区五个机场的空间分布有关珠江三角洲.doc
- 高等职业教育类的毕业论文发表.doc
- 高等职业教育类的硕士论文.doc
- 高等职业教育类的论文.doc
- 高等职业教育硕士论文范文.doc
- 高等职业教育类的论文下载.doc
- 高等职业教育方面硕士论文免费参考.doc
- +Unit+2+Hobbies+Welcome+to+the+unit第1课时课件 译林版(2024)七年级英语上册.pptx
- 植物生长调节剂的应用 学案 高二上学期生物人教版选择性必修1.docx
- 备课素材:环境因素参与调节植物的生命活动情境教学 高二上学期生物人教版选择性必修1.docx
- 人教版中考词汇整理系列1116(共二组).docx
- 第2课+西方国家古代和近代政治制度的演变+导学案 高二上学期历史统编版(2019)选择性必修1国家制度与社会治理.docx
- although和though引导的让步状语从句(课件) 人教版英语八年级上册.pptx
- +Unit1单词短语句子 人教版九年级英语全册.docx
- 动词的语态 中考人教版英语总复习专题复习 .pptx
- ++Unit+3+My+school+Section+A+Grammar+focus 人教版(2024)英语七年级上册.pptx
- Unit+5+A+healthy+lifestyle+Welcome+to+the+unit 译林版英语七年级上册.pptx
文档评论(0)