- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
5.3跨语言信息检索跨语言信息检索的模式查询翻译查询翻译指将提问用语种转换成文献用语种(如将中文提问转换成英文提问),然后再进行单语言检索文献翻译文献翻译指将源文献语种转换成提问用的语种(如将英文源文献转换成中文文献),即不对提问式进行翻译,而是对集合中的文献翻译成与提问用的语种一致的语言中间语种转换中间语种转换指将提问和文献转换成一种逻辑形式,或者第三方语言5.3跨语言信息检索翻译技术机器翻译技术一种方法是将用户的查询翻译为与文档相同的语种;另一种方法是将文档翻译为与查询相同的语种,然后再用单语种的信息检索系统进行检索基于词典的方法基于词典的方法主要是利用双语词典,将用户提交的提问式翻译成目标语种,然后进行检索基于语料库的方法基于语料库的方法从大规模的语料入手,从中抽取所需的信息,自动构建与应用有关的翻译技术2词的歧义和多义性3查询词的切分1查询词与检索到的文献分属不同语言6对多语言资源的依赖5输出结果的排序方式4文献的多语言性跨语言信息检索解决问题5.3跨语言信息检索5.3跨语言信息检索跨语言信息检索解决问题由于汉语的特殊性,汉英跨语言文献检索还面临如下问题:中文文本之间没有分隔符。没有较好的方法识别汉语中的新词、外来词、专有名词、人名、地名和缩略语等语词。汉语没有词缀变化。汉语句法、语义分析复杂。5.3跨语言信息检索跨语言信息检索优化技术查询扩展查询扩展指的是利用计算机语言学、信息学等多种技术,把与原查询相关的词语或者与原查询语义相关联的概念添加到原查询,得到比原查询更长的新查询,然后检索文档,以改善信息检索的性能检索反馈技术在跨语言信息检索中,通过一次检索往往得不到想要的结果目的文献,这时就需要通过检索结果中反馈的信息对提问式检索方法或翻译方法进行改进消除检索词多义性对查询来说,确定查询中检索词的确切含义是查询扩展的基础对于被检索信息来说,明确信息中出现的检索词的含义是提高检索准确率、确定信息相关性的关键。可以利用一种词的共现技术来消除词的多义性,以明确其含义5.3跨语言信息检索跨语言信息检索系统Cindor系统特点:统一的字符编码标准、自然语言检索、查询自动扩展、申请专利的跨语言检索技术。核心技术:概念中间语言、语言分析、有哪些信誉好的足球投注网站管理。Keizai系统A、使用统一字符编码检索体系(USRA)和交互文档摘要方法(MINDS)。B、提供自动和用户帮助两种方法,以构建和提高跨语言查询的效率。C、有英文查询输入框、新闻源选择框、翻译查询按钮、提交查询按钮、存储查询按钮等。它目前所提供的新闻源有英文、法文、德文、西班牙文、意大利文、中文、日文、韩文的新闻,支持以上几种语言的跨语言翻译和检索,不过查询只能是英文的。跨语言信息检索系统Keizai系统查询举例:输入英文单词“rose”,选择“XinHuaNews94-95(Chinese)”作为新闻源,点击查询翻译按钮,则一个翻译清单显示在屏幕上,排在最前有“花圣、紫月季、胜春、月季花”等。每种翻译形式前有复选框,用户可以选择最适合自己需要的查询。选择了“花圣、紫月季、红蔷、月季花、芙蓉”作为所需要的查询翻译形式,提交查询后,检索到12份文档。0103025.3跨语言信息检索“”“”第五章数字图书馆信息检索3跨语言信息检索1信息检索概述4知识检索2基于内容信息检索本章内容信息检索概念信息检索模型信息检索的意义和作用信息检索发展趋势5.1信息检索概述信息检索概念就是基于信息组织形式,如字符串、结构化数据库,应用信息处理方法,如排序、数据查找、字符匹配,实现信息查找以满足信息需求的过程,本质上是对信息集合与需求集合的匹配与选择。三种角度的认识:时间性通信角度的认识、信息处理角度的认识、文献查找角度的认识。01025.1信息检索概述5.1信息检索概述信息检索模型布尔模型布尔模型(BooleanModels)是基于特征项的严格匹配模型,文本查询的匹配规则遵循布尔运算的法则。向量空间模型一般是从文本中抽取出关键词,根据该词在文本中的重要程度赋予其一定的权重,把用户模板和待检索文本均表示成向量空间中的向量,利用一些相似度计算方法(如夹角余弦、内积等)计算他们的相似度。概率模型概率模型基于概率排序原理,考虑了关键词、文档之间的内在联系,它以贝叶斯公式为理论基础,利用关键词之间和关键词与文档之间的概率相依性进行信息检索。020304050601信息检索是信息社会人才个人素质的重要组成部分信息检索是知识经济时代现代人才的基本生存技能信息检索是开发情报信息资源,提高经济效益的重要工具信息检索是科学
您可能关注的文档
- 急性胰腺炎的诊治原则.ppt
- 小学五年级家长会优秀.ppt
- 心理评估的技术分类及其适用范围.pptx
- 建立统一规范的人力资源市场.pptx
- 探索碱的性质第一课时浙教版.ppt
- 平面向量的分解及向量的坐标表.ppt
- 有机化学基础和稳定同位素.ppt
- 展示设计基础制图知识.ppt
- 思想品德第一单元复习.ppt
- 有机物构建植物体.ppt
- 2025北京市公安局公安交通管理局招聘勤务警务辅助人员59人笔试备考题库及答案解析.docx
- 2025“梦工场”招商银行兰州分行暑假实习生招聘笔试模拟试题及答案解析.docx
- 2025北京积水潭医院招聘派遣合同制2人笔试备考题库及答案解析.docx
- 2025兵地融合发展草湖项目区公共服务局面向校园招聘教师(49人)笔试备考题库及答案解析.docx
- 2025北京首都医科大学事业编制岗位招聘12人(第二批)笔试模拟试题及答案解析.docx
- 2025甘肃甘南州招聘4人笔试备考题库及答案解析.docx
- 2025二季度重庆市属事业单位考核招聘952人笔试备考题库及答案解析.docx
- 2025福建龙岩开放大学招聘教师3人笔试备考试题及答案解析.docx
- 2025北京首都医科大学事业编制岗位招聘12人(第二批)笔试备考试题及答案解析.docx
- 2025北京市芦城体育运动技术学校招聘19人笔试模拟试题及答案解析.docx
文档评论(0)