模糊理论在信息检索中的应用(人工智能)讲解.docx

模糊理论在信息检索中的应用(人工智能)讲解.docx

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
模糊理论在信息检索中的应用(人工智能)讲解

安徽三联学院课程论文 无线网络技术课程(论文) 题 目: 模糊理论在信息检索中的应用 学生姓名 1: 孟朋朋 学 号: 130101062 学生姓名 2: 王磊 学 号: 130101063 所在系院: 计算机工程学院 专业班级: 13计科2班 指导教师姓名: 裴培 职称/学位: 助教 硕士 完成时间: 2016 年 6 月 计算机工程学院 制 摘要:模糊理论是为了解决真实世界中普遍存在的模糊现象而发展的一门学问。模糊理论以模糊集合为基础 ,基本精神是接受模糊性现象存在的事实 ,而以处理概念模糊不确定的事物为其研究目标 ,并积极地将其严密量化成计算机可以处理的信息。本文首先简介模糊理论 ,而后将模糊理论在信息检索上的应用做一探讨。希望通过本文 ,使大学对模糊理论有更深入的了解 ,并且思考如何将之更广泛地应用于图书信息学上。 关键词:模糊理论 模糊集合 信息检索 1.对模糊理论的一般解释 基于康托经典集合论的精确数学要求: 一个元素 a 和一个集合 A 的关系只存在 a∈A 和 aA 两种情况 。集合可以通过特征函数描述,每个集合 A 都有一个特征函数 C A ( a) ,其定义用下式表示 : 1 当 a ∈A C A ( a) = 0 当 a A 该式表明, 经典集合论容不得模糊概念。这对现实世界存在的大量模糊现象的解释造成困难。针对这一情况, 美国自动控制专家查德( L. A. Zaden) 于 60 年代初提出了“模糊集合”( Fuzzy set) 概念。其基本出发点是用“隶属函数”概念来描述差异的中间过渡。这是首次从精确性向模糊性的逼进 。通过隶属函数对经典集合论中的特征函数加以推广 ,并由此引入了“模糊子集”概念。模糊子集定义如下 : 设给定论域 u,u 到闭区间[ 0 ,1] 的任一映射 μ A 为: μ A : u → [ 0 ,1] 确定 u 的一个模糊子集 ~ A ,μ A 为 ~ A 的隶属度 。正如经典集合论是传统精确数学的基础一样, 模糊子集论也正是模糊理论的基础 ,同样也可以定义模糊子集上的运算。总之, 模糊理论可以将传统的二值逻辑{ 0, 1} ,推广至可取[ 0,1] 闭区间任意值即无穷多个值的连续值逻辑。 2. 信息检索???引入模糊理论的必要性 2..1传统信息检索方法存在的问题 2.11 通过检索语与索引语的精确匹配来进行检索, 只能检索到二者完全相同的信息。 传统的信息检索以精确数学、普通的集合理论为基础, 检索系统主要基于三种经典检索模型:布尔模型、 向量空间模型和概率模型。 这三种模型的检索过程是通过检索者输入的关键词 ( 或称检索语) 与信息所登录的关键字 ( 或称索引语)之间的精确匹配来完成的, 只能检索到检索语与索引语完全相同的信息, 而对于二者在一定程度上一致或意义相近、 相关的信息却无法查询。 2.12传统的检索方式中检索者虽然可以利用检索语之间的逻辑运算及其组合来表达检索要求, 但却无法描述检索者对检索语的重视程度以及检索语对信息是否贴切等许多问题。 2.13 只能对一些具有确定含义的信息进行访问和处理。在客观世界中, 许多事物都表现出其不完全或不精确的一面, 例如, 我们常说的 “ 高与矮”、“ 胖与瘦” 、 “ 美与丑”,这些词都是属于模糊概念, 既难以准确地加以度量, 也难以明确地划分界限。 在检索此类信息时传统的检索方法无法进行。 2.2信息发展的模糊性 2.21 信息的模糊性 现代科学技术的发展及其渗透, 许多新兴学科、 边缘学科、 交叉学科不断涌现, 使学科的分类呈现出模糊性。如 “ 生物电子学”, 它既涉及到生物学范畴, 又与电子学有关, 在对文献进行学科分类时, 只能根据文献对这两门学科的侧重点多少来大概划分是属于生物学还是属于电子学方面。 在情报学范畴, 学科分类的模糊性必将反映到分类法和叙词表中, 使分类类目和叙词表达范围变得模糊。 因此, 随着科学技术的发展, 信息也呈现出模糊性。 2.22 信息检索结果评判的模糊性 我们经常用 “ 文献是否相关”、 “ 文献是否切题” 来对信息检索的结果进行评判, 相应的 “ 相关性” 、 “ 切题性”也就成了评判信息检索结果的两个重要指标。“相关性” 是指信息检索时检索系统中被命中文献与用户需求文献相吻合的程度。文献

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档