网站大量收购闲置独家精品文档,联系QQ:2885784924

人物信息有哪些信誉好的足球投注网站.ppt

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
人物信息有哪些信誉好的足球投注网站

人物信息有哪些信誉好的足球投注网站 Group 18 胡永伟,李奇,谢双宾 项目介绍 有哪些信誉好的足球投注网站引擎现状: 返回结果数量庞大 有太多的重复 存在一些过时的网页 结果:导致用户检索信息时效率低下,浪费时间 项目介绍 我们的目标: 从有哪些信誉好的足球投注网站引擎返回的多个文档当中,提取出 人物的相关信息,并进行综合,使最终结果简单、精炼、美观 使用户更快、更方便的得到所需信息 基本方案 对人物进行分类 娱乐明星、专家学者、政坛人物、普通人等 关键字段预先搜集 不同的类提取不同的信息 人物的相关信息 娱乐明星: 出生日期,艺名,身高,体重 血型,星座,籍贯,学历 专家学者: 出生日期、工作单位、职称、职务、 研究领域、研究成果、获得奖励 系统工作流程 人名 提取的网页集 有序网页集 指定人的相关信息 查询扩展 网页抓取 功能 输入:人名 输出:包含该人名相关信息的网页 实现方式 利用现有的有哪些信誉好的足球投注网站引擎(如Google,Baidu等)提取包含该人名的网页 查询扩展(特定于所需要提取的信息) 网页抓取 问题 这一部分相对来说比较简单,主要问题在于如何对查询词进行扩展上。在这里所做的扩展最好是与我们需要提取的信息相关。 查询扩展的时机 网页排序 功能 输入:从各有哪些信誉好的足球投注网站引擎有哪些信誉好的足球投注网站到的包含指定人物信息的网页集 输出:根据一定的条件进行排序后的网页集 网页排序 实现方式 最简单的方法:直接利用有哪些信誉好的足球投注网站引擎的排序结果。 利用文档中各关键词的出现次数 利用布尔模型 利用向量空间模型 利用向量表示各文档。但应注意的是这里用于表示文档的关键词并不是出现在网页中的所有词,而是特定于我们所需查询的人的信息的。 根据各文档的向量表示求其长度,然后根据各文档的长度对它们排序 网页排序 问题 上面的方法2,方法3有一个问题就是它们对长文档比较有利,因此需要对它们进行归一化处理。(经考虑,这已不是一个问题了) 信息提取 功能 输入:经过排序的网页 输出:指定人物的相关信息 信息提取——实现方式1 字符匹配,利用正则表达式 能实现精确提取 问题: 速度 C++标准不支持 信息提取——实现方法2 查找关键词,然后提取关键词之后的n个词作为提取结果 问题: 无用信息,如网页中的标签 解决方法:如果利用网页显示这些信息的话,所需要做任何处理了就比较少了,因为在显示时有的标签是不会显示出来的。一种解决方法就是将所有出现在“”内的字符去掉。另一种方法在后面讲到。 n的选取 信息提取 问题 信息集成 由于我们显示给用户的不是一个个网页,而是该人的统一信息,因此我们需要将每个网页中提到的该人的信息进行集成。 信息集成解决方法1 信息集成解决方法1 当某个网页中包含的信息已在记录中存在时如何处理的问题(即上图中的“判断策略”) 对不同的信息应用不同的处理方法 如果已经去除了无用信息的话,可以通过计算两个信息的权重来作为判断标准 如果没有去除无用信息的话,就可以求两个字符串的最大公共子串,然后计算权重 信息提取 问题 重名 解决方法:对每一个网页都维护一个记录,当处理完所有的网页之后再对这些记录进行处理。如可以通过两个记录中的信息的相似度来判断这两个记录是否记录的是同一个人的信息。使用这种方法的条件是网页的数量比较少(对人物信息提取来说这个条件是满足的) 信息提取 问题 查询扩展 有条件,有目的性的对查询进行扩展。条件:当从当前有哪些信誉好的足球投注网站到的网页中提取的信息不足时。目的:将当前没有查到的信息添加到人名中再到有哪些信誉好的足球投注网站引擎上去有哪些信誉好的足球投注网站 改进 对著名人物作一个简介 希望了解该人物的生平情况 实现方案:查询扩展,信息综述 改进 家谱 给定一个人名,找出和他相关的其他人(如他的父母,妻儿等)的信息,构成该人的一个家谱。理想的结构是一个图形显示该人的家人,可以任意点击图中的点来查看其家人的相关信息 实现方式:首先找到该人的家人的姓名(者可通过将查询词扩展之后有哪些信誉好的足球投注网站),然后利用现有的技术提取该人的信息

文档评论(0)

skvdnd51 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档