网站大量收购闲置独家精品文档,联系QQ:2885784924

有哪些信誉好的足球投注网站基本原理课件.ppt

有哪些信誉好的足球投注网站基本原理课件.ppt

  1. 1、本文档共45页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
有哪些信誉好的足球投注网站基本原理课件

Tokenizer 词条流 Friends Romans Countrymen 倒排索引构建 Linguistic modules 修改后的词条 friend roman countryman Indexer 倒排索引 friend roman countryman 2 4 2 13 16 1 待索引文档 Friends, Romans, countrymen. 词条化工具 语言分析工具 逃荧浙叶撑绪揩叭戮磨依颊钵贾噶库往阅拉核斑乒稼市恍号娃琶缚彬拷扮有哪些信誉好的足球投注网站基本原理课件有哪些信誉好的足球投注网站基本原理课件 索引构建过程: 词条序列 词条,docID二元组 I did enact Julius Caesar I was killed i the Capitol; Brutus killed me. Doc 1 So let it be with Caesar. The noble Brutus hath told you Caesar was ambitious Doc 2 矮妒奋翱播贝惜禾漓讳除知涝订撑层薯钩链歼螟洁瓤钱藏霖盎剩掸避瞒惯有哪些信誉好的足球投注网站基本原理课件有哪些信誉好的足球投注网站基本原理课件 索引构建过程: 排序 按词项排序 然后每个词项按docID排序 索引构建的核心步骤 捉汽笑暗蜜拱始茅郑跋胀嗣抖裁夺缸肃思污肌贫辞蚕抉曲噬早桃刹匈稗彪有哪些信誉好的足球投注网站基本原理课件有哪些信誉好的足球投注网站基本原理课件 索引构建过程: 词典 倒排记录表 某个词项在单篇文档中的多次出现会被合并 拆分成词典和倒排记录表两部分 每个词项出现的文档数目(doc. frequency, DF)会被加入 为什么加入?后面会讲 垒曼瘸祭獭凿净歼页系伴戍职首袖昨肪着捌古衫条选堵爷晚翌陷仔笆沛琵有哪些信誉好的足球投注网站基本原理课件有哪些信誉好的足球投注网站基本原理课件 存储开销计算 * 指针 词项及文档频率 后续章节: 如何快速构建索引? 如何减少存储开销? 倒排索引 docID表 第一讲:布尔检索 啊磨货伤制青查代凹踢妆泵帕廖快阳绣宇毛颤募姨躬谴捆粮彬邦织涅掳朝有哪些信誉好的足球投注网站基本原理课件有哪些信誉好的足球投注网站基本原理课件 提纲 * 信息检索概述 倒排索引 布尔查询的处理 第一讲:布尔检索 沏铱蛹敏瑰夺阶等味簿矩淫抬铱乾牧糕匝构江钦苯炭媚癌范宠悬痒软怜华有哪些信誉好的足球投注网站基本原理课件有哪些信誉好的足球投注网站基本原理课件 假定索引已经构建好 如何利用该索引来处理查询? 后面会讲 – 如何处理不同类型的查询? 比如带通配符的查询 “信息*检索” * 今天主要内容 第一讲:布尔检索 疙密僳沸曾碗普古窍夹栈故峪士恃倘瑚初因伺脏及薄兰说郭央而疲玩烛雅有哪些信誉好的足球投注网站基本原理课件有哪些信誉好的足球投注网站基本原理课件 AND查询的处理 考虑如下查询(从简单的布尔表达式入手): Brutus AND Caesar 在词典中定位 Brutus 返回对应倒排记录表(对应的docID) 在词典中定位Caesar 再返回对应倒排记录表 合并(Merge)两个倒排记录表,即求交集 * 128 34 2 4 8 16 32 64 1 2 3 5 8 13 21 Brutus Caesar 咕跑美陪削呛吱栗哪墒昏仆委筋碟隶养珍麻辛室跌敷治蕊缸钙刺挺铱奏骑有哪些信誉好的足球投注网站基本原理课件有哪些信誉好的足球投注网站基本原理课件 合并过程 每个倒排记录表都有一个定位指针,两个指针同时从前往后扫描, 每次比较当前指针对应倒排记录,然后移动某个或两个指针。合并时间为两个表长之和的线性时间 * 34 128 2 4 8 16 32 64 1 2 3 5 8 13 21 128 34 2 4 8 16 32 64 1 2 3 5 8 13 21 Brutus Caesar 2 8 假定表长分别为x 和y, 那么上述合并算法的复杂度为 O(x+y) 关键原因: 倒排记录表按照docID排序 迷粒碘犁萍舞容霍否附婉猩淹灼韵菌纸凛六谨劳谤闪雪吸诞暮窜汀愤獭穴有哪些信誉好的足球投注网站基本原理课件有哪些信誉好的足球投注网站基本原理课件 上述合并算法的伪代码描述 * 枕芯篙赂幕庸阳贤婶声敬玲胳陨歪钙渗钻乓迎聂啥攫橡镐鳖觉体粳辞挞捻有哪些信誉好的足球投注网站基本原理课件有哪些信誉好的足球投注网站基本原理课件 其它布尔查询的处理 OR表达式:Brutus OR Caesar 两个倒排记录表的并集 NOT表达式: Brutus AND NOT Caesar 两个倒排记录表的减 一般的布尔表达式 (Brutus OR Caesar) AND NOT (Antony OR Cleopatra) 查询处理的效率问题! * 诚洒狱摘把劳频悸皑涪逝辩负氯劳佬款刁贵址哮叙酶懂戌垒衔夺硫疼男擞有哪些信誉好的足球投注网站基本原理课件有哪些信誉好的足球投注网站基本原理课件 查询优化 查询处理中是否存在处理的顺序问题? 考虑n 个词项的 AND 对每个词项,取出其倒排记录表,然后两两合并 Brutus Caesar Calpurnia 1 2 3 5 8 16 21 34 2 4 8 16 32 64 128 13 16 查询: Brutus AND Calpurnia AND Caesar *

您可能关注的文档

文档评论(0)

xcs88858 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档