TRS全文检索参数.doc

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
项目 数量 具体参数 全文检索数据库 1 ★要求与地方志目前使用的网站内容管理系统同品牌,或能够进行无缝衔接; ★要求原厂服务,且必须原厂家在南宁当地有常驻技术人员,;投标时必须提供加盖公章的原厂服务承诺书; 16个Licenses版本 全文检索数据库系统用以搭建站内全文检索应用,及实现统一入口跨全站有哪些信誉好的足球投注网站的网站全文检索应用,具体要求如下: 系统技术要求 实现结构化和非结构化数据的统一检索,并全部字段都能建立索引,实现基于元数据(meta-data)和全文(full-text)的联合查询。 支持多种数据源数据的全文索引。可自动将关系型数据库(如Oracle、SQL Server、MySQL、Sybase)中的数据导入全文数据库,并自动保持同步更新,使用户在享有关系型数据库卓越的数据处理功能的同时,拥有实时全文检索功能。 支持Text、HTML、XML、RTF、MS OFFICE文档(Word/Execl/Powerpoint)和PDF文件自动建立索引。 支持GB18030和UTF8大字符集, 便于对中文偏僻字和各国文字的支持。 词典:检索时同义词典进行检索 允许使用文中的任意字、词、短语、句和片段进行检索 ★汉语分词准确率及字词混合索引机制:切分正确率达到99.1%以上; 由于汉语分词不能达到100%准确,所以中文检索系统需要提供一种索引方式(字词混合索引),保证一定查准率的同时提供100%查全率。 支持对检索结果的各种排序:检索结果与检索词的相关度排序;基于字段的排序;后进先出的快速排序。同时对多库检索结果可以进行混排。LIFO(后进先出的快速排序)对实际运行系统的性能提高有很大作用。TOPn排序可通过结果记录数的裁减以减少检索历史的存储来提高检索速度。 支持有多个文本字段和非文本字段参与的相关排序。 自动分库(Partitioning):充分利用多库并行检索技术,进一步提高了检索速度;使得数据加载速度保持稳定,进一步提高了数据更新速度。 自然语言检索:输入一个检索串或一句话,分词后进行高频词过滤、词语个数限定、词语之间的位置关系等处理,根据词语在文章中的位置和频度,以及词语的倒文档频度,计算相关度,按相关度高低排序后输出结果。 ★为了专题检索的需要, 必须提供布尔算符、关系算符、邻近算符、同在算符、频率算符、截词符(通配符),以及长检索表达式的支持(1MB字节)。 ★ 检索结果的分类统计等分析功能: 统计检索结果在各库表中的分布情况;检索结果的分类统计,支持用正则表达式来筛选分类统计的目标字段值,并支持抽取部分子串组成新的类别。 ★西文大小写无关检索、全半角无关检索、中文简繁体扩展检索。 具有系统级、数据库级、记录级和字段级四级安全控制机制。 支持数据的加密与压缩传输。 支持主流的操作系统平台Windows/Linux/Solaris/AIX/HPUX; 支持主流开发平台,提供CAPI,Java API,.Net API二次开发接口。 系统功能要求 全方位检索手段:提供多种检索运算符。包括外部特征与正文内容的各种逻辑组合检索(与、或、非、异或)、位置检索(同段、同句、相差几个字以及前后次序有关等)、二次检索、渐进检索、模糊检索、历史检索、词根检索、大小写敏感检索、概念检索、对检索结果按与检索表达式的相关性程度排序等。 支持扩展检索:包括主题词典自动扩展检索, 同义词/反义词自动扩展检索, 全半角自动扩展检索, 简繁体自动扩展检索等。 支持语义检索:支持长句检索,系统可自动分词,按句子语义进行检索。并可选择关键词再次检索。 支持检索结果的分类统计与分析:统计检索结果在各库表中的分布情况; 检索结果的分类统计,支持用正则表达式来筛选分类统计的目标字段值,并支持抽取部分子串组成新的类别。 ★支持检索结果排序:支持多字段加权的相关性排序, 并且可以设置文档的不同字段以不同的权重, 提升关键字段的权重;Date/Number类型字段按大小排序, Char类型提供按内码、拼音、笔画等三种排序方式。 相似文档检索: – 百度新闻有哪些信誉好的足球投注网站的相同新闻 – Google的类似网页 – 文章消重 – 相关文章推荐 系统性能要求 G级数据全文检索响应在毫秒之内。 全文检索数据库的零空间膨胀率(-10%~20%) 数据索引更新时间平均小于0.02s/记录(每条记录4kb) T级文本数据库,一个任意词的检索都在1秒钟之内 检索智能词典能按需扩展 汉语切分正确率达到99.1%以上。 全文数据加载和索引单机速度为10GB/小时; 元数据加载和索引单机速度为16GB/小时。 千万记录的全文数据单机查询速度为0.x秒; 十亿记录的元数据单机查询速度在3秒内。 全文检索网关 1 支持主流支持Oracle, DB2, SQL Server,

文档评论(0)

hzhplyvb8 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档