- 1、本文档共13页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
专业出版领域知识服务系统设计
摘要:基于开放域的知识服务系统已较为成熟,但
是对于传统出版领域,尤其是专业出版领域而言,它还
一个非常新鲜的技术。在分析行业现状及需求的基础上,
设计专业出版领域知识服务系统,构建专业领域知识体系,
对专业出版领域的资源进行知识化加工及标引,形成知识
库,并基于知识库提供面向不同用户的个性化定制服务。
关键词:专业出版;知识服务;知识标引;知识库构
建;语义检索
DOIDOI:10.11907/rjdk.161078
中图分类号:TP319
文献标识码:A 文章编号:1672-7800 (2016 )005-
0062-04
0 引言
20 世纪80 年代,信息服务产生并在世界范围内广泛普
及,成为社会信息化的重要标志之一。随着信息技术打破
摩尔定律继续以超高速迅猛发展,信息给人们的科研和决
策也带来了诸多麻烦。信息元作为信息传播的最小单位,
可以不断地连接、组合形成新的结构。信息元的这种无穷
组合能力促使新信息不断产生,导致信息爆炸,形成信息
烟雾。在众多信息和数据库面前,科研工作者和决策者却
感到获取有用信息变得更加困难。为了让人们从 “信息超
载”和 “知识饥渴”的困境中走出来,在知识密集型服务
行业中出现了一个新的服务领域――知识服务。知识服务
从各种显性和隐性知识资源中按照人们的需要有针对性地
提炼知识,是一种用来解决用户问题的高级阶段的信息服
务过程,它是一种面向知识内容和解决方案的服务。
区别于传统的信息服务,知识服务是用户目标驱动的
服务,面向知识内容的服务,它非常重视用户需求分析,
根据问题和问题环境确定用户需求,通过信息的析取和重
组来形成符合需要的知识产品,并能够对知识产品的质量
进行评价。此外,知识服务是面向解决方案的服务,它关
心并致力于帮助用户找到或形成解决方案。同时,知识服
务是为用户解决问题工程的过程性服务,帮助用户进行知
识的捕获、分析、重组及应用,根据用户需求来动态和连
续地组织服务。
1 行业现状与需求
在当前语境下,专业知识服务[1]工作的开展,无论
对出版企业还是技术提供方都提出了较高要求,尤其是在
专业知识领域[2],具体要求主要体现在如下几个方面:一
是对资源的要求,区别于无体系、无规范及无专业保证的
互联网资源,出版社具备专业的编辑团队及知识来源,
开展知识服务的最佳基础;二是对技术的要求,只有依托
于先进的技术手段及产品设计理念,才能实现合理的知识
呈现、提供良好的解决方案;三是对知识服务的理解程度,
在知识服务开展过程中,知识服务提供方要结合自身的资
源优势及用户特点,基于对知识服务内涵及外延的了解,
建立行业及专业的知识谱系及服务模型[3]。
近年来,国外学界对知识服务概念及范围的研究甚嚣
尘上,与知识服务概念研究热潮形成鲜明对比的是知识服
务实践开展却相对滞后,能真正系统开展知识服务的机构
很少。但是,众多数字出版企业并没有停下前进的脚步,
国内外众多出版机构都开展了在该领域的探索,并在探索
的基础之上依托多元化的产品形态及运营模式,为用户提
供基于知识的服务,为我国出版界开展知识服务建设提供
了宝贵经验[2]。
本课题的主要研究目标是提供一套可行的解决方案,
满足专业出版领域的知识体系构建、知识加工及标引、知
识库构建以及对外提供知识服务的需求。
2 系统架构设计
2.1 系统总体架构
系统总体架构如图1 所示。
2.2 资源采集及管理
专业出版领域的资源是专业出版社最核心的资产,将
这些资源进行数字化、结构化及知识化,结合构建的知识
体系形成知识库,再对外提供知识服务[3],这是本解决方
案要实现的目标,也是整体框架设计的依据。
存量资源以图书、期刊等出版物为主,这些资源由于
出版时期不同,其存储介质也不尽相同。早期出版物以纸
质为主,到了20 世纪80~90 年代,出现了排版软件,例
如方正书版、InDesign 等,这时资源存储的介质已经数字化,
基本上以方正书版文件、PDF、WORD 等形式出现。
对于存量的纸质图书,可以通过扫描、OCR 识别形成
PDF 文件实现其数字化。但是数字化只是第一步,想要获取
到知识,还必须将资源进行结构化,本方案中结构化的数
据采用XML 来描述,XML 的标准以国际通用标准配以国内
标准的扩展。例如,国际通用的DO
文档评论(0)