传输和数据交换系统功能说明.docxVIP

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
传输和数据交换系统功能说明

数据传输与数据交换功能说明 1需求说明 兵器210应用系统中,完成七家成员单位和兵器中心的数据传输工作,七家成员单位的源数据包含有网络采集的数据,兵器中心包含的源数据有网络采集的数据和自身的媒体库数据两种。 2源数据连接说明 网络采集数据格式说明 数据库是oracle10G, 具体数据格式参考下面数据库: IP:192.168.12.26 SID:testing USER:bqsj PAWD:bqsj 涉及到的表: Classly - 分类体系表 MutiFiles - 视频和音频库 WebInfo - 采集信息存储的主表 WebInfoContent - 采集信息主表的关联表【详细内容表】 WebSiteRule - 采集的站点信息表【采集站点说明】 兵器中心媒体库数据格式说明 详细数据格式请参考“附件目录”中媒体库资源。 兵器中心媒体库总共分为三个“三维模型库”、“国防科技图片库”,“视音频及二三维动画库”。 详细数据格式请参考:《资源库关系.doc》 3数据传输匹配说明 数据传输的源数据包含网络采集的“正文信息库”、“视频库”,和媒体资源库“三维模型库”、“国防科技图片库”、“视音频及二三维动画库”。下面将说明源数据与目标库的对应关系,及需要做的数据处理。 3.1网络采集的“正文信息库” 源数据库字段查询说明 select e.classlyname,b.classlyid,a.classname, b.title, b.collecttime, c.cj_abstract, c.cj_content, c.cj_words, d.webname from Classly a ,WebInfo b ,WebInfoContent c ,WebSiteRule d,webSiteRuleClassly e where a.id = b.classlyid and b.websiteruleid = d.id and b.id = c.webinfoid and d.websiteruleclasslyid = e.id 序号源数据字段目标库说明 DB_SEARCH_WEBINFO备注1ID自建字段(生成不重复的主键)2PAGES页数(自建字段)3COLLECT_UNIT所属馆藏单位,对应代码表 SM_COLLECT_UNIT (自建字段)4COLLECTTIMECOLLECTTIME采集日期5TITLETITLE标题6WEBNAMEWEBNAME来源7CJ_CONTENTCONTENT正文内容(含图片标签)8CJ_ABSTRACTABSTRACT摘要内容9CJ_WORDSWORDS关键字10CLASSLYIDTYPE_ID分类号11FIRST_TYPE_ID一级分类号12SECOND_TYPE_ID二级分类号13CLASSLYNAMEDEFINE_NAME采集自定义类型名称14PICTURE图片 (/usr/aaa.jpg,/usr/bbb.jpg)15SOURCEFILE_NAME文档附件名称 + 路径(/usr/aaa.pdf)16URLFROMURL来源网址 数据处理说明 源数据CJ_CONTENT字段,对应的是正文内容,内容中可能包括图片标签imglogo src=’’…./,需要将图片对应的src值,匹配成目标数据存储的实际路径。建议:可以通过配置文件,读取目标数据存储的实际路径。 源数据表“WEBINFO”中定义了一个字段“isFetch”抽取每一条数据后,将该字段赋值为“1”,表示该条数据已经被获取。 目标数据中其它字段值的获取方式: ID:自动生成,不重复主键; COLLECT_UNIT:对应目标数据库中表SM_COLLECT_UNIT中字段UNIT_CODE值; PAGES:默认值0; PICTURE:存储每篇文章的图片路径,可以存储多个,每个数据之间用半角逗号“,”隔开; 图片的路径从正文中解析imglogo src../标签获得,入库之前替换成目标数据的实际存储路径。 数据统计:要求没入库一条数据,更新当前数据库表中记录的数据总量。1) 表:DB_TYPE按国防分类体系记录数据总量。每插入一条数据对应分 类号的“COUNT”字段增加1,分类号为一级分类号、二级分类号、三级分类号。 表:SM_DOCTYPE,按资源类型分库统计数据总量,更新字段DOC_CODE=“DB_SEARCH_WEBINFO” 的memo1字段,每新增一条数据对应MEMO1增加1; 表:DB_SEARCH_WEBI

您可能关注的文档

文档评论(0)

185****7617 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档