- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
非结构化WEB数据库与图书馆多媒体信息资源的组织利用论文
非结构化WEB数据库,是指其字段长度可变,并且每个字段的记录又可以由可重复或不可重复的子字段构成的基于INTERNET、INTRANET的数据库,用它不仅可以处理结构化数据而且更适合处理非结构化数据并在互联网上发布。非结构化WEB数据库主要是针对非结构化数据而产生的,与以往流行的关系数据库相比,其最大区别在于它突破了关系数据库结构定义不易改变和数据定长的限制,支持重复字段、子字段以及变长字段并实现了对变长数据和重复字段进行处理和数据项的变长存储管理,在处理连续信息和非结构化信息中有着传统关系型数据库所无法比拟的优势。 我们知道音频、图象、视频等多媒体信息数据是非结构化的,它们不能用简单的数字解析式表示,多媒体数据库必须取得基于这些媒体对象内容及信息特征的解释,才能完成存储及应用,这些解释就称为元数据,通过对元数据的归类、整理、实现标准化的存储是多媒体信息资源组织利用的关键。多媒体数据库元数据存储技术要求包括:文本元数据的存取,语音元数据的存取,图象元数据的存取,视频元数据的存取等方面的技术要求。 a.允许可变长字段、可重复字段、子字段和MARC字段。 b.数据库记录的数目与记录长度,字段数目与字段长度,字段可重复次数不应受到限制。 c.允许建立可以快速存取的倒排文件和多媒体、多语言记录表。 d.数据库可自动接受和产生MARC和ISO2709记录格式的文件,并且满足对MEDADATA数据模式的支持功能。 随着用户对于信息需求的大量增加,以及对于多媒体信息的实效性要求,基于WEB的数据库信息存储的检索越来越倾向于多媒体全文信息检索的查询语言,并且对于检索结果的需求也侧重于多媒体全文信息的获取。与此同时,WEB数据库的信息发布形式开始更多地过渡到通过网络浏览器以多媒体电子文档的方式传输给网上用户。也要求利用多媒体WEB传输技术,向用户提供主动的特定多媒体信息的推送服务。 根据非结构化多媒体数据信息的特殊性,非结构化WEB数据库在进行存储和管理多媒体信息时,整个数据库的管理机制摈弃了传统结构化关系数据库对于信息采取定长和结构化定义和管理的局限,它从多媒体数据模型入手,采用子字段、多值字段以及变长字段的机制,允许创建许多不同类型的非结构化或任意格式的字段,从而突破了关系数据库非常严格的表结构,解决了关系数据库模型过于简单,不便于表达复杂嵌套的问题。非结构化WEB数据库在数据类型上不仅支持字符型、数值型数据,而且由于具有很强的外部文件支持功能,使其可以支持如超长文本、图像、声音、动画等多种多媒体扩展数据类型。与传统关系数据库相同之处是非结构化WEB数据库的数据结构也是建立在二维表的基础之上的,但它与关系数据库不同的是:非结构化WEB数据库二维表的属性长度是不可变的,在列的维度上可以随意扩展,这就能较好地满足多媒体数据处理时,需要灵活的可变长字段的要求。非结构化WEB数据库由于支持重复字段、子字段,使其可以在数据库记录中实现二维嵌套,解决了非结构化多媒体数据结构复杂、可能存在重复字段和多个嵌套子字段的问题。非结构化WEB数据库一个字段可以存放关系数据库的一张表,它可以在一张表中压缩关系数据库中一对多的关系,因此利用非结构化WEB数据库能很好地实现多种多媒体数据库的集中组织与管理。 图书馆多媒体信息资源数据库是海量数据库,支持基于广域网的海量多媒体信息存储和管理是非结构化WEB数据库管理系统的主要功能之一,不仅存储数据量大,而且存取速度快,同时检索功能强、检索速度快,在检索速度方面一般不受信息量大的影响。以IBASE非结构化数据库为例,每个数据库最大的记录数可达到1000万条,每条记录的最大长度可达64000字节。每个数据库最多可有800个字段。 馆藏多媒体信息资源组织利用的关键是要实现多种方式的多媒体全文检索,而要实现多种检索方式,建立索引是前提,传统关系数据库支持的索引只限于单字段索引、复合索引等几种方式,受其限制,关系数据库检索能力也受到很大限制。非结构化WEB数据库由于有着灵活的数据结构,在其底层存储机制变革的基础上,采用先进的索引倒排挡技术,使它支持的索引方式比关系数据 库要丰富得多,可以满足极其复杂检索的需要,实现对于海量多媒体信息的快速全文检索功能,它支持字段索引、子字段索引和全文索引甚至可以支持人工标引索引,中英文混合索引等方式。配合非结构化数据库的格式化语言,可以对同一字段进行若干种不同的索引,以满足特殊检索的需求,实现多种检索策略。例如IBASE非结构化数据库管理系统目前支持8种不同的索引方式,可以涵盖所有关系数据库所提供的90%以上的检索方式,同时还提供了包括简单检索、组合检索、字段检索、右截断检索、全文检索、扩展检索
您可能关注的文档
- 雾霾建议书500字.docx
- 雾霾天气调查报告作文.docx
- 雾霾建议书400.docx
- 雾霾引起的思考作文.docx
- 雾霾研究报告表.docx
- 雾霾现象调查报告.docx
- 雾霾社会实践调查报告.docx
- 雾霾调查报告_1.docx
- 霍比特人读后感.docx
- 雾霾社会实践调查报告_1.docx
- 2025年山东省德州市武城二中第二学期高三第一次模拟考试物理试题含解析.doc
- 2025年山东省青岛市胶州实验初三下五校联考语文试题含解析.doc
- 2025年山东省青岛市即墨区重点高中高三2月份网上月考高三物理试题试卷含解析.doc
- 2025年山东省济宁市第一中学高三下学期第二次验收物理试题理试卷含解析.doc
- 2025年山东省牟平第一中学高三必威体育精装版物理试题分类汇编含解析.doc
- 2025年山东省乐德州市夏津县重点达标名校初三寒假延时阶段检测试题生物试题含解析.doc
- 2025年山东省淄博第十中学高三预测金卷(物理试题)含解析.doc
- 2025年山东省荣成市第三十五中学初三第三次统考语文试题试卷含解析.doc
- 2025年山东省青岛市实验高中高三第四次模试物理试题文试题含解析.doc
- 2025年山东省济南市市中学区初三年级模拟考试(四)语文试题含解析.doc
文档评论(0)