维普资讯 http://www.cqvip.com
数字图书馆网络信息资源整合及其技术分析 贾 宏 (南阳师范学院图书馆南阳473061) 摘 要 在飞速发展的网络技术和通讯技术的强力推动下,数字图书馆迫切需要对已经发生了根本性变化的馆藏信 息资源进行统一的组织、梳理和定位,并设置统一的入口,以达到为用户提供优质、高效的信息服务的目的,信息资源 整合由此成为数字图书馆发展的关键。从数字图书馆信息资源构成入手,在概迷数字图书馆信息资源整合相关问题 的基础上,分析了数字图书馆网络信息资源整合的相关技术。 关键词 数字图书馆信息资源整合 目录服务 系统功能 发布技术,整合网站资源;建立统一、高效的网络信息资源发布服 l 数宇图书馆信息资源构成 务平台等。信息资源的整合须按照 整合而非混合、整合而非兼 信息资源是图书馆生存和发展的基础,是满足用户需求的根 并 的原则进行,首先应制订相应的资源标准,然后由各网站按照 本保证。网络技术和通讯技术的飞速发展,使图书馆的信息资源 标准对站点进行改造,开发相应的功能模块,最后建设整合后的 类型和馆藏结构发生了根本性的变化,也促成了传统图书馆向数 站点,形成一个大的资源系统。用户可以通过整合形成的门户服 字图书馆的急剧转变。数字图书馆以分布式数字信息为对象,以 务站点,方便地访问到被整合站点所发布的各种信息资源。 网络资源和服务为主体,通过计算机和通信网络多渠道、全方位 2.2 以xML结构化数据表示为核心的信息资源的描述、整合 地收集文本、声、光、图像、影视等电子信息资源。根据存在形式, 与发布随着Web技术的飞速发展,丰富的信息资源给人们的学 目前数字图书馆信息资源类型大体上分为三类:a,传统的印刷型 习生活带来了极大的便利。电子出版、远程教育等基于web的新 文献。这类资源依然是数字图书馆的熏要馆藏来源,但所占份额 兴领域的全面兴起,也使得数字图书馆传统的Web资源更加多样 在逐渐减少。b,磁性介质的正式与非正式出版物,包括电子书 化和复杂化,人们对Web服务功能的需求标准也随之提高。比如 刊、光盘数据库(网络版和单机版)、网络数据库(或联机数据库) 需要对Web进行智能化的语义搜索,需要对数据按照不同的需求 等电子信息资源。这类资源具有体积小、容量大的突出特点。是 进行多样化显示,以实现基于智能的信息推送和个性化服务等。 数字图书馆的主要馆藏来源。c.流动在Internet上的虚拟信息资 在这种情况下,XML(eXtensible Markup Language,可扩展的标记 源(即网络信息资源),包括www站点、邮递表、新闻组、公告栏 语言)应运而生。 等等。这类资源具有虚拟的性质,没有具体的载体形态,须经过 XML以一种开放的自我描述方式定义了数据结构,在描述数 整合、组织和转换才能进入数字图书馆的馆藏,是数字图书馆最 据内容的同时也突出对结构的描述,从而体现出数据之同的关 有潜力的信息资源。 系。对于Web信息资源整合来说,XML技术具有诸多优点:其 数字图书馆将不同载体的信息资源经过有序整合后,以数字 一,XML允许组织、个人建立适合自己需要的资源集合,可广泛应 化方式存储,以网络化方式传递。与传统图书馆相比,数字图书 用于信息交换的多种领域;其二,XML把文档的三要素开来, 馆信息资源具有类型多样化、分布式组织、计算机处理和格式化 其自我描述性质能够很好地表现许多复杂的数据关系,使得应用 存储的总体特点。本文将重点探讨数字图书馆网络信息资源的 程序可以在XML文件中准确高效地搜索相关的数据内容;其三。 实现方式及其相关技术问题。 在信息发布方面。同样的XML接口,可以适用于不同的用户端访 问形式;其四,XML于平台。有利于跨平台同的信息交流,完 2数字图书馆网络信息资源整合的技术分析 全可以充当网际语言,并有希望成为数据和文档交换的标准机 2.I 网络信息资源整合的日标 网络环境下,图书馆信息资 制;其五,XML能够更准确地表达信息的真襄内容,其严格的语法 源逐步走向以网络信恩资源为主,而分布在网络上的信息基本上 降低了应用程序的负担,也使智能工具的开发更为便捷。 处于一种无序的状态。各个网站在信息结构上采用完全不同的 2.3 Web service的信息发布和访问接口 Web Service是继 组织结构。此外还包括了Web发布的数据库、应用程序等等其他 Web访问之后的新一代资源发布方法,有着更大的灵话性和交互 多种类型的信恩资源。因此,信息资源必须实施整合,形成结构 性。特别是强大的交互性能,使网络资源不再作为一个的孤 化、有序化的资源系统,建立统一的信恩资源访问调用接口和资 岛。而能够作为一个整体信息系统的有机组成部分而存在。Web 源索引,为用户提供方便快捷的资源检索和调用服务。 Service除了具有业务逻辑处理功能的发布能力外,更有强大的编 数字图书馆网络信息资源整合系统的目标,主要包括制定信 程和自动处理功能。 息资源的分类标准、资源描述表示标准;利用先进的信恩处理及 利用Web Service的技术策略进行站点资源整合,还具有以下 作者简介:贾宏,女,1968年生,副研究馆员。研究方向为网络技术开发管理及应用、网络信息资源的开发和利用。 囤 维普资讯 http://www.cqvip.com
优点:a.访问灵活。用户可以使用Web页面访问方式获取静态资 如前所述的资源整合系统的应用目标,我们设定系统的以下三方 源,也可以通过Web Service接口远程获取动态应用资源。b+分类 面的功能需求: 清晰。可以根据功能对网站内容进行分类,提供分类的Web Ser. 3 1 1 站点资源的发现、分类和标glg[ ̄务。系统通过对各个 vice函数接口。c.容易扩展 升级各个网站服务功能,无需改变 网点的静态页面、动态页面和数据库资源进行搜索,发现和分类 各个网站的整体结构,同时可以动态地集成更多的新网站资源。 各站点的Web数据,按照定义好的分类标准格式,以XML格式重 d.移植方便。各个网站的网络服务可以轻松移植到不同的系统 新描述、封装信息内容,并以信息标引的形式生成信息资源索引, 平台上。e.支持异构环境。通过Web Service技术屏蔽不同的操 并保存于资源数据库中,以供用户对资源的静态自动检索。此 作系统、数据库系统等服务平台。f.功能丰富。各个网站能够根 外,系统也提供对被整合站点的实时动态资源检索访问接口,满 据自己的特长,提供各种具有自身特色的信息服务。 足用户的即时资源检索以及系统资源自动更新的需要。 2.4 Ontology(本体论)Ontology原为哲学术语,意为 关于存 3.1.2站点资源的分类、分析处理和存储管理。系统通过 在的学说或言论。,或者。客观存在的一个系统的解释或说明 ,它 资源分析处理功能。对发现的Web资源XML格式标引信息进行 关心的是客观现实的抽象本质。现代学科的交叉和融合,使专业 分析、筛选处理,排除、合并冗余的信息,检验信息资源的一致性, 术语的内涵和外延兼具了可以厂泛使用的共性。Ontology技术是 对信息进行结构化处理和排序,为资源标引信息建立索引,按照 从图书馆学、哲学和知识表述等领域发展起来的一门科学。但 定义好的标准格式进行存储。其中,对资源索引的智能化数据排 是,目前该技术的应用领域已经完全超越了上述领域,被广泛应 冗和信息一致性处理是主要功能,也是资源整合过程的关键部 用到目录系统、数据库系统、Web出版系统、知识管理系统中的中 分。 心词汇控制表中,并成为上述应用系统的核心组成部分。 3.1.3 Web资源的检索和调用服务。Web资源的检索和调 网络信息资源整合系统要解决的是网络信息资源的描述、一 用服务是根据用户的不同访问形式(如Web浏览器、自动程序、移 致化利用等重要问题。作为信息资源分类的基础,Ontology的目 动终端等)提供不同需要的资源检索和调用服务;所有检索和调 标是捕获相关领域的知识,提供对该领域知识的共同理解,确定 用服务采用Web service来实现,以XML作为接口描述格式,实现 该领域内共同认可的词汇,并从不同层次的形式化模式上给出这 不同用户形式的统一访问。 些词汇(术语)和词汇间相互关系的明确定义。由于Ontology具 有良好的概念层次结构和对逻辑推理的支持,因而在信息检索, 3.2信息资源整合系统功能的实现根据以上功能分析,在 特别是在基于知识的检索中得到了厂泛的应用。同时,也是由于 系统设计中我们可按照。功能实现与接口分离。的原则,系统部分 Ontology通过对概念的严格定义和概念与概念之间的关系来确定 之间的访问和调用接口采用Web Service接口来实现,以xML为 概念的精确含义,表示共同认可的、可共享的知识,因此它在语义 接口表示和数据交换格式;而在具体功能模块实现上,实现 互联网方面也有着广泛的应用领域与厂阔的发展甑景。 的功能处理模块。 2.5 目录服务在数字图书馆网络信息资源快速增长的背景 3.2.1子站点信息资源的搜索、封装、更新服务模块。这类 下,集中的信息存储已经无法适应Web文档信息的数据储存需 服务模块包括:a,数据库资源采集封装服务;b.静态资源搜索发现 要,而对于Web信息而言,建立简明有效的Web资源索引显得重 和封装 资源的实时更新、新增服务;d.动态应用的封装服务。 要起来。当酊。应用广泛的目录服务(directory Services)可以较好 这些功能模块实现自动发现和检索有关网站Web页面和动 地满足这一需要。 态应用资源,根据定义的信息资源分类标准来分类信息。生成信 目录可以雹作网络系统中各种资源的清单,它保存了网络用 息标引。信息描述采用。XML+ontology。的方式进行。 户、服务器、客户机、交换机、打印机等等的详细信恩。如果运用 对于动态应用的封装服务。应用实例包括对各网站已有的 在Web信息资源中,可以用于描述网络资源。 Web项目申报、电子政务、技术评估等服务进行资源整合。将这些 目录服务表述的是一种层次性的存储结构。适合描述同样具 动态Web应用统一以Web Service标准呈现给用户。 有层次关系组织的Web资源。同时,目录服务还收集资源之间的 3,2,2资源服务主站点功能模块。主站点功能模块包括两 相互关联关系,并且可以动态改变和更新。当网络中新增一种资 部分:一部分提供信恩资源检索服务,即资源程序调用服务模块 源时。可以通过在目录中添加相应的数据对象以及与其它对象和 和资源检索服务模块;另一部分为信息资源的内部分析处理。即 用户的关系来进行资源更新。当网络资源位置移动或更新时,可 资源的一致性分析、冗汆资源的排除和筛选资源的规范化。以及 以通过移动相应的目录项或更新操作来完成。目录服务提供了 结构排序存储服务和资源维护更新服务功能。 一个有效管理网络资源的手段,它将网络的实际情况与目录一一 资源数据的存储也是资源服务主站点的重要功能。系统采 对应。这样对资源的管理可以变成通过目录服务来进行。目录 用 XML+目录服务。的方式,建立资源的快速索引服务;并且利 服务也支持网络资源的分区域层次化管理。 用关系型数据库和XML文件。存储静态资源和动态资源调用接 和其它数据存储方式相比,目录服务在数据的处理性能方面 口。 具备很高的数据检索性能。能够满足大规模的资源快速检索要 3 2.3 Web Service接口封装。由于系统要遵循 功能实现 求。如果和其它数据存储形式配合(如大型分布数据或文件类型 与接口分离 的原则。因此。系统分别在子站点和服务站点要采 数据)。可以实现大规模的信息资源存储和检索。 用专门的Web eSrvice接口封装,对需要对外发布的服务模块实现 此外。借助于目录服务在用户管理和安全管理方面的优势。 接口封装。 也可应用于资源整合系统的用户管理和安全管理中。 3.2,4对外服务接口 对外服务接口是系统为了适应不同 3 数字图书馆网络信息资源整合系统的功能及其实现 形式的用户端访问需要而设立的,主要设计实现普通Web访问、 应用程序调用和移动设备三类访问接口。以满足不同的服务访问 3.1信息责源整合系统功能概迷根据以上技术分析,结合 形式。 囫 维普资讯 http://www.cqvip.com
4 结语 发现、整合与利用提供一个全新而高效的技术平台。为数字图书 馆的网络信息服务开辟更加广阔的发展 景。 在图书馆界,信息资源整合历来是一项重要工作;以网络信 ’考文献 息资源为发展方向的数字图书馆馆藏结构的变化,更使其成为一 1胡昌平.现代信息管理机制研究武汉:武汉大学出版社,2004 项涉及面很厂、技术难度很大的系统工程。本文所阐述的资源整 2周 民.信息资源整合与价值管理中国海洋大学.2003 合系统和相关技术是目前数字图书馆一种行之有效的网络信息 3王善平.论数字信息资源的整台与标准化.情报资料工作,2002;(6) 资源整合方案,是新型的网络信息在不断涌现,技术更新的周期 4杨晓丽,孙莉.XML在Web信息资源整合中的应用.东华大学学报(自然 在加速缩短,基于此方案的数字图书馆信息资源整合及其配套工 科学版),2002:(6) 作还有待进一步的研究和实践。这种研究和实践的主要内容包 5张文德,戴晓翔.信息资源整合系统与技术研究.现代图书情报技术,2003; (6) 括以下几个方面:a.信息的标准化问题。包括资源分类标准化、静 6董慧.基于本体论和数字图书馆的信息检索.情报学报.2003;(6) 态页面模版标准化和被整合站点的Web Service接口标准化都有 7黄晨.资源整合模式及其实现研究.大学图书馆学报,2004;(1) 待完善o b.信息范围的扩大化问题。随着被整合网站在数量和 8海胜利数字信息资源整合检索的技术基础图书馆工作研究,2004;(2) 信息量方面的同步增加,需要考虑大量数据对网络资源的同步搜 9许科峰,高建民,陈富民等.基于Web Services的企业应用集成技术及宴现. 索、发现与更新,以及信息资源的一致性和数据分析处理效率等 计算机应用,2004;(3) 方面的影响。c.新的网络资源方式的集成和服务的提供同题。 10曾新红.XML在数字图书馆相关技术中的研究动态.现代图书情报技术, Web信息技术的发展日新月异,各种全新的信息表示和访问技术 2004;(5) 层出不穷,如何将这些新型的网络资源无缝地整台到系统中。并 l1邹嘉麟,陈家训.Web信息资源整合系统模型和方法.计算机工程,2004; (12) 且能够提供个性化的信息资源服务,也是一个需要进一步解决的 12胡潜.个性化服务中的信息资源整合分析.图书馆论坛,2005;(1) 实际问题。 13赵冬梅.图书馆信息资源整合.情报科学,2005;(3) 随着网络信息的海量增长,信息资源的有序化和信息的可用 14龚亦农.数字图书馆的资源整合.图书情报工作,2005;(7) 性同题已经成为以数字图书馆为核心的国家信息资源建设中的 15何小清数字化馆藏资源的多层次揭示http://www zhupao corn/con 一个关键问题。互联网所包容的信息内容在数量和覆盖内容方 tent/338/347/2824.htm(浏览日期:2005—08—16) 面日趋全面,但众多有效的、可使用的信息资源也往往被淹没在 16张晓林等.我国数字图书馆标准规范建设.http://202.106.125.20/infor- 网络信息的汪洋大海之中,各种资源因此形成了~个个有待开发 resour/communications/The%20future%20devlopment%20of%20standard% 的信息孤岛。网络无止境,研究无穷期。我们期待着设计更加科 20specification%20of%20digita1%20library%20.pdf(浏览日期:2005—08— 16) 学、结构更加完备、功能更加强大的资源整合系统。为网络资源的 (责编:勃阳l (上攮I|38页l最大限度地为用户发现服务。也使得数字图书馆的服 详细介绍了多代理网格服务中介的各组成部分。服务发现部分演 务具备了一定程度的语义功能,更加智能化。 示了模糊匹配机制的动态发现和匹配过程,同时也提出模糊匹配 3.2高效性多代理网格服务中介将已发现的网格服务按照效 机制需要与其它处理方式相结合以减轻不当匹配的偏差。服务规 用和可行性排序,然后确定网格服务的规划并协调使其有效执行。 划和协调部分解释了根据效用排序的服务规划选择和OWL—S本 这样。数字图书馆的用户最终获得的服务信息是经过量化选拔的。 体与BDI代理结构相映射的服务协调。服务的安全性和可靠性处 是最合适、最有效的服务。 理部分提出了用事务处理来保证网格服务可靠性。并对未来网格 3.3健壮性多代理网格服务中介通过事务技术,保证网格环 服务的安全问题表示了担忧。最后,本文介绍了多代理网格服务中 境下分布式处理的可靠性。这对于数字图书馆的服务记录和付费 介在数字图书馆中的应用。它一方面使得数字图书馆服务在网格 转账环节有极其重要的价值。 开放、共享的资源环境下具有更多的可扩展性、高效性和健壮性;另 当然。网格和多代理网格服务中介也给数字图书馆带来了一 一方面也为数字图书馆的权限管理、版权管理和安全措施等方面 些问题。在网格开放、麸享的环境下。用户身份验证和权限管理更 提出了更高的要求。 加困难。数字版权管理的完善更加急切L7j,数字图书馆的安全问题 也变得更加值得重视。这些都需要我们在进一步的研究中找到解 ●考文献 决的措施。真正建立起完善的基于网格和多代理网格服务中介的 1馀志伟等.网格计算技术.北京:电子工业出版社.2004 数字图书馆系统。 2桂小林.网格技术导论.北京;北京邮电大学出版社,2005 3胡春明等.基于Web服务的网格体系结构及其支撑环境研究.软件学报, 4结 论 2004;(15) 4 Rao S.A.。Georgeff M P.BDI Agents:From Theory to Practice Conference 网格是一种在[nternet范围内实现资源广泛共享与协同使用 Proceedings of 1st International Conference oN Multiple Agent S ̄tem,1995 的新模式。基于多代理的网格服务中介动态地发现网格服务。为已 5 Hendler J.Agents and the Semantic Web.IEEE Intelligent Systems March/ 发现的服务确定最有效的规划和协调策略。并安全可靠地利用这 April,2001 些服务。 6刘勇等.BDI模型信念特性研究.计算机研究与发展,2005;(1) 本文介绍了基于多代理的网格服务中介,首先在OGSA的框 7王丽华.未来数字图书馆的关键技术探讨.图书馆论坛.2004;(3) 架下简要介绍了含有多代理网格服务中介的网格总体结构,然后 (壹编:王京) 田