您的当前位置:首页正文

图书馆馆藏数字资源整合方案研究

来源:九壹网
维普资讯 http://www.cqvip.com

2OO6年8月 第8期 August.2OO6 No.8 图书馆馆藏数字资源整合方案研究 李红霞 (德州学院,德州253023) 【摘要】 本文针对图书馆馆蕞数字资源整合技术的难点,提出了整合检索网关的wGate的思想覆解决方案。 【关键词】 电子资源;整合; ̄,ate [Almract].I1li8paper proposestheidea wGage and solutionstothe ditilcultiesfromlibrary reso ̄tlon. ’ integra. 【Key woras ̄dig眦resource;integration;wCate [中图分类号)G253 [文献标识码)C [文章编号)1008.0821(20O6)08—0144—02 目前,数字信息资源已经成为图书馆馆藏的重要组成 部分,为用户查询提供了极大的便利。但从另一方面讲, 数字资源越多,给用户造成的负担就越重。主要原因是数 字资源整体的无序化,内容组织程度不高,各数据库之间 不能实现跨库检索。使用户需要掌握不同的检索方法。在 多个数据库中重复进行检索。这样必然会浪费用户的时间。 影响用户对数字资源的兴趣和数字资源的有效利用。因此, 对数字资源进行有效整合变成了数字资源建设的核心问题。 功能上的差异是检索系统整合中最常碰到的问题之一, 对于特定系统提供的特定功能可以根据功能分布透明性的 要求采取不同的处理方式。但核心功能集所有参与整合的 检索系统都必须具备。 2.1.3属性与内容的异质 检索系统可能支持不同的提问句法、不同的结果返回 格式,数据库可能支持不同的属性集,它们的语种不同, 标引的词汇有差别等。 l数字资源整合的概念及目标 1.1数字资源整合的概念 数字资源整合.是指依据一定的需要和要求。通过中 间技术(数字资源无缝链接整合软件系统)。把不同来源和 2.2解决方案设计 检索工具对不同目标系统的查找可以有两种方式。其 不同通信协议的信息完全融合,使不同类型、不同格式的 数字资源实现无缝链接。通过整合的数字资源系统,具有 集成检索功能。是一种跨平台、跨数据库、跨内容的新型  国 数字资源体系。书 1.2整合的目标 馆 进行馆藏数字资源整合方案设计,主要是达到以下目 管  理 标:2.1单一的访问方式; 与 1.资 1.2.2分布资源的有序集成; 源 1.2.3个性化服务; 建 2.4提供智能化的知识服务。 设 1.是定义一种查找的标准,规定客户端和服务器之间的提 问与结果返回格式,因此检索过程产生的是标准化的信息 流,通过标准化的应用程序接口消除了不同目标系统之间 的差异。z39.50就是这种方法的典型代表。另一种方式是 由客户自行学习使用各个目标系统的查询界面,这是目前 最为常见的方式。如果对这两种实现方式作一个划分。前 种是基于标准方式的互操作。而后一种实际上是一种代 理,书目整合检索网关wCate就是按照这种思路设计的。 wGate是对现存于WEB上的书目检索服务器 四PAC进行 整合的,这些WEBPAC没有提供标准的接口。都以HTML 一一的方式输出结果,要实现它们之间的整合。代理是最适合 的方式。 2.2.1 wGate的网络拓扑图 2数字资源整合技术及方案 2.1整合技术难点分析 检索系统实现整合的难点大体上可以归纳为3种: 2.1.1应用协议的异质 多个参与协作的检索系统可能运行于不同的软件平台 之上。如系统甲是由Tehaet界面来查询。乙是通过H】:卯协 议来提供服务,而丙则是一个标准的Z39.50服务器。甲需 要建立连接来实现检索。而乙采用的是非连接协议;丙需 要保存检索状态。而乙是无状态的检索协议。屏蔽协议的 异质可以有多种方法。如采用外部代理方式。或是对原有 系统进行对象化的包装来重新构建系统间的界面。 2.1.2功能的异质 收稿日期:2OO 一lS 见图1,作为整合检索网关的wGate服务器不存储书目 数据库,它只通过单一的瑚 协议与提供书目检索的目 标系统发生关联,负责接受浏览器的检索请求,经过格式 转换后把请求向目标服务器转交。对返回的检索结果进行 处理后回送至浏览器。wOate可存取的目标系统包括存有书 目数据库的Web服务器、存有书目数据库的239.50服务器 的WEB通道、WEB网关、239.50网关的WEB通道等等。在 定的协议支持下。目标系统还可以是其它wGate服务器。 2.2.2 wGate的功能设计 一‘ 与实现多目标系统检索的239.50网关一样,实际应用 中wGate实现的功能并不等同于软件本身具备的功能,而 受制于目标系统自身提供的检索功能。通常情况下。整合 作者简介:李红霞(1976一),女,毕业于山东师范大学计算机系,德州学院图书馆技术部馆员,研究方向:计算机系统维护和管理。 ・—-——144・--—— 维普资讯 http://www.cqvip.com

2OO6年8月 第8期 August.2006 No.8 I浏览器 = WEB服务器 浏览器I = 器的WEZ39.5ofl ̄务 通道 B WEB 查询 = WEB刚关 网关 wGate l浏览器I㈢ = Z的WEB通道 39.50网关 其他wGate = HTTP协议 Z39.50协议・…・ 其他协议 图l 查询网关实现的功能集是各个目标系统支持的功能集的交 (1)查询功能的扩展 集。但整合查询网关软件本身具备的功能应当是各个目标 检索系统实际应用中还需要进行一些功能的扩展,如: 系统功能集的并集,因此在wGate功能设计时按照尽可能 退出检索;检索式和检索策略的保存、修改、删除;根据 完善的指导思想来进行。 保存的检索式重作检索;定时以批处理方式提问;根据特 (1)检索功能 定数据库的特征。对检索表达式进行优化;检索结果集的 检索系统应提供存取异地、异构数据库的能力;对不 保存、清除与提取;检索结果集的过滤、归并;结果集中 同数据库的检索提供统一的操作界面;支持广播式检索。 记录的排序(按书目机构或按内容);检索结果以多种格式 检索包括两个核心过程:一是查找(se锄h)即用检索入口 提交(文本、XML。MARC等);检索结果以多种方式提交 词按数据库的索引提取结果,形成查找结果集。系统应当 (mⅦ.页面、Email等);对提问和结果自动进行编码转换 支持多种查找方式,包括完全匹配、比较匹配、截词查找、 (如GB,BIGS);索引浏览;信息源查询等。另外,wGate 邻接查找、模糊查找,在指定的全部或部分字段中查找, 还可以集成Zclient的功能,实现对239.50服务器的直接访 支持布尔表达式查找等;第二是检索(retrieva1)即进一步 问。 对查找结果进行选择和处理,并提交给用户。 (2)服务功能的扩展 (2)词表功能 在有合作关系的图书情报机构之间建立虚拟联合目录 wGate的词表概念是指网络上以WWW方式提供的标题 可以做到文献资源的共知,在此基础上能够实现协调采购, 表、叙词表、分类表、名称规范档(人名、地名、专有名 合作发展馆藏。也可以在wGate上继续开发新的功能模块, 词、会议名)、题名规范档、主题规范档、责任者规范档 从而实现虚拟联合目录之上的文献资源传递与管理。 等。它不是wGate实体的组成部分,是一个虚拟的词表。 2.2.5整合检索协作网wMesh 因为词表的建立和维护本身就是一项很浩大的工程,加之 无论是从网络条件还是wGate本身的处理能力来看, 整合检索中目标系统采用的词表可能不尽相同,因此在 它都难以对众多的WebPAC服务器进行整合,因此,在某 wGate上不存储任何词表,而只是提供一种建立和使用虚拟 些情况下需要多个wGate协同完成任务。这些相互协作的 词表的方法,因而具有更大的灵活性和适应性。 wCate之间可以形成一个分布式的检索网wMesh(图3)。 2.2.3 wGate的结构流程 图3 要使wMesh有效地运作,需要给它赋予一些功能,这 些功能主要包括: (1)资源发现 资源发现的目的是全面查找用户己知的分布式信息系 统,并且揭示含有相关信息的其它数据源。资源发现的另 图2 外的功能是资源的监视,即当一个资源的内容变化时及时 2.2.4系统功能的扩展 通知用户。 (下转第148页) ・---——145・--—— 国 书 馆 管 理 与 资 源 建 设 维普资讯 http://www.cqvip.com

2OO6年8月 第8期 August.2OO6 No.8 5当前图书馆知识管理系统建模中的问题归纳 目前,知识管理系统涌现出了多种模式,主要包括: 基于层次模型的知识管理系统、基于一般系统框架的知识 管理系统、基于知识生命周期的知识管理系统、基于本体 的知识管理系统及基于XML的知识管理系统等。对当前主 流图书馆知识管理系统模型进行分析和总结,概括起来主 要存在以下几个方面问题与不足: 快速、有效、准确地为用户提供服务是图书馆知识管理系 统今后发展的必然方向。 参考文献 [1]付立宏,袁琳.图书馆管理教程[M].武汉:武汉大 学出版社,2o05:432—433. [2]王君,樊治平.一种基于Web的企业知识管理系统的  5.1 系统性的图书馆知识管理系统模型框架还远 模型框架[J].东北大学学报:自然科学版,2003,(2):没有完善,缺乏统一的标准 研究者们提出了很多知识管理系统的体系模型框架。 比如在模型中,把知识管理分为6层,即物理层、数据层、 知识存储层、功能层、应用层和表示层;提出基于本体的 知识管理系统模型,该模型框架分为3层,用户层、中间 层、数据存储层。然而,这些模型框架缺乏统一的执行标 准。 182—185. [3]肖菲,罗艳玲.图书馆知识管理模式研究[J].江西 社会科学,2002,(8):135—138. [4]Widom J.Data Management for X1 .珊旺Data EIlgiIleer in Bulletin Special Issue on XML,1999,(3):45—52. [5]苏新宁,等.组织的知识管理[M].北京:国防工业 出版社。2004:103. 5.2对隐性知识认识不足、管理不到位 (Tacit或Hidden)两类,而显性知识只占知识总量的10%, [6]周明建.基于本体的开放式知识管理研究[J].博士 [7]盛小平,何立阳・知识管理系统研究概述[J]・图书 : ,(1):36—39・  .知识可分为显性的( ed或Explicit)和隐性的 =[孟 文・浙江大学,2OO4・. . ,. , 另外9o%是隐性知识。显性知识由于已经用特定的方式表 现其稳定、明确的内涵,并且可以反复验证,所以容易储 [8]高天真・知 管 统的誉 框架 成功实施知识管 存、容易传递传授;而隐性知识由于不稳定、难提摸、原 理的核心问题分析[J]・科学学与科学技术管理,2005, 理不明确。常常被表现为个人的诀窍和特性,所以不容易 (3):69—72・ 储存、不容易传递传授。图书馆知识管理系统应加强对隐 性知识的管理。 [91.究【J J・科学技术与工程,2005,(6):351—356・ 孽新,徐小娟,徐国梁・基于本体的知识管理系统研 5.3 图书馆知识管理系统的人性化、智能化水平 ’ [10.]妻 宁,等・组织的知识管理[M]・北京:国防工 图书馆知识管理的最终目标是为用户服务.L…一………………,因此如何 .… [II]张建华,刘仲英.当前知识管理系统模型问题与对策 j :‘2 (1‘; ; :一……“ Z39.50的客户软件Zdient有很多共同之处,只是它们针对 0 查询路由是指使用索引信息来把一个提问只引导到那 不同协议的服务器进行检索。但Zdient会逐步融入查找非 里 些有可能含有相关信息的服务器上去。建立查询路由的目 Z39.50服务器的能力,而wGate也可以集成7. ̄ient的功能 翟 标是避免低效的广播式搜索。 来检索Z39.50服务器。最终这两方面的功能会集成在一 强 (3)任务分配 起。为适应B/S结构的发展趋势,向WEB平台迁移是 理 按照事前的协商结果,wGate之间具有相互配合的义 Zelient发展方向之一,在7.39.50标准与HTrP协议结合的 与 务,可以按照wGate不同的条件在wMesh协调下进行任务 研究中将会补充定义新的查询语言和新标准,这些与wEB 基 分担,保证整个系统负载大致均衡。 紧密相关的技术可以直接用在wGae。中,从而逐渐实现 (4)管理工作 WEB书目查询网关的标准化。 l (上接第145页) I (2)建立查询路由 特性集和数据加工的质量。在支持的功能上wGate和 藩 检测wGate和WebPAC的状态,收集各种统计数据,对 其网络条件、服务时间、服务质量、工作量等进行评估, 对网络中的变化情况及时通知协作成员(如某数据库URL 参考文献 [1]刘长发.论传统图书馆与数字图书馆的整合[J].现 代情报,2004,(6). 的变动、软件的升级、索引方式的变更等)。 可以定义一组wGate之间的网关互联传输与服务协议 来实现服务器间任务分担和网络路由选择。每个wGate只 负责检索速度较快或较近或指定的站点,将结果初步处理 后提交发起请求的wGate,可以节省远程低速站点的连接时 间,同时能在wGate间合理分摊任务。 [2]王善平.论数字信息资源的整合与标准化[J].情报 资料工作,2002,(6). [3]崔玉卿.论图书馆网络信息资源的整合[J].情报资 料工作,2003,(4). 2.3方案的特点 wGate是通过外部代理方式实现检索系统互操作的,它 建立的是一种虚拟联合目录,能够避免集中式目录的一些 缺点。wGate和Z39.50两者都只是提供了一种技术上的可 [4]陈维明,孙传涛,王源,等.数据库的整合与数据网 络[J].计算机与应用化学,2003,(9). [5]海胜利.数字信息资源整合检索的技术基础[J].图 书馆工作与研究,2004,(2). [6]马文峰.数字资源整合研究[J].中国图书馆学报, 2002,(4). 行方案,检索的效果最终都是取决于目标系统支持的功能、 -・——148-・—— 

因篇幅问题不能全部显示,请点此查看更多更全内容

Top