联系我们 |
 |
合作经济与科技杂志社
地址:石家庄市建设南大街21号
邮编:050011
电话:0311-86049879 |
|
|
经济/产业 |
[提要] 本文通过档案互操作的需求分析,明确互操作问题在档案馆系统中的重要地位,以及解决互操作问题的现实意义。在研究档案馆系统互操作需要解决问题的基础上,提出基于构件技术的解决方案。
关键词:构件;档案;互操作
资助信息:保定市科技计划资助项目(10ZC006);河北大学青年基金项目(2011Q07)
中图分类号:TP 文献标识码:A
原标题:基于构件技术的档案系统互操作问题研究
收录日期:2013年4月14日
一、引言
构件技术是目前流行的软件开发技术之一。构件是面向软件体系架构的可复用软件模块,构件具有有用性、可用性、质量、适应性和可移植性等属性。其有用性和可移植性的特点可以避免相同功能模块的重复性开发工作,可用性和质量的特点可以极大减少软件测试阶段的工作量。基于此,在考虑解决档案系统互操作问题时,考虑到了构件技术。
二、档案互操作的需求
在数字档案馆系统中,可互操作的含义不仅仅是技术层面的,更多的是服务层面的。数字档案馆系统通过一定的技术手段屏蔽各异构数据库之间的差别,为用户提供一致的检索界面,由系统自动执行跨平台的检索,对子系统不同的信息格式进行转换,并向用户提供最优显示。
目前,网络上的数字档案馆是由不同机构、组织创建和维护的,这就导致各种资源拥有自己专用的资源描述、组织和检索系统,各个资源间具有现实和潜在的互不兼容性。数字档案馆系统不是单门独户的档案馆在封闭的环境中所能建成的,数字档案馆系统是网络环境下一个国家乃至世界范围的信息资源库群的建设事业。每个档案馆都有可能成为整体数字档案馆系统工程的组成部分。在这个前提下,可互操作问题是必然存在,也是不需要解决的。
(一)互操作问题是数字档案馆系统的基础。互操作性是构建数字档案馆的基础,他不仅是构建数字档案馆系统的底层技术之一,而且涉及到数字图书馆系统的每一项操作。
首先,底层异构平台的互联是数字档案馆系统存在的基础。数字档案馆系统是依托于网络的,如果底层异构平台的互操作都不能解决,数字档案馆系统也就失去了存在的前提条件。
其次,实现数字档案馆间的互操作是构建数字档案馆系统的前提。不解决数字档案馆间的互操作问题,数字档案馆就无法进行互访,更不用说为用户提供统一的检索界面,实现跨库的无缝检索了。
第三,互操作涉及到数字档案馆系统建设的方方面面。从底层的数据加工描述、数字对象的存储,到高层的信息搜索、付费,以及权限管理,等等,都与互操作密不可分。如果各个档案馆在这些环节上不能达成一致协议,那么整个数字档案馆系统的互操作问题必将难以解决。
(二)数字档案馆系统互操作需要解决的问题。在软件体系结构中,互操作是有层次性,数字档案馆系统的互操作问题也不例外。数字档案馆系统的互操作性可以通过三个层面来表达。
1、技术层面的互操作。通过遵循相同的通信协议来实现,这能够保证信息交换的顺利进行。
2、内容层面的互操作。包括数据对象和元数据的协议,即对传送内容在语义解释上保持一致。
3、组织层面的互操作。数字档案馆系统的访问机制、付费机制、权限管理等遵守相同的协议,保证数字档案馆间的互操作性。
三、数字档案馆系统中的互操作问题解决方案设计
数字档案馆系统,是面向数字档案这一特定主题领域的、可供多级用户并发使用的、集信息采集、信息整理、信息加工和信息服务为一体的智能知识服务系统。我们可以通过构件技术,建立一个简单的数字档案馆系统互操作模型SDASIM。
(一)SDASIM模型介绍。建设数字档案馆系统需要对多个数字档案馆系统进行整合,以门户网站的形式为用户提供服务。SDASIM采用四层C/S体系结构。第一层是瘦客户,用户访问系统的入口;第二层是Web服务器,处理和管理读者发来的各种HTML请求和Web内容;第三层是应用服务器,作为中间层提供多种服务,使档案馆门户可采集、加工、处理、存储、组织、发布、管理和安全地访问后端多种数据源;底层的数据库服务器则存储各个子系统的元数据。
(二)SDASIM的互操作性。SDASIM系统采用下面的机制来保证其互操作性:
1、应用服务器构件化。运用CORBA的思想把数字档案馆系统各项服务构件化,保证互操作性的前提下,使系统易于维护,具有较好的稳定性和可扩展性。
2、对象数据和元数据的分离。将信息分成元数据和对象数据,利用元数据的共享,使得各种查询工具可以充分发挥作用,大大提高检索效率。
3、对各数字档案馆进行封装。用CORBA技术封装各数字档案馆,注册到ORB总线上,屏蔽各成员数字档案馆的差异,为互操作提供基础。
(三)SDASIM系统的服务内容
1、内容管理服务。内容管理服务为资源加工的整个过程提供服务,SDASIM系统提供相应的工具帮助完成数据的标引、分类、提交、发布。内容管理工具分为两类:一类是数据加工工具,包括元数据加工工具和对象数据加工工具;另一类是信息资源管理工具,包括元数据管理工具、信息资源的提交发布工具和异构数据源管理工具。
2、数据访问服务。SDASIM系统提供个性化访问方式,通过用户角色和个人偏好的明确定义或者观察用户选择的内容、显示风格变现出来的习惯来模糊地给用户提交个性化内容。在信息显示方面,根据内容进行分类,可以由用户定义分类法,也可以由外部数据源自动化分类处理,支持不同的浏览器和操作系统。
3、搜索服务。主要完成对分布式资源的检索,利用元数据来描述分布式资源,从而对分布在不同地方的资源进行检索。除此之外,SDASIM系统还提供非结构化信息的检索。数字档案馆中大量的非文本信息或者多媒体信息属于非结构化信息,采用基于内容的检索技术难度大,技术实用性有待于提高,也可采用通过检索元数据达到检索对象数据的目的,比较而言,后者实施起来更加容易。为了提高服务质量,SDASIM系统提供自动文摘生成,辅助用户筛选资源。
4、安全服务。提供用户鉴权、访问控制、数据保密和数据一致性等功能。
5、门户管理服务。提供图形化管理工具,使SDASIM系统门户管理员可以监控后台数据库和门户模块的状态,设置数据库存取方式,以及监控用户操作,防范和处理门户网站可能受到的攻击。
(四)SDASIM系统门户网站的设计。SDASIM系统门户网站的建设选择以CORBA技术为主,以Java为辅的技术方案:系统后台利用CORBA对分布异构的成员数字档案馆进行封装,接插到软总线上,评判各子系统间的平台差异。面对用户的Web应用采用CORBA+Java,充分发挥两种技术的长处,为用户使用数字档案馆系统提供有利条件。按照该技术方案设计的站点结构如下:
第一层为表示层,即客户端。Java Applet可以利用Java对象请求与CORBA对象通信。具体流程是:首先,浏览器从Web服务器上下载网页,网页内嵌Java Applet程序。当Java Applet下载完毕,Web浏览器开始解析执行Java Applet。之后, Java Applet调用CORBA服务对象。Java Applet中包含IDL产生的客户存根,用它来调用对象请求中介服务器上的对象。
第二层为Web服务器,是表示层和业务逻辑层的中间层。
第三层为业务逻辑层,即应用服务器。其是整个结构的核心,把异构数据源抽象成数据源对象后集成在一起供Java Applet调用。这些数据对象的实现为客户端提供查询服务、数据的基本操作、事务处理、并发服务、安全控制等操作。数据源对象间可以通过对象请求代理ORB对话通信,达到负载平衡,优化组合分布式业务对象。
第四层为数据存储层,由于系统采用CORBA技术构建,所以后台的数据库可以是多种不同类型的数据库。
整个系统利用Java来实现。把Web浏览器作为通用CORBA客户端,透明地访问后端各种CORBA应用服务。这样既扩张了CORBA的应用范围,同时也增强了Web的分布计算能力。
(作者单位:1.河北大学计算中心;2.河北金融学院)
主要参考文献:
[1]李霞,王琦.基于软构件技术的业务建模平台的设计与实现[J].现代计算机(专业版),2010.10.
[2]张静.校园数字化建设系统架构的档案数字化服务平台建设[J].现代情报,2010.11. |
|
|
|