由于NSDL的内容和用户的多样性,为让各种用户共享不同的信息,最初的体系结构设计就是通过共享元数据,并利用元数据开发核心服务(如,搜索和发现)。其体系结构(见图2),包括以下几个基本概念:[2][3]
附图
图2 NSDL体系结构
·采用公共的核心元数据实现异构系统间的资源发现。
·核心元数据与具体领域的扩展元数据相结合。
·以元数据为基础实现跨库搜索并创建更丰富的服务。
·采用自动索引和检索系统来减少编目工作。
元数据库—NSDL体系结构的关键部分是元数据库。元数据库存储所有藏品集的元数据,并通过OAI协议把它们提供给服务商,服务商通过元数据可以开发出各种服务。在NDSL中,元数据库可能分布在多个服务器上,并有多个镜像。NSDL早期采用分布式元数据库,现在改成集中式。这是因为分布式元数据库在检索时会因为其中的一个元数据库的查询失败或响应较慢,而造成整个检索的失败或长时间的响应,而集中式元数据库可以避免这种现象。
NSDL的互操作性问题
NSDL的互操作性采用三种方式来实现:[4]
·联合:这是一种传统的方法,其所有的成员组织都遵从某些标准规范,如通过Z39.50协议共享在线目录。
·OAI采集:以OAI元数据采集为基础。每个数字图书馆藏品的元数据都能提供到Dublin Core的映射,并以简单的交换格式向外提供,这样,服务提供商就能采集这些元数据,把它建入到信息发现系统中,而且这些藏品能够实现良好的互操作性。
·搜集:即使各种不同的组织之间不存在任何形式的合作,通过网络爬虫收集开放访问的信息仍然可以实现一定程度上的互操作。各种网络搜索引擎就是这样。
NSDL主要通过OAI元数据采集来实现互操作。2001年初,NSDL确定支持8种标准元数据格式,这8种元数据之间的互换通过Dublin Core元数据核心集作为过渡。
(1)Dublin Core
(2)Dublin Core with DC—Ed Extensions
(3)LTSC(IMS)
(4)ADL(SCORM)
(5)MARC 21
(6)Content Standard for Digital Geospatial Metadata(FGDC)
(7)Global Information Locator Service(GILS)
(8)Encoded Archival Description
3 NCSTRL项目体系结构介绍
NCSTRL (Networked Computer Science Technical Reference Library)是另一个有代表性的数字图书馆项目,其规模仅次于NSDL,它是由DARPA资助的,来自北美、欧洲和亚洲的160多家学术研究机构参与了该项目。其体系结构以 Dienst体系结构为基础,该体系结构的一个重要特征就是分布式搜索(见图3)[5]。
附图
图3 NCSTRL的体系结构
在NCSTRL的早期项目中,用户的查询式被直接提交给所有的索引服务器,但随着参与机构的增多,检索时同样会因为其中的一个元数据库的查询失败或响应较慢,而造成整个检索的失败或长时间的响应,为了解决这一问题,NCSTRL引入了查询路由器的概念[6][7]。
查询路由器QR(Query Routers):根据一定的机制把查询式发送到分布式的索引服务器中,并负责合并来自不同的索引服务器的查询结果。另外,该体系结构还引入了藏品服务(Collection Service)的概念,它是查询路由的基础,提供把各种服务集成到数字图书馆中的各种机制。按照当前的藏品服务定义,它提供以下信息:
·参与该藏品服务各单位的目录
·每个单位的索引服务器的网络地址
·索引服务器的元信息(为查询路由提供依据)