网络应用的日益普及为分布式内容管理提供了技术上的可行性,而网络资源管理系统则为它的实施提供了管理上的可行性。[5]同时,随着电子文献在数量和质量上的迅速增长,人们在教学科研过程中对电子信息资源的依赖程度和掌握能力也同步地增长,这就为内容管理员群体提供了越来越充分的人力资源背景。
三、网络资源管理系统的设计和开发网络信息资源重构的工具平台
设计和开发网络资源管理系统是实现分布
式网络信息资源重构模式的核心任务,一个功能完善的网络资源管理系统能够起到以下作用:
·向读者提供网络信息资源的宏观和微观视图以及相应的访问方式;
·向内容管理员提供便利、高效的信息收集、组织和发布工具平台;
·向系统管理员提供用户管理、资源监测、资源评估等系统管理功能。
以下笔者将根据在主持清华大学图书馆“985”电子图书馆建设项目的课题“网络资源管理系统的开发和应用”过程中的思路和经验,对网络资源管理系统的结构和功能加以概括。如图1所示:
附图
图1 网络资源导航系统总体结构
网络资源管理系统包括5个方面的内容:
(一)网络资源的描述。网络资源的描述是通过对相关元数据的制订来实施的,经过调研,确定以专门用来组织网络资源并且易于操作的都柏林元数据核心元素集(Dublin Metadata Core Element Set,简称DC)为基本集合,结合用户的检索要求、网络资源的特点以及系统的信息挖掘、资源监测和评估等高级功能,增加了相应的属性,制定出一套用以帮助识别、描述、定位、组织和管理网络资源的元数据集合:网络资源管理元数据(Network Resource Management Metadata,简称NRMM)。
(二)网络资源收集、整理、组织和发布工具。工具平台包括各级用户注册模块、内容管理员资源添加、管理和维护模块、内容管理员站务管理模块和普通用户推荐资源模块。在网络信息导航系统平台上,系统的功能分为两种:
第一种是需要人工参与的,包括面向系统管理员、内容管理员和普通用户等三种参与者的相应功能。其中,系统管理员具有最高权限,包括管理内容管理员和用户的属性信息、设置学科等;内容管理员负责分布式地收集、标引、组织和发布网络信息资源,以及审查由用户推荐的资源;普通用户可以浏览系统内现有资源和推荐新资源供内容管理员审查,同时还可进行信息反馈和交互。
另一种系统功能是由系统自动执行的,具体包括网络信息源的自动监测和质量评估、网络信息挖掘和提供。
(三)网络信息源的自动监测和质量评估。网络信息导航库的资源质量控制是通过人工审核和自动监测相结合来实现的,网络资源管理系统主要提供自动监测和基于自动获取指标数据的质量评估机制。[6][7]由于网上资源的变动性很大,因此,为了保证系统中资源的可用性和新颖性,这种定期监测评估是必需的。
针对学术性资源,主要着眼于网站的内容和它的结构与系统机能进行评估。由于本系统所收集的网站信息资源已经十分庞杂,采取人工方式进行评估耗时耗力,因此,采取软件实时测试的自动评估方式。目前,将测试指标定为网站的链接状态和特征页面信息提取等几项,同时会记录每一个被监测对象的监测时间和监测周期,通过系统定时执行监测程序并保存监测结果。监测结果最终会向系统的内容管理员发出监测报告的通知,从而起到保持和维护信息资源系统的监督作用。
(四)网络信息挖掘和提供。采用内容管理员模式来收集专业网络资源,提高了资源的精度和深度,但是,网络资源浩如烟海,光靠内容管理员人工查找是无法达到广度要求的。因此,采用自动抓取和人工过滤相结合的方式,即用非结构化的数据挖掘技术获取更有价值的信息。