当前位置:公文范文网>领导讲话 > 组织人事 >

意见建议

主题网关对网络信息资源的组织探讨

发布: 2022-10-10 15:30:19   阅读: 次 【   

(南京图书馆,江苏 南京 210002)
摘 要: 文章认为,主题网关的发展给网络信息资源的组织和导航带来了新的模式,主题网关与搜索 引擎优势作用的互补,极大地提高了信息资源的发现的检全率与检准率,为图书馆情报界等 传统信息服务机构提供了争取网络信息服务主动权的机遇。
关键词:主题网关;信息服务;图书馆
中图分类号:G250.73  文献标识码:A  文章编 号:1007—6921(2009)04—0142—02

随着互联网络信息资源的曾几何级数的增长,兴起于20世纪80年代的搜索引擎作为一种网上 资源发现工具,逐渐暴露出检索结果冗余度过大、检准率不高的缺点,想通过它们检索出关 于某一学科的较系统、较专业的信息是非常困难的。同时,信息服务界开始面临着数字时代 到底是占有资源还是指引用户有效利用资源的局面,信息服务者需要开发有效的导航服务工 具。导航服务的重要内容之一是对网络信息资源进行优选和整序,将筛选出的优质资源按照 一定的体系结构进行整理并提供给用户,起到提高检索效率的作用。图书馆学情报学、计算 机科学和相关学科的专家,在传统文献信息组织技术的基础上结合现代的信息技术,开创的 主题网关(subject information gateway,SIG)服务模式正是符合这种网络信息资源服务 模式的导航工具。
1 主题网关概述
1.1 主题网关的涵义

Traugott Koch最早对主题网关进行定义:“主题网关是支持系统化资源发现的因特网服务 。通过因特网提供对资源文献、对象、网站或服务的链接。该服务建立在资源描述的基础上 , 可以通过主题结构浏览访问资源是其重要的特征。”

主题网关作为一种新的网络信息资源组织和服务模式,许多专家根据其特征对其定义进行了 有益的探讨,并提出了基于自己专业领域的见解。在欧美主要以DESIRE计划中的定义为代表 :“主题网关是有以下特征的质量信息控制服务:①提供因特网上大量网站或文献的链接 的在线服务;②根据制定的质量标准和范围标准人工选择资源;③主要依靠人的智慧完成 内容描述(排除利用计算机自动抽取文摘);④人工构建浏览/分类结构;⑤至少部分是人 工为每个资源创建书目源数据。”国内的一些学者如张晓林、王玮、黄如花等都对主题网关 的定义进行了介绍和比较分析。认为主题网关是针对特定学科或主题领域,按照一定的资源 选择和评价标准、规范的资源描述和组织体系,对具有一定学术价值的网络资源进行搜集、 选择、描述和组织,并提供浏览、检索、导航等增值服务的专门性信息网关。主题网关是“ 致力于将特定学科领域的信息资源、工具与服务集成到一个整体中,为用户提供一个方便的 信息检索和服务入口。”

综合起来看对于主题网关的涵义,可以从以下几点来理解。①主题网关是围绕某个主题而 建立的网络信息资源导航服务,通过因特网向用户提供对文献、网站和服务的链接,实现网 络信息资源的增值和开发利用。②被引导的信息资源是由专家按照一定的选择标准和质量 标准进行严格的质量控制,因而由主题网关引导的链接都是高质量的。③信息资源的描述 是图书馆学情报学、计算机科学和信息科学专家对图书馆应用、实践与数据库技术有机结合 的结果,而不是计算机自动抽取文摘,因此信息资源的描述更为准确和完整,便于信息用户 利用。④按照一定的分类体系对被引导的内容进行组织,同时大部分主题网关服务还提供 主题检索功能。
1.2 主题网关的发展背景

主题网关的提出和兴起于20世纪90年代中期,最初是英国电子图书馆计划(the Electronic  Libraries Program,eLib),项目的第一阶段计划里包括的一个项目网络资源存取(Access  t o Network Resources,ANR)的一部分,它的运作开始于1995年,其中社会科学主题网关SOS I G在eLib资助之前就已经建立起来。目前,国外建设的著名SIG达50多个,英国、美国、北欧 国家、荷兰、德国和澳大利亚SIG的建设比较活跃。处于主导地位的是1996年建立的DESIRE  “欧洲研究与教育信息服务之发展(Development of a European Service for Information  on Research and Education, DESIRE)”项目。该项目由来自欧洲的四个国家(荷兰、挪 威 、瑞士、英国)的十个协会联合工作,主要目的是通过增强现有的欧洲信息网络,提高对资 源的存储、发现、组织等服务。在欧洲Renardus的出现真正实现了主题网关的联合和共享。 Renardus是在欧盟范围内开展的信息开发计划,成员包括丹麦、芬兰、德国、荷兰、瑞典、 英国的图书馆与研究中心,其服务的目的是为欧洲高等教育的教学和科研提供一个精选的、 高质量的网络信息的值得信赖的信息源;提供一个集成化的网络信息资源门户站,能够为用 户提供整合检索和浏览途径,可以检索全欧洲各个参与主题网关的记录。美国加州大学图书 馆和加州其他馆开发的“图书馆员因特网索引(Librarians’Index to the Internet, LII )”是图书情报学科主题网关的典型。LII是一个可供检索的、提要性的学科信息资源目录, 收录30 000多个经过选择和评价的网站,基本收录了网上重要的图书情报类资源,它以公共 图书馆用户、图书馆员和图书情报领域的研究者作为明确的目标用户群。目前,国外SIG已 经从单纯的学术研究和课题项目发展到大规模建设阶段,我国在2001年底正式启动中国国家 科学数字图书馆(Chinese National Science Digital Library,CSDL)项目,起步较晚,但 是在SIG建设方面已经做了大量的研究和开发工作,取得了一定的成绩和经验,特别是科学 院文献情报中心的SIG建设,在国内具有示范作用。目前已经由CSDL资助建成并投入使用的 有物理数学(PHYMATH)、生命科学(LSSIP)、图书情报(LIG)、化学(CHIN)、和资源环境科学( RES)等5个主题网关。
2 主题网关建设的关键问题
2.1 主题网关的关键技术 

主题网关的关键技术包括资源选择技术、资源描述技术、资源排序技术和资源浏览和检索技 术。
资源选择由三种方式:①由图书馆员或领域专家根据资源选择标准进行人工选择;②根 据主题需要,设计某种程序,专门采集和评价领域主题;③接受用户推荐的主题资源网 站。

资源描述就是主题网关资源款目的著录和标引,经过资源描述形成一条完整的网上资源著录 款目。目前的资源描述普遍采用元数据方式,经人工描述形成。

资源排序就是采用一定的分类体系进行组织,组织成有序的资源。目前,资源排序的方式主 要有:按资源类型排序,按学科专业排序,按字顺排序。通常,这几种方式混合使用。

资源浏览和检索。浏览是利用某一个通用的分类法或自编分类法,结合超链技术组织资源, 从而向用户提供浏览途径的查询方法。
2.2 主题网关资源的选择标准

主题网关与搜索引擎最大的区别是“质量控制”问题, 解决质量控制问题的关键需要制订 一定的标准,按照精选标准对资源进行筛选,精选资源的标准制定包括以下方面:
2.2.1 内容标准:资源的内容应当符合本主题网关的收集范围,从资源类型来说,可以 包括网站、网页及其他类型的文档,如DOC、PDF、TXT 以及图像、音像资源等。
2.2.2 质量标准:质量标准是保证资源基本质量的前提,除了要考虑用户需求的相关性 、未来用户的满意度、资源本身的可持续性等因素外, 还需要大量的人工干预,需要寻找 相关的专家和图书馆专业的工作人员来协助。 
2.2.3 维护标准:跟踪已有资源,定期检查资源的动态变化,发现新资源,并用质量标准 衡量该资源是否可以选入本主题网关。
2.3 主题网关的资源描述和元数据标准的选用

主题网关的资源描述和元数据标准的选用经过选择评价的资源, 必须经过资源描述形成一 条 完整的网上资源著录款目。简单地说, 就是主题网关资源款目的著录和标引。目前对资源 的描述普遍采用一定的元数据标准。

主题网关的元数据标准的选择和制定一般遵循标准、开放、实用、可扩展的原则。大多数国 家的主题网关采用Dublin Core (DC) 这一元数据标准。但许多主题网关制定了比DC更简明 的元数据格式。例如英国的BUBLLINK只有资源的题名、描述、作者、主题、分类、文献类型 和网址七个元素。而SOSIG采用的元数据, 与BIB-1〔Z39.50 标准最主要的属性集〕和GILS  ( the Government Information Locator Service) 等多种标准具有良好的相容关系, 同时 采 用资源描述框架(RDF) , 使它的元数据在进行编码、交换、重用时有了基础。RDF 的使用 也 提供了交换受控词表数据的语法和其他应用服务, 增强了元数据的互操作, 从而便于在跨 网关检索时实现互操作和数据共享。

目前,主题网关资源描述元数据的生成主要依赖人工的方式。随着主题网关的发展, 需要 开发一定的工具对资源进行初步的加工, 通过自动标引, 自动生成资源描述元数据。
3 主题网关对我国信息服务业的启示

主题网关技术的出现为图书馆等传统信息服务机构提供了争取网络信息服务主动权的机遇。 我国图书馆应该积极行动起来, 为主题网关服务在我国的发展与应用积极努力。

我国“资源环境学科信息门户”在其项目宗旨中提出:“实现资源环境学科专业领域各种文 献信息数字资源系统(包括二次文献数据库、全文数据库、联合目录、馆藏目录、馆际互借 和全文传递等相关服务系统) 的横向整合,逐步实现同构和异构数据库的统一检索服务。逐 步实现不同文献类型数据库和不同信息服务系统间按照用户信息检索或利用流程开放地无缝 连接,形成系统的有机联系的多层次文献信息资源使用体系。”


这项宗旨对于图书馆来说也具有很强的现实意义,当然要完全实现主题网关与本地图书馆资 源的无缝式存取,还需要有关各方的重视和付出极大的努力。①政府部门及科研、教育或 合作组织应注重加大资金投入,将其作为国家的社会公益事业大力扶持;②注重新技术的 开发与应用,在主题网关建设中应当充分借鉴应用分布式、自动化等构建技术,提高速度, 降低成本;③注重协作协调,在确定主题网关的应用范围和新建主题网关时,充分融合利 用现有主题网关中的资源,分工协作,最大限度地发挥各自的作用。
[参考文献]
[1] 曹玲,侯汗清.文献分类法在主题网关互操作中的应用研究[J].图书馆杂志 ,2004,(1):25~28.
[2] 王玮.网络信息资源组织的新模式——主题网关[J].大学图书馆学报,2004 ,(2):66~70.
[3] 徐佳宁,赵洋. 国外学术信息主题网关特点分析[J].图书情报工作,2005, 49(1):60~64.
[4] 李运景,侯汗清.主题网关关键技术研究[J].大学图书馆学报,2006,(1):6 9~73.
[5] 李爱国, 魏彬.学术图书馆中的主题网关服务[J].情报理论与实践,2005, (2):195~198.
[6] 王雅戈,侯汉清.主题网关信息组织关键技术分析[J].图书馆理论与实践,2 006,(1):73~75.
[7] 潘卫东,衡中青.主题网关与搜索引擎的比较分析[J].佛山科学技术学院学 报(自然科学版),2007,(6):14~16.

 

相关文章