- CADAL数字图书馆知识标准规范及应用研究
- 刘柏嵩
- 5215字
- 2020-06-28 08:34:49
2.4 当前环境下知识组织体系标准的演化
2.4.1 各国国家标准的演化
2.4.1.1 英国标准BS 8723
2000年,在ISO 2788—1986和ISO 5964—1985发布后一直未能更新的情况下,分别与前二者等同的英国标准BS 5723—1987《单一文种主题词表的编制与改进指南》和BS 6723—1985《多语种主题词表的构成与编制指南》显然无法适应网络化、数字化的新环境的要求。于是,英国标准组织BSI决定进行英国标准BS 5723和BS 6723的更新,再将新标准BS 8723推荐给国际标准组织,更新的最主要动机是叙词表的互操作性。BS 8723全面修订了单语种及多语种标准,将两者置在一起并指明了对互操作性的要求。随后3年间,BS 8723分期发布:
2005年11月1日,BS 8723-1—2005《信息检索用结构词汇指南 第1部分:定义、符号和缩写》发布;
2005年11月1日,BS 8723-2—2005《信息检索用结构词汇指南 第2部分:主题词表》发布;
2007年12月31日,BS 8723-3—2007《信息检索用结构词汇指南 第3部分:主题词以外的词汇》发布;
2007年12月31日,BS 8723-4—2007《信息检索用结构词汇指南 第4部分:词汇间的互操作》发布;
2008年7月31日,BS DD 8723-5—2008《信息检索用结构词汇指南 第5部分:互操作的交换格式与协议》发布。
2.4.1.2 美国标准Z39.19
1999年11月,美国国家信息标准协会组织了一个专题研讨会以探讨调查发展电子叙词表标准的必要性及可行性。基于此次研讨会,ANSI/NISO Z39.19—2005《单语种受控词表的结构、格式和管理规范》应运而生,代替1980年至2003年先后发布的5个修订版本。该标准的内容范围由叙词表扩展到可选清单,同义词环,等级分类表及叙词表的编制目的、概念、原则和结构,对术语的选择,复合词,词间关系,受控表的显示、互操作以及编制、测试、维护和管理系统进行规范和描述。虽然最初的目的是指明对互操作性的重视,然而该修订版却并未继续进行跨资料库查询议题、多语种情况或资料交换格式及其协定书等方面的研究。所以,在2008年又开始对该标准进行了修订补充,旨在解决知识库及其相关工具的编制与实践指南,对知识库格式、知识库供应链的数据格式ONIX SOH的互操作、OpenURL等方案研究提出草案,这部分的内容已成为ISO 25964-2的一部分。
2.4.1.3 中国标准
自20世纪80年代以来,我国加快了知识组织体系标准化研究和制定的进程,提出了一系列的标准草案和送审稿。由于我国对知识组织领域的学术研究起步较晚,因此目前国内的主要标准和规范基本上是参照国际组织如ISO, IFLA等以及美、英等国家的国家标准编制的。即便如此,我国对相关标准的编制的努力却一直进行着,紧密关注国外相关领域的最新研究进展,如在分类法方面,《中图法》编委会多次研讨国外标准的最新研究进展,并加以实施运用,对《中图法》不断进行修订与完善,使之能符合21世纪信息网络化的要求。目前,《中图法》第5版已于2010年9月出版,《中图法》Web版的研制工作于2012年完成;《中国分类主题词表》电子版在相当程度上也运用了国外相关标准的成果。在叙词表标准编制方面,我国也参照国际标准化组织ISO的相关标准,制定了相应的国家标准:GB/T 13190—1991《汉语叙词表编制规则》、GB/T 15417—1994《文献多语种叙词表编制规则》、GB/T 19486—2004《电子政务主题词表编制规则》、GJB 1776—1999《军用主题词表编制规则》、GJB 5098—2004《军用电子叙词表编制规范》等。
2.4.2 国际标准的演化
2.4.2.1 IFLA指南
IFLA指南,原文名为“Guidelines for Multilingual Thesauri”。2002年,国际图书馆协会和机构联合会(International Federation of Library Associations and Institutions, IFLA)成立多语种叙词表工作小组,以便更新及改善ISO 5964—1985的内容。2005年4月,该标准草案提出,并在全球范围内征求意见。《多语种叙词表指南》引用了大量的多语种范例作为补充,最终于2009年正式出版。
此外,在出版《多语种叙词表指南》之后的同一年,IFLA又颁布了《主题规范数据的功能需求》(FRSAD)第2版的草案,并于2010年出版了其最终报告。
2.4.2.2 ISO 25964
2007年4月,ISO着手修订叙词表国标标准的项目,以N458文件的形式发布了叙词表国际标准修订项目计划。该计划以英国BS 8723为基础,将ISO 2788《单语种叙词表编制准则》与ISO 5964《多语种叙词表的编制规则》更新扩展为ISO 25964,并取代前两者。ISO 25964标准的总标题为“信息与文献——叙词表及其他叙词表的互操作”,包括两个部分:
(1)ISO 25964-1:用于信息检索的叙词表,于2011年8月8日正式发布,涵盖了单语种及多语种叙词表。该部分主要为用于信息检索的叙词表(无论是单语种还是多语种)的研发和维护提供推荐,它同时也应用于用来检索文本、声音、静态动态图像、物理实体或者多媒体等多种媒体和知识基础、知识门户、文献数据库、文本、博物馆或者多媒体馆藏等多种类型信息资源的词表。另外,ISO 25964-1还提供了叙词表数据输出和输入的数据模型和推荐格式,且对于多语种叙词表和单语种叙词表均适用。但是,该部分标准不适用于制备书后索引,虽然它的许多推荐对此可能有用。此外,它还不适用于数据库或软件在搜索或索引应用中的直接使用,但是预料到了对叙词表管理推荐中的这类应用的需求。
(2)ISO 25964-2:与其他词表的互操作。2011年2月28日,国际标准化组织推出了ISO CD 25964-2。2013年3月4日,ISO 25964-2正式发布。ISO 25964第2部分的全称是“信息与文献—叙词表与其他词表的互操作—第2部分:与其他词表的互操作”。主要关注叙词表与其他类型词表之间的互操作,尤其是它们之间相互映射的原则与实践。词表类型包括:分类表(包括企业档案分类法)、知识分类法、标题表、名称规范列表、本体、术语表和同义词环。其重要主题包括:映射的结构化模型、映射类型指南,以及如何处理先组式(具体出现在分类表、知识分类法和标题表)。互操作是指两个及以上的系统或组件进行信息交换和利用的能力。简单来说,互操作能力是我们依赖已久的信息网络运作的基础,也促成了语义网(semantic web)的发展。适用于叙词表互操作的两个级别如下:以标准化方式呈现数据,可在其他系统中导入和使用(详见ISO 25964-1);词表的配套使用,如在叙词表之间建立术语/概念的映射(详见ISO 25964-2)。除非映射得到ISO 25964-2推荐,否则任何基于映射的语义推理可能会给信任的网络浏览者提供误导性的结论。ISO 25964的总体关注点是叙词表,除了术语之外,尚不存在可供比较的其他词表类型的标准。第2部分并不试图进行规范,而是只涉及其他词表与叙词表的互操作。因此,每个词表类型声明如下:
(1)词表的关键属性(描述性的、非规范化的);
(2)语义组件与关系(描述性的、非规范化的);
(3)在适用情况下,其他词表与叙词表的映射推荐(规范化的)。
在本体、术语与同义词环中,映射到或映射自一个叙词表的作用不大,推荐使用配套的其他形式,如在语义网环境下,本体可以结合叙词表一同部署。ISO 25964-2澄清了叙词表与本体差异的一些细节,采用实例来说明互操作功能的可能性。
2.4.2.3 FRBR家族
FRBR自初次颁布以来,就给国际图书馆编目界带来了深远的影响。在随后的发展中,国际图书馆协会与机构联合会(简称国际图联)(International Federation of Library Associations and Institutions, IFLA)不断地对其进行完善,最后形成了FRBR家族,包括FRBR、FRAD和FRSAD。
FRAD,全称为“Functional Requirements for Authority Data”,中文名称为“规范数据的功能需求”。该标准最开始是国际图联的FRBR研究小组认为有必要对“主题规范、叙词表、分类表的中心实体和这些实体之间的关系”这一论题进行进一步研究,于是于1999年4月成立了规范记录的功能需求与编号(FRANAR)工作组。2003年,FRANAR工作组新任主席Glenn E.Patton在意大利举行的国际会议International Conference on Authority Control中,发表了FRANAR:A Conceptual Model for Authority Data一文。又于2005年5月3日在OCLC举办的FRBR研究会上发表了FRAR:Extending FRBR Concepts to Authority Data一文。在文章中,Glenn E.Patton指出“规范记录的功能需求(Functional Requirements of Authority Records, FRAR)”概念模式是由FRBR的概念扩展而成的。2005年6月,FRANAR工作组推出FRAR《规范记录的功能需求:概念模型(草案)》,在全球征求评论之后,修订并改名为《规范数据功能需求》,简称FRAD,并增加图示及实体关系的范例。工作小组还在2007年4月1日推出了新草案,并至7月15日截止征求第二次世界性评论,于2008年12月完成了最终报告。
FRSAD,全称为“Functional Requirements for Subj ect Authority Data”,中文名称为“主题规范数据的功能需求”。该标准是FRBR家族的第3个成员。尽管FRANAR工作组在FRAD概念模型中着重关注数据,并且已经包含某些方面的主题数据,但是还没有对相关主题规范的实体属性关系进行全面分析,忽略了它们是怎么组织的。因此,国际图联(IFLA)于2005年4月成立“主题规范记录的功能需求(FRSAR)”工作组,其目的是针对主题规范记录方面的问题展开研究,并且调查广大用户对主题规范记录的直接和间接利用,其责任是在FRBR框架中就FRBR第3组实体——作品的“关于(aboutness)”方面——制定一个概念模型。FRSAR工作组和FRANAR工作组(1999—2009年)共同致力于在FRBR的框架内创建模型。当FRANAR在2009年6月发布它的最终报告时,FRSAR也发布了它的第一份报告草案——《FRSAD的世界范围研究综述》。FRSAD是一个以FRBR的设计思想设计出的概念模型,是用来表述人类认识世界的基本框架。与传统的图书馆学研究不同,FRSAD的研究方法采用了一种更为精确的表述结构,使得其研究成果更为容易地被解析、编码和处理。FRSAD的核心是用来表述我们的认世界,在FRSAD的草稿中解释其目的是给FRBR中的著作(work)的“关于”(aboutness)建立概念模型。它试图通过这个概念模型把不同用户的目的联系起来,对主题规范记录(元数据)的创建者提出控制要求。因此,FRSAD的概念模型可以看成是主题规范数据建设的规范标准,属于知识组织标准的范畴。
2.4.2.4 AACR
1967年,在贯彻1961年国际编目原则会议制定的“巴黎原则”的基础上,英国、美国、加拿大三国合作编制完成了《英美编目条例》(Anglo-American Cataloging Rules, AACR),这标志着全球编目标准化的开端。到了1978年,为了适应科学技术发展带来的文献载体变化、文献类型增多以及编目工作自动化的要求,AACR共同修订指导委员会(The Joint Steering Committee for Revision of AACR, JSC)组织力量对AACR进行了修订,出版了《英美编目条例》第2版(AACR2)。另外,1988年和2002年又先后对AACR2进行过两次修订。此后,为了适应数字化文献的大量出现及其计算机编目网络的需要,JSC又对AACR2进行全面的补充和修订。2005年4月,在芝加哥举行的JSC和CoP(The Committee of Principals, AACR原则委员会)会议决定,修订后的AACR2依据其作用和特色被重新命名为“资源描述与检索(AACR3: Resources Description and Access, RDA)”,并于2009年取代AACR2成为新的编目标准。RDA以FRBR为理论基础,突破了AACR2在多样化资源描述以及动态电子资源描述方面的局限性。
2.4.2.5 ISO 690—2010
ISO 690的发展历经数次更新,并且发布了多个针对不同信息文献书目引用的标准规范。ISO 690—2010是其最新的一个版本,英文名称为“Information and documentation. Guidelines for bibliographic references and citations to information resources”,中文名称为“信息和文献:信息资源文后参考引用指南”。该标准整合和修改了ISO 690—1987和ISO 690-2—1997,于2010年6月15日正式发布。ISO 690—2010是参考文献的编制指南,同时也是那些本身不是书目形式的作品的拉丁引文指南。该标准适用于各种类型的信息资源的参考文献和引文,包括专著、期刊、专利、地图、电子信息资源(计算机软件和数据库)、歌曲、录音、印刷品、照片、图形和视听作品以及影视资料等类型的信息资源,但是绝不仅仅限于这几种类型。然而ISO 690—2010却不适用于机器可解析的引文,同样也不适用于法律文献,这两种类型的信息资源都有它们各自的标准。ISO 690—2010并没有描述参考文献和引文的一种特定样式,它使用的例子也不是指定的样式和符号。
2.4.2.6 其他
除了上述几个有较显著变化的知识组织体系标准之外,近几年还出现了一些其他的新标准:
ISO/IEC 19788-1—2011《信息技术:学习、教育和培训学习资源用元数据第1部分:框架标准》于2011年1月7日发布。该国际标准指定了描述学习资源和与学习资源直接相关的资源的元数据元素及它们的属性。ISO/IEC 19788-2—2011《学习资源用元数据.第2部分:Dublin核心元素标准》于2011年6月8日发布。该标准从ISO 15836—2009《Dublin核心元数据元素集中获得数据元素》,使用ISO/IEC 19788-1—2011提供的框架,从而为学习资源的描述提供基础数据元素集。
ISO 27729—2012《信息和文献:国际标准名称标识符(ISNI)》于2012年3月15日正式发布。该国际标准规定了团体公共身份识别的国际标准名称标识符(International Standard Name Identifier, ISNI),也就是说,该标准是用来标识媒体内容创建、生产、管理和传播的整个生命周期中所涉及的机构。一个团体的公共标识(public identity)是该团体众所周知的名称。这里提到的团体可以是一个人,一个法律实体,也可以是一个幻想中的角色。ISNI提供了一个消除歧义的公共标识,是唯一公开标识跨领域创建活动的标准。ISNI并不是为了提供关于公众认同的复杂信息的直接获取,而是为了提供和拥有这些信息机构的链接。
2.4.3 新技术在标准中的应用
信息技术的发展,网络化、数字化信息环境的出现,给知识组织体系的发展带来了巨大的冲击。许多计算机技术、互联网技术也被应用到知识组织体系的实践中,产生了一些新型的知识组织体系。随着实践经验的丰富,这些技术在知识组织体系中的应用也应该加以规范,从而实现最佳秩序。在这一规范的过程中,一些如W3 C的非传统国际标准与国家标准的制定机构也积极加入了制定知识组织标准的行列。主要有两个标准体现了这一点:
(1)SKOS推荐标准。它是一个由W3C发布的汇聚不同领域知识、技术和实践的数据共享标准,是一个基于语义网技术表示受控词表及其他知识工具的概念框架。这在前文已有阐述。
(2)Zthes。该标准是一个抽象模型,用来表示和检索主题词表。Zthes中揭示了如何利用Z39.50来实现这个抽象模型,同时也揭示了如何利用其他协议和格式来实现该模型,其中,Z39.50是一个用于信息检索的ANSI/NISO标准协议。