中国机读目录格式(CNMARC)是我国图书情报界用来记录书目文献元数据的统一标准,它提供了一套完整、详尽、严密的数据表示规范。书目数据是图书馆提供给用户最大的信息资源,但是,由于ISO 2709格式的CNMARC元数据的专用性,使用者必须依靠专用的客户端并且在特定的软件系统所提供的检索工具中,才能够进行信息的检索。
XML(Extensible Markup Language)是由W3C(World Wide Web Consortium,万维网联盟)推广、采用的一个新标准,它是SGML的一个优化子集。由于XML采用了SGML系统中文档结构的核心部分,而省去了SGML中复杂且较少用到的部分,故体现出明显的简洁性和灵活性。又因为XML是一种元标记语言,使用者可以按需要扩展、定义新的标记,因而具有良好的扩展性。
将CNMARC书目记录从ISO 2709格式转换为XML格式,可以将书目数据从严格、复杂的格式转换为机器可读取的XML结构化数据,实现书目数据和因特网上非书目数据的集成,从而使现有的、大量的CNMARC数据能够方便地在传统图书馆和数字图书馆中应用,提供面向万维网的有效信息。
早在2005年,ISO TC46/SC4(信息和文献工作/技术协作委员会)曾发布标准草案“ISO/DIS 25577:Information and documentation – MarcXchange”,并推出了一个称为“MarcXchange”的MARCXML模式。该模式是一个通用的、能够满足世界范围所有遵循ISO 2709的MARC格式的通用XML模式,它可以在ISO 2709格式的MARC记录和以XML编码的MARC记录之间进行无损地互转,也可确保MARC数据与其他元数据(如DC元数据)的兼容。
GB/T 34832-2017《信息与文献 CNMARC的XML表示》提供CNMARC记录的XML格式,作为网络环境下对ISO 2709格式的一种补充。标准将阐明通用的、基于XML交换格式的书目记录和其他类型元数据的功能需求,但不定义单个记录的长度或内容,也不为字段标识、指示符、标识符以及执行格式的功能说明赋予任何定义。本标准适用于使用CNMARC格式编制的各种类型记录,包括书目记录、规范记录、分类记录和馆藏记录,使用W3C XML的结构。