投稿

敦煌文书的数字化———纪念国际敦煌项目组织成立二十周年

来源/ 甘肃文化产业网 作者/ 韩春平 时间/2014-06-13 10:24:44
甘肃文化产业网按 敦煌文书通常又称敦煌文献、敦煌遗书等,是指发现于莫高窟及敦煌地区的数万件古代纸本文献。大部分文书在发现之初即已流散英、法、俄、日等国,国内遗留部分后来分散多个地区。百余年来

敦煌文书的数字化

敦煌文书通常又称敦煌文献、敦煌遗书等,是指发现于莫高窟及敦煌地区的数万件古代纸本文献。大部分文书在发现之初即已流散英、法、俄、日等国,国内遗留部分后来分散多个地区。百余年来,海内外有关各界在文书的考察、编目、录文、摄影、出版、研究和保护(含修复)等方面取得了显著成就,但是以传统方式所取得的成就与理想的目标之间仍存在很大差距。进入信息化时代以来,数字技术在文书各项工作中得到广泛引入,文书的数字化不仅为文书的整理和共享提供了全新手段,而且为文书的辅助研究和保护等工作开辟了新的渠道。总之,数字化给敦煌文书带来了新机遇,而敦煌文书的数字化,有利于更好地发掘丝绸古道的文化意蕴,并为建设“丝绸之路经济带”增添传统文化的亮彩。

既有的成果

敦煌文书数字化工作滥觞于上世纪80年代。1994年春,中、英、法等多国参与共建的国际敦煌项目组织(IDP)在伦敦成立,标志着本项工作正式启动。此后海内外同行在文书数字资源和数字平台建设方面多方努力,取得了较为丰硕的成果。

数字资源的创建者既有国内的,也有海外的,既有组织机构,也有个人。截至目前,主要基于文书目录和内容的成果少说有20余种,例如国家图书馆《中国国内散藏敦煌文献联合目录数据库》和《王重民向达所拍照片影像库》、敦煌研究院《敦煌遗书数据库》、爱如生数字化技术研究中心《敦煌文献库》、上海师范大学《英藏敦煌社会历史文献(拟)》、方广锠先生《敦煌遗书数据库》及日本新泻大学《俄藏敦煌文献》等。

有些数字资源并未专门基于敦煌文书,而是综合敦煌文书、石窟艺术文物及学术论著等多种敦煌学学术资源,甚至旁及其他文化资源,敦煌文书只是其中一部分甚至一小部分。此类资源主要有国际敦煌项目组织所属《IDP DATABASE》、敦煌研究院所属《敦煌学信息检索系统》、兰州大学所属《敦煌学数字图书馆》、台湾成功大学所属《敦煌学数字资源(拟)》及美国梅隆基金会所属《ART STOR》(含梅隆国际敦煌档案)等。

除以上主要基于文书目录和内容的资源外,还有一些涉及文书研究、保护等方面的资源,比如基于中、英两国国家图书馆合作项目创建的《敦煌文献研究论著目录数据库》、由国家图书馆创建的《各国藏敦煌遗书研究目录索引》和《敦煌遗书修复档案与古籍修复档案管理系统》、IDP英国中心的《敦煌文字数据库》以及挂靠日本学者高田时雄个人网站的《敦煌写本研究年报》等。

存在的问题

敦煌文书数字化工作虽然成果较为丰富,也在一定程度上满足了用户需求,但却存在诸如资源数量较少、质量欠佳,服务工作不够到位等多种问题。

相较于数量庞大的敦煌文书,目前反应文书基本信息的数字资源数量还很有限,距全部文书数字化还有很大距离。即以堪称文书数字资源重镇的《IDP DATABASE》而言,各成员机构的藏品远未全部数字化,目前中国内地除国家图书馆和敦煌研究院外,众多散藏文书尚未纳入IDP数字化工作范畴。其他海内外现有资源虽然名目繁多,但多数资源的数量均较有限,且数据多有重复,深度开发的资源更属凤毛麟角。

敦煌文书数字资源的质量,首先取决于资源的内容,亦即文书前期整理成果的质量和所拍数字图片成果的质量,但目前两类成果的质量普遍偏低。资源质量还取决于资源建设中的技术条件,特别是元数据标准和系统软件等因素。既有各种文书数字资源多采用不同的元数据标准,不仅造成了质量的参差不齐,而且为资源的整合设置了障碍。既有资源的软件多种多样,后期开发资源因软件优势,质量普遍较高,但长期以来多数资源因软件陈旧或更新滞后,开发深度不足,部分资源因此已近乎废品。

在服务方面,向来的工作也多不够到位,主要表现为:不少资源从未提供网上共享;部分资源的访问困难重重;部分资源收取高昂费用或限制使用。

问题的解决

解决以上问题,需要首先理清其原因所在,才能有的放矢。经分析,相关原因主要存在于技术、经费与合作等多个方面:一是文书数字化拜数字技术所赐,但统一元数据标准的缺乏,软件更新的滞后等问题,根源都在于技术领域的掉队;二是文书数字资源的建设及共享,无不需要大量的经费投入,但工作中经费缺乏的问题一直比较严重;三是文书数字化是一个面向世界的学术性工程,既需要敦煌学专家与数字技术专家的合作,更需要海内外各方多层面的合作,但目前的合作还较为有限。此外知识产权意识淡薄、相关人才缺乏等也是重要原因。

多在技术方面着力。首先应创建和采用基于国际共建的、唯一的、详备的元数据标准,这是提高资源质量的关键所在。新的标准必须基于海内外所有工作,不能仅针对个别国家、机构或个人;必须是唯一的,不能搞多元化;必须是详备的,不能是粗略的。唯有如此,才能保证海内外所有的数字资源在质量上具有统一的高标准。另外在系统软件等技术层面,也必须随时关注和跟进新的技术进步,避免掉队。

加大经费筹措力度。国内业务主要依靠项目经费拉动,不过资助额度向来有限。2012年,国家社科基金重大招标项目首次资助创建“敦煌遗书数据库”,今后经费的筹措颇可借鉴。海外业务既注重各种基金的资助,也倚重多样化的社会捐赠,费用一般较为充裕。可见在这一方面,国内应更多向海外学习,取长补短,多渠道募集经费。

加强海内外同行的通力合作。以既有相关组织机构为核心,整合各方人力、经费及既有资源,以此提高资源质量,避免数据的重复和对人力、经费的浪费,并适时创建相关门户网站。至于资源不能共享、网站关闭或死链等问题,也多有出于保护知识产权的考虑。解决此类问题,既有待社会大众知识产权意识的增强,也更需要资源拥有者不计得失,乐于奉献。当然,还应该重视人才队伍的建设工作。总之,只要各方能够齐心,就会形成巨大的合力,使敦煌文书的数字化工作取得更加丰硕的成果。

(作者单位:兰州大学) 

特别声明:甘肃文化产业网为公益性网站,转载此文(如有图片或视频亦包括在内)是出于向网民传递更多信息之目的,并非商业用途。若有来源标注错误或侵犯了您的合法权益,请作者或者媒体机构与本网联系,我们将及时更正、删除!

栏目导航

推荐阅读