当前位置:网站首页 -- 业界人物-- 名家访谈
名家访谈

古籍资源共享迈入新时代

发布时间:2016-11-28 11:05:52     点击量:0

  古籍资源共享迈入新时代

  □本报记者  王雪霞

  2016年,我国古籍保护工作的一个重要阶段性成果,就是国家图书馆正式对外发布“全国古籍普查登记基本数据库”和“中华古籍资源库”。这两个重磅古籍资源数据库,为读者通过网络轻松检索古籍资料、浏览古籍提供了更大的便利。古籍普查平台首次按照统一的古籍著录规则来完成古籍普查工作,有效摸清了古籍家底,实现了全国古籍的统一检索。而“中华古籍资源库”则采取“原样数字化”方式,按照古籍原貌原样扫描或拍照,最大限度地保存古籍历史信息,避免了因整理者水平差异,数字文献底本、校本选择不善等产生的二次错误。目前发布善本影像10975部,包括宋刻本71部、元刻本148部、明刻本4730部、明抄本551部、清刻本1838部、清抄本2818部、明清稿本466部、活字本173部、域外汉籍108部、明清钤印本31部以及其他画像、拓本、彩绘本、磁版印本等41部,约占国图善本总量的三分之一。据介绍,该资源库计划今年底发布第二批善本6200余部,至2017年底发布善本达到2.3万部,国图超过80%的古籍善本可以在网上免费阅览。未来将超过3万部,成为古籍研究的世界第一资源库。

  古籍资源数据库的建立和社会共享,这一举措被有些学者称为具有“划时代意义”,对此,大家都有何看法?对今后资源库的完善有何期待和建议?古籍数字化的社会共享大家有何见解?近期,记者采访了几位业内专家学者。

  采访嘉宾:沈乃文(北京大学图书馆研究馆员)

  郭立暄(上海图书馆研究馆员)

  尹小林(首都师范大学电子文献研究所所长)

  沈乃文:真正做到了古籍资源的共享

  如果我们回头看,粗略地说,古籍曾经历过三次物质形态的变化。第一次是在两晋时期用纸张取代竹简,第二次是在五代北宋时期用雕版印刷的册页本取代手工抄写的卷子本,第三次是在清后期至民国初年用西方传来的机器印刷取代手工的雕版印刷。决定这三次物质形态变化的客观因素是两条:方便和效率。也就是说,比较方便和效率高的,取代了比较不方便和效率低的。显然,这是不以人的意志为转移的历史发展规律。

  应该说,今天我们已经跨入了古籍第四次物质形态大变化的时期,这一变化的进展速度远远超过前三次。我最早听说计算机数据库是在上世纪70年代末,当时纸本书籍还供不应求,听闻美国搞计算机数据库,感觉像天方夜谭。而听说计算机处理中文数据、建立中文数据库,是在80年代末。1989年北京大学图书馆和中国科学院图书馆联合组团,我担任领队去美国,与美国人合作编制美国高校藏中国古籍善本书的数据库,就是去看美国人是怎么做的。回来的时候美国人送给我们一台286,拿到北大的时候,连校长都来看了,但是那时还没有internet。到90年代末,用计算机进行中文文字处理,建立中文数据库,和internet通讯,在国内已经全面普及。2000年以后,数码图像逐步取代缩微胶卷。以前费用很高、很难得到的彩色图像,由于手机、数码相机的普及,变得唾手可得。看到书上哪一页内容好,掏出手机拍一张,一分钟之内可以传遍全国。今天的古籍研究都是在机器上写作、在网络上交流的,这就不能不影响到我们利用古籍的物质形态。

  历史上的古籍传播,主要是抄写、雕版翻刻、石板珂罗版照相影印、铅字排版翻印,以及现代的照相或扫描底本用胶版印刷机影印。90年代以后,开始新编大部头影印丛书,我参与影印的古籍超过11000种,其中《续修四库全书》5000种,《清代诗文集汇编》4000种,《明别集丛刊》2000种,《北大图书馆地方志珍本丛刊》280种。我曾经认为,当今利用古籍应该主要依靠纸质影印本。但是在几年以前,北大中文系一位副系主任问我,你和上海古籍出版社的人熟不熟?我说当然熟。他说你帮我联系一下,想买一部《清代诗文集汇编》。我立刻劝他,个人买太贵,全套16开大本800册,在家里往哪儿放啊,图书馆全开架,随便看,很方便。他只回答了我一句,还是不方便。我由此意识到,主要存放于图书馆的古籍纸质影印本,和基于机器处理和无线移动终端的古籍研究,已经分属两个不同的时代。今天科技的发展早已解决了通过电子文本、数码图像、网络交流、移动通讯,直接提供读者查找、阅读和研究古籍的所有技术问题,是必然的发展道路。

  “中华古籍资源库”以数码图像的方式,通过网络直接服务于读者,有如下优越性:

  一是方便快捷,完全克服了时间、空间的障碍。同时读者自主操作,消除中间的人为管理手续,即查即得,快捷高效。二是数码图像拥有更逼真的图像质量,能更到位地满足研究人员对图像质量的要求,同时基本解决图书馆在古籍收藏与利用上的历史矛盾。图书馆的古籍保护与服务是一对老冤家,不仅多年解决不了,而且在日益强化古籍保护的形势下,还有更加严重的趋势。之所以如此,是因为保护与服务都是客观需求,无法取舍。而“中华古籍资源库”的建立和完善,在满足读者绝大部分的借阅需求的同时,也满足了古籍保护的需求,是解决上述矛盾的最好方法。

  更加重要的是,“中华古籍资源库”能够真正做到共享古籍资源,消除不同地区、不同单位、不同级别的研究人员在获取古籍资源方面的客观差别。不管是在北京也好,在新疆、西藏、海南也好,获得古籍资源的权利从此真正平等,而在学术资源方面的任何一次突破都会带来学术研究的显著发展。

  可以说,“中华古籍资源库”的建立,一举扭转了我国在中国古籍资源数据库建设上落后于美国、欧洲、日本以及台湾地区的状况,一步跨入世界前列。以高校的情况来说,凡是出国回来的教员,利用域外资源数据库的能力都比较强,可以通过很多途径查到域外单位发布的很多稀见古籍,没有出国经历的在这方面就相对逊色。我们国家不应该在世界的中国古籍资源数据库建设领域没有一席之地。

  待到古籍抄写和雕版印刷字体的计算机识别技术实现突破后,与“中华古籍资源库”超过3万部的原始古籍资源结合起来,可以预期,古籍的文本、校勘、版本研究,都会发生今天难以想象的巨大变化。

  郭立暄:对借阅双方既是机遇又有挑战

  尹小林:共享还需重视基础工作

  藏书报:“全国古籍普查登记基本资源库”和“中华古籍资源库”前段时间向社会公布,这两大资源库您是否使用了?如使用了,觉得有哪些方便之处,它的优点有哪些?希望在哪些方面加以改进?

  郭立暄:我已经使用过“中华古籍资源库”,觉得很好用。界面简洁,进入的操作步骤不复杂,很适合普通公众使用。从今年开放的资源来看,均为国图珍藏的善本古籍,文献价值极高,数量也很可观,几乎包含了国图绝大部分的善本收藏。它依据的底本,是国图在上世纪80年代制作的胶卷,避免了对原书造成二次伤害。

  据我所知,当时国图为善本共制作了两份胶卷:一份放置在阅览室,供读者阅览,我们专业人员过去利用的都是这套,使用多年,画面难免已有模糊;另一份是作为备份的母片,不对外开放使用,因而损伤较少。今年向读者开放资源,国图专门选用了画面更为清晰的备份母片作为底本,对读者而言,这一举动可谓是非常贴心。作为国图长期的、忠实的读者,我深切地感受到这一点。

  尹小林: 两大资源库都有所了解,用得不是特别多。使用后的第一感觉是全,东西多,应该是迄今为止我国公布的最全的。“中华古籍资源库”有一万多种书,可在网上方便调用。而“全国古籍普查登记基本资源库”是多年来对公共图书馆馆藏古籍的一个总汇,对学术界来说功莫大焉。刚开始还有不完善的地方,比如说下载速度慢,有个别书名和图片不匹配,查找会有些困难,相信会不断改进。

  藏书报:据您了解,国内公共图书馆古籍数字化目前是什么样的进展?处于什么样的阶段?今后应该如何发展?

  郭立暄:近年来,国家在文化事业(特别是古籍保护工作)方面的经费投入有所加大,这些经费中有相当大的一部分被用于古籍数字化。各家公共图书馆在数字化方面进展普遍很快,比如上海图书馆,古籍全文数字化的量曾达到惊人的100万拍年。从这个角度来说,我们目前正处在一个高速扫描的阶段,恐怕并不为过。当然繁荣之外,也有可忧之处:有些地方片面追求数字化的量,对主事者既不求专业,也许一位计算机专业人员、几位扫描人员就解决了;对书目数据的质量也重视不够,大致是先将古籍扫描了再说,数据大致沿用旧有的,不作进一步更正,就向读者推出。而事实上,目前各馆古籍书目,除了国图的质量较好,其他各馆多少都存在一些问题。

  在这方面,我们的邻国日本做得更为严谨。举例来说,日本宫内厅书陵部将其所藏的南北朝以前抄本及宋刻本的全文图像向公众开放,今年6月4日公布第一批,品种并不多,数量并不大,但它的目录是由庆应义塾大学斯道文库的专业人员负责撰写与维护的,其主事者是目前日本中青年一代最优秀的版本学者。要知道,宫内厅书陵部的善本原来都是有老辈编制过专门目录的,难道他们的主事者不知道直接拿过来用最省事?我相信,这是基于对未来更为长远的目光,对古籍更为郑重的态度。他们的做法一开始也许慢一些,但其成效终究会逐渐显现,并超过现在那些盲目的奔跑者。

  尹小林:大部分馆还处在普查阶段,一部分馆做的古籍资源的全面数字化还处于起步阶段。而实现全文数字化识别需要严格加以整理,标点断句也要适合现在的计算机使用,这个工程量是很大的。国图出版社正在做再造善本,除全文数字化识别以外,还包括标点,对古籍数字化有示范效应。

  藏书报:您认为国图公布这两大古籍资源数据库有何意义?其他图书馆有何动作?目前有怎样的进展?

  郭立暄:上海图书馆于今年4月23日“世界读书日”来临之际,遴选50种古籍善本、2000种家谱的数字资源上线免费开放,以助推全民阅读。今后,相信上图会结合本馆实际,继续进行古籍资源的开放。

  尹小林:国图公布两大古籍资源数据库的意义非常重大,这是我国公共图书馆建设的重大事件。以前看古籍需要复印,成本很高,现在在网上就能方便看到,这是与中国作为文化大国、文明古国的地位相匹配的。存世古籍,常用的一万到三万种就能满足大部分研究需求,有一万种是基础古籍,下一步还要公布一万多种。将馆藏古籍以数字化的形式供公众使用,这是国家文化战略的一部分,有利于文化走出去和文化安全,意义重大。这也促使其他图书馆加快对各自馆藏古籍资源的统计整理,即将公布的这一万多种古籍中,有一部分就是国图外的其他图书馆贡献出来的。其他图书馆也会以国家图书馆为参照来开展古籍数字化工作,这将极大满足学术的需要,特别是对传统文化、古代文化的研究,是一个很大的跨越。

  藏书报:从学者角度讲,您觉得古籍数字化的成果是否应更大程度地社会化?您认为如何才能做到合理共享?

  郭立暄:对于古籍数字化成果的共享,我很赞成,只要这些成果是真正用于推动个人阅读而非市场投机,它就是合理的。过去中国内地的古籍数字化成果一般在本馆局域网体现,读者复制需要支付比较高昂的费用。今年,国图与上图均推出免费的古籍数字化线上资源,这一做法估计将很快在全国推广。乐观的话,不久的将来,读者就能在自己喜欢的场所,以更便捷的方式、更低廉的成本获得古籍数字文献。

  请允许我用个人的经历来说明这一问题。我供职于上海图书馆,工作中需要经常作古书版本的调查。因此,从2002年起,我每年都抽出一两周时间,将自己当年积累的版本疑问汇总起来,带到各地与异本作比对,其中国图是必到的。十几年积累下来,学术上收获固然不小(我的新作《中国古籍原刻翻刻与初印后印研究》一书就是这十几年寻访的成果),但交通、住宿、餐饮、复制等费用与时间的投入也很大。现在突然发现,当年许多我坐着飞机火车、住着招待所、花费了私人时间去寻访的珍本在互联网上便可免费查阅,这是多么让人高兴的事!

  尹小林:大家对古籍数字化成果共享的积极性很高,但是如何合理共享是正在探讨的问题,比如说很多基础性工作大家不愿意做。我们前些年在网上供给了很多资源,已经是广泛的社会化了,但也发现了许多不规范的做法。如很多人(包括机构)会把别人的成果拿去发布,给原创人员带来损害,盗用甚至成为正常状态。像《全唐诗》《二十四史》,好多人使用时并不署名,这说明还缺乏一定的使用规范。政府应该鼓励原创,应对从事古籍数字化基础工作的机构和个人采取一些保护措施。

  藏书报:您认为古籍数字化成果的普及会对公众借阅带来什么变化?

  郭立暄:古籍资源的线上免费开放,对于古籍借阅的双方(典守者与阅读者)来说是机遇,更是挑战。一方面,这种借阅方式的变化对典守者的学术研究水平提出了更高要求,他们的工作态度、业务水平将在一个更开放的平台受到更挑剔的检视,这会促使他们更加努力;另一方面,过去一些阅读者往往将自身文献版本知识的缺乏归咎于典守的过于严密,现在这一借口不复成立了,他们再也不能以此来掩饰自己的懒惰与不作为了。总之,对于借阅双方来说,这都会是很有意思的体验。

  尹小林:古籍数字化成果的普及对公众借阅带来了不少变化。北大图书馆的沈乃文先生曾谈到,2010年北大图书馆的外借量是110万册,现在是40万册左右,这说明古籍数字化对纸质实物借阅、对降低公共成本具有很大意义。从理论上讲,未来能在网络上解决所有的古籍查询借阅问题,不过现在还不能做到,但我想这个目标的实现指日可待。古籍资源完全可以实现无纸化,并在互联网上传播,其内容质量、传播速度和十年相比,已不可同日而语。

  问题与建议

  采访过程中,其他学者也提到了古籍资源数据库建设面临的几个问题,并提出了各自的建议。

  避免各自为政、重复建设

  现在各个省也在做古籍资源平台,有的馆也在做古籍资源数据库,但是互相之间还不能实现共享。建议国家在平台建设中能将资源整合起来使用,而并非简单相加。目前馆藏古籍以清代民初的为主,粗略估计占馆藏古籍总量的70%以上,如果没有任何壁垒,数据可以互相使用,就非常好。各做各的,必然浪费非常大,互相看不到无疑造成浪费。建议打破这个壁垒,实现资源共享。建立数据库的最终目的是要让大家使用,应该更开放。

  建议把国家馆、其他馆的孤本做成电子版,最先公布出来,因为它是孤本,如果将来在保护方面出现一点点问题就会有很大损失。所藏的孤本最先做出来,数据库建设质量会更好一些。

  还有就是有没有统一的办法把这些数据库建设纳入到一个大的框架下。如套印本,套印本数量很大,大家都在做,就会有重复的地方。从国家层面讲,能否有一个指导性意见,提出更加高效、更加节省的做法,而不是现在这样大家都在做。比如上海馆、南京馆等都在做善本总目,曾经网上都有导航,学者都觉得不错,如果能整合就更好了,会节约不少时间和资金。

  版本鉴定做不好,质量就会受诟病

  在古籍资源数据库建设过程中,建议要有更多懂得古籍版本鉴定、学识基础深厚的学者的参与。但很多学者因为手头工作繁忙,没有更多地参与到基础的繁琐性事务性工作中去。建设数据库过程中,最难的就是版本鉴定问题。在版本鉴定问题上,因为古籍版本的复杂性,造成版本千差万别,版本鉴定做不好的话,大型数据库就会存在硬伤,就会被人诟病。所以希望在古籍资源数据库建设过程中投入更多学者力量,避免此类情况出现。

  另外就是我们的数据库内容还有些简单,仅有书名、卷次等,没有更详细的内容。台湾在这方面就做得不错,不仅有简单提要,还有释文。相比来说,我们的书目太过简单。如果能在这方面加以改进,对于使用者来讲就非常愿意使用。


 


 

上一篇:《四部丛刊四编》出版访谈录

下一篇:集报 缘来有你