明成祖永樂元年,翰林學士解縉等人奉召整理歷代典籍,廣泛蒐羅宋元以前重要的圖書文獻,舉凡經、史、子、集、釋藏、道經、戲劇、工技、農藝,無所不包,最後歷時六年編纂成兩萬多卷共一萬多冊規模宏大、裝禎精美的《永樂大典》。許多不易取得的珍稀秘本,也因此得以傳世。如此一套集結古今創作的鉅著只有寫本一份,直到150年後差點毀於皇宮大火,明世宗才命人照正本摹寫一部。
永樂正本至明末已全數亡佚,現存皆為重抄本,僅存800餘卷400冊,散落在8個國家30多個收藏單位或個人。雖然是複製品,但卻是後人一窺《永樂大典》的唯一途徑。
在台灣,如果想翻閱這部有近500年歷史的古籍,中央研究院歷史語言研究所傅斯年圖書館收藏有6卷,如因研究需要,到館可申請閱讀原件,但為避免珍貴古籍因為經常翻閱而損壞,館內的閱覽區可以調閱1:1的數位圖檔閱讀,無論是印記、校注或紙張紋理皆清晰可見。其中一卷《永樂大典》還可以看到清乾隆期間《四庫全書》的纂修官從書中抄出佚文的簽條,可見清人從《永樂大典》編輯佚失古籍的工作。
傅斯年圖書館從1988年起,在多數台灣家庭都還沒有電腦與網路時,就開始進行善本古籍的數位化工作。如此,即使未來古籍原件隨著時間或使用而永久毀損或遺失,數十或數百年後,如同《永樂大典》的重抄本,數位副本可能是後世子孫能取得最接近正本形式的複製品。
傅斯年圖書館是國際重要的漢學圖書機構,館內珍藏善本古籍五萬餘冊,金石拓片4萬幅,俗文學與少數民族文書也是重要的館藏特色。其中宋刊本《史記》、《文苑英華》與《南華真經》合稱鎮館三寶,是善本古籍中時間更早的珍貴圖集。另有寫於簡帛上的敦煌卷子49件,許多是唐人至敦煌考察時所攜回的手寫經卷,2002年傅斯年圖書館與大英圖書館的國際敦煌項目(IDP?, ?International Dunhuang? ?Project)合作,完成敦煌卷子的數位化,並置於IDP的資料庫供研究者使用。
踏上時空之旅
所謂善本古籍,指的是古籍線裝書中,因為歷史悠久、或為手稿、或經名家批校等,被視為特別珍貴的圖書版本。目前台灣收藏有善本古籍的單位,包括傅斯年圖書館、故宮博物院、國家圖書館等,各有不同的館藏特色,譬如傅斯年圖書館以文集與方志為最大宗,故宮博物院以皇宮收藏的精美殿本為特色,每個收藏單位對於善本古籍的定義也有些微不同。
但概括而言,依照中國圖書館學會出版的《中國編目規則》,善本古籍的範圍包括
(1)明弘治(西元1505年)以前的刊本、活字本(2)明嘉靖(西元1522)以後至近代,刊本及活字本之精者或罕見者(3)稿本(4)名家批校本(5)過錄名家批校本之精者(6)舊鈔本(7)近代鈔本之精者(8)高麗日本之漢籍古刊書、鈔本之精者。
這些善本圖書內涵主題豐富,對於研究明清史的學者來說,不論是經濟史、社會史或文人風氣,古籍都是最好的史料來源,而傅斯年圖書館與國家圖書館所收藏的諸多明清詩文集,也都是研究中國文學的學者經常會需要參考引用的;另外,研究版本學或藏書源流的學者,可能會對書頁上的印記、批校文字,或是買賣與移轉的註記特別感興趣。
正由於善本古籍富含廣泛內容與研究主題,並且是最常為讀者調閱的館藏,1988年傅斯年圖書館決定投入數位化工作時,從館藏多樣化的收藏中,選擇了善本古籍作為優先數位化的對象。比起來,館內收藏的金石拓片雖然珍貴,屬拓片中時間較早的拓片,保留了大陸後期大量翻修(或竄改)碑文以前的史料,但一方面拓的時間不若古籍成書來得早,內容也多限於器皿圖像、石刻與碑文,研究主題相對侷限,因此較常被翻閱而有迫切保存顧慮的善本古籍,成為最早進行數位化的項目。
漫長的旅程
回到1988年的時空背景,當時無論是影像規格、儲存媒體或檢索系統的變動性都非常大,資訊技術的快速進展,增添了數位化工作的難度。從最初選擇當時最先進的「王安整合影像資訊系統」,到1996年王安公司不再支援該系統,因而轉換為「漢珍TTS影像系統」,同時提高影像品質並與其他資料庫進行交換,其間歷經多次系統轉換,讓館員吃足了苦頭。但也因為這般漫長的數位化歷程,到了2001年傅斯年圖書館加入數位典藏計畫,能夠發展出一套完整且具彈性的資料庫規劃方案,建立高規格的全彩影像與更細緻的資料庫內容,並續發展至今。
目前傅斯年圖書館已完成善本古籍、空間資訊系統與印記的資料庫系統,其他正在進行的還有人物人名資料庫、少數民族文書系統等等,未來所有的系統都會整合在一起,使用者可以從書目查詢系統找到所需的書籍,接著翻閱書本的目次、序文,甚至閱讀全文。此時點選作者,可以進入人名資料庫系統了解作者生平。如果書上有印記,會是藏書源流或是名家批校的證明,使用者也可點選印記縮圖,查閱該印記的原始圖像與內容。同樣的,使用者也可以從查找人物開始,進到其所撰寫的書籍,或連結到他使用的印記等等,這些資料庫結合在一起,形成往復循環,提供讀者更為整體的知識。
在這個規模龐大的善本古籍資料庫裡,傅斯年圖書館負責善本審定的曾冠雄先生,特別挑出多部具有特色的重要典藏向一般民眾介紹,除了前面提過的《永樂大典》府內鈔本6卷,朱熹《大學或問》元刊公文紙印本也相當具有特色。這本書流傳甚少,而且因為是印在公文紙上,背面還可以看到當時的公文,內容包括當時的錢糧、物料價格、老年津貼、遷調官吏、地方官關防等史料,具有極高的歷史價值。
清原稿本《滿州世家通譜》41本,以譜系表的方式,記載了當時清朝旗人的世襲官爵的承襲譜;而清同治年間的《湘鄉縣志》朱墨校樣本可見四種不同朱墨顏色與用紙,書旁還有朱墨筆的校改,可見當時在書籍刊刻出版前繁複的校對工程。另外,《杏林承露圖》雖然只是一份藥品的彩繪廣告,但卻邀請到清道光、咸豐年間127位名宦文人為其彩繪及題詞,相當可觀。
在規劃善本古籍資料庫時,傅斯年圖書館採用的彈性架構值得參考。首先,在後設資料的部份,由粗略到細緻,一共規劃了三個層次,並且視經費與人力而定,決定著錄資料的細緻程度。第一層就如同傳統圖書館的書目格式,使用者可以查詢到書目的主題、作者,以及是否為叢書等基本資料,目前已對外開放,在任何一台可連上網路的電腦,都可以查詢到書目資料,系統還提供了三張書影圖檔作為讀者檢視之用。到館使用的讀者,向館員取得權限,即可進入第二個層次,閱讀詳細的內文目錄,或是連結到印記與人名等資料,並可檢視每一頁書籍的圖檔。如果經費與人力充裕,再考慮是否進行第三層次的電子全文的製作。目前傅斯年圖書館已完成兩套電子全文提供展示,並持續與中研院史語所的漢籍工作室合作,未來將陸續新增更多全文資料。
其次,整個數位化的過程中,傅斯年圖書館也參考了使用者的回饋,調整數位化的優先順序。中文古籍以經、史、子、集、叢為傳統的分類方式,其中漢籍經典都在經部,也是研究者較常參考的典籍,因此,最初的規劃是從經部開始,順著經史子集叢一路做下來。不過,後來發現經部的圖書特別多,可能要很多年以後才輪得到其他類目的書籍,而這些類目的書籍中,也有許多是較常為人翻閱,而需儘快數位化的書籍。因此,圖書館便根據讀者的提件申請以及研究者與相關單位的請托,調整數位化的優先順序。譬如國家圖書館收藏的明清詩文集是他們經常被讀者申請提件取閱的圖書,因此,傅斯年圖書館也配合國家圖書館先進行明清詩文集的數位化。
為古籍加速
要把這樣一個使用方便且內容紮實的資料庫建置起來,需要更多研究人員的投入。以印章印記資料庫為例,由於印記通常會疊印在文字或圖像上,在製作印記圖檔時,必須去除疊印的文字,並進行補朱紅的動作。而由於人工修圖的效率不高,圖書館於是發展出一套電腦取圖程式,能夠加快印記取圖的速度。不過,儘管技術的問題解決了,更困難的還是在於內容的審定。印記資料庫的價值,特別在於它可以鑑定書籍的真偽,但也因此出現了許多偽刻,所以必須由專業的審定者進行鑑定,待確認無誤後才能放到資料庫去。因此,目前的印記資料庫雖然只有一百多筆,卻是編審湯蔓媛等人投入了漫長的時間與精力才完成的。
其他的資料庫也是一樣,譬如人名資料庫系統除了歷代名人之外,也會涉及到許多方志人物,但事實上方志人物許多名不見經傳,譬如以往女性沒有名字,往往以陳氏、王氏稱之,只是恰巧被小有名氣的親戚寫入文章裡,才為後人所知。這些方志人物實際身份的鑑定,也都需要研究者進行文獻的考察,譬如研究其關係人為何,才能把方志人物的資料建立起來。
數位典藏是一件需要集合眾多不同領域的專業人才,才能完成的工作。在圖書館的部份,透過數位科技,可預期未來圖書館會有頻繁的國內與國際資訊交換,能夠協助使用者透過整合性的系統重新組合與活用知識。要達到這個目標,傅斯年圖書館負責數位典藏的館員林妙樺認為,未來的館員尤需具備法律、知識與技術三項素養,如此能權衡如何在不侵權的情況下提供資料給讀者,並根據知識的內容作最適當的呈現,同時營造一個容易使用的環境,讓知識得以有效地傳播與利用。如此,人類累積的智慧能夠安然抵達未來,並創造新的生命。
感謝:中央研究院傅斯年圖書館館員林妙樺、編審湯蔓媛接受訪談與提供資料。