古籍線裝書數位化工作流程指南
Tags: none 發表: 2009-10-19, 點閱: 231,048 , 加入收藏櫃 , 列印 , 轉寄
壹、 引 言
綜觀人類文明的演進,人類的生活隨不同環境展現出多元化的改革,將智慧著眼於發展出能增進生活的各種方式。十五世紀德國商人古騰堡(Johannes Gutenberg, 1397-1468)以活字印刷圖書,由於不再由人工抄寫,且能大量印製,將圖書價格降到原本的1/400,也因此當時的一般農民才有看書的機會,同時也造成知識的流通。[1]二十世紀初期公共圖書館的運動,有效的散布公共文學以及文化遺產,因此由Micheal Hart帶領的古騰堡計畫(Project Gutenberg),於1971年由自願者參與將圖書數位化,超過22000種書籍,主要收錄西方傳統文學作品外,食譜、書目、期刊、樂譜等版權過其資源,當時規定作品都是免費的,任何人都可以自由取用與散布,倘若修改其內容或格式,則不可使用古騰堡計畫之名,此為最早數位化計畫的開始。[2]二十一世紀是一個網際網路科技突破的年代,在資訊便利的環境下,知識的取得模式,不僅打破了原有的空間限制,更建構出有利於知識交流的溝通平台。
清康熙乾隆四十九年(西元1784年),中國歷史上最大規模的一套圖書集成《四庫全書》編纂完成,總計高達三千六百多位文人學者參與,其中繕寫人員更不計其數,其中收錄眾多中國重要典籍,為後世學者留下一份珍貴的研究紀錄。經過兩百多年後,1998年由香港迪志文化出版有限公司與上海人民出版社、香港中文大學合作,出版電子版的文淵閣本《四庫全書》,利用光學字元辨識技術 (Optical character recognition ;OCR)將超過四百七十多萬頁的原文圖像(約八億漢字),以掃描方式儲存於光碟中,是當時較大型的數位出版工程,提供包含標題及全文等兩種光碟版的檢索方式,數位化後的《四庫全書》資料庫,輔以資訊科技的檢索技術,提供便利的搜尋檢索功能,進而將知識再轉化,融入生活中。
迄網路泡沫化後的2004年夏天,Google開始提供一項名為Google Print的新服務。該工具主要是在Google Print[3](於2005年11月該網頁改稱為Google Book Search)的搜索頁面,由內容出版商提供書本內容之搜索結果,並可購買書本的網頁及內容相關廣告,但隨之而來關於著作權是否侵權的質疑爭議不斷。[4]有鑑於此,Internet Archive、Yahoo及Adobe、HP、MSN於2005年共同推出的環球數位圖書館(Open Content Alliance;OCA[5])開放內容聯盟服務,收錄無版權爭議的資源,鼓勵出版商與作者將公共財產的書籍,及著作權所有人明確准許數位化的內容掃描成數位檔,避免書籍數位化所帶來的版權爭奪問題。此外,美國亞馬遜網站更於2005年末提出分頁銷售計畫(Amazon Pages)及其加值應用的服務(Amazon Upgrade),允許使用者可以單買某一本書的某一頁或某一章節在網路上瀏覽,並運用加值服務例如價格20美元的書只要加1.99美元及可看完整的電子檔,不僅增加實體書籍與虛擬內容之間的互補性,期望讀者能在此獲得精確書籍搜尋,提高讀者購買實體書籍的意願。
台灣的古籍數位化先驅自中央研究院1984年7月起開始執行「史籍自動化計畫」(現為「漢籍電子文獻資料庫[6]」),直至迄今的「數位典藏與數位學習國家型科技計畫」(2008年)已累積有24年數位化經驗,其中參與單位從中央研究院、國立台灣大學、國立故宮博物院、國家圖書館、國史館台灣文獻館、檔案管理局等重要的機關單位,並同時以公開方式徵選邀集大學院校共同投入[7],納入民間資料的蒐藏,體現台灣典藏品的完整性。而在這些參與計畫中,與古籍線裝書數位化相關的計畫,包含: 國立故宮博物院、國家圖書館、中央研究院歷史語言研究所傅斯年圖書館,以及台大圖書館參與國家文化資料庫計畫等,結合電腦科技、資訊數位化與古籍相關的「裝訂形式」、「古籍附圖」、「人名權威」、「印記」、「書影」跨古籍的整合,促使「知識」的獲取從被動轉為主動,數位化成果促使古籍不再只是典藏於實體圖書館中。若想要再一窺清代宮中藏書面貌,在國內你可以選擇故宮博物院圖書文獻處所建置的網站,或直接進入到國家圖書館的「認識中國古書[8]」網站更附上精美的圖片,精簡扼要的簡介古籍內涵以及外觀,如同互動式教學一般帶領讀者一同認識古書,若想搜尋與印記、人名權威、書影等詳盡的線裝書資料,不能錯過由中央研究院歷史語言研究所傅斯年圖書館所建置的「人名權威資料庫」、「印記資料庫」、「善本圖籍資料庫」等。此外,中央研究院歷史語言研究所更與大英圖書館「國際敦煌項目」(International Dunhuang Project;IDP[9])簽定合作協議,將館藏敦煌文獻數位資料提供予大英圖書館,經由「國際敦煌項目」可閱覽到各國相關文獻,另由傅斯年圖書館建置敦煌網站,以完整呈現建置此案的始末。如此豐富的中國古籍,如要進行資源分享,除了以數位化保存外,完整的資料庫建置是不可或缺的重要工作。
本指南擬整合各館之數位化技術及相關規範,提供擬數位化單位參考。指南為詳實記錄、忠實陳述執行計畫的規劃及方式,藉由指南的制訂及規範,能讓操作人員或新進人員等,從全面性整合的觀點清楚瞭解整體性的工作概況,及自身的工作範圍、工作細項和執行步驟,降低人員在面對新的工作程序及流程上的不安與恐懼,也可作為訓練新進人員的教材。並可幫助管理者找出計畫導入流程後,所產生的變異原因,進而提出改進之道;亦協助後續欲數位化之工作者依循規範產出成果,避免人為錯誤所產生的損失,節省時間成本,以保持良好的數位化成果的產出品質。
(一) 本書定位
1. 對象:本指南以較不熟悉數位化工作的單位為對象,並提出適用於多數古籍線裝書數位化工作情形的工作流程;內容詳盡陳述數位化工作各領域所需的基本知識與工作流程,並羅列各館不同的時空背景因素,例如:單位規劃、經費、人力、典藏品狀況等,讓各單位在決定「如何數位化」時,能循序漸進地規劃數位化專案,及彈性地逐步調整數位化方式的規劃。
2. 主張:以「數位資訊生命週期」來提出數位化專案管理的各面向,並帶出各單位「如何數位化」的背景因素,且詳盡地論述數位化相關流程以及工作規範與標準,又主張以「系統」來管理數位內容,讓產出能有相同的品質,並藉由數位化工作的透明化,更符合數位圖書館之趨勢。
3. 領域:古籍數位化工作需要圖書資訊學、資訊科學、語言學、中國文學及歷史學等不同學術社群及機構間的溝通、交流與合作,為跨領域的一門新興學科,因此本指南擬將所涉及之各學科領域於本文中概述,期望能兼顧機構及執行廠商,一方面,提供給前者在執行時注意事項與各項工作規範;另一方面,當委外廠商在執行機構數位化工作時,也能有一概括性的對古籍數位化時所需的認知,雙方皆須避免造成典藏品二次傷害,並可提升機構與廠商之間積極的合作空間。因此本指南可提供給欲數位化之團體,在選擇數位化方式時採用委外或不委外之基本概念,並同時能以系統方式規劃其數位化計畫,除讓繁瑣流程透明化外,自動化的系統串連,更容易控管流程及產出的品質,達到標準化工作流程的精神,並降低數位化之藏與用的衝突。
(二) 本書架構
本指南將數位化工作流程規劃出三個部份,從數位化背景淵源的「引言」,到如何數位化的「古籍線裝書數位化流程圖」、「前置作業」、「物件數位化程序」、「後設資料與資料庫建置」等,最後以專題討論的方式,規劃出一系列與數位化相關的延伸議題,包含:「數位化設備分析」、「儲存設備分析」、「數位內容保護」及「數位化內容工作之挑戰」,希望能提供給讀者完整的數位典藏觀念及古籍線裝書數位化工作流程之專案規劃藍圖。
(三) 本書特色
本指南擬取代《古籍線裝書數位化工作指南》2004年版。於2004年工作坊後,2004年版電子檔放置於網路提供大眾使用,另於參加太平洋鄰里協會(Pacific Neighborhood Consortium,以下簡稱PNC[10])國際研討會會後,接獲許多改進意見,因此依適切性納入此新版中。主要更新包含:古籍線裝書「數位化方案選擇」、「數位資訊生命週期管理」等架構,以及範例單位之相關數位化工作流程規範與方式,為一本詳實記載並忠實陳述的數位化工作流程指南手冊。
(四) 物件定義
1. 古籍:指古代書籍,原則上指1911年及其以前所書寫或印刷的書籍[11]。
2. 線裝書:由包背裝演化發展而成。整幅封面為散開的前後封面,連結材料也不再用膠料,而是打眼穿線,比包背裝更加牢固美觀,是明、清以來雕版書籍和抄本的主要裝幀形式。依打眼的數量,又可分為四眼裝、六眼裝、八眼裝等。
3. 古籍線裝書:指1911年以前以冊頁線裝形式的書籍,容易因天然災害或過度使用而愈加受損及脆化,因此古籍線裝書之數位化更顯出其重要性。而〈古籍線裝書之數位化工作流程指南〉(以下簡稱〈指南〉),便是依此而制訂,適用於「冊頁線裝形式之書籍」進行數位化工作時之指南(後文所提「書籍」皆概指以冊頁線裝形式之書籍而言)。
4. 書籍裝訂形式之流變及特色[12]:書籍由內容(文字)、載體(紙張)以及技術(印刷術)等三元素組成,隨不同朝代或年代的需求,衍生出不同的裝訂形式。《史記.孔子世家》中記載「孔子晚喜易,讀易韋編三絕」,所謂的韋編,是用皮繩將簡或策編聯再一起,並由於當時將文字書寫在竹子或木簡策上,稱之為簡牘時代。後來將文字記載在絲棉上,但由於絲棉的價格不斐,因此在當時書籍相當的昂貴,不僅不普及,在學術研究上也相當不便。直到東漢蔡倫改良造紙的方式,書籍正式形成,並由於閱讀的需求有不同的裝訂方式。所謂有需求有創新,有創新有需求,究竟古籍線裝書中裝訂形式的演變,會對數位典藏在數位化時有哪些要注意的面向呢?以下就各年代不同的衍生需求列出其裝訂形式:
表 1-1、古籍線裝書裝訂形式的演變
資料來源:肖振堂、丁瑜著,《中國古籍裝訂修補技術》,北京:書目文獻出版社,1988.年11月,初版,由拓展台灣數位典藏計畫 彙整。
由表1-1內容可了解,書籍的裝訂形式是會隨著人類生活的需求,不斷地修正與演進,從方便攜帶卻不容易閱讀的卷軸裝,到逐步改善不易閱讀課題的炫風裝以及經摺裝,但隨著閱讀便利性的提升,相對產生摺頁處容易產生裂開或分裂的問題,因此開始有了以紙釘加以固定的裝訂方式,到了明代中葉的線裝形式,書籍閱讀便利性趨於完善,是目前較為普遍的一種書籍裝訂方式。
[1] 古騰堡,活版印刷的發明人,http://en.wikipedia.org/wiki/Johannes_Gutenberg。
[2] 古騰堡計畫網站:http://www.gutenberg.org/wiki/Main_Page。
[3] Google booksearch計畫網站:http://books.google.com/。
[4]這個服務與A9.com提供的很類似,而A9.com本身,就是號稱全球最大網路書店amazon.com的分支。參見該公司網頁http://a9.com/。
[5] Open Content Alliance聯盟網站:http://www.opencontentalliance.org/。
[6] 中央研究院漢籍電子文獻網站:http://www.sinica.edu.tw/ftms-bin/ftmsw3。
[7]羅鳳珠,〈臺灣地區中國古籍數位化的現況與展望〉,《書目季刊》,第35卷第1期,2001年6月。
[8] 國家圖書館認識中國古書網站:http://rarebook.ncl.edu.tw/rbook.cgi/frameset2.htm。
[9]國際敦煌項目()IDP網站:http://idp.nlc.gov.cn/。
古籍線裝書數位化工作流程指南全文下載 (8.6 MB, 6,673 hits)