1024x768 1280x800   Decrease font size for  - 拓展台灣數位典藏 - 數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫網站 Reset to normal font size for  - 數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫網站 - 拓展台灣數位典藏 Increase font size for  - 拓展台灣數位典藏
 


漢籍全文數位化工作流程指南

Tags: none 發表: 2008-01-18, 點閱: 28,473 , 加入收藏櫃 , 列印 列印 , 轉寄 轉寄

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

壹、前言                

 

    當火焰燃燒到達華氏451度,所有記錄人類智慧的典籍都將灰飛煙滅,但卻燒不毀被壓抑的靈魂……這是一個沒有火災的世界,消防員的工作,是縱火。這是一個所有的書都是「禁書」的世界,消防員的職責,是「焚書」。

 
    這樣的場景,發生於當代科幻大師雷‧布萊伯利(Ray Bradbury),在西元1953年發表的科幻小說──《華氏451度(Fahrenheit 451)》。未來的西方世界,實體書籍將因某種因素淪入如同中國古代秦始皇下令焚書的悲慘命運,而愛書人為了拯救這些人類歷代傳承的知識典籍,自願成為知識的載具,將經典書籍的內容記憶於腦海,再現於言行,因而每個人都是一本書,如果有人想了解聖經,就來這裡找「聖經」這個人,想拜讀莎士比亞,就去那裡找「莎士比亞」那個人。
    「每個人都是一本書」以保存、傳遞知識的這種想法,是西元1953年電腦、網際網路尚未蓬勃發展,布萊伯利針對書籍無法以實體形式存在,又必須另謀存活形式,所構想的解決方案。然而,假設這本書的寫作年代為二十一世紀的今日,由人作為知識載具的浪漫劇情,或許直接為數位化取代,電子化的書籍透過電腦、網際網路,更能客觀地、科學地、久遠地、安全地保存,並且經由網路易於傳遞的性質,知識能夠快速且有效地流通。
    圖書文獻的電子化,是將實體(例如紙本)的典籍進行數位化作業,轉換成虛擬的電子形式。目前比較常見的數位化方案有三種,第一是針對書籍的原貌,依照既有的頁數或篇幅,一一拍攝,產出黑白或彩色的數位化影像,稱作「全文影像數位化」;此方案的優點是能夠同時呈現書籍的原文、紙質與原色。第二種「全文數位化」,是將書上的文字進行繕打輸入與校對,產出內文的文字電子檔;此方案能辨識註解內文、意義模糊不清處,以現行文字代替目前已經不通行的古文難字,並且提供全文檢索,進而提高典籍之研究價值。上述兩個數位方案,前者重視書籍「形式」的再現,讀者能夠觀看原書的樣貌影像,後者則注重書籍「內容」的呈現與索引,讀者能夠藉此閱讀原書的文字與意義。另外還有第三種方案結合前兩種考量,分別將形式與內容數位化後,共同儲存於資料庫中,再將兩者並置於畫面或建立超連結呈現,以達形式、內容相輔之效。
    數位化資料除了有AAA(Anyone Anywhere Anytime)─任何人隨時隨地均可取得資料之特性,亦有其他四大益處:一、能大量儲存於攜帶方便的光碟片、硬碟、或是磁碟陣列,節省空間,利於保存;二、能夠展現新的資料型式,如超文件(hypertext)、超媒體(multi-media),令人耳目一新;三、刺激開發研究的新方向,以佛教典籍的全文數位化為例,藉由數位化後之詞頻統計,可以得知佛典之用詞概況,易於歸納佛典相關之典章、事故;四、易於複製、傳遞、傳播,增進知識之流通【1】。
    我國最早的電子全文資料庫「漢籍電子文獻資料庫」,為中央研究院於西元1981年研發製作,收錄二十五史、十三經、清實錄、小說戲曲……等各種歷代古籍叢書之電子全文,是國內現有最周全的經典史料資料庫。行政院文化建設委員會「國家文化資料庫」收集之全國藝文資源中,也有其他古今、地方文學與古文書的全文影像資料。宗教典籍方面,道教有中央研究院中國文哲研究所研究員李豐楙先生帶領的「正統道藏」全文數位化工作;佛教細分經錄與經文,前者有中華電子佛典協會的佛教藏經目錄數位資料庫,以及香光尼眾佛學院之藏經目錄整合查詢系統,後者包括佛光山和中華電子佛典協會製作的《大正》、《阿含》等藏經全文資料庫,其中,佛光山是以精選數部佛典加以新式標點,並附題解及註解,付費使用之方式經營,中華電子佛典協會的「佛典集成電子藏經資料庫」,則按原書全文全套製作,並提供免費瀏覽下載,其經文之質量皆踞漢文佛典數位化之冠。
    國科會數位典藏國家型科技計畫自西元2002年起,便致力推動國內各項文物、資產的數位化工作,整合台灣漢字全文數位化的「漢籍全文主題小組」也於西元2005年7月成立。計畫成員有中華佛學研究所「佛典數位典藏內容開發之研究與建構─經錄與經文內容標記與知識架構」計畫,主題小組召集人由中華佛學研究所圖書資訊館館長─杜正民先生擔任,積極推動國內全文數位化相關計畫、單位的研究分享與技術切磋,其中,對於全文標記的推廣更是不遺餘力,因為合適生存於數位時代的數位資訊,必須具備優良成品、加值應用價值高,且能分享流通於世界之特性,故「全文標記」也是本文之撰寫重心。
    本「漢籍全文數位化工作流程指南」,係紀錄彙整已執行漢籍全文數位化計畫、單位之工作經驗,參考國內外相關技術、標準,歸納統整一套電子全文數位化之工作流程,期能提供執行中單位之管理者與實際作業人員觀摩、檢視,且讓後續更多文書收藏單位加入數位典藏時,能依此參考依據,更有效的執行數位化工作。〈目錄〉
       

註1:黃鴻珠,〈「觀前顧後」資料電子化的要訣之一〉,《佛教圖書館館訊》,第十五期1998年9月。 

 

 

 









Download: 漢籍全文數位化工作流程指南  漢籍全文數位化工作流程指南 (2.3 MB, 1,766 hits)



評分:

1 Star2 Stars3 Stars4 Stars5 Stars (No Ratings Yet)
Loading ... Loading ...

回應:


請輸入圖片中的文字
請按圖片取得圖片中文字的錄音檔
Click to hear an audio file of the anti-spam word