迎向數位 寶典共享
內容發展分項計畫/謝筱琳
數位時代,現代人不用再和唐三藏一樣到西天取經,只消坐在家用電腦前,任何佛教經文、孔孟儒說或是道藏符令,就能彈指即現,二十一世紀的「新絲路」隨數位科技與網際網路,應運而生。數位典藏國家型科技計畫內容發展分項計畫,協同中央研究院歷史語言研究所禮俗宗教研究室,於2006年3月7日,假中央研究院歷史語言研究所,舉辦「數位寶典─宗教文獻數位化工作經驗交流會」,特邀台、日兩界,儒、釋、道三家,共享宗教文獻數位方面之工作經驗。
座談引言人,日本京都大學人文科學研究所莫尼卡副教授(Dr. Monica Esposito)與維習安副教授(Dr. Christian Wittern),從研究與技術兩面,介紹京都大學「道藏輯要」全文數位化計畫。中研院亦有中國文哲研究所李豐楙教授領軍,中研院計算中心協助建置的「道藏資料庫」。李教授助理張超然先生表示,目前《全藏》已輸入完畢,其中三分之一完成初步標點,另五百萬字(約八分之一)內容已提供線上免費檢索。
史語所漢籍工作室製的「漢籍全文資料庫」為台灣歷史最悠久的全文資料庫,內容蒐羅萬象,廣包二十五史、十三經、小說戲曲暨其他、清實錄等,主持人史語所副研究員袁國華指出,漢籍工作室主要工作為校對與標記,線上現有約三億四千六百萬字,其中也含部分道藏經文,逾半數已標記完成。
佛經方面,中華電子佛典協會(CBETA)自1997年起,以日本大藏株式會社授權使用之《大正新脩大藏經》為本,進行《大正藏》第一到五十五冊以及第八十五冊,共五十六冊之數位化作業,已全文上線,並發行光碟供免費索取。CBETA總幹事杜正民說,CBETA早期處理缺字之技術,部分由中研院資訊所研發之構字式移轉;現行的組字式與其他技術流程,則有賴TEI(Text Encoding Initiative)之應用與CBETA同仁之技術研發。
國際流通的全文標記語言──TEI,也是本會討論重點之一。TEI符合XML格式,易於交換,能隨各種文體調整標記方式,也能有效解決經文數位化工作最常見的缺字與異體字問題,是國際學者極力推崇之標記語言。會中,莫尼卡與杜正民更同聲讚道,多虧維習安博士扮演TEI引路人角色,引領日本京都大學與中華電子佛典協會的經文數位化計畫採此公開標準,享有資料交換與完整架構文件之益。
此交流會,除就宗教文獻數位化工作交換經驗、討論常見缺字與異體字問題的解決之道,內容發展分項計畫子計畫一主持人邱澎生更提出合作建置共同平台的想法。他說:「跨學科的數位資料使用環境無論對研究、教學或是自修,都有很大的效益。努力減少資訊不流通、技術不細緻等『進入障礙』,讓社會大眾能更便利且有效使用數位資源,或能發展更多的知識創新,甚至知識經濟」。
最後,談到台灣經典數位化工作需要大量標點專家,一與會者建議,中國北京大學的儒藏數位化工作,由一位北大博士統籌負責,標點作業則發給全國大學教授協助,部分完成就舉辦展覽展示,而計畫的主要資金來源為全國性的募款,台灣或可引為借鏡。