中央研究院歷史語言研究所史語所藏漢代簡牘數位化工作流程簡介
Tags: Metadata, 中央研究院, 影像, 掃描, 掃描器, 數位典藏, 數位化工作流程, 數位攝影, 文物典藏, 檔案, 資料庫, 資訊 發表: 2008-08-08, 點閱: 8,713 , 加入收藏櫃 , 列印 , 轉寄
計畫單位:中央研究院歷史語言研究所
計畫名稱:珍藏歷史文物數位化典藏計畫-分支二:拓片與古文書數位典藏計畫之漢代簡牘
中央研究院歷史語言研究所歷史文物陳列館(以下簡稱史語所文物館)典藏的漢簡,以1930年至1931年瑞典考古學家貝格曼(Folke Bergman)在內蒙古與甘肅境內之額濟納河流域發掘的「居延漢簡」為主,約一萬一千餘枚,另外還包括1930年、1934年黃文弼在新疆鹽澤發現的「羅布淖爾漢簡」(五十八枚),以及於1944年、1945年夏鼐、閻文儒勘查玉門關、陽關及漢代邊防烽燧遺址路線,所發現的「敦煌小方盤城漢簡」(七十六枚)、「武威剌麻灣漢簡」(七枚)。這批珍貴的考古遺物歷經戰亂,由北京經香港轉運美國,1965年由美國運回台北入藏史語所。
這些漢代邊塞地區出土的簡牘文書,直接、生動地記錄了西漢中晚期到東漢初期,當地軍民之軍事、法律、教育、經濟、信仰以及日常生活的情形,舉凡漢代的吏制、養老、撫恤、秩奉、農墾屯田、眥算、上計、邊塞防禦、算數、曆法等問題,均可從所藏簡牘得到深具價值的研究素材,是國內一批價值非凡的文化資產。
有鑒於電腦應用在漢簡研究上的突破性,史語所簡牘整理小組自九十年代初期起,即以紅外線攝影儀、掃描器、電腦,重新釋讀所藏簡牘,並進行影像、釋文資料數位化,同時也進行「簡帛金石資料庫」以及《居延漢簡補編》紅外線影像檔系統之建置,可謂台灣學術界數位典藏之先驅。
拓片與古文書數位典藏計畫在前述的基礎上,建置「歷史語言研究所藏漢代簡牘資料庫」,提供檢索漢簡基本資料、釋文以及彩色照、黑白照、紅外線照、遺址平面圖等數位影像線上瀏覽,此外建置歷史語言研究所藏居延漢簡遺址查詢系統、秦漢歷史地圖查詢系統等史地工具,藉此增進漢簡研究的便利性。網站部分將提供漢代簡牘導覽,以深入淺出的文字與圖像,提供社會大眾認識漢代簡牘的窗口,介紹本所漢代簡牘的典藏特色與價值。
以下為中研院史語所藏漢代簡牘數位典藏數位化工作流程圖,相關說明如後。
中央研究院歷史語言研究所藏漢代簡牘
數位典藏數位化工作流程圖
圖一、漢代簡牘數位典藏數位化工作流程圖
本所對於該批漢簡的實體整理與數位化前置作業可分為下列三個階段:
(一)考古組的清點、排架與修復
1987年考古組進行漢簡的清點,依勞榦《居延漢簡-圖版之部》(1957)的圖版順序,將簡牘遺物改置在特製平扁鐵抽屜中,進行排架工作,並製成文物典藏清冊。其中也進行部分殘簡的修復工作,如將斷裂或脆弱者用紙裱或膠合等。
(二)簡牘整理小組的校釋與出版
1988年「漢簡整理小組」成立(翌年重組後改稱「簡牘整理小組」),開始著手進行所藏簡牘的校釋工作。在比對原簡與出版圖錄進行釋文判讀的同時,並使用紅外線攝影儀輔助辨識,獲得相當著益。除以資料卡記錄新校釋文與文字影像清晰評比資訊外,並進行釋文的電腦打字與造字,漢簡釋文收入本所文物圖象室「簡帛金石資料庫」中,另建置釋文與紅外線影像結合之「居延漢簡補編圖象系統」提供資料檢索與研究上的便利。在出版工作方面,將部分尚未刊佈或刊佈不全的漢簡進行黑白照片的攝影,配合紅外線影像及釋文,出版《居延漢簡補編》(1998),其中也將史語所藏羅布淖爾漢簡、敦煌小方盤城漢簡、武威剌麻灣漢簡以及國家圖書館藏30枚居延漢簡一同整理發表。
(三)文物館庫房的典藏編目與基本資料著錄
史語所文物館成立於1986年,除了商周青銅器、甲骨、陶器、玉石器、骨器等考古文物之外,漢代簡牘也是該館的重要典藏品之一,為便於文物管理、展示、修復、科學鑑定、調件等工作,近年也著手進行漢簡典藏的編目及基本資料的建檔,其工作簡列如下:
1.測量與檢視工作
測量與檢視工作包括漢簡圖版資料之查閱、尺寸之測量、保存現況之檢視等工作(圖二至圖四),其餘欄位資料如釋文資料則由簡牘整理小組提供電子檔案。
2.漢簡DBASE基本資料建檔與出土文物清冊
DBASE著錄欄位包括典藏號、簡號、品名、材質、尺寸、年代、件數、單位、遺址名稱、遺址代碼、釋文、保存狀況、展區位置、建檔日期,出土文物清冊則由Dbase產生(圖四、圖五)。其中漢簡典藏號編目至13813筆(2004年12月止),目前持續中。
圖二、史語所文物館工作人員取出漢簡(操作人員:楊德禎)
早在「數位博物館計畫」或「國家型數位典藏科技計畫」進行之前,史語所藏漢簡影像數位化或資料庫建置等數位化工作,已由史語所簡牘整理小組進行多年。1992年,該小組採購紅外線影像處理器及電腦影像強化及儲存系統,以紅外線攝影儀所見字跡,經影像強化處理後,儲存於光碟作為資料之保存。簡牘小組於資料卡記錄新校釋文與文字影像清晰評比資訊,並進行釋文的電字檔與缺字造字檔,上述的成果為本計畫奠立重要的基石。以下就相關的數位化工作流程分述如下:典藏品數位化物件的整理與清點、數位掃描與攝影、數位影像修稿、數位影像檔後製作等四方面。
(一)數位化物件的整理與清點
該本計畫欲影像數位化的典藏物,除原簡約一萬一千餘枚外,尚有1940年拍攝於香港的黑白反體照片《居延漢簡‧圖版之部》605張,以及《居延漢簡補編》黑白照片2000餘張,紅外線數位影像約11,100餘張。《居延漢簡補編》黑白照片及其底片以無酸護套進行檔案整理(圖七、圖八),並註記簡號與四碼流水編號,製作索引目錄(欄位包括簡號、文物館登錄號、底片編號、電子圖像檔名、原始光碟編號)(圖九),最後須進行資料之校對工作。
(二)數位攝影與掃描
漢簡數位影像的物件包括原簡、《居延漢簡—圖版之部》黑白反體照、《居延漢簡補編》黑白照片三個部分,原簡影像攝影則分別以紅外線攝影儀設備與數位相機,產出紅外線數位影像與彩色數位影像。《居延漢簡—圖版之部》黑白反體照片與《居延漢簡補編》黑白照片,則以高階平台掃描器與底片掃描器進行數位化工作,設備與規格如下表1。
表1、漢代簡牘數位典藏數位攝影與掃描設備與規格表
項目 |
數位化方式 |
設備 |
規格 |
原簡 |
紅外線影像數位攝影(圖十~十四) |
紅外線影像處理器電腦影像強化及儲存系統 |
512×480pixels/ BMP/72dpi |
彩色影像數位攝影(圖十五~十七) |
數位相機 |
10013×8000pixels/3000 dpi/TIF/全彩 |
|
《居延漢簡‧圖版之部》黑白反體照 |
照片掃描 (圖十八~二十) |
高階平台掃描器 |
600dpi/TIF/全彩 |
《居延漢簡補編》黑白照片 |
照片、底片掃描 (圖二十一~二十二) |
底片掃描器 高階平台掃描器 |
以35mm底片掃描者4000dpi/ TIF/灰階 以120mm底片掃描者,4000dpi/ TIF/灰階 照片掃描者1200dpi/ TIF/灰階 |
1.紅外線影像數位攝影(圖十至圖十四)
2.彩色數位檔按照之拍攝
以數位相機拍攝文物之全形照,方向包括正面、背面或側面,每件作品至多四張。對照書籍圖錄記錄之正確拍攝位置、檔案品質之校對,如文字清晰度、色彩準確度等。此數位影像僅作為庫房文物管理之使用,非國家典藏級規格。(圖十五至圖十七)
3.黑白反體照平台掃描(圖十八至圖二十)
(三)數位影像修圖
1.檢視影像之正確性(方向、內容、檔名)、完整性、清晰度。
2.紅外線照片-影像裁切、接圖、註記簡號(圖二十三)。
3.黑白照片-影像裁切、修圖、註記簡號(圖二十四、二十五)。
(四)影像檔產出清冊彙編
1居延漢簡紅外線影像檔
居延漢簡紅外線影像檔產出清冊以EXCEL填寫如下:
(1) 居延漢簡紅外線影像接圖工作記錄(表2)
包含:每日工作清單,欄位包括日期、簡號、遺物登錄號、接圖影像檔名原影像檔名、每日數量、總數量累計。
表2、居延漢簡紅外線影像接圖工作紀錄表
(2)《居延漢簡補編》紅外線接圖清冊(表3)
以簡牘整理小組編之《居延漢簡補編》為主之紅外線影像清冊,欄位包括序號、簡號、遺物登錄號、接圖影像檔名、原影像檔名。
表3、《居延漢簡補編》紅外線接圖清冊一覽表
(3)《居延漢簡圖版之部》紅外線接圖清冊(表4)
以勞榦《居延漢簡圖版之部》一書圖號為序之紅外線影像清冊,欄位包括圖版號、簡號、遺物登錄號、接圖影像檔名、原影像檔名、備註。
表4、《居延漢簡圖版之部》紅外線接圖清冊一覽表
(4)居延漢簡紅外線接圖總清冊(表5)
分別以遺物登錄號(即典藏號)、簡號排序的影像總冊,包括序號、遺物登錄號、簡號、接圖影像檔名、原影像檔名、備註。
表5、居延漢簡紅外線接圖總清冊一覽表
2.《居延漢簡補編》黑白照片影像檔(表6)
產出清冊填寫以下紀錄欄位包括「序號」、「簡號」、「文物館登錄號」、「底片編號」、「電子圖檔名」、「原始圖檔CD編號」、「修改圖檔CD編號」。
表6、《居延漢簡補編》黑白照片影像檔一覽表
(五)數位影像檔後製作
相關工作包括影像檔案命名、上傳備份、降階轉存、加入浮水印等技術之執行。影像檔備份分別儲存於歷史語言研究所數位典藏計畫之伺服器、中央研究院計算中心之巨量儲存系統,另降階轉存於中研院資訊所多媒體中心。分述以下幾個步驟:
1.數位影像檔之命名
依《中央研究院歷史語言研究所歷史文物陳列館影像檔名編碼原則》命名。
2數位影像檔之儲存
原始影像檔以光碟片等儲存媒體儲存,並上傳中央研究院歷史語言研究所數位典藏伺服器備份,資料量達200GB時另傳磁帶備份。
3.轉入多媒體中心與降階轉存
降階轉存工作則結合中研院資訊所多媒體中心進行影像檔案儲存與分類工作(圖二十六),影像上傳時,並將影像檔另批次轉出三種不同等級的影像檔,分別為索引級、預覽級和鑑賞級,分述如下:
(1)索引級
索引級圖檔用在目錄索引時供使用者預覽用之縮圖,由原始圖檔以等比例轉出最長邊不超過200個像素的JPEG檔,其轉出之影像檔最大約36KBytes,視圖檔之畫面和色彩而不同。
(2)預覽級
預覽級適合做為鑑賞級影像之預覽,透過瀏覽器以有限的解析度檢視原始圖檔。以等比例轉出最長邊不超過640個像素的JPEG檔,其轉出之影像檔最大約80KBytes。
(3)鑑賞級
鑑賞級圖檔為讓使用者能透過有限的網路頻寬,線上即時瀏覽原始圖檔,兼顧影像的品質、影像檔大小和在網路上的傳輸能力,此等級圖檔引用了DjVu影像壓縮技術,使用者透過加裝DjVu plug-in的瀏覽器便能快速地檢視原尺寸大小的高解析度影像檔,並可直接做拖曳、放大縮小、旋轉、局部標示等功能(圖二十七)。
圖二十六、資訊所多媒體中心進行影像檔案儲存與分類工作
圖二十七、引用了DjVu影像壓縮技術的鑑賞級圖檔
這部分工作包括典藏品Metadata分析、漢代簡牘數位典藏管理系統、歷史語言研究所藏漢代簡牘資料庫(檢索介面)、居延漢簡遺址查詢系統(Web Gis)、秦漢歷史地圖查詢系統(Web Gis)開發設計,分述如下:
(一)典藏品Metadata分析
填寫數位典藏國家型科技計畫後設資料工作組提供之「Metadata藏品元素需求表單」、「內涵關係結構圖」、「Metadata元素代碼表單」、「Metadata著錄範例表單」、「Metadata系統功能需求表單」等資料,以利該小組進行「漢代簡牘後設資料需求規格書」之撰寫。
(二)典藏管理系統功能與介面設計開發
漢代簡牘數位典藏系統(圖二十八)由中央研究院資訊所電腦暨通訊系統實驗室協助資料庫管理系統開發,管理系統包含「著錄查詢」、「系統管理」兩大部分:
圖二十八、漢代簡牘數位典藏系統首頁
1.著錄查詢:
分為「基本資料」、「合編資料」、「文字資料」、「媒體檔案」、「遺址資料」、「文獻資料」六個表單。「基本資料」為漢簡品名、年代、遺址資訊、形制、材質、 度量等基本資訊。「合編資料」為簡冊復原與簡牘綴合的版本紀錄。「文字資料」為漢簡不同版本之釋文以及相關著錄文獻之資料。「媒體檔案」為漢簡彩色照片、黑白照、紅外線照片、遺址平面圖或照片等影像資訊之記錄。「遺址資料」為出土簡牘遺址之相關資訊;「文獻資料」可建立簡牘著錄之文獻資料,並提供上述五個表單連結所需著錄資料。上述各個表單中各有「索引瀏覽」(含簡易查詢)、「著錄」(含新增、維護、刪除、預覽)、「進階查詢」、「校對報表」等功能。「報表列印」提供將上述著錄表單之資料多筆列印功能,以供校驗之用;「進階查詢」提供典藏單位與資料庫管理者工作上的檢索功能。
2系統管理:
分為「著錄代碼維護」、「資料異動紀錄」、「使用者權限管理」、「資料交換管理」四個部分。「著錄代碼維護」提供系統管理者可增刪上述著錄表單中之代碼;「使用者權限管理」依使用者身分與所需設定管理系統操作之權限控管;「資料匯出匯入管理」則設計以XML作為資料交換的標記。
3. 歷史語言研究所藏漢代簡牘資料庫開發設計
由中央研究院資訊所電腦暨通訊系統實驗室協助建立資料庫之檢索介面,包括「簡易檢索」、「進階檢索」、「瀏覽檢索」等檢索方式(圖二十九)。此外資料庫為提供漢簡研究上的便利性,設計「影像選擇與比對」、「影像放大」、「釋文版本選擇與比對」、「影像與釋文比對」等功能(圖三十)。
4. GIS地理資訊系統開發
由中央研究院資訊所計算中心協助開發歷史語言研究所藏居延漢簡遺址查詢系統(圖三十一)、秦漢歷史地圖查詢系統。遺址查詢系統提供包括史語所藏居延漢簡圖層、西漢東漢圖層、地名、遺址位置查詢,並連結資料庫瀏覽指定之遺址出土漢簡等功能;秦漢歷史提供秦漢圖層、地名、行政區地理資訊查詢,以及歷史地名沿革查詢。
後設資料校對與著錄工作說明如下:
(一) 擬定歷史語言研究所藏漢代簡牘資料庫著錄規範與各著錄表單工作流程。
(二) Dbase資料校訂與轉檔:
校訂歷史語言研究所文物陳列館製作之「中央研究院歷史語言研究所出土文物清冊(居延漢簡)」Dbase資料,依其對應之欄位轉入或填入歷史語言研究所藏漢代簡牘資料庫基本資料。
(三) 依資料庫著錄規範與各著錄表單工作流程進行資料校訂與著錄:
1.基本資料表單
依「中央研究院歷史語言研究所出土文物清冊(居延漢簡)」Dbase資料進行校訂與增補。
2.文字資料表單
將漢簡釋文電子檔依原簡釋文排列位置填入,並依簡牘整理小組資料卡片進行校對,並填寫文字影像評比。釋文內容若遇BIG5缺字則使用中研院資訊所文獻處理實驗室「漢字構形資料庫」填寫構字式,又若「漢字構形資料庫」尚未建立之字,需另行整理造冊由文獻處理實驗室協助造字。
3.合編資料表單
依簡牘整理小組資料卡片,就簡冊復原、綴合等情況進行合編定義的設定。
4.媒體檔案表單
將影像數位化後製完成之漢簡彩色照片、紅外線照片、黑白照片、遺址平面圖等電子影像檔案進行著錄。
5.遺址資料表單
依簡牘整理小組資料卡片,及相關文獻著錄出土簡牘之遺址相關地理資訊並連結基本資料。
6.文獻資料表單
著錄史語所藏漢簡相關著錄資料之簡稱與詳細文獻資訊。
(四) 校對報表之列印
定期列印著錄資料之校對報表,包含基本資料、文字資料、合編資料、媒體檔案、遺址資料、文獻資料等表單,以利資料校對與修正。
建立「漢代簡牘數位典藏」網站(圖三十二),包括以下內容:
(一)漢代簡牘導覽網頁:
藉由深入淺出的文字與圖像,提供社會民眾認識漢代簡牘的窗口,介紹史語所漢代簡牘的典藏特色與價值。
(二)歷史語言研究所藏漢代簡牘資料庫
將史語所收藏之漢代簡牘提供線上檢索瀏覽。依使用需求可使用「簡易檢索」與「進階檢索」、「瀏覽檢索」三種檢索功能,查詢簡牘基本資料、釋文、紅外線照片、彩色照片、黑白照片等資訊。
(三)史地工具:
提供漢代歷史年表、歷史語言研究所藏居延漢簡遺址查詢系統、秦漢歷史地圖查詢系統等史地研究工具。
(四)標準與規範:
提供漢代典藏數位化工作流程、系統規格需求書、Metadata資料、著錄規範等計畫資料。
(五)網站連結:
提供簡牘帛書研究、秦漢史研究、史學研究、歷史地理資訊、資料庫檢索、博物館、圖書館、研究工具、搜尋引擎等相關網站連結。
(六)計畫小組:
提供參與相關工作之成員名錄。
(七)誌謝:
提供漢代簡牘數位典藏系統網頁設計使用之作品與作者資料介紹。
圖三十二、漢代簡牘數位典藏網站首頁
※ 製作單位:中央研究院歷史語言研究所珍藏歷史文物數位化典藏分支二─
拓片與古文書數位典藏計畫
數位典藏國家型科技計畫 內容發展分項計畫
※ 文字撰寫:中央研究院歷史語言研究所珍藏歷史文物數位化典藏分支二─
拓片與古文書數位典藏計畫助理 遲恒昌、陳秀慧
數位典藏國家型科技計畫 內容發展分項計畫
金石拓片主題小組助理 洪嘉培、張瑞芸、吳淑鈴、黃如足
※圖片拍攝:數位典藏國家型科技計畫 內容發展分項計畫
金石拓片主題小組助理 洪嘉培、張瑞芸、吳淑鈴、黃如足
※資料、圖片提供:中央研究院歷史語言研究所簡牘整理小組助理 夏嘉萱
歷史文物陳列館 館員林玉雲、助理潘詩韻、楊德禎
※ 圖文編輯:中央研究院史語所珍藏歷史文物數位化典藏分支二─
拓片與古文書數位典藏 助理遲恒昌、陳秀慧
數位典藏國家型科技計畫 內容發展分項計畫
金石拓片主題小組助理 洪嘉培、張瑞芸、吳淑鈴、黃如足、溫敏宇
※以上數位化工作流程,參考:
中央研究院資訊科學研究所,《拓片與古文書數位典藏計畫漢代簡牘數位典藏系統軟體設計規格書1.3》,2003年,頁8。
邢義田,〈傅斯年、胡適與居延漢簡的運美及返台〉,《中央研究院歷史語言研究所集刊》,1995年66:3,頁921-952。
邢義田,〈中央研究院歷史語言研究所藏居延漢簡整理工作簡報〉,收錄於大庭脩編,《漢簡研究的現況與展望》,京都:關西大學出版部,1993年,頁38-50。
劉增貴,〈電腦在漢簡研究中的應用〉,《新史學》2:2,頁129-138。
簡牘整理小組編,《居延漢簡補編》,台北:中央研究院歷史語言研究所,1998年。
簡牘整理小組,〈史語所藏漢簡整理工作簡報〉,收錄於簡牘整理小組編,《居延漢簡補編》,台北:中央研究院歷史語言研究所,1998年。
簡牘整理小組,〈中央研究院歷史語言研究所藏居延漢簡整理近況簡報〉,《古今論衡》4,2000年6月,頁87-113。
致謝:
感謝珍藏歷史文物數位化典藏計畫─拓片與古文書數位典藏計畫計畫主持人 邢義田先生、顏娟英小姐、袁國華先生悉心指導。
全文下載 (2.7 MB, 975 hits)