中央研究院近代史研究所檔案館外交經濟重要檔案數位化工作流程簡介
Tags: Metadata, 中央研究院, 工作流程, 影像, 掃描, 數位, 數位典藏, 數位化, 數位化工作流程, 數位影像, 檔案, 資料庫, 資訊 發表: 2009-09-09, 點閱: 5,100 , 加入收藏櫃 , 列印 , 轉寄
計畫單位:中央研究院近代史研究所
計畫名稱:近代外交經濟重要檔案數位化計畫
中央研究院近代史研究所籌備處於1955年2月成立,1965年4月正式設所,同年徵得清末以來外交部門的官方檔案,1966年經濟部亦移交大陸時期經濟檔案,長久以來,近史所檔案館庋藏的外交與經濟檔案,為研究清末民國時期外交、財經方面重要史料,數量龐大,利用頻率也相當高。為了長久保存這批史料,近史所檔案館於1991年進行檔案微縮的拍攝,1997年改以數位典藏,至2004年止,總計完成約300萬頁的影像檔案。
以下就數位化工作流程做一說明。
數位化工作流程圖
原檔案已按全宗、系列、冊層級作好整編,為配合影像製作必須逐冊拆卷、編寫每冊文件號及每冊文件之流水編號。檔案拆卷(圖一)前須檢查全宗號、系列號、宗號、冊號與本宗函目是否相符,將文件逐頁攤開,編頁作業依《外交檔案編頁規範》進行,編頁時使用2B鉛筆,將頁碼寫在檔案原件的左上角(圖二)。長寬均大於A3的檔案,整編時先將大於A3文件抽出,並於抽出文件的位置放入一張註記「A0」的白紙,依續編上流水號,並將抽出的檔案登錄在清單上。
圖一:拆卷
由檔案館影印每冊的檔案目錄(圖三),挑選Metadata中的基本欄位,依《外交檔案目錄建檔流程及規範》委外製作,採Excel格式建檔,完成一校一改後交還檔案館。
圖三:檔案目錄影印稿
一校稿完成後,由檔案館負責人員合併、調整電子檔列印目錄,進行二校。二校人員需根據《外交檔案目錄校對流程及規範》配合檔案原件進行目錄校對,並註記收發欄中人名、機關等相關資訊,以利權威控制作業。
圖四:校對目錄
圖五:參考檔案原件進行二校
由於外交檔案原始文件收發者多只註記簡稱、職銜,為方便使用者查詢,必須對文件人名、地名作權威控制之加值。外交檔案權威款目包括「機關」名稱、「人名」之別名或字號、「職銜」以及「地名」等,這些訊息來自目錄中「收發文者」、「描述」、「冊名」、「題名」等欄位,作業人員根據原始文件查考相關資料(圖六),補填人名及職銜全稱(圖七)。權威控制作業項目包括(1)整理機關、人名、地名、職銜行政資訊;(2)製作權威對照表;(3)將權威控制欄位與別名檔在檢索系統中連行連結。(圖八)此項工作須查考史籍文獻,以具有史學背景、熟悉檔案內容的專業背景者擔任為佳。
圖六:權威控制資訊著錄表格(部分)
圖七:參考資料,如「辛亥以後十七年職官年表」、「近代來華外國人名辭典」
圖八:大鐸系統權威著錄畫面
(一)檔案
數位影像製作採招標委外作業,為確保數位化影像之品質與完善的處理流程,並保護檔案原件不致受損,廠商必須將機器設備進駐近史所檔案館,進行掃描工作(圖九至圖十一)。影像規格為300dpi、TIFF格式,另轉製一份品質壓縮參數75%之JPEG光碟備分。由於影像規格高,掃描存檔長,操作人員可同時多機進行,唯同一宗檔案只能於同一部機器處理,以避免錯誤。影像掃描存檔後,交由後端裁切人員裁切、存檔。以上作業均須符合《外交檔案掃描規範》。
圖九:掃描現場
圖十:影像掃描
圖十一:影像掃描
圖十二:掃描時的電腦畫面
(二)大圖
所謂大圖為長寬尺寸超過A3(42*29.7cm)的資料,包括表單、地圖、契約、證書等。
編頁時註記「A0」的白紙掃描後檔案會特別小,依檔案大小即可從系統中辨識大圖的位置,大圖掃描完成後,將影像插入。(圖十三、圖十四)
圖十三:大圖影像掃描
圖十四:大圖掃描時的電腦畫面
廠商完成初步數位影像製作後,須作預檢(圖十五、圖十六),再交由檔案館進行全數查核(圖十七),廠商更正錯誤後,檔案館再進行複查,複查時採十分之一影像抽驗,影像檢驗標準必須符合《外交檔案影像檢驗規範》。
檢驗過程中爭議性最大的為色彩,色差的產生可能來自多部掃描機有多種色調,也可能來自於同一台掃描機不同時間所產生的掃描色差。因此檔案館每月必須定時校色。校正方式為掃描色彩導表,一來比較不同機器的色度是否一致,二來每一台機器所掃描的色表須與前次所掃描的色表作比較,以看出同一台機器前後的色差度。
圖十五:影像校正
圖十六:正在進行影像校對的圖檔
圖十七:館方人員進行驗片
檢驗修正後影像,以宗為單位,儲存於100G抽取式硬碟交付館方資訊人員,製作一式兩份的磁帶備份(圖十八、圖十九)。一份存於檔案館,一份存於中研院計算中心。廠商並同時提供JPEG影像以硬碟交付館方,俟檔案館完成三校目錄後,進行圖文比對。
數位化製程中由於專業分工的需要,目錄與影像往往採取分別製作的方式產生。數位影像的命名原則通常由館藏號而來,故檔案目錄中的館藏號資訊一方面是影像掃描製作的依據,另一方面則是影像備分及系統整合時的校正依據。
檔案館以「件」為單位進行圖文比對,每一筆目錄應產生一筆該件的影像檔;比對時,可自實體檔案的電子目錄中擷取出館藏號欄位,製成「應掃檔案文號索引」,再自掃描後的影像檔名中產生「掃描檔案文號索引」,兩個索引檔的產生方式如圖二十。
圖文比對後,由檔案館人員更正錯誤影像檔名,上傳中研院計算中心主機後交還廠商燒錄光碟(圖二十一)。
圖十八:磁帶機與磁帶
圖十九:右側兩台即為大容量空間的磁碟陣列
圖二十:圖文比對
圖二十一:光碟備份
外交檔案Metadata經檔案館與Metadata小組協商並比對EAD款目後,完成Metadata需求規格書0.3版,並由計算中心開發著錄系統。外交檔案分為全宗、系列、卷、件四層著錄格式,其欄位屬性及著錄系統參見圖二十二至圖二十九。
圖二十二:【全宗】需求欄位總表
圖二十三:【全宗】著錄系統
圖二十四:【系列/副系列】欄位需求表
圖二十五:【系列/副系列】著錄系統
圖二十六:【卷】欄位需求表
圖二十七:【卷】著錄系統
圖二十八:【件】欄位需求表
圖二十九:【件】著錄系統
檔案館建置有「近代外交經濟重要檔案數位典藏計畫」網頁,(網址http://dipeco.sinica.edu.tw),提供外交檔案數位典藏之相關文件及規範,並與計算中心合作開發管理、檢索系統。
圖三十:近代外交經濟重要檔案數位典藏計畫網頁
※製作單位:中央研究院近代史研究所 近代外交經濟重要檔案數位化計畫
數位典藏國家型科技計畫 內容發展分項計畫
※文字撰寫:中央研究院近代史研究所檔案館 莊樹華
數位典藏國家型科技計畫 內容發展分項計畫 溫淳雅
※圖片拍攝:數位典藏國家型科技計畫 內容發展分項計畫 溫淳雅、陳嘉萍、陳美智
※圖文編輯:數位典藏國家型科技計畫 內容發展分項計畫�溫淳雅、劉華珍
致謝:
感謝莊樹華小姐、張凱達先生、林威妏小姐、黃國斌先生的悉心指導,並蒙檔案館同仁提供協助,特此致謝。
全文下載 (1.4 MB, 913 hits)