1024x768 1280x800   Decrease font size for  - 拓展台灣數位典藏 - 數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫網站 Reset to normal font size for  - 數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫網站 - 拓展台灣數位典藏 Increase font size for  - 拓展台灣數位典藏
 


中央研究院近代史研究所檔案館 外交經濟重要檔案數位化工作流程簡介

Tags: , , , , , , , , , , , 發表: 2008-08-08, 點閱: 4,003 , 加入收藏櫃 , 列印 列印 , 轉寄 轉寄

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

 

 

計畫單位:中央研究院近代史研究所

 

計畫名稱:近代外交經濟重要檔案數位化計畫

 

計畫簡介

 

中央研究院近代史研究所籌備處於1955年2月成立,1965年4月正式設所,同年徵得清末以來外交部門的官方檔案,1966年經濟部亦移交大陸時期經濟檔案,長久以來,近史所檔案館庋藏的外交與經濟檔案,為研究清末民國時期外交、財經方面重要史料,數量龐大,利用頻率也相當高。為了長久保存這批史料,近史所檔案館於1991年進行檔案微縮的拍攝,1997年改以數位典藏,至2004年止,總計完成約300萬頁的影像檔案。

 

以下就數位化工作流程做一說明。

 

  目      錄 

計畫簡介


工作流程圖

 

一、檔案整理

 

二、檔案目錄建置

 

三、檔案目錄校對

 

四、權威控制

 

五、數位影像製作

 

六、影像檢驗

 

七、圖文比對及影像備分

 

八、建立電子資料庫

 

九、網站建置、系統開放/

 

 

 數位化工作流程說明

 

數位化工作流程圖

 


<目 錄>

 

一、檔案整理

 

原檔案已按全宗、系列、冊層級作好整編,為配合影像製作必須逐冊拆卷、編寫每冊文件號及每冊文件之流水編號。檔案拆卷(圖一)前須檢查全宗號、系列號、宗號、冊號與本宗函目是否相符,將文件逐頁攤開,編頁作業依《外交檔案編頁規範》進行,編頁時使用2B鉛筆,將頁碼寫在檔案原件的左上角(圖二)。長寬均大於A3的檔案,整編時先將大於A3文件抽出,並於抽出文件的位置放入一張註記「A0」的白紙,依續編上流水號,並將抽出的檔案登錄在清單上。

 

 

橢圓形圖說文字:

 


<目 錄>

 

二、檔案目錄建置

 

由檔案館影印每冊的檔案目錄(圖三),挑選Metadata中的基本欄位,依《外交檔案目錄建檔流程及規範》委外製作,採Excel格式建檔,完成一校一改後交還檔案館。

 

圖三:檔案目錄影印稿

 


<目 錄>

 

三、檔案目錄校對

 

一校稿完成後,由檔案館負責人員合併、調整電子檔列印目錄,進行二校。二校人員需根據《外交檔案目錄校對流程及規範》配合檔案原件進行目錄校對,並註記收發欄中人名、機關等相關資訊,以利權威控制作業。

 

 

圖四:校對目錄

 

 

圖五:參考檔案原件進行二校

 


<目 錄>

 

四、權威控制

 

由於外交檔案原始文件收發者多只註記簡稱、職銜,為方便使用者查詢,必須對文件人名、地名作權威控制之加值。外交檔案權威款目包括「機關」名稱、「人名」之別名或字號、「職銜」以及「地名」等,這些訊息來自目錄中「收發文者」、「描述」、「冊名」、「題名」等欄位,作業人員根據原始文件查考相關資料(圖六),補填人名及職銜全稱(圖七)。權威控制作業項目包括(1)整理機關、人名、地名、職銜行政資訊;(2)製作權威對照表;(3)將權威控制欄位與別名檔在檢索系統中連行連結。(圖八)此項工作須查考史籍文獻,以具有史學背景、熟悉檔案內容的專業背景者擔任為佳。

 

 

圖六:權威控制資訊著錄表格(部分)

 

 

圖七:參考資料,如「辛亥以後十七年職官年表」、

 

「近代來華外國人名辭典」

 

圖八:大鐸系統權威著錄畫面

 


<目 錄>

 

五、數位影像製作

 

(一)檔案

 

數位影像製作採招標委外作業,為確保數位化影像之品質與完善的處理流程,並保護檔案原件不致受損,廠商必須將機器設備進駐近史所檔案館,進行掃描工作(圖九至圖十一)。影像規格為300dpi、TIFF格式,另轉製一份品質壓縮參數75%之JPEG光碟備分。由於影像規格高,掃描存檔長,操作人員可同時多機進行,唯同一宗檔案只能於同一部機器處理,以避免錯誤。影像掃描存檔後,交由後端裁切人員裁切、存檔。以上作業均須符合《外交檔案掃描規範》。

 

 

圖九:掃描現場

 

 

圖十:影像掃描

 

 

圖十一:影像掃描

 

 

圖十二:掃描時的電腦畫面

 

(二)大圖

 

所謂大圖為長寬尺寸超過A3(42*29.7cm)的資料,包括表單、地圖、契約、證書等。

 

編頁時註記「A0」的白紙掃描後檔案會特別小,依檔案大小即可從系統中辨識大圖的位置,大圖掃描完成後,將影像插入。(圖十三、圖十四)

 

 

圖十三:大圖影像掃描

 

 

圖十四:大圖掃描時的電腦畫面

 


<目 錄>

 

六、影像檢驗

 

廠商完成初步數位影像製作後,須作預檢(圖十五、圖十六),再交由檔案館進行全數查核(圖十七),廠商更正錯誤後,檔案館再進行複查,複查時採十分之一影像抽驗,影像檢驗標準必須符合《外交檔案影像檢驗規範》。

 

檢驗過程中爭議性最大的為色彩,色差的產生可能來自多部掃描機有多種色調,也可能來自於同一台掃描機不同時間所產生的掃描色差。因此檔案館每月必須定時校色。校正方式為掃描色彩導表,一來比較不同機器的色度是否一致,二來每一台機器所掃描的色表須與前次所掃描的色表作比較,以看出同一台機器前後的色差度。

 

 

圖十五:影像校正 

 

 

圖十六:正在進行影像校對的圖檔

 

 

圖十七:館方人員進行驗片

 


<目 錄>

 

七、圖文比對及影像備分

 

檢驗修正後影像,以宗為單位,儲存於100G抽取式硬碟交付館方資訊人員,製作一式兩份的磁帶備份(圖十八、圖十九)。一份存於檔案館,一份存於中研院計算中心。廠商並同時提供JPEG影像以硬碟交付館方,俟檔案館完成三校目錄後,進行圖文比對。

 

數位化製程中由於專業分工的需要,目錄與影像往往採取分別製作的方式產生。數位影像的命名原則通常由館藏號而來,故檔案目錄中的館藏號資訊一方面是影像掃描製作的依據,另一方面則是影像備分及系統整合時的校正依據。

 

檔案館以「件」為單位進行圖文比對,每一筆目錄應產生一筆該件的影像檔;比對時,可自實體檔案的電子目錄中擷取出館藏號欄位,製成「應掃檔案文號索引」,再自掃描後的影像檔名中產生「掃描檔案文號索引」,兩個索引檔的產生方式如圖二十。

 

圖文比對後,由檔案館人員更正錯誤影像檔名,上傳中研院計算中心主機後交還廠商燒錄光碟(圖二十一)。

 

 

圖十八:磁帶機與磁帶

 

 

圖十九:右側兩台即為大容量空間的磁碟陣列

 

 

圖二十:圖文比對

 

 

圖二十一:光碟備份

 


<目 錄>

 

八、建立電子資料庫

 

外交檔案Metadata經檔案館與Metadata小組協商並比對EAD款目後,完成Metadata需求規格書0.3版,並由計算中心開發著錄系統。外交檔案分為全宗、系列、卷、件四層著錄格式,其欄位屬性及著錄系統參見圖二十二至圖二十九。

 

 

圖二十二:【全宗】需求欄位總表

 

 

圖二十三:【全宗】著錄系統

 

 

圖二十四:【系列/副系列】欄位需求表

 

 

圖二十五:【系列/副系列】著錄系統

 

 

圖二十六:【卷】欄位需求表

 

 

圖二十七:【卷】著錄系統

 

 

圖二十八:【件】欄位需求表

 

 

圖二十九:【件】著錄系統

 


<目 錄>

 

九、網站建置、系統開放

 

檔案館建置有「近代外交經濟重要檔案數位典藏計畫」網頁,(網址http://dipeco.sinica.edu.tw),提供外交檔案數位典藏之相關文件及規範,並與計算中心合作開發管理、檢索系統。

 

 

圖三十:近代外交經濟重要檔案數位典藏計畫網頁

 

※製作單位:中央研究院近代史研究所 近代外交經濟重要檔案數位化計畫

 

數位典藏國家型科技計畫 內容發展分項計畫

 

※文字撰寫:中央研究院近代史研究所檔案館 莊樹華

 

數位典藏國家型科技計畫 內容發展分項計畫 溫淳雅

 

※圖片拍攝:數位典藏國家型科技計畫 內容發展分項計畫 溫淳雅、陳嘉萍、陳美智

 

※圖文編輯:數位典藏國家型科技計畫 內容發展分項計畫�溫淳雅、劉華珍

 

致謝:

 

感謝莊樹華小姐、張凱達先生、林威妏小姐、黃國斌先生的悉心指導,並蒙檔案館同仁提供協助,特此致謝。

 


<目 錄>

 









Download: 全文下載  全文下載 (1.3 MB, 854 hits)



評分:

1 Star2 Stars3 Stars4 Stars5 Stars (No Ratings Yet)
Loading ... Loading ...

回應:


請輸入圖片中的文字
請按圖片取得圖片中文字的錄音檔
Click to hear an audio file of the anti-spam word