中央研究院歷史語言研究所史語所藏內閣大庫檔案數位化流程簡介
Tags: Metadata, 中央研究院, 主題小組, 典藏, 工作流程, 影像, 掃描, 數位, 數位典藏, 數位化, 數位化工作流程, 數位影像, 數位攝影, 文物, 檔案, 資料庫 發表: 2009-09-09, 點閱: 4,817 , 加入收藏櫃 , 列印 , 轉寄
計畫單位:中央研究院歷史語言所
計畫名稱:珍藏歷史文物數位典藏計畫分支五—史語所藏內閣大庫檔案
中央研究院歷史語言研究所(以下簡稱:史語所)典藏清代內閣大庫檔案約三十一萬件,包括詔令、題奏、移會、賀表、三法司案卷、實錄稿本、各種黃冊、簿冊等。
史語所自民國十八年購入此批檔案始,因環境與時代變遷,或斷或續,整理工作持續至今。民國九十年始,史語所參與中央研究院國家典藏數位化計畫,將內閣大庫檔案的整理納入重點計畫之一,主要目的在於尋求更多的人力、物力,加速檔案的整理工作、減緩檔案的毀損、促進檔案的開放,提昇檔案的利用價值,並同時盡到對國家財產保存與維護的使命與責任。
檔案的整理是一連串嚴謹的程序,牽涉學術、技術與經驗的整合,從實體到數位,要如何完整妥善地將檔案存在的價值,以及歷經時空轉換不同的意義予以呈現,並滿足不同使用者、研究者的各種需求,是一個艱難的課題。在此以史語所明清檔案工作室整理內閣大庫檔案,以及近年來因應時代科技的發展趨勢進行數位化作業的經驗,簡介內閣大庫檔案的數位化流程,提供相關的檔案典藏單位進行參考。
數位化工作流程說明
內閣大庫數位化工作流程圖
一、整體規劃—數位檔建置
(一)實體維護
(二)數位影像製作
(三)數位影像製作—掃校作業
(四)Metadata資料庫
(五)內容分析—權威控制
(六)數位管理計畫
(七)Web計畫
(七)數位影像移轉作業
(一)原件掃灰
實體整理工作階段的第一步驟是掃灰。用軟刷一一刷清原件上的蠹魚、蟲卵、黴斑及灰塵(圖一)。
圖一、掃灰
(二)原件檢視
接下來,是原件實體狀況的檢視,主要目的在於決定後續處理的方法(圖二)。目前原件掃灰及檢視兩項工作已有一定存量。
圖二、原件檢視
(三)裱褙
工作人員根據原件的實體狀況與目的,選擇裱褙的方法,一般以簡單的托裱為主。有展覽目的的檔案,則需要較為嚴謹的裱褙與裝潢(圖三)作業。整個裱褙的過程需要使用的工具有:楮皮紙、自製漿糊、裁刀、大牆、竹啟子、鑷子、尺等。
裱褙使用的漿糊由工作人員自行調製。將澄粉加入冷水攪拌均勻開;為了避免漿水焦糊,所以攪動速度要越來越快,待漿糊開始呈現白色半透明狀時,將熱源關閉,漿糊即製作完成。漿糊冷卻後放入冰箱,使用時再挖出所需份量調水即可。
圖三、裝潢
裱褙的方式如下:準備一張略大於待托裱原件的棉紙,稍微潮潤刷平(圖四),再將欲托裱原件正面朝下,於其上稍微潤濕並將原件檢整、刷平(圖五),另外在桌面鋪一張托紙(楮皮紙),刷勻漿水(圖六),再將托紙慢慢輕放原件上,與底紙重疊,然後使用毛刷上下勻刷托紙,待整張托紙刷實後,以吸水紙蓋在托紙上,再刷一遍吸去水份,去掉吸水紙,托紙四週邊緣上糊後,再貼上一片啟口紙,便可上牆。上牆後,將底紙揭下即完成。
圖四、潮潤刷平
圖五、原件檢整
圖六、乾裱
裱褙的檔案在進行上牆陰乾時,必須採用特製的木製大牆(圖七)。待檔案陰乾後進行下牆裁方(即檔案揭離特製的牆面之後進行裁切),依照摺件原本的樣式摺疊,然後將多餘紙邊裁去,天地留下一定的比例。
圖七、上牆陰乾
(四)原件校核登錄
工作人員查核檔案次序的正確性和完整性,予以鈐印典藏章(圖八),再進行登錄編號(圖九)。鈐印用的印泥,是為配合脆弱的典藏檔案而特別挑選,成本較為昂貴。
圖八、鈐印
圖九、打號
(五)入庫上架
原件校核、登錄之後,便可進行封存及上架。線裝書採用平放而非立放的方式,摺式的文件也是如此,較適宜平放。首先每份文件以弱鹼性楮皮紙包裹,接下來在大張楮皮紙上放置與摺件大小相符的紙板,以幫助固定摺件,再按檔案編號順序,依據檔案的厚薄,存放在紙盒裡。之後在紙盒外側標示文件起訖的登錄號,以便調閱。裝盒亦可避免地震傾倒所造成的重新整理等問題。檔案原件保存在恆溫恆濕條件的庫房中(圖十)。溫溼度的控制採用國際標準,溼度在50~60﹪之間,溫度則在18°C~20°C之間。
圖十、檔案平放於紙箱後,放置於庫房架上
分為三方面同步進行:
第一方面:影像處理
(一)原件掃描、數位攝影
依據檔案數位化的目的,擬定數位影像的規格。其次再依原件的實體整理狀況,決定製作數位影像的方法,可分為掃描法(圖十一)與數位攝影法(圖十二)。掃描圖檔的規格為典藏級300dpi TIFF格式,以下再由系統直接降階轉存為150dpi規格。
圖十一、檔案掃描
圖十二、數位影像拍攝
一般摺件多用掃描方式進行數位化,大尺寸的檔案或卷軸則是採用數位攝影。
史語所內閣大庫檔案初期採用黑白與灰階掃描方式並行,後改為黑白與全彩掃描。自九十二年起掃描色彩標準全面改為全彩。
掃描的單位以頁為計算,即摺件攤開每二幅算一頁。這是因為每份摺件厚薄不一,頁數也不一,因此不適合以件做計算單位;且為了配合掃描平台尺寸普遍為A4至A3大小,以頁為單位大小亦較為適合。經過系統合檔之後,即可一頁一頁翻看。
數位影像的拍攝大多數使用數位相機,小部分採用數位機背,拍攝後的數位影像,直接連接電腦進行圖像編輯處理。為了達到原貌重現,數位攝影圖檔的規格設定在300dpi、real pixel,使攝影後的影像能接近原圖;拼圖也力求完美,檔案上不論字跡、水痕都力求一致。此外,為了讓數位攝影所拍出來的圖像能夠銳利清晰,便會使用吸鐵輔助對焦(圖十三),事後再以圖像編輯軟體將吸鐵的影像修掉。至於掃描的部分則是系統自動合檔,無須人工接圖。
圖十三、大尺寸檔案
(二)數位影像校對、修稿
數位影像的校對須校核其正確性、完整性及清晰度(圖十四)。由廠商進行初步校對,再由工作人員進行校驗,查核是否有漏頁、重複頁、少字或缺字,如有問題即進行重新掃描。
圖十四、影像檔案校對
(三)數位影像後製作
包含影像接圖,即掃描法的系統自動合圖及數位攝影法的人工接圖、合檔、備存。將數位化的典藏級檔案進行降階轉檔、接圖、合檔等技術執行,以使影像成為可實際提供給使用者的數位圖檔。
第二方面:目錄建置
(一)目錄檔著錄
提調檔案,以件為單位,根據〈明清檔案著錄規則(草案)〉,繕寫提要目錄(圖十五)。
圖十五、撰寫提要
提要目錄必須包含:
1.「檔案的內容資訊」:如檔案的具奏人、官銜、時間等;依照檔案複雜程度的不同加以判讀;
2.「檔案載體狀況的資訊」:檔案為完整或殘缺、裝潢的形式、裱褙與否、保存狀況等;
3.「檔案管理的資訊」:包括摘要撰寫人、檔案將來運用等。
從九十年起,為更方便讀者檢索利用,將檔案貼黃部分全文輸入至系統。
(二)目錄檔校對
摘要進行線上著錄後,便由系統列印校對報表,進行目錄檔校對與修正(圖十六)。
圖十六、目錄檔校對
第三方面:加值分析
(一)權威檔著錄
權威檔的著錄,首先需決定權威檔性質。史語所內閣大庫針對人名、地名進行權威控制。再由內閣大庫檔案中摘錄其中人名,並參考清代古地名沿革決定地名。
其三,選擇考證與參考資料(由研究人員提供),依資料的可信度加以排序,並查找、記錄資料來源與位置。
最後根據〈明清檔案人名權威檔著錄規則(草案)〉、〈明清檔案地名權威檔著錄規則(初稿)〉(各規則由本所相關領域之研究人員研擬),進行資料的考證比對並著錄。
(二)權威檔校對
採用線上校對或系統列印校對報表,並直接進行修正。
(一)系統連結
檔案的實體與內容皆進行數位化後,便進入應用階段。連結影像檔、目錄檔、權威檔,執行系統功能運作,提供檢索,過程中並進行權威控制。目前已可以網上閱讀目錄檢索,影像方面則須申請付費使用。
(二)開放利用
研擬檔案閱覽規則,以系統控管方式,提供使用者進行檢索、閱覽目錄及閱覽全文影像。
※製作單位:數位典藏國家型科技計畫 內容發展分項計畫
中央研院歷史語言研究所珍藏歷史文物數位化典藏子計畫─分支五:史語所藏內閣大庫檔案
※文字撰寫:數位典藏國家型科技計畫 內容發展分項計畫
檔案主題小組研究助理 溫淳雅
※圖片拍攝:數位典藏國家型科技計畫 內容發展分項計畫 檔案主題小組研究助理 溫淳雅、陳美智
中央研院歷史語言研究所珍藏歷史文物數位化典藏子計畫─分支五:史語所藏內閣大庫檔案
※圖文編輯:數位典藏國家型科技計畫 內容發展分項計畫 檔案主題小組研究助理 溫淳雅、劉華珍
※以上數位化工作流程簡介之文字,主要是參考中央研究院國家典藏數位化計畫/何漢威、洪一梅、明清檔案工作室」所撰寫之【典藏內閣大庫檔案數位化流程簡介】編寫而來。
致謝:
感謝中央研究院歷史語言研究所「明清檔案工作室」同仁的悉心指導。
全文下載 (1.7 MB, 983 hits)