肆、數位化物件
一、建立色彩管理模式
二、古籍線裝書掃描程序
三、數位化影像後製
四、數位化影像備份與管理
五、數位化工作程序之注意事項
(一)儀器之色彩校正
色彩校正之目的在於充分保留古籍線裝書的文字及圖像等資訊,尤其是色彩與文字資訊部分,讓使用者能從閱覽數位化檔案,便能獲取與原物件相同之資訊內容,並瞭解古籍線裝書在掃描當時的保存狀況為何。而色彩校正一直是電腦繪圖及印刷最困難亦最不易解決的問題,因電腦螢幕上的顏色有許多根本就無法列印出來,或者有嚴重的色偏等,其數位化程序的每一環節皆環環相扣,從掃描器的輸入至螢幕、印表機、印刷廠等輸出,每一層轉換步驟都可能造成色偏的問題。造成色偏之因素如下:
掃描器則必須使用該掃描器專用的校正用色卡,經由比對理論顏色與實際掃描得到的顏色來做修正。
2. 螢幕
螢幕校正需要使用貼在螢幕上之光學儀器,藉由讀取螢幕上特定色塊之顏色值來修正。
3. 印表機、印刷機
依然必須執行色彩校正才能在可能範圍內得到最佳的輸出品質。
(二)色彩校正方式
就桌上型掃描器而言,是依照國際照明協會(Commission Intornation De’l E’ clairage,簡稱CIE或International Commission on Illumination,簡稱ICI)於1976年將CIE Yxy以數理方式轉換成新的CIE Lab模型為基準,並以色彩工業標準─IT8標準色彩導表來作為桌上型掃描器校色之基礎。
而近年來則因為數位相機的誕生,便出現取代傳統相機底片的電子光學元件,即感光耦合元件(Charge Coupled Device,簡稱CCD),而隨著CCD或互補性氧化金屬半導體(Complementary Metal-Oxide Semiconductor,簡稱CMOS)技術的進步,各設備皆有其相對專用之色彩導表以進行色彩校正,並產生裝置色彩描述檔ICC Profile,根據此影像標準格式檔與前、後端設備做連結,盡可能保持輸出的一致性。倘若儀器設備狀況有任何變動的話,則必須重新進行色彩校正與調整。在此本文以專業多用途掃描器為例(廠牌:I2S、型號:DiGiBook10000RGB)進行色彩校正。
數位化過程中若需要較大的亮度才能顯現掃描物件本身的細節與特性,則必須考慮需求與目的為何,是否以物件本身色彩為第一優先,或以清晰呈現細節為優先考量。例如:以植物標本的物件掃描,便需取捨若使葉脈更為銳利化,則物件本身顏色即會些微失差。
(四)輸出應用模式
1. 列印(印表機)
一般個人使用並不會特別注重印表機的色彩校正,然而以專業色彩校正而言,印表機本身及所使用紙張、碳粉或於墨水更換時都必須確實執行色彩校正,才能確保輸出之色彩品質均具有一致性。
2. 印刷(印刷機)
確保印刷文件品質與原件相同,印刷機也必須執行色彩校正,但卻也因目前台灣市場上大部分的印刷機器並不支援色彩校正,所以實務上執行有其困難度存在。
3. 網路瀏覽
經過螢幕及掃描設備色彩校正後之檔案可直接應用於網路瀏覽。
數位掃描作業開始之前,先進行書籍試掃並存檔後,可留做日後校驗等工作之依據。另外,由於國內外各機構所典藏之古籍線裝書原件數量龐大,目前多傾向於委外廠商來執行數位掃描工作,於後文的第五點論述數位化工作注意事項,提供機構單位在實際執行時的參考。
1. 襯紙
一般數位掃描建議以不襯紙為原則,以免襯紙傷及原書版心;試掃前,若原件透背葉時,且版心沾黏、面積小而無法攤開,或因為書口之版心開裂過大而無法修裱時,則需要襯紙將兩頁併掃。另外,若當書籍因紙質較薄,而產生本頁可透視前頁文字的情況時,國家圖書館則會在掃描前加襯白紙[14],但襯紙建議要小於古籍線裝書之單幅尺寸。
2. 不拆線
執行數位掃描工作人員需戴上手套,以減低對於古籍線裝書本身的傷害。一般而言,數位化必須以維持古籍線裝書本身原貌為原則,且力求降低位於古籍線裝書本身之損害,因此以古籍線裝書原件不拆線為主,若古籍線裝書本身不適宜數位化操作則應暫緩數位化,不得因為數位化而損傷原件。若需要拆線修復則委請專業修裱人員進行此工作。
(二)校色
使用專用的反射或透射色票,調節掃描軟體中的高光、暗調數值及中間值的Gamma值。必要時調節R/G/B或C/M/Y/K單通道數值,以使數位影像的階調、色彩及灰平衡與色票一致。以下列出掃描器的校準原則:建議每日正式數位化掃描作業前,依照該顏色校正軟體之標準校對流程與校正顏色,雖然此動作會較為費時,但能保持數位化影像檔之顏色正確性。
(三)準備原件
原件拿取、維護以及翻閱三步驟時皆需制定操作原則,無論在上述三步驟中,皆需戴手套、使用軟毛刷子、以手掌托拿且注意平衡等基本原則,並且建議在拿取原件時盡量以整套為原則,避免有散失之狀況發生。
(四)試掃
先進行古籍線裝書試掃,除了試掃結果可當校驗的範本外,雖費時但可降低古籍線裝書因機械操作不當、人為疏失等因素的傷害,並可降低數位化影像問題的產生。在規劃每日或更換數位化掃描清單時,建議可取每套書可能較易產生問題的某一冊來試掃存檔。當設備故障需先聯絡廠商及軟硬體廠商尋求支援,看問題是否可解決,若無法改善則暫停數位掃描工作。
(五)列印掃描範例影像
掃描完成後古籍線裝書影像經校驗後,建議將範例影像列印,以全彩,掃描及校驗人員雙方簽名以供日後校驗之用。將試掃結果記錄於表單中並列印,並將影像儲存於硬碟中後,進行正式數位掃描工作。
(六)正式數位掃描
數位掃描方式會依照古籍線裝書原件的書況而定,一般可分為原書掃描以及併掃的不同掃描方式。掃描時必須加上標準色彩導表、比例尺,以作為色彩校正及判別原書之依據,並且在掃描面板週邊上夾紙,讓掃描的版面更為清楚、乾淨。
而每日正式掃描前必須執行掃描的色彩校正程式,以檢查燈光以及掃描效果;執行時必須進行影像預覽,避免影像產生色差問題。一般而言若原書不拆線掃描則不蓋上掃描器面板,以免損傷原書;若是拆線併掃或攤開掃描則需蓋上面板掃描效果較佳。最後,回系統註記。
另外,由於設備的操作在事前需先有人員訓練的課程,因此較不建議請工讀生來執行此項工作,除了有排班問題外,由於非此領域的人員,事前訓練的時間會拉長且不容易吸收。
1. 一般數位掃描
不同設備分為書面向上掃描的平床式掃描器,以及書面向下掃描的平台式掃描器。由於設備選擇需考量書籍尺寸、書況,及單位預算、人力配置等各方面,因此掃描時需注意相關設備之功能與物件之相容性。
2. 圖像跨頁掃描
當古籍線裝書內容圖像有跨頁的現象時,國立故宮博物院以及中央研究院歷史語言研究所傅斯年圖書館各有不同的考量因素,國立故宮博物院採用接圖分區方式來掃描,建議視原件大小分數區掃描,各區間重覆之區域至少 2-4 公分,以利後續接圖作業;掃影像檔經校驗無誤之後,再接成原圖[15]。中央研究院歷史語言研究所傅斯年圖書館則以維持原書樣貌為考量,因此不採用接圖方式。
三、數位化影像後製
數位掃描後的影像需經過校驗後,才能以DVD光碟或磁帶備份儲存。通常影像校驗以該計畫研究助理為主,但若研究助理本身工作繁重,則可再請大學以上工讀生協助校驗工作。另外,建議系統欄位有轉錄DVD進度、校驗品質統計、修裱進度統計、掃描類別統計等功能項目。
影像校驗基本上以數位掃描現場一校、校驗人員進行兩校為主,通常檢查掃描圖檔是否有歪斜、黑邊,模糊,不當裁切等問題,並將問題註記於校驗清單中,並針對有問題的頁次進行修正再校驗,才需進行三校,但仍以原書保存狀況為優先考量因素。
資料儲存與備份須視實際需求與環境來選擇適合的儲存媒體,因此有賴規劃人員對整體環境的瞭解及需求,避免造成錯誤評估及採購短缺等現象。以下包含數位化影像備份及數位化影像管理等兩面向,並簡述備份之緣由、備份架構等論點。另外,將於第陸章詳述儲存媒體類型以及相關容量、傳輸速度、業界應用產品介紹。
(一)數位化影像備份
(1)原件故障
由於電腦系統是由許多原件組成,任何一個原件故障都會導致資料破壞或遺失。例如,硬碟機故障導致資料毀損,不穩定系統當機導致資料寫入錯誤或覆蓋到原始檔案資料等狀況。
(2)不可預測災害(天災、戰禍、人為破壞等),造成系統實體上故障、無法使用。
(3)侵入性傷害(系統被入侵造成資料被刪、更改、宣稱無效或有害的資料)。
(4)人為因素(例如,誤刪檔案極為常見)。
2. 備份架構
一般分為分散式資料備份與集中式資料備份,前者較適用於個人資料備份方式,由於本參考標準擬針對團體,因此將以集中式資料備份為主要論述基礎。集中式資料備份大多配合備份軟體(例如ARCServeIT、Veritas Backup Exec…等),可達成排程、備份記錄以及還原、災難復原等功能,加上Client備份代理程式,使得備份程式能有跨平台、即時備份的能力。
圖 8、集中式資料備份架構圖
3. 其他相關事宜
(1)儲存媒體與燒錄
通常光學解析度300dpi影像,以TIFF無壓縮之標準格式儲存,建議以兩份DVD光碟備份、一份磁帶備份較為安全。儲存媒體依單位實際狀況及需求為例,例如影像檔案大小之主觀因素,與單位經費、原有設備、空間大小等客觀因素都必須一併考慮。
(2)儲存媒體之標示
一般較常使用光碟專用油性筆,但由於人工書寫較為費時,建議使用熱轉印的方式進行標示資料工作,既工整且資訊完整,迅速不費時也可節省人力。內容以註記光碟編號、圖籍登錄號為主。
(3)儲存媒體保存環境
建議在一般以溫度20℃,溼度 45%-55% 為佳,尤其應避免高溫。由於光碟資料儲存較接近於印刷面(書寫面)之處,刮傷會讓資料無法讀取,需注意。
(二)數位化影像管理
由於電腦技術使得實體物件可以另一種方式儲存,但電腦技術卻會因人員操作的疏失、電腦當機、病毒、天災(火、水、地震)、斷電、駭客風險等,造成資訊系統無法正常運作或是資料損毀。以下將深入針對儲存備份以及異地備援兩方面來論述,而關於儲存媒體分析比較,將於後面第陸章有詳細的分析比較。
一般個人資料的儲存備份觀念平時就應該建立,每日工作完畢後,必須將資料儲存同時備份,以免突發的病毒或是當機,造成資料的流失。一般依存取特性可分成三種方式,一、線上即時備援(On-Line Backup),以硬碟作為儲存媒介,讀寫速度快,強調在資料保全的磁碟陣列,但費用是最高的;二、近線備援(near online Backup),以光碟櫃(Jukebox)為儲存設備,可隨時存取、方便查詢且資料保固度高,保存年限較長,費用也比較便宜一些。三、離線備援(Off Line Backup),以磁帶(tape)來做儲存,是最經濟但存取速度慢,且安全性較低的儲存方式。完整的備援系統應該是整合上述三種儲存方式,才能使資料保存做到萬無一失。除了可分別用磁碟陣列、光碟櫃與磁帶機達成外,也需要可操作的儲存管理軟體協助達成。
「資料異地備份」之要件即是在不同的地點備份所需之資料,以因應若第一組資料或系統損毀時,尚有第二地備援機制。影響整體建置成本之原因,則有電腦伺服器等級,磁碟陣列之容量大小、介面( SAN or SCSI )、品牌,及單一磁帶機與自動化磁帶櫃。NT或Unix版本之軟體、網路專線頻寬不同,建置成本端賴機構單位本身需求之考量。
依各單位計畫之基礎建設情形,各單位必須先有一個能滿足其數位典藏需求的主要儲存設備,或找尋可提供更佳服務品質的就近環境,作為典藏成果長久保存之基礎。異地備份架構之主要瓶頸在於各單位至異地備份點之網路頻寬。因此在遠端異地備援點之外,應先有一主要備份點,同時亦應逐年改善基礎架構。各典藏單位對於異地備份點之存取速度,將與主要備份點有差距,視單位至異地備份點間之基礎架構而定,此差距為異地備份點選擇之主要依據。主要備份點與異地備份點間,應可視主要備份點狀況,自動選擇可最快捷取資料之來源,省去人為操作維護之困擾與負擔。
請參考附錄二中之各單位目前異地備援之比較概況。
(一)前置作業
在書況檢查古籍線裝書提借部分,只針對即將數位化之珍藏資料進行提借,可避免資料因溫度及溼度改變而受損。若古籍線裝書書況檢查時,發現書況極為不佳,則採用其他數位化方式進行,例如數位拍攝方式。另外,古籍線裝書整理之前置作業及裱褙工作,建議可以委請此領域之專業人員來協助該館數位化之操作,可節省人力成本的耗費,及減少古籍線裝書的損傷。
(二)數位化程序-影幅取捨
中文古籍線裝書的板框四週邊欄可能具有特殊設計,最常見的情況便是左右雙欄、版心(即書頁對折處)黑口;左右欄對稱。此種情形若取單頁為一幅影像,不僅單一影幅不完整。且線裝古籍刻本一般字體大,即使列印縮印,仍可得到清晰的效果,但由於線裝古籍尺寸不一,以通書為例,此書寬為A4的1/3,且字體小,因此古籍線裝書數位化需特別注意。西文書大多未於全文四周加欄框,因此,以單頁為一影幅。
此外,相較於古籍線裝書刻本,現代字體較小,若取跨頁為一影幅,在列印縮印時,會產生字體難以閱讀之效果。因此影幅取捨,應視古籍類別、書頁版面的設計、字體大小等而決定,並非一程不變。以下以實例來說明不同古籍線裝書採用不同的選取影像方式效果。另外,由於中西方文字排版的不同,因此在掃描時需注意其順序是否與書籍放置方向一致性,因此典藏單位應綜合評估需求、使用上便利程度、設備方面的限制等問題。
龐大的資料量需要龐大的儲存空間,以現在電腦技術的發展來看,儲存空間不是問題,值得注意的是儲存媒體的保存年限,例如磁帶的保存年限約為15-20年,而最耐用的CD-ROM,其壽命也不過是30年左右,因此,唯有不斷地重新複製,才能保持資料的穩定性。說來有些矛盾,人們目前最愛用的磁帶、光碟等,原本是指望能夠永久保存的,其實際壽命卻遠不及經過特殊防腐處理的紙張和微縮膠卷。還有這些儲存媒體極易受到外力的干擾及破壞,如電腦病毒、磁場、電磁脈衝等,其破壞程度並不亞於一把火將傳統圖書館燒為灰燼,因此在長期保存方面,還是存在著許多問題。
由於科技發展日新月異,尋找保存年限更長的儲存媒體之際,更應規劃定期的媒體轉換,並且為例行工作,雖然過去研究表示可以DVD光碟可以保存50年,但依據近期研究發現,約2-5為期有效保存年限,因此兩年為一週期,進行數位影像轉製或備份的工作應為合理,若兩年內有發現產生光碟片起霧現象,則應儘早轉檔備份[21]。〈目錄〉
13.程婉如、曾欣怡 著〈期刊報紙全文輸入工作流程參考標準(初稿)〉,台北:數位典藏國家型科技計畫 內容發展分項計畫,2005年9月16日,頁14-15。
14.國家圖書館 著〈國家圖書館古籍原書、拓片、普通本線裝書掃描影像規格〉,出自國家圖書館,2005年10月25日修訂版。
15.故宮博物院圖書文獻處 著〈國立故宮博物院圖書文獻處93年善本古籍數位化影像製作 規格書〉,出自國立故宮博物院圖書文獻處,2004年修定版。
16.多人共同 著〈儲存設備與備份〉,出自:《study-area》網站,檢索:2005年12月22日,http://www.study-area.org/storage/storage.html。
17.羅玳珊 著〈建構企業儲存環境 把錢花在刀口上〉,出自《台灣通訊》網站,發表:2005年9月,檢索:2005年12月22日,http://www.arconet.com.tw/taiwantelecom/tech/tech_1.asp?idxid=6683。
18.同上。
19.中央研究院 著〈中央研究院異地備份儲存資料網路建置ppt檔〉,出自中央研究院92年度 年中稽核會議, 2005年10月。
20.葉慶玲 著〈館藏發展:數位圖書館ppt檔〉,2005年5月30日。
21.項潔、陳雪華、吳海如 著〈國家檔案數位化影像品質之研究〉,台北:國立台灣大學資訊工程學系,2004年10月30日。
古籍線裝書數位化工作流程指南 (636.8 KB, 3,403 hits)
評分:
Loading ...