數位典藏資源的長期保存與品質管理(2)

拓展臺灣數位典藏計畫 李姿穎 林彥宏

1.1數位資源長期保存的挑戰
數位資源在長期保存方面所面臨的挑戰主要有三,一是由於資訊科技的發展造成技術的淘汰或是儲存媒體容易損壞的特性,促使數位化資源必需面臨轉換、重置或遷移。二是數位轉換、重置或遷移的過程中,如何避免資料損失,維持數位資源的完整性。三則是如何保持數位資源變更的紀錄,維持數位資料的真實性。

(1)資訊科技的發展造成技術的淘汰
數位化資源需要配合基礎的資訊設備和維護的知識技能,此外,也需要保持運行的軟體,或者編碼架構的知識,才能正確地在螢幕上展示數位化的檔案。但是資訊技術的快速改變,往往使得正在使用的技術設備很快便過時,根據RLG(Research Libraries Group)調查便舉出,技術上的逐漸過時是數位化保存能否成功的最大的威脅。特別是新技術的發展所呈現的混亂現象,例如硬碟的界面(USB1.1、USB2.0、SCSI、IEEE 1394a、IEEE 1394 b、ATA、SATA、SATA2)或是光碟媒介的格式發展等,如DVD(DVD-RAM、DVD+RW和DVD-RW),在缺乏標準化的情況下,將導致光碟機與媒介不相容,並且使用者選定任何一項技術都是風險。

(2)儲存媒體容易損壞的特性
數位化的資源本身雖然不會隨著時間而改變(像紙一般的褪色或脆化),但由於他們保存在脆弱的磁性和光學的媒介上,容易迅速惡化,並且由於曝露於熱度、濕度、空氣中的污染物,或者不良的讀、寫的設備而突然故障。因此也需要採取預防措施,例如保存在一個穩定、受控制的環境裡,幫助降低損失的風險。而且即使媒介能維持在原始的狀態裡,隨著技術迅速改變以及讀取設備的汰換,也可能面臨無法使用它所包含的資訊的情況。

(3)維持數位資料脈絡關係及完整性
數位化資源容易大量複製的特性,容易讓人誤認為從「數位」變換到「數位」時,不會面臨「類比」變換成「數位」時的轉化問題。但是,即使數位內容裡的位元(bit)是相同,但查看數位內容的應用環境卻隨著技術發展而有所不同。尤其在數位化的世界,資訊之間的相關性增強,通常一件作品不止是由單個檔案組成,而且當只有單個檔案時,便可能無法展示,例如在網路上最普通的錯誤資訊 「404 Not Found」,便是指向的網站一些簡單的重新組織所引起。或如我們儲存一本數位化圖書裡的每頁影像,但除了圖書影像是可用的之外,我們也必須儲存「閱讀」的重要行為,像後設資料以及相關的行為,例如允許未來的用戶翻閱書頁、從目錄跳躍到特定的章節,或者在本文和附註之間來回。

(4)維持資料的真實性、可靠性
除了維持數位化資源的脈絡和完整性之外,數位化資源的真實性也與其他部分同樣重要。例如,學者或研究人員對於引用數位化資源的內容需要覺得有信心,所引用的內容必須長期都會是相同的。而要取得真實性最好的方法便是透過與過程的結合,有資料完整追蹤機制,並審查全部變更行動的紀錄。
但除就技術問題外,數位資訊的不易儲存勢必投入相當多的經費、人力,以維護資料的存取,因此就長期而言不僅是技術層面的問題,尚需考量成本、保存的政策、法律等組織整體性的策略問題。

1.2數位資源長期保存的策略

因為數位資訊的長久保存,乃是對人類整體知識與記憶的收藏。究竟該如何對數位保存下定義?資訊與影像管理學會(The Association for Information and Image Management,AIIM)認為,數位保存意指持續使文件和檔案可在時間遷移中,超越技術的進步,而無須擔心可讀取性的變化或遺失。為了保存數位資訊從產生至刪除為止的生命週期內,乃一連串的管理活動,這一連串活動需被永久執行。
Oya Y. Rieger則為數位化的保存確定四個主目標:(1)位元(bit)相同,保證檔案沒損壞並且是安全的,沒有未授權的使用和未經紀錄的改變;(2)技術脈絡,保持與更廣泛的數位化環境的相互作用;(3)起源,保持內容的起源和歷史的記錄;(4)參考和可用性,保證用戶能容易找到、檢索,並且無限期地使用數位化藏品。
為達到數位保存的目的,需要選擇合適的保存方法,「技術保存」、「模擬」、「轉置」、「更新」是常被討論的幾種方法,數位保存聯盟(Digital Preservation Coalition,DPC),則進一步將保存策略區分為主要保存策略和次要保存策略,主要保存策略包括「轉置」(Migration)、「模擬」(Emulation),次要保存策略包括「技術保存」(Technology preservation)、「堅持標準」(Adherence to standards)、「舊版本兼容性」(Backwards compatibility)、「封裝」(Encapsulation)、「永久的識別符」(Permanent identifiers)、「轉變成穩定的類比格式」(Converting to stable analogue format)和「數位化的考古學」(Digital archaeology),詳如表2:


除以上所列之外,還有一項常被討論的是更新(Refreshing),其意義是更新儲存媒體,把資料轉存到一種更新的媒介副本,如加拿大文化遺產資訊網計畫,針對檢查的時間表,擬定各時間點不同的任務。在每星期、每月、每半年的階段,主要在檢查數位內容的資料是否完整、可讀,是否與編目符合、是否有損毀?自每兩年起則評估數位檔案,是否能在現存的資訊媒體上讀取,並考慮是否有必要將資料轉至新的媒體或系統平台上。每五年則瀏覽所有檔案格式,檢視各檔案類型的經濟效益,考慮將效益不佳的檔案類型轉至新格式,每十年則應將舊有數位媒材保存的數位內容更新。
更新是每一個數位化專案保存的重要部分,但是對於在技術上逐漸過時引起的問題,他本身沒有提供任何的解答,而是必須與其他主要策略一起使用。

以上是幾種常見的數位資源長期保存的方法,在國內檔案管理局出版的「電子媒體類檔案管理制度及保存技術之研究」,則整理出九種保存策略,並將其分為三個層次:(1)基礎層:更新、標準化、詮釋資料。(2)核心層:轉置、模擬、封裝。(3)輔助層:系統保存、重複一套系統、印成紙張或其它可瀏覽媒體。基礎層:意指隨著時間演進,必須經常、定期的實施。核心層:指保存技術中最核心的部分。輔助層:意指在核心層的保存技術對於數位資源保護,有其困難性才使用的保存方法。因此,目前針對長期保存的議題,並沒有一套固定的方式,而是按照典藏的目標和實際現況,評估能力挑選符合長期保存的策略,研擬適合的長期儲存方案。

接下來將與你分享「制定數位典藏長期儲存策略」敬請期待下期數位島嶼電子報


2008-01-24