由數位資訊生命週期探討數位典藏工作流程之建立
Tags: none 發表: 2008-07-11, 點閱: 6,970 , 加入收藏櫃 , 列印 , 轉寄
摘要
影響數位典藏品質的原因很多,其中工作流程的建立,可使複雜工作採系統化步驟,並重視各階段的方法、功能、規格等,甚至朝向標準作業程序(SOP)的發展。使得系統建置減少因人而異的偏差,達到品質提升與成本降低的目標。
近年來國內外積極推展數位典藏,並為提升建置品質,已研定相關工作流程及作業規範。然而數位資訊生命週期為闡述資訊發展的系列過程,其概念可幫助數位典藏工作流程完整性的驗證。
本文以數位資訊生命週期為出發點,探討國內外數位典藏的建置流程,証實國際標準組織(ISO)所發佈的開放式典藏資訊系統(OAIS),以及國內外重要數位典藏計畫的工作流程,均有符合數位資訊生命週期的概念。
本研究結果,可提供研制數位典藏標準作業流程等參考。
關鍵詞:數位典藏、工作流程、數位資訊生命週期、標準作業流程
1. 前言
將國家文化資產利用資訊科技,有系統地進行數位化,建立數位典藏資源,做永久保存,並透過網際網路傳播,提供大眾共享,已成為世界各國文化發展的重要作法,更是資訊國力的指標之一(數位典藏國家型科技計畫,2007)。愈來愈多的國家在探討數位典藏的方式與運用,而在國內由行政院國家科學委員會所推動的數位典藏國家型科技計畫,自2007年起也邁入了第二期,已展現豐碩成果。此計畫在2002年與2004年分別發行了數位典藏技術彙編,撰寫發表200多篇數位典藏相關技術規範與經驗,而其中引述數位典藏與數位資訊生命週期(Digital Information Life Cycle) 的關係密切。
英國的藝術與人文科學資料服務(Arts and Humanities Data Service, AHDS)、國內的嚴漢偉等人,都強調以數位資訊生命週期方式,來發展數位典藏處理流程(AHDS, 2001、嚴漢偉,2007)。數位資訊生命週期闡述了數位資訊的發展過程,其概念有助於驗證數位典藏工作流程的完整性。而AHDS也在2001年提出了創造與保存數位典藏的策略綱領(Strategy Policy Framework for Creating and Preserving Digital Collection),整個綱領是圍繞著數位資訊生命週期來探討,由此可見數位資訊生命週期對數位典藏的重要性。
數位典藏是跨領域跨學科的作業,其工作配合較為複雜,工作流程的制定可使工作人員了解整體作業流程的規範與做法,有助於數位典藏系統建置的品質,因此數位典藏國家型科技計畫近年來已積極推動各類典藏品之數位化工作流程。
有鑒於工作流程制定的必要性,本文分析國內外數位典藏的建置流程,探討其與數位資訊生命週期的關聯性,期望提供數位典藏系統建置以及未來推動標準作業流程等參考。
2. 數位資訊生命週期
資料如同人類、生態以及企業等,具有生命週期;例如資料從產生、保護、讀取、遷移、存檔、應用、到回收的過程,有其發展週期。數位資訊生命週期主要分為資料創造(Creation)、獲取(Acquisition)、分類與定義(Cataloging & Identification)、儲存(Storage)、保存(Preservation)、以及取用(Access) (Hodge, 2000)。而中央研究院電子計算中心提出的數位資訊生命週期圖中,包含了資料數位化(創造、擷取)、建構與管理(分類、索引、智財管理)、傳播(分享、知識搜尋、檢索與取用)與儲存(中央研究院, 2007)。另外,陳昭珍教授(2001)也對於數位資訊生命週期提出:所謂數位資訊的生命週期乃指從數位資料的創作、編輯、描述、索引、傳布、徵集、使用、註解、修訂、再創造、修改、一直到永久保存或遭毀損等。
由此可以歸納出數位資訊生命週期的輪廓,主要包括資料的創造、管理、保存、以及供應(如圖1),闡述如下:
(1) 資料創造
資料創造的檔案類型,可以是獲取原生數位資料或者是由傳統媒體數位化後的資料。然而資料創造的過程是由一連串的決策所組成,如內容特性、結構、格式、壓縮、編碼、描述層次、性質、著作權、成本效益、以及其他相關內容等。資料如何被建立,也直接影響到被利用與管理等作法(陳昭珍,2001)。
(2) 資料管理
資料管理包含的內容有描述資料 (如Metadata)、分類、索引、格式、定義(Identification)、文件(Documentation)、儲存、使用權限與智慧財產權管理等相關作業的制定與規劃。資料需要用哪些方式來管理,應考慮資料當初是如何被創造以及用途等因素。
(3) 資料保存
資料保存需考慮儲存的型式與環境,資料儲存涉及到檔案的格式、資料轉換(Migration)、以及資料需要部份或全部、以分散或集中的方式來儲存,其技術方面包括儲存的媒體及平台的選用(陳昭珍,2001)。一般所指的資料「儲存」,通常被認為是資訊生命週期中被動的一個角色,當儲存介質和格式改變後,原有的資料有可能會毀損、或難以讀取 (Hodge, 2000);然而資料「保存」則是強調資料在時空與資訊設備的變更下,都不受到損傷,並且確保資料仍能繼續被取用,也就是「長久性」的保存(Long Term Preservation),此屬於策略性的思考。
(4) 資料供應
資料的創造、管理與保存都是為了資料的供應,也就是讓需要的人能透過取用機制(Access Mechanisms),適時適地的檢索、分享與傳佈這些資訊,並且從中獲取所需的知識。然而其中最棘手的問題是,這些資料的財產權該如何區分,這是大眾或者資料的提供者,在資料管理的時候,必須注意考慮智慧財產權的問題。
圖1 數位資訊生命週期圖
3. 數位典藏工作流程與品質管理
工作流程的建立一般被認為是要使工作有一貫性的作業方式,以達到重視步驟、講求方法、規格、提升效率、改善品質的目的。尤其是數位典藏這類多工複雜的作業,更需要工作流程的規範,使工作人員了解整體作業流程的規範與做法,減少典藏步驟上不必要的疏失,協助作業能順暢的進行,此有助於提昇數位典藏系統建置的品質。
一個數位典藏的機制是否完善,可由其工作流程規劃是否得宜而知,然而標準化的工作流程,也就是建立所謂的標準作業程序(SOP),更能使整體數位典藏達到品質一致與工作效率提升的目的。為因應當前典藏系統的建置,各典藏單位依循數位化工作流程,使典藏工作更為迅速有效的產出。因此,在執行SOP過程中的良窳於否,將影響「數位台灣」的品質打造(黃足如、梅士杰,2003)。國內的數位典藏工作流程發展在數位典藏國家型計畫的推動下,已經逐漸成熟,並推展到各類典藏品數位化工作流程的參考標準,並擬建立正式的標準作業流程。
數位資訊生命週期對於建立數位典藏之工作流程有檢核其完整性之作用,而由國際標準組織所發佈的開放式典藏資訊系統,在符合數位資訊生命週期概念的同時,也提供相關規範來規劃典藏資訊,總的來說,此系統模型在數位典藏應用上能對資料的產生、管理、儲存、應用以及循環發展等有所掌握,因此數位典藏的標準作業程序可考慮以OAIS作為基礎來研訂。
4. 數位典藏工作流程與資訊生命週期之探討
從數位典藏國家型科技計畫的內容發展分項發行的數位典藏叢書:數位化工作流程參考標準,其闡述數位化的工作流程主要可分為前置作業、物件數位化程序、檔案儲存與後設資料管理三大步驟,此步驟部分符合數位資訊生命週期的資料創造、管理、保存與供應概念。進一步從數位典藏資訊系統建置的角度來看,數位典藏的工作流程大致可分為前置作業、數位化處理、資料儲存、資料取用這幾大步驟,也就是從典藏品數位檔案的創造到典藏品檔案的利用,皆符合數位資訊生命週期的概念。因此可知,在建立複雜的數位典藏工作流程時,可用數位資訊生命週期流程作為建置基礎,確保整體工作流程的完整性。
茲探討國內外數位典藏相關機構的工作流程與數位資訊生命週期的關聯性。
4.1 開放式典藏資訊系統與數位資訊生命週期
國際標準組織(ISO)在2003年發佈了開放式典藏資訊系統(Open Archival Information System, OAIS),該系統模型涵蓋六大功能實體:擷取、檔案儲存、資料管理、取用、行政管理、以及保存計畫。此系統原先是為了儲存太空資料所設計,但近年來已被廣泛的接受與使用於更多樣的資料類型。其所涵蓋的功能如下:
(1) 擷取(Ingest)
這一個實體的功能是負責接收生產者的繳交資訊封包(Submission Information Package, SIP),也就是說典藏品數位化工作在生產者端就進行,並進行資料查核 (如:CRC)與補充更新描述資訊(Descriptive Information),將處理完畢的封包轉換成檔案資訊封包(Archival Information Package, AIP)格式,且符合管理者規劃時所制定的檔案標準,最後將之送入資料管理和檔案儲存兩實體內。
(2) 檔案儲存(Archival Storage)
接收AIP,並且永久保存(Permanent Storage)。在儲存當中須符合儲存的等級(典藏級、瀏覽級等),並且必須隨時更新儲存媒體,定期做特殊的錯誤查詢(Error checking),提供檔案修復功能,最後需要符合使用者端的命令,再以AIP方式傳送。
(3) 資料管理(Data Management)
這個實體主要是管理典藏品的後設資料。所負責的工作有:使用資料庫系統儲存後設資料;更新資料庫內容(從擷取實體獲得更新的描述資料,或是依照行政策略修改資料庫內容);定期製作報表,報告資料庫使用狀況。
(4) 取用(Access)
與使用者作溝通,幫助使用者取得OAIS內的資訊。將使用者要求的資訊轉換成傳佈資訊封包(Dissemination Information Package, DIP),提供應用。
(5) 行政管理(Administration)
這個實體規範了OAIS的所有運作規則。其中包含與生產者協調典藏品的協定、審核典藏品是否符合檔案標準、維持數位典藏計畫的軟硬體結構、監督與改善檔案的運作。整體的功用就是在制定數位典藏計畫的規則與監督作業的品質。
(6) 保存計畫(Preservation Planning)
依據行政管理制定的政策,發展出典藏計畫的保存方法,並且確保使用者可以取用OAIS的資訊。而且在規劃保存的同時,必須注意資訊科技對數位檔案儲存的衝擊,也就是須作長久性的保存。
簡單的說明OAIS的流程;SIP是由生產者產生,並交給擷取實體;擷取實體再把SIP轉換成AIP,遞交到檔案儲存實體,然而SIP相關的描述資訊,則送到資料管理實體。當使用者利用正確的描述資訊和檢索工具來索取資料時,檔案儲存實體將提供符合要求的AIP,經由取用實體轉換成DIP,傳送給使用者。整體的使用規範都是依循行政管理實體的指示;保存策略和技術研發則是由保存計畫來制定,並由行政管理實體來實現(Sawyer, 2002)。
OAIS是由人員和系統所組織成的模型,負責為特定的社群作資訊的長期性保存(ISO, 2003)。也就是說,OAIS是藉由人員與系統的配合,完成數位典藏的長久保存與維護。
依照上述所介紹的數位資訊生命週期與OAIS功能互相作比對,可以發現OAIS各實體的功能,符合數位資訊生命週期的概念。圖2的灰色塊部分為數位資訊生命週期範疇,OAIS的生產者與擷取實體,可結合對應到數位資訊生命週期的資料創造;檔案儲存實體對應到資料保存;資料管理對應到資料管理;取用則對應到資料供應。
除了OAIS的四項實體已經符合了數位資訊生命週期的概念之外,當一個資訊要擁有其附加價值,甚至是長久性的保存,必須有一套策略性的思考來監督與規劃,OAIS的保存計畫與行政管理這兩大功能實體,符合這個需求。這兩大實體可在數位資訊生命週期的運作中視為幕後統籌的角色,為所創造、擷取的資料做監督、規劃、規格、保存、轉換、加值、與應用的規劃,可說是整體數位典藏計畫的決策部門。
圖2 OAIS與數位資訊生命週期對應圖
4.2 從AHDS數位典藏工作流程看數位資訊生命週期
英國的藝術與人文科學資料服務(Arts and Humanities Data Service, AHDS) 為JISC(Joint Information Systems Committee)、AHRB(Arts and Humanities Research Board) 兩單位共同成立,是蒐集、保存及推廣藝術人文領域,促進電子資源教育研究的服務機構。同時AHDS也增進相關資源在線上的供應,以鼓勵研究及教育界之使用。
而AHDS典藏的種類眾多,主要基於互通的架構下,使用了OAIS的系統架構,成功的建置數位典藏工作流程與系統(如圖3),是目前國際上推動數位典藏的重要機構。
若將其工作流程與數位資訊生命週期做對照,可以發現:AHDS的資料提供者可對應到數位資訊生命週期的資料創造;SIP轉換為AIP的過程可視作資料管理;檔案伺服器、磁碟陣列與檔案備份可對應到資料保存;使用者與目錄管理系統的互動,則可視為資料供應。
由此可驗證AHDS所建置的數位典藏工作流程與系統,是符合數位資訊生命週期的概念。此外,AHDS中心、策略工作小組、技術工作小組等,也在整體流程內提供典藏的規劃與協助,發揮了保存計畫與行政管理的功能。由此例可知,數位資訊生命週期與OAIS在數位典藏工作流程應用的可行性與使用方式。
4.3 NEDLIB計畫與數位資訊生命週期
Networked European Deposit Library(NEDLIB)計畫係以荷蘭國家圖書館為首,發展於歐洲地區。參與的單位包括荷蘭、芬蘭、法國、挪威、瑞士等八個國家圖書館、一個國家檔案館、兩個資訊通信科技組織以及三家出版社。此計畫的目標是要發展出歐洲地區各國的共同電子儲存系統(Deposit System for Electronic Publications, DSEP),並且確保電子出版品能為現在與未來所用。其中最重要的貢獻就是各個圖書館都能獨立的使用此系統達到共同寄存與使用的目的(NEDLIB,2000)。
為了求得寄存的共識,此計畫的相關機構在討論時,必須以同樣的標準來界定電子出版品與工作流程。有鑒於OAIS在數位典藏的應用上能帶來標準化的基礎,因此決議採用OAIS之參考模型,並以之為基礎發展出共同的寄存圖書館處理模式與資料模式。
圖4為NEDLIB網站所展示的流程圖與數位資訊生命週期的關聯性,由圖中可看出,為了使OAIS的理念能夠具體化實作,DSEP的工作流程在符合OAIS六大實體之外,還另外新增了此兩個功能實體:電子出版品必須先經過收送實體 (Delivery and Capture) 的審核才能進入OAIS實體,而使用者要取得資訊時,必須透過包裝與傳送實體 (Packaging and Delivery)。
若將其流程圖與數位資訊生命週期作比對,收送實體與擷取實體的配合屬於資料創造,資料儲存實體為資料保存,資料管理實體為資料管理,最後的取用實體與包裝傳送實體為資料供應的部份。
圖3 AHDS數位典藏流程圖與數位資訊生命週期
圖4 DSEP電子出版品寄存工作流程與數位資訊生命週期
4.4加強保存計畫與行政管理
從上述對國外數位典藏工作流程的討論中可見,其在製作工作流程時,會將保存計畫與行政管理實體規劃在內,而且視為必要性的存在,使工作流程除了能標示典藏步驟外,還能加強保存計畫政策與行政管理監督在整體數位典藏活動的關聯性,將外顯的典藏作業程序與內隱的管理工作,在同一工作流程圖內作結合,使數位典藏工作流程圖的表示更加完整,然而當工作流程圖表現的方式越完善,越能使工作人員瞭解典藏程序,減少不必要的步驟疏失,進而提昇數位典藏建制之品質。
若將數位資訊生命週期與數位典藏工作流程整合對應,可將保存計畫與行政管理視為對應整個數位資訊生命週期的策略與管理行為,可在週期中發揮策略規劃與監督管理的效果。
圖5 書畫數位化工作流程與數位資訊生命週期對應圖
4.5 國內數位典藏工作流程與數位資訊生命週期
數位典藏國家型科技計畫在2005年出版了一套數位典藏叢書:數位化工作流程參考標準,內容收集了國內參與數位典藏國家型計畫相關單位的工作經驗,透過系統化、規格化、標準化的方式,歸納撰寫各類典藏品的數位化參考作業程序,展現國內的數位典藏已經逐漸成熟,並邁入建立工作流程規範的階段。
在叢書內文中有提到:雖然各單位因管理方式不同,而有不相同的數位化工作流程,但基本上這些工作流程可歸納出前製作業、物件數位化程序、後設資料與資料庫建置等三個部分 (數位典藏國家型科技計畫內容分項,2005):
(1) 前置作業
了解典藏物狀況與數位化工作流程及方式的規劃。包括文物整理、數位檔案規格制訂、檔案命名、數位化方式選擇及工作人員安排。
(2) 物件數位化程序
在前置作業時,必須將數位化工作的作業規範制訂完成,且安排必要的工作人員後,即可施行文物的實體數位化作業。此程序包含數位化環境的準備、典藏品的提領與清潔、數位檔案的色彩校正、檔案儲存等作業。
(3) 後設資料與資料庫建置
此程序包含需求評估與內涵分析、後設資料制定、著錄規範、系統設計、資料儲存與備份等作業。
若將其歸納出的三部份工作流程與數位資訊生命週期來互相比對,可以看出整體流程吻合了資料創造、保存、管理與供應,也就是符合了數位資訊生命週期的概念,以下用圖文來做此部分的說明。
書畫主題的數位典藏作業是目前國內相對較多典藏機構所著墨的部份,如故宮、史博館等都有相關的典藏。圖5是國家型科技計畫內容分項發展小組由許多書畫典藏機構中所整理而得的流程,可説是書畫在做數位典藏時必要參考的流程圖,若把它與數位資訊生命週期作對應可得知:流程圖內的前置作業與數位化作業可對應到數位資訊生命週期中資料創造的部份;儲存與備份可對應到資料保存;資料庫建置的過程可對應到資料管理部份;檢索系統則可視為資料供應的部份。
由此看來書畫主題的工作流程參考符合了數位資訊生命週期的概念,不僅如此,在其他主題中,如線裝古籍、水下生態影片、考古等的工作流程圖,雖然各有執行的重點,但也同樣符合數位資訊生命週期的概念。
5. 結論
科技的進步,帶動了數位典藏的發展,此是國際間積極推動的數位內容基礎建設。然而國內的數位典藏近年已有豐碩的成果,在數位典藏國家型科技計畫的帶動下,各類典藏品的數位化工作流程逐步建立參考標準規範。
影響數位典藏品質與效率的原因眾多,而工作流程的標準化一直被視為品質與效率提升不可或缺的環節,尤其在數位典藏這種複雜的工作上更是如此。由於數位典藏的工作流程因各典藏品的屬性差異甚大,所以執行的步驟會有所不同。但是數位典藏處理的主要是數位資訊,故脫離不了數位資訊生命週期的範疇。除了本文所探討的案例外,目前國內外的數位典藏建置,仍不盡然依照數位資訊生命週期的發展作規劃,而有各自工作流程的體認。事實上,數位資訊生命週期所包含的資料創造、資料管理、資料保存到資料供應,都與實際數位典藏工作有所對應,故在建置數位典藏工作流程,甚至是標準作業程序(SOP)時,可使用數位資訊生命週期的概念,檢視工作流程的完整性。
由國際標準組織所發佈的OAIS,在國際間廣泛的被應用在數位典藏相關工作上,該模型不但符合數位資訊生命週期的概念,同時也擁有「保存計畫」與「行政管理」兩大實體來為典藏的資料做策略規劃與監督管理。故在建置數位典藏工作流程時,可參考該模型的概念與表達方式,以達到完整性的目的。然而數位化參考標準叢書已經為國內的數位典藏標準化奠定穩固的基石,繼續發展為數位典藏的標準作業程序,會更增進規範性。
致謝
感謝行政院國家科學委員會支持及補助本研究,計畫編號96-2815-C-128-010-H。
參考文獻
[1] 中央研究院(2007)。中央研究院電子計算中心網站之數位資訊生命週期圖。上網日期:96年7月10日。網址:http://www.sinica.edu.tw/~sclin/present/DLM07112001/slide6.html
[2] 英國藝術與人文科學資料服務(AHDS)網站。上網日期:96年6月1日。網址:www.ahds.ac.uk。
[3]黃如足、梅世杰(2003)。標準作業程序(SOP)於數位典藏建置之初探。上網日期:95年10月29日。網址:http://datf.iis.sinica.edu.tw/Papers/2003datfpapers/a/A-2.pdf
[4]數位典藏國家型科技計畫內容分項 (2005)。〈數位典藏叢書:數位化工作流程參考標準〉,數位典藏國家型科技計畫內容分項計畫。台北市:中央研究院。
[5]數位典藏國家型科技計畫(2007)。數位典藏國家型科技計畫總成果網站。上網日期:96年6月30日。網址:http://www.ndap.org.tw/
[6]陳昭珍(2001)。〈電子資源的長久保存〉。《佛教圖書館館訊》第25/26期:頁36-44。
[7] 蔡順慈、林昱伍(2006)。〈數位典藏工作流程與作業規範之探討〉。《中華傳播學刊》,(10),267-316。
[8] 鄭邦彥、楊美莉(2004)。標準作業程序於器物數位化流程之應用─以故宮器物數位典藏子計畫為例。上網日期:95年11月8日。網址:http://www.npm.gov.tw/da/ch-htm/pdf/tech/tech-2.pdf
[9] 嚴漢偉(2007)。中央研究院數位典藏簡介-嚴漢偉。上網日期:96年7月17日。網址:http://www.ascc.sinica.edu.tw/nl/89/1625/02.txt
[10] AHDS(2001). A Strategic Policy Framework for Creating and Preserving Digital Collections。 Retrieved July 1, 2007 from the Word Wide Web: http://ahds.ac.uk/strategic.pdf。
[11] AHDS(2007). AHDS OAIS Mapping. Retrieved June 10, 2007 from the Word Wide Web: http://www.dcc.ac.uk/docs/ahds-low-res.pdf
[12] International Organization for Standardization (ISO) (2003). Reference Model for an Open Archival Information System (OAIS). ISO:14721:2003
[13] Hodge(2000). Best Practices for Digital Archiving─An Information Life Cycle Approach. Retrieved July 9, 2007 from the Word Wide Web: http://www.dlib.org/dlib/january00/01hodge.html
[14] Kelly Russell(1999). Digital Preservation: Ensuring Access to Digital Materials Into the Future. Retrieved July 3, 2007 from the Word Wide Web: http://www.leeds.ac.uk/cedars/Chapter.htm.
[15] Networked European Deposit Library(2000). Applying the OAIS Reference model to the Deposit System for Electronic Publications(DSEP). Retrieved May 10, 2007 from the Word Wide Web: http://nedlib.kb.nl/results/OAISreviewbyNEDLIB.html.
[16] Sawye (2002). The Open Archival Information System (OAIS) Reference Model and its Usage. Retrieved December 19 , 2006 from the Word Wide Web: www.aiaa.org/Spaceops2002Archive/papers/SpaceOps02-P-T5-39.pdf