數位化工作流程整合性工作流程指南
Tags: oais, 品質管理, 後設資料, 拍攝, 掃描, 整合, 數位化工作流程指南, 永久保存, 系統建置, 規格, 錄影, 錄音 發表: 2010-09-17, 點閱: 48,213 , 加入收藏櫃 , 列印 , 轉寄
肆、 數位典藏整合性工作流程
一、 數位典藏整合性工作流程
數位典藏與數位學習國家型科技計畫依參與計畫的藏品性質,有各個不同物件的數位化工作流程。在上一個章節有關「數位典藏的工作流程探討」的說明,我們試圖歸納出數位化工作流程的主要步驟、程序,並繪製出一個整合性、共通性的工作流程圖(圖4-2)。以下將以此流程圖為輔,加以說明整合性工作流程中的幾個主要的步驟、流程內容。
(一) 整合性工作流程的主要步驟
依據上一章節的分析歸納,可以發現數位化工作流程有幾個主要的步驟程序,如圖4-1。主要的步驟有四:前置作業、數位化工作、資料保存以及加值運用等層面。
圖4-1、數位化工作流程概念圖
拓展台灣數位典藏計畫繪製
依循上面的數位化工作流程概念圖延伸,綜合各個不同物件類型的工作流程,可繪製成下圖更為詳細的「數位化工作流程圖」(圖4-2)。
圖4-2、數位化工作流程圖
拓展台灣數位典藏計畫繪製
由上列圖表的顯示,可以簡要說明目前數位典藏整合性工作流程的主要步驟如下:
1. 前置作業:
主要的工作項目包括從資料的清查、清冊整理製作,至選定欲數位化的物件(必要時還得進行物件的修復)。同時間進行後設資料需求的評估與分析,研擬後設資料功能的主要需求,並針對後設資料欄位做調整,訂定著錄規範等前置作業。
2. 數位化工作:
此階段程序是目前計畫的執行重點工作,除了進行實體物件數位化(包含掃描、拍攝、影音錄製與轉檔等)外,還有資料著錄與系統建置開發。無論是哪一階段步驟,「檢視品質」也是流程程序中重要的工作之一,包含檢視數位化的品質、檢視數位化後製的品質,校對著錄的後設資料以及資料庫與檢索系統的測試修改等,都需不斷地進行檢視與修正,這些都是工作流程中品質確保的重要一環。
3. 資料保存:
資料保存是目前數位化工作所需面臨的長久性策略工作,其主要的基本程序包括了數位檔的儲存(各媒材不同的儲存形式、原始檔案的儲存、數位化的成果儲存),以及複製備份、異地備援機制,和所有數位檔和後設資料轉入資料庫的儲存工作等。此階段的工作也將在後面的章節繼續加以討論,如何面對數位化資料的永久保存。
4. 加值運用:
數位典藏工作從一開始的資料建置完成後的檢索系統上線分享外,現在也需加以思考這些寶貴的數位資料如何加值運用,能達到永續經營,讓更多大眾所知道、利用。加值運用的範圍亦脫離不了下列諸項:系統開放檢索、網站服務、授權應用與創新服務等。不僅是學術教育方面、商業加值的運用,甚至公共社會的各種服務型態,都是此階段的重要任務。
此四大步驟工作流程中,還包含著更多細部的流程程序,每一環節都相輔相成,緊密連繫,若其中有一步驟出現狀況,都應再次檢視修改,這樣才能有效掌控流程運作,力求成果品質的提昇。
(二)整合性工作流程與OAIS的關係
整合性工作流程大致可分為前置作業、數位化工作、資料保存、加值運用幾個主要步驟,其流程也都符合數位資訊生命週期的概念。相較於國外的數位典藏工作流程系統的發展,在此以符合國際標準組織(ISO)的開放式典藏資訊系統(Open Archival Information System,OAIS)為例,討論兩者在數位化工作流程的關係。
1. OAIS(Open Archival Information System)
美國國家太空總署執行數位典藏已行之多年,其所屬的太空資訊系統諮詢委員會(Consultative Committee for Space Data Systems,CCSDS)支援國際標準組織(International Organization for Standardization,ISO),在2003年發佈了開放式典藏資訊系統(Open Archival Information System,OAIS)。其內容是建議長期保存為主的模式,由人員和系統所組織成的工作流程模式。該系統模型主要涵蓋了六大功能:擷取(Ingesting)、檔案儲存(Archive Storage)、資料管理(Data Management)、取用(Access)、行政管理(Administration),以及保存計畫(Preservation Planning)等要素。並表示數位典藏上、中、下游,資料產生者、管理者和使用者的關係,依據不同的保存時期,將會在過程中出現以下三種資訊封包,分別為:提交資訊封包(Submission Information Package,SIP)、檔案資訊封包(Archival Information Package,AIP)、傳佈資訊封包(Dissemination Information Package,DIP)。
此系統原先是為了儲存太空資料所設計,近年來已經廣泛被使用於更多類型的資料系統。OAIS的環境模型如下圖所示:
圖4-3、OAIS的環境模型[16]
OAIS是針對數位典藏庫的功能與需求,並根據標準提供系統間後設資料與共通性的架構,提供一個概念性的框架,定義一個檔案系統存在的環境、檔案系統的功能組織以及支持檔案處理的信息基礎結構,並完成數位典藏的長久保存與維護。其主要的六大功能為:
(1) 擷取(Ingest)
此功能主要是負責接收生產者的提交資訊封包(Submission Information Package,SIP)。也就是說典藏品在數位圖文建立前,就必須進行相關傳送規則標準,如資料格式、類型、形式、傳送方式、實體文件、內部業務等,並將處理完的封包轉換成檔案資訊封包(Archival Information Package, AIP)格式,且符合規劃時的檔案標準,再傳至資料管理和檔案儲存兩者。但有些資訊在生產端無法提供的,或有些資訊需隨內容改變有所更新。
(2) 檔案儲存(Archive Storage)
接收數位圖文建立產生的AIP並永久儲存。在儲存當中需符合儲存的需求(如典藏級、瀏覽級等),且隨時更新儲存媒體,定期做確認資訊,提供傳輸、偵錯等相關工作,再以AIP方式傳送。
(3) 資料管理(Data Management)
主要是管理典藏品的後設資料,提供維護和取用的服務,包括管理檔案資料庫,維護檔案結構、完整性和資料庫更新等。系統資訊則用於支援典藏機構的運作,資料依結果輸出描述資訊給資料存取封包。
(4) 取用(Access)
此階段功能以輔助使用者取得資訊,將使用者要求的資訊轉換成傳佈資訊封包(Dissemination Information Package,DIP),讓使用者檢索、取得回應,提供應用。
(5) 行政管理(Administration)
此階段主要是負責整體的典藏系統運作之管理。其中包含與生產者徵集和協議,從規格建議和保存規劃,並維護典藏計畫的軟硬體結構,接收資料管理、檔案儲存功能各種運作統計資料等。整體功用就是在制訂典藏計畫的規則與維持整個系統運作管理,以監督作業的品質。
(6) 保存計畫(Preservation Planning)
保存計畫主要是發展長久典藏的政策,確保使用者可以取用OAIS資訊。因此針對資料長久儲存、檢索提供意見,並調查使用者族群、更新資訊技術、資訊標準等,必須做長久性的保存規劃。
OAIS的流程即是藉由人員和系統的配合,完成數位典藏的長久保存與維護。其中的主要角色又可分別為生產者、管理者和使用者。生產者扮演的是提供保存資訊或者是客戶系統;管理者則由規劃設置OAIS整體政策的人組成,定期評估其政策和運作;使用者則是與OAIS服務交互以獲得這些資訊的角色。整個使用規範依照行政管理階段實體指示,保存策略和技術研發則由保存計畫制訂,並由行政管理來實踐。
2. 整合性工作流程與OAIS的關係
數位典藏整合性工作流程可以透過數位資訊生命週期為基礎來對應數位典藏工作的步驟,以檢視數位典藏工作流程的完整性。主要的步驟:前置作業、數位化工作、資料保存以及加值運用等層面,也皆能符合數位資訊生命週期。但是數位典藏國家型科技計畫的工作流程和OAIS系統仍有些許相異之處。如表4-1「各國OAIS使用表比較」所示,目前的整合性工作流程計畫和OAIS相同之處在於,皆考量藏品的交換性,以國際標準格式作為交換之用。相異處乃是目前國家型科技計畫因執行多年,已根據不少工作經驗研擬了數位化工作手冊,供各計畫參考。
此外,OAIS在其工作流程中已將保存計畫和行政管理實體規劃在內,這和整合性工作流程一樣,也針對資料保存有所規劃,是提昇數位典藏建置品質的必要工作。然而,在進行數位資訊資源之長久保存時,OAIS模式確實是一項可以依循的指標。尤其是整合性工作流程的「加值運用」階段,除了檢索服務系統外,也將藏品加值運用層面納入,以增進數位典藏的效益。
表4-1、各國OAIS使用比較[17]
主要計畫 |
與 OAIS 共同性 |
與 OAIS 差異性 |
|
機構或計畫名稱 |
規劃觀點 |
||
數位典藏國家型科技計畫 |
後設資料需求設計,相關單位的工作經驗,做為參考與改進 |
考量典藏品的交換性,以國際標準格式做為交換之用 |
以工作經驗研擬的數位化工作手冊,供各主題參考 |
國家文化資料庫 |
整合型典藏資料庫,訂定共同性後設資料欄位供各單位填寫 |
考量典藏品的交換性格式,建立文建會各主題的格式規範 |
將數位化檔案與後設資料提供至文建會建立共同的查詢平台 |
美國國會圖書館 |
數位典藏不需要符合所列舉的所有步驟,大多數工作流程被並聯執行 |
著重於行政管理與保存規劃,提供交換性檔案的確認,以供交換使用 |
考量文物數位化加值應用 |
加拿大文化資產資訊網 |
全盤性的典藏規劃建議,包括短期、長期規劃重點 |
提供交換性檔案的確認,以供交換使用 |
考量文物數位化工作 ( 攝影、掃描 ) 的相關參考 |
英國人文藝術科學資料服務 |
以 OAIS 架構規劃工作流程,考慮工作流程間角色責任的分派 |
以 OAIS 的相關元件作為工作流程規劃要點 |
強調工作流程中的角色任務,與資訊系統的配合。 |
歐洲委員會論壇 |
著重資料的儲存、傳送、內容定義 |
考量整體性的長期保存規劃 |
只強調數位檔案儲存與描述的概念 |
澳洲國家圖書館 |
以典藏目的與意義闡述步驟 |
提供交換性檔案的確認,以供交換使用 |
行政管理與保存規劃的評估,不強調如何製作資訊系統 |
二、 原生與非原生數位典藏工作之異同[18]
數位化工作流程的起始重點就是須選定欲數位化的物件,其中又分為原生與非原生的數位物件。
(一) 原生與非原生的數位物件
數位物件(Digital Objects)一般被視為是數位資料(Digital Materials)的主體,舉凡數位出版品和數位文件(Digital Records);原生數位化(Born-Digital)和數位化資料都算是,也就是一般所謂的數位典藏品。[19]
數位典藏品有些是原生的,也就是資料建立的初始階段即為數位媒體,有些則是已典藏有數位化格式的物件。
就典藏資料種類而言,數位典藏保存的資料範圍相當廣泛,凡代表人類文明,具有保存價值的資料,不論資料產生的時間和形式,舉凡文化、科學、藝術、音樂、動植物等,都是數位典藏的範圍就數位化資料的格式而言,只要是典藏範圍內之標的物(如文件、器物、標本、錄音、影片、建築等)數位化後的電子格式如:文字、語音、影像、2D/3D物件等,均屬於數位典藏之資料格式範疇。數位物件是原生物件的替代品,或本身就是原生數位物件。數位物件表達除了該資料本身外,通常還包括該資料相關之屬性,如其結構、檔案格式與大小、出處等資料。[20]
「原生數位」之資料,即一開始就以數位形式產生的資料,這些資料相當地龐大,可有多種形式呈現。[21]在資訊科技的時代,由於數位資訊的特性,易於傳播、複製、以及不易失真,故「原生數位」資源已是相當普遍的資訊形式。而原來就是數位資料,像影音資料、電子公文、電子格式的各種資料等,均為「原生數位」物件。
與「原生」相對的就是「非原生」,透過數位化典藏技術而改變成數位化格式的物件,也就是典藏範圍內之標的物本體(如文件、器物、標本、錄音、影片、建築等)以類比形式建立相關檔案。
(二) 原生與非原生物件數位典藏工作之異同
「原生數位」物件,本身就是數位資料,在進行數位典藏的工作時,可以省略掉一些工作的步驟,例如文物選件、修復的程序、以及進行實體數位化的程序。例如:電子公文,以工作流程的四大階段來看─1.前置作業:規劃挑選哪些部分要進行整理、製作清冊、進行後設資料需求評估分析;2.數位化工作階段:公文本身就是數位檔案,所以實體數位化的程序可省略,直接檢視公文本身的數位化品質、並直接進行數位化後製、數位檔儲存、資料著錄、系統開發建置;3.資料保存階段:數位檔儲存(各媒材儲存)、異地備援、轉入資料庫;4.加值運用:系統開放檢索、加值應用。
以電子設備產生的影音物件,如訪談錄音檔為例,1.前置作業:主要工作包括規劃挑選哪些部分要進行整理、建立清單、聯繫資料創作者、簽訂授權書,並同步進行後設資料需求評估分析;2.數位化工作階段:檢視數位化品質、數位化後製(包括轉檔、剪輯)、數位檔儲存、資料搜尋著錄、系統開發建置;3.資料保存階段:包括燒錄備份、檢查、歸檔、並將資料上傳至資料庫;4.加值運用:包括檢索系統開放與應用。
「原生數位」物件的工作流程,整理如下表4-1、「原生數位」物件的工作流程彙整表:
表4-2、「原生數位」物件的工作流程彙整表
前置作業 |
數位化工作 |
資料保存 |
加值運用 |
|
原生 |
1. 選定數位化物件 2. 製作數位物件清冊 3. 後設資料需求評估分析 |
1. 檢視數位化品質 2. 數位化後製 3. 數位檔儲存 4. 資料著錄 5. 系統開發建置 |
1. 數位檔儲存(各媒材儲存) 2. 異地備援 3. 轉入資料庫 |
1. 系統開放檢索 2. 加值應用 |
資料來源:拓展台灣數位典藏計畫彙整
「非原生數位」物件,本身並非數位資料,在施行數位典藏的工作時,必須先進行文物選件、文物修復清理的程序,並將其轉換為數位化資訊,也就是要進行實體數位化這個程序。以早期「文書檔案」為例,1.前置作業:也就是實體整理階段,主要工作包括原件掃灰、原件檢視、裱褙、文書檔案編整進行、數位化方案選擇、工作規劃、後設資料需求評估分析;2.數位化工作階段:建立色彩管理模式、拍照或掃描成數位檔案的程序、數位影像後製、文書檔案後設資料建議欄位、資料庫建置、後設資料著錄;3.資料保存階段:數位影像備份及管理;4.加值運用:系統整合與開放使用。
以「照片」為例,1.前置作業:包括清點原件與工作規劃、決定數位檔規格、數位化方式選擇、選件與核對清單、後設資料需求評估分析,2.數位化工作階段:包括設備色彩校正、掃描數位化作業、圖檔命名與校調、影像轉檔、資料著錄、系統開發建置;3.資料保存階段:包括打樣輸出、複製備份、異地備份、資料轉入資料庫;4.加值運用:系統管理與開放應用。
「非原生數位」物件的工作流程,整理如下表4-2、「非原生數位」物件的工作流程彙整表:
表4-3、「非原生數位」物件的工作流程彙整表
前置作業 |
數位化工作 |
資料保存 |
加值運用 |
|
非原生 |
1. 資料清查 2. 清冊整理製作 3. 提件 4. 後設資料需求評估分析 |
1. 進行實體數位化(掃描、拍攝、影音錄製與轉檔) 2. 資料校驗 3. 數位檔轉檔 4. 資料著錄 5. 系統開發建置 |
1. 數位檔儲存(各媒材儲存) 2. 異地備援 3. 轉入資料庫 |
1. 系統開放檢索 2. 加值應用 |
資料來源:拓展台灣數位典藏計畫彙整
原生與非原生數位典藏工作差異,主要在「資料創造」的部分。由於「原生數位」物件,本身就是數位資料,在資料創造時,只需檢視其品質,如果品質不良,則需重新調件,進行實體數位化,若品質檢驗合格,則可省略前置的一些步驟程序,像物件選件、清理修復、以及進行實體數位化(掃描、拍攝等)等程序。
以數位化工作流程圖來看,原生與非原生的差異請參考圖4-4、原生與非原生的工作流程之差異。
圖4-4、原生與非原生的工作流程之差異
拓展台灣數位典藏計畫繪製
三、 數位圖文及後設資料之規格選定
工作流程中前置作業數位物件的選定,有原生和非原生物件的流程差異外,其主要的數位圖文及後設資料規格選定,也是接下來流程中重要的步驟。以下將介紹目前國內外數位典藏計畫中,一些常用的參考標準。各典藏計畫可依循藏品所需選擇適合的規格使用。
(一) 圖像規格的選定
在數位檔案規格的規劃上,首先需瞭解數位檔案未來會有何種用途。以目前的典藏計畫來說,通常以永久保存、商業加值以及網路瀏覽為主。其中圖像數位規格又可分為文字資料和影像資料:
1. 文字資料
(1)原始資料為電子檔
若原始資料是以電腦打字的電子檔,儲存一份原始檔外,建議轉成HTML、PDF 或RTF 三種檔案格式。
(2)原始資料為印刷品或手稿
原始資料為手稿或印刷資料,如果要做全文檢索,則需重新打字或以OCR辨識軟體產生數位檔案,其餘處理方式同上;若不做全文檢索,則只須建立詮釋資料,並將原件掃描,並以不壓縮格式,儲存一份永久檔,再視須求轉成其他目的之格式,如網路下載格式及預覽格式。此三種格式之規格建議如下:
表4-4、文字資料檔案規格參考:
數位檔用途 |
永久保存 |
網路下載 |
預覽影像
|
說明 |
將資料數位化 典藏,保持原有風貌。 |
提供使用者網路 |
提供使用者預覽 |
檔案格式 |
TIFF(不壓縮) |
JPEG(壓縮) |
GIF(壓縮) |
色彩模式 |
RGB(24bit/piexl)以上 |
RGB(24bit/piexl)以上 |
RGB(8-bits piexl)以上 |
解析度及 尺寸 |
解析度: 300~600 或更高 dpi(依原始資料品質 |
150dpi~300 dpi 或影像大小從 |
72dpi 或影像大小從 |
資料來源:整理自[數位典藏國家型科技計畫技術彙編]與拓展臺灣數位典藏計畫
2. 影像資料
若原始資料為照片、圖片、地圖等,則需以掃描器掃成影像檔,並以不壓縮格式儲存一份永久檔,再視需求轉存成其他目的之格式。物件拍攝檔案規格有三種格式參考如下:
表4-5、影像檔案規格參考:
數位檔用途 |
永久保存 |
永久保存或出版 |
網路瀏覽 |
說明 |
將資料數位化典藏,保持原有風貌。 |
提供使用者作為重製、壓縮處理或其他圖像處理交換之用 |
提供使用者預覽 |
檔案格式 |
RAW |
TIFF |
JPEG |
色彩模式 |
RGB(24bit/piexl)以上 |
RGB(24bit/piexl)以上 |
RGB(24bit/pixel) |
解析度及 尺寸 |
原尺寸300dpi以上i |
原尺寸300dpi以上( 依原始資料品質及重要性選擇適當解析度,一般印刷品可採300dpi,美術品供複製畫使用建議採600dpi,供印刷出版使用採 350dpi ) |
72dpi,尺寸視網路呈現需求訂定(或影像大小從150×100 到 200 x 200 pixels |
資料來源:整理自[數位典藏國家型科技計畫技術彙編]與拓展臺灣數位典藏計畫
數位典藏用途中的「保存」與「分享」是數位化工作中重要的目的。以書畫數位化典藏品為例,未來應用於出版圖錄或複製化的機會相當高。因此這些數位檔案規格相對的標準必須提高,以確保數位檔案色彩的正確性與品質。以下再列舉出書畫方面的計畫單位之數位檔案規格為參考,表4-6「故宮書畫數位典藏子計畫數位攝影之影像檔規格」以及表4-7「華岡博物館數位攝影之影像檔規格」。實際執行時則以各計畫所需選擇適合本身的規格。
表4-6、故宮書畫數位攝影之影像檔規格
資料來源:高朗軒、陳秀華,《書畫數位化工作流程指南》,台北市:數位典藏拓展台灣數位典藏計畫,2009年4月。
表4-7、華岡博物館數位攝影之影像檔規格
|
複製畫級 |
典藏級 |
網頁級 |
預覽級 |
影像格式 |
TIFF |
TIFF |
JPEG |
JPEG |
色彩模式 |
RGB |
RGB |
RGB |
RGB |
影像模式 |
48bit、300-600dpi |
48bit、300dpi |
24bit、150dpi |
24bit、72dpi |
應用格式 |
不壓縮圖檔儲存,影像品質忠於原色 |
不壓縮圖檔儲存目的,以高品質儲存為原則 |
檔案不超過200KB,以1024×768為解析範圍 |
GIF索引色壓縮之檔案格式 |
檔案目的 |
印刷出版之用,以平面輸出為目的 |
原有資料的保存格式 |
網路應用與一般格式轉檔之應用 |
提供最快速預覽性低解析之圖檔 |
資料來源:高朗軒、陳秀華,《書畫數位化工作流程指南》,台北市:數位典藏拓展台灣數位典藏計畫,2009年4月。
(二) 影音規格的選定
影音數位化不同於文字資料,它在數位化時可以選擇多種規格,其規格標準又不斷地在進步與更新,加上不同格式之間常有不能互通的情形,因此必須考量數位化的目的與未來的應用,選擇適合的影音規格。此外,影音數位化後的儲存空間較大,儲存硬體的花費也相對提高,在有限經費下儲存規格的選定也是考量的重點之 一。
關於影音資料數位檔案規格的建議選定,主要還分為聲音資料數位檔規格與視訊資料數位檔規格兩類。
1.聲音資料
若原始資料為錄音帶、CD 或LP 等有聲資料媒體,則需將該媒體轉成數位檔案,並儲存一份不壓縮之永久檔,再視需要轉成其他目的之檔案,如下列兩表所建議:
表4-8、聲音檔案規格參考-1:
數位檔用途 |
永久保存檔 |
聲音串流檔 (網路瀏覽用) |
說明 |
將資料數位化典藏,保持原有風貌。提供使用者作為重 |
提供使用者線上聽取 |
建議檔案規格 |
檔案格式:WAVE( Microsoft 格式) /16~ 24 bit/sample |
檔案格式:WMA或Mp3 取樣率:44.1 kHz / 16bit/sample 聲道:立體音 頻寬:64Kbps-128 Kbps 檔案時間:聲音前端30秒至60秒間 或完整 |
資料來源:整理自文建會國家文化資料
表4-9、聲音檔案規格參考-2:
檔案目的 |
說明 |
建議檔案規格 |
資料永久保存格式 |
將資料數位化典藏,保持原有風貌。 |
檔案格式:WAVE (Microsoft 格式) |
串流(streaming) 寬頻格式 |
提供以寬頻方式上網之使用者線上聽取 |
檔案格式:MP3 |
檔案格式:RA 格式 |
||
串流(streaming) 窄頻格式 |
提供以窄頻方式上網之使用者線上聽取 |
檔案格式:MP3 |
檔案格式:RA 格式 |
資料來源:數位典藏國家型科技計畫技術彙編
http://www2.ndap.org.tw/eBook/showContent.php?PK=157
2.視訊資料
若原始資料為錄影帶,則需以視訊擷取軟體將之轉為數位視訊檔,並存成下列檔案格式。主要參考規格有:
表4-10、視訊檔案規格參考-1:
數位檔用途 |
永久保存檔 |
視訊串流檔(網路瀏覽用) |
說明 |
將資料數位化典藏,保持原有風貌,此為DVD 的品 |
提供使用者線上觀看 |
建議檔案規格 |
檔案格式:MPEG4以上影像大小:1920*1080像素以上 音效解碼為立體雙聲道 資料傳輸率:8Mb/sec |
檔案格式:WMV 影像大小:320*240像素 資料傳輸率:150-300kbps 檔案時間:1-5分鐘或完整(具有代表性或主題畫面呈現) |
資料來源:整理自「文建會國家文化資料」與「拓展台灣數位典藏計畫─影音主題工作組數位化製作規格」
表4-11、視訊檔案規格參考-2:
檔案目的 |
說明 |
建議檔案規格 |
資料永久保存格式(1) |
將資料數位化典藏,保持原有風貌,此為VCD 的品質 |
檔案格式:mpg |
資料永久保存格式(2) |
將資料數位化典藏,保持原有風貌,此為DVD 的品質,檔案大小為格式(1)的3~100 倍,適合需高解析保存物件 |
檔案格式:mpg2 |
串流(streaming) 寬頻格式 |
提供以寬頻方式上網之使用者線上觀看 |
檔案格式:mpg4 |
檔案格式:RM |
||
檔案格式:ASF |
||
串流(Streaming) 窄頻格式 |
提供以窄頻方式上網之使用者線上觀看 |
檔案格式:mpg4 |
檔案格式:RM |
||
檔案格式:ASF |
資料來源:數位典藏國家型科技計畫技術彙編http://www2.ndap.org.tw/eBook/showContent.php?PK=157
每一單位依據本身藏品所使用的目的與儲存方式,決定選用的規格標準。下列表格是「台灣社會人文影音資料庫」計畫所選定的規格,其數位檔案依不同的用途有不同的選用標準。然而資訊科技的發展汰換速度之快,技術的更新與儲存的工作將是不容怠忽的問題。
表4-12、「台灣社會人文影音資料庫」規格選定參考
資料來源:拓展台灣數位典藏計畫「語言影音與新聞主題」小組
(三)後設資料規格的選定
在數位化工作流程的前置作業中,另一項重要的基礎資訊工作即是「後設資料需求評估與分析」。因數位化工作依照典藏品類型的不同,所採用的後設資料標準也有所異同,後設資料規格的選定也是如何將藏品內涵忠實呈現給使用者的重要描述資料標準。
後設資料不僅對使用者了解數位資源有所助益,對於擁有者和管理者而言,可以更有系統地管理、統計數位資源,也能建立資料保存、檢索等數位資源運用機制。另一層面而言,後設資料標準有了一致性的準則,支援互通性的描述資料後,典藏品才能具備一致性、結構性、全面性的描述,對於未來數位資源的共享與互通,跨單位或與國際接軌,資料才具有交換性的運用空間。
1. 後設資料的類型
後設資料是一組結構化和標準化的背景資料,包括管理性、結構性與描述性等三大類型,以及語義性、語法性和詞彙性三大屬性。現今各類型文獻所提及的後設資料,多指用於資料描述的後設資料紀錄,所謂的描述性資料,就是針對典藏品或特定物件所紀錄的相關描述,亦即描述一個文件或資源的內涵與關聯性,以便索引、發現與識別資源。
描述性後設資料依據其利用的範圍,可分為一般性與特定性兩個方面。一般性後設資料標準的特點在於:簡單、具延展性、跨學科、跨資料類型,以都柏林核心集(Dublin Core)為最典型的例子,強調支援數位典藏品的資源探索(Resource Discovery)。其擁有15個基本元素的後設資料欄位,已成為國際間廣泛使用的標準,也是目前國內數位典藏聯合目錄於成果匯入時所採用的規範。而特定性的後設資料標準特點在於:深入描述學科或領域的精髓架構,著重於特定領域的共同需求和著錄標準,發展出特定的後設資料格式。例如,達爾文核心集(Darwin Core),即為生物領域所採用的後設資料標準,共含有50個描述生物的數位化物件資料元素。
以下將以國際間常用的描述性後設資料標準為例,簡介目前數位典藏計畫選定後設資料規格的依據。
2. 國際間常用的後設資料標準
(1) DC(Dublin Core)
Dublin Core(都柏林核心集,以下簡稱DC)是1995年由國際圖書館電腦中心(Online Computer Library Center,簡稱OCLC)和National Center for Supercomputing Applications(NCSA)所聯合贊助的研討會,參與成員包括來自圖書館、電腦、網路及其他專業領域的學者和專家,目的是希望建立一套具有國際共識的元素集,以用來描述網路上電子文件,進一步協助資訊檢索。目前於國際間已被專業領域廣泛使用,如圖書館界、博物館界、政府單位和商業組織等都以DC為基礎發展出更複雜的框架。
DC最大的特色就是建立了一組跨領域,具有國際一致性的元素集(Element Set)。DC為「一般性」參考規範,設有15個欄位,強調支援數位典藏品的資源探索。其元素有以下五個特點:[22]
A. 每個元素皆為選擇性(可以採用或不採用),及皆為可重複著錄。
B. 每個元素可以任何排序呈現。
C. 建議一些元素的內容著錄規則,但並非必備。
D. 每個元素的內容著錄規則由個別建置單位訂定。
E. 鼓勵採用所屬特定領域的應用檔案,並遵守這些應用檔案規範的資料內容與資料值之規範或標準。目前國內的「數位典藏與數位學習國家型科技計畫」所規劃建置的「數位典藏聯合目錄」,以單一平台進行檢索及查詢功能,其平台即是採用Dublin Core標準,所使用的核心欄位結構如下:
‧標題(Title):給予資源的名稱
‧著作者(Creator):編輯資源內容的主要負責人
‧主題/關鍵字(Subject & Keywords):資源內容的標題
‧描述(Description):資源內容的解釋
‧出版者(Publisher):使資源能廣泛的使用者
‧貢獻者(Contributor):對於資源內容形成貢獻者
‧日期(Date):資源週期的事件日期
‧資料類型(Resource Type):資源內容的性質或類型
‧格式(Format):關於資源的實際或是數位的形式
‧資料識別(Resource Identifier):可以明確的指示出該資源
‧來源(Source):敘述目前資源的參考來源
‧語言(Language):資源所使用的語言
‧關連(Relation):說明相關的資源
‧範圍(Coverage):資源內容的廣度或範圍
‧管理權(Rights Management):描述資源權利相關的資訊
(2) CDWA
Categories for the Description of Works of Art (CDWA)是由隸屬於Gatty組織的Art Information Task Force(AITF)所發展之標準,旨在發展一套資訊結構,描述並存取美術品、雕刻、陶藝、建築、有形文化、相關的藝術收藏品與團體,及其藝術影像資料庫目錄項目。其欄位設計以滿足藝術史研究者的需求為目標,CDWA包含了381種目錄與子目錄的討論、基本著錄準則以及範例,而用來描述及辨識一個典藏品所需的基本目錄集稱為核心(Core)。CDWA Lite 是一份XML模組,基於CDWA與CCO(Cataloguing Cultural Objects)兩份標準,用以描述藝術作品與文化物件的核心紀錄。
參考網站:
http://www.getty.edu/research/conducting_research/standards/cdwa/
(3) EAD
EAD(Encoded Archival Description),是一種檔案描述格式,此一標準發展始於1993年美國加州柏克萊大學的「柏克萊檢索工具計畫」(Berkeley Finding Aid Project,BFAD),並於1998年經美國檔案學會(Society of American Archivists,簡稱SAA)共同參與研發通過成為標準。目前由美國國會圖書館所屬的「網路發展與MARC標準處」(Network Development and MARC Standards Office)與美國檔案人員學會(Society of American Archivists,簡稱SAA)共同維護。EAD是目前檔案界常使用的詮釋資料標準,其目的在協助檔案與手稿資料的數位化及檢索、呈現,是一個標準的機讀描述格式,促進網路上手稿、檔案資料的取得。
(4) VRA
VRA是由美國Visual Resources Association的資料標準委員會(Data Standards Committee)所制訂。該組織是一個影像多媒體資料管理交流協會,會員包括數位影像、電影、攝影、博物館、出版等方面的專業領域人員。此後設資料標準所包含的元素是作為促進作品與影像視覺藏品之間資訊共享之用。本項標準又可視為視覺資源的DC,資源包括作品和影像(Work and Image),同時採用DC的一對一原則,也就是一組後設資料只描述一個物件或作品;VRA類目內的元素順序可以任意排列,目前最新版本為VRA4.0。
參考網站:http://www.vraweb.org/projects/vracore4/
(5) Species 2000 Data Standard
Species 2000計畫是由國際生物科學聯盟(International Union of Biological Sciences)發起,於1994年9月成立,是跨國技術團隊共同維護與發展。Species 2000資料庫成立的動機是為建立一個包含全球主要生物的物種資料庫。其中每一個資料庫都依一致性的物種分類系統來紀錄各生物物種資料,串連全球性範圍的物種目錄,讓使用者可以利用物種的名稱,迅速搜尋到該物種完整的資料。
參考網站:http://www.sp2000.org/index.php
(6) DwC
達爾文核心集(Darwin Core)是由美國University of Kansas 的The Species Analyst project所發展,目的在描述生物自然歷史藏品和資料。DwC試圖在不考慮儲存內容機制的前提下,提供標本的共通性紀錄,以相對簡單的方式支援搜尋和描述訊息的擷取。目前最新版本為DwC V2.0,共擁有48個元素之後設資料定義。
參考網站:http://wiki.tdwg.org/twiki/bin/view/DarwinCore/WebHome
(7) CSDGM
由美國聯邦地理資料委員會FGDC(The Federal Geographic Data Committee)訂定之描述空間數位資料目錄的標準格式CSDGM(Content Standards for Digital Geospatial Metaadata)提供了後設資料應用的基本架構,並於1994年6月發佈。其目的是為了建構國家空間資料基礎,描述GIS資料的內容、品質及供應方式,作為資料搜尋的基礎。
參考網站:http://metadata.teldap.tw/project/project-frame.html
表4-13、為國際常用後設資料規格:
Metadata 名稱 |
實例 |
簡介 |
CDWA |
書畫、拓片、簡牘、器物、建築、遺物、遺址 |
此標準旨在發展一套資訊結構,作為博物館與檔案學界描述藝術作品(如繪畫、雕刻、陶藝、建築、傢俱、表演藝術等)及其影像資料的標準。 |
EAD |
檔案、公文 |
EAD是一種結構化的檔案檢索工具(Finding Aids)標準,其發展目的是為了支援檔案和手稿的收集保存,提供一個永久編碼標準,可機讀處理各種單位(如檔案館、圖書館、博物館與手稿館)所產生的目錄、登錄簿、索引等查檢工具,以利檔案資源易於在網路上取得。 |
HISPID |
植物 |
HISPID 是一種以資料交換為目的的標準,所交換的資訊包括分類、術語、書目、標本模型、罕見及絕種植物保育等資訊,涵蓋了標本館與植物園領域的活動與議題,並依資訊的屬性歸類群組。此外也重視與資料庫結構的關聯性,以解決資料庫結構的差異性,減少資料交換作業的障礙。 |
LOM |
數位學習、學習資源 |
為定義學習物件後設資料的語法(Syntax)與語意(Semantics) 的標準。LOM 著重在學習物件管理、定位和評估所需的最少的屬性,提供九大項類目、基本的欄位和實體類型,供個別的資訊系統應用發展。 |
Marc |
善本古籍 |
機讀編目格式(MARC)應該說是圖書館界編目格式的大家族,而非單一標準。起源於 1965~6 美國國會圖書館發展一套標準化的資料記錄架構 (LC MARC),以利圖書館間書目資料的交換。之後各國紛紛採用,並以國情加以修訂,如 US MARC(美國)、UK MARC(英國)、CAN/MARC(加拿大) 、 AUS MARC(澳洲)。 |
SPECIES 2000 |
動物 |
Species 2000利用一組標準資料欄位來描述所有已知的物種。這些資料欄位是簡化自 Global Species Databases (GSD ,為一種包含全世界單一分類群之所有物種的資料庫) 而來,所以可相容多種不同的現有物種資料庫之資料欄位。利用此組標準資料欄位,使用者輸入物種名稱,即可取得來自特定物種資料庫所提供的物種資料。 |
VRA |
照片 |
此標準以視覺資源社群為焦點,提供指引以描述藝術品、建築物、器物,大眾或民族文物等視覺資源。為了便利於視覺資源社群間資訊的交流與分享,其設計原則著重元素(共17 項元素)簡單、彈性、可重覆應用,並提供元素資料值 (data value)建議標準,以利資料的一致性與正確性。 |
資料來源:數位典藏學習網:http://ic.shu.edu.tw/DA/DADL/dam_03_metadata.htm
3. 六大主題後設資料規格
以下將依目前數位典藏與數位學習國家型科技計畫項下的六大主題藏品特性組別,就其不同學門領域與技術所依循的後設資料標準列為下表:
表4-14、六大主題後設資料規格
六大主題 |
主題工作組類別 |
後設資料著錄標準 |
實例 |
生物與自然 |
動物 |
1. ABCD Schema (Access to Biological Collection Data Schema) 2. Da rwin Core (DwC) (Species Analyst 2001) 3. FGDC Biological Metadata Profile 4. UCMP (University of California Museum of Paleontology) Data Model (UCMP1994) 5. Species 2000 Standard Data |
中研院台灣動物相典藏之研究-魚類計畫是採用Species 2000 Standard Data作為 metadata 架構參考標準 |
植物 |
1. ABCD Schema (Access to Biological Collection Data Schema) 2. Da rwin Core (DwC) (Species Analyst 2001) 3. FGDC Biological Metadata Profile 4. FGDC Vegetation Classification and Information Standards 5. Plant Names in Botanical Databases (Bisby 1994) 6. UCMP (University of California Museum of Paleontology) Data Model (UCMP1994) |
|
|
地質 |
古生物化石相關標準 : 2.The Paleobiology Database 礦物相關標準: |
|
|
生活與文化 |
人類學 |
1. CDWA (The Categories for the Description of Works of Art) |
|
考古 |
1. CDWA (The Categories for the Description of Works of Art) |
|
|
語言、影音與新聞 |
語言 |
1. OLAC Metadata standard |
|
影音 |
1. The ECHO Metadata Modeling Report WP3 (2000) (IST-1999-11994) |
|
|
新聞 |
1. NewsML (News Markup Language) |
|
|
藝術與圖像 |
器物 |
1. CDWA (The Categories for the Description of Works of Art) |
|
書畫 |
1. CDWA (The Categories for the Description of Works of Art ) 2. VRA(Core Categories for Visual Resources ) 3. REACH (for Shared Description of Museum Objects) 4. SPECTRUM (The UK Museum Documentation Standard) 5. CIDOC (The International Committee for Documentation) |
華岡博物館採用CDWA作為metadata架構參考標準
|
|
地圖與建築 |
地圖與遙測影像[23] |
1. CSDGM(Content Standards for Digital Geospatial Metadata) 2. ISO TC211 地理資訊及空間資訊學相關標準 3. CEN TC287: Geographic Information - Data description - Metadata. Draft V2 - for 2nd informal vote by WG 2, January 1996. 4. CERCO/MEGRIN: GDDD - Geographical Data Description Directory 5. IHO: S57, version 3. 6. ISO / TC 211: ISO 19115:2003 Geographic information–Metadata, 2003-05-08 ,140pages. 7. NATO DGIWG/DIGEST: N469 Geographic Information – Data description - Metadata. 8. 中華民國:國土資訊系統 (NGIS) 相關規範 |
|
建築 |
1. CDWA (The Categories for the Description of Works of Art ) |
|
|
文獻與檔案 |
檔案 |
1. EAD (Encoding Archival Description) 2. BAC( Business Acceptable Communications ) Metadata 3. National Archives of Australia Recordkeeping Metadata Standard 4. SPIRT RKMS, Australian Recordkeeping Metadata Schema 5. ISAD (G) General International Standard Archival Description 6. ISAAR (CF)International Standard Archival Authority Record for Corporate Bodies, Persons and Families 7. MARC 21 |
採用 EAD 格式作為 metadata 架構參考標準: 1. 中研院近史所外交檔案數位典藏計畫
|
善本古籍 |
1. MARC |
|
|
金石拓片 |
1. CDWA (The Categories for the Description of Works of Art) |
|
|
漢籍全文 |
1. TEI markup (Text Encoding Initiative) |
|
資料來源:數位典藏技術彙編2006年版
四、 數位圖文及後設資料之應用系統
在選定數位化工作的數位物件相關規格外,如何讓數位典藏系統有效的運作,其中的系統建置與開發是必須結合更多資訊科技的技術人員與內容專家才能發揮事半功倍的效果。結合數位圖文與後設資料應用系統的建置,是工作流程裡自始至終都要緊密考量的規劃。以下簡要說明幾個重要的系統規劃流程要點:
(一) 系統建置評估
數位典藏系統建置,除了系統方面的考量外,也必須一同將後設資料的規劃設計納入。因此要建置一個數位典藏系統,得經過系統規劃、後設資料分析、系統分析設計與系統開發等不同工作程序。[24]
1. 系統規劃:
由典藏單位針對本身的典藏需求,盡可能從各方面進行通盤的規劃考量。規劃出合適的系統規格、功能說明,並做出初步的評估,產出系統規格書。
2. 後設資料分析:
進行數位化工作的典藏單位可尋求後設資料專家討論,充分了解典藏資料適用的後設資料標準規格,擬訂功能需求,隨時調整資料欄位,並訂定著錄規範讓典藏單位、後設資料專家與系統開發人員三方能有效進行工作溝通。
3. 系統分析與設計:
系統開發人員與典藏單位進一步溝通分析使用者的系統功能需求,再針對資料庫與檢索系統等進行設計。以及為確保每一個程序的正確性,系統需求規格書和設計規格書即是掌握流程的要點之一。
4. 系統開發:
經過專業的技術與知識訓練的系統開發人員,依照系統分析書的規格,開發利用各項系統功能(如資料管理、資料搜尋、全文檢索、資料庫查詢、瀏覽等相關技術),並整合所有數位圖文及後設資料,以建立一套完整的數位典藏系統。
(二) 系統開發與建置
延續前面的縝密規劃分析後,系統開發人員就是將典藏單位的系統需求轉換為技術規格。且必須考量典藏單位的實際使用情境,根據系統需求設計出適合的系統架構和功能。其中主要的有兩大方向:資料庫與檢索系統的設計。不同單位也依據本身的作業與管理需做不同的功能需求調整,以下為系統在開發建置的過程中,常用的幾項功能設計:[25]
1. 庫房管理功能:整合實體典藏品的管理與數位資料的管理。
2. 系統安全機制:除了系統防護、系統復原外,也包含了資料的備份、異地備援等機制。
3. 數位權利管理機制:資料加密、權利描述、拷貝偵測與追蹤等。
4. 系統擴充性及負載平衡機制:確保系統服務品質,預估同一時間內系統的最多使用人數與最大的資料量。
5. 典藏資料交換的功能:建立資料互通機制,分享研究成果。
在每一個建置的過程步驟中,也都必須隨時配合資料的補充與修正,並不斷測試與修改,才能將資料輸入並建置完整的資料庫與檢索系統,以利後續的加值應用。
(三) 應用服務與創新加值
數位典藏系統除了典藏具有保存意義價值的數位資源外,依各個不同族群的使用需求,這些典藏資料也應用於展示、研究及教育等諸多的功能面向,如數位圖書館、公共展示系統、數位博物館等數位典藏應用系統。[26]
1. 數位圖書館:為提供典藏之數位化資料予使用者,以進行研究及教育活動。例如:數位典藏聯合目錄,彙整了各典藏單位之成果,建置單一資訊瀏覽檢索平台系統。
2. 公共展示系統:將典藏成果引介給社會大眾,展示方面,介面朝直覺、趣味、簡單、互動等特點。例如:「數位典藏與數位學習成果入口網」,將專業精深的典藏成果重新包裝,以介紹給一般社會大眾。
3. 數位博物館:結合數位圖書館與公共展示系統的特色,將博物館功能延伸到數位化世界。例如:故宮博物院全球資訊網(http://www.npm.gov.tw/),將實體博物館在數位化世界加以延伸,提供資料檢索、互動資訊等,滿足一般大眾教育、研究等需求。
數位典藏應用服務系統除了上述的三個主要功能面向,在加值應用層面上,簡要的說有以下可利用典藏資源發揮創新的空間。例如,檢索系統的提供、網站服務、授權應用以及創新服務。檢索系統的提供與網站服務,大致已由數位圖書館、數位博物館、公共展示系統等層面發揮應用。授權應用與創新服務,也因數位資源的意義價值附加,除了以往的學術界、教育領域外,延伸至商業等創新的領域。因此數位資料的保存與數位資源的授權機制也是目前典藏單位都應建立的一套資源管理系統。以下章節也將針對如何管理數位化資料及數位化資源永久保存的重要課題做簡要的論述。
五、數位典藏的永久保存
數位典藏國家型科技計畫參與機構及計畫眾多,這幾年計畫執行累積出來之數位典藏內容成果相當豐厚,還有過去計畫之執行經驗,培育出來之數位典藏人才資源,以及開發完成之網路平台技術和相關應用軟體資源等,由國家數位典藏政策的長遠角度出發,這些資源均為資訊社會時代的重要公共資產(Commons),也是國家推動資訊社會發展、解決數位落差的關鍵基礎。以致於數位典藏國家型科技計畫這幾年努力推動達成典藏成果永續保存與經營,為數位化資料的長期保存,提供一致化的使用界面,並規劃研發可不隨時間、技術、軟體硬體設備、儲存媒體等演進而變動的永久保存方式。
數位典藏在使用上的便利性、可檢索性、儲存空間小等,雖具極大優勢,然而,所引發的其他問題也不少。尤其是在大量資料數位化/電子化或原生數位資料不斷產生後,其所面臨的資訊安全、保存與典藏等的問題與傳統紙本印刷上的問題是截然不同。數位資訊是十分容易被破壞,因此,數位資訊須要更進一步的研究、評估與計劃。[27]
在評估與規劃永久保存工作時,可針對以下三個部分作考量:
1. 儲存媒體的部分:儲存媒體缺乏耐久性、且退化快速,若不小心操作易造成傷害。
2. 儲存技術的部分:資訊技術推陳出新快,儲存技術容易過時,且數位資料必須依賴軟、硬體才能讀取、以及數位資訊的格式不同,也是需要考量的問題之一。
3. 數位資訊本身性質的部分:數位資訊由於便於傳播、複製,導致其真確性無法保證,且數位資訊在轉換、更新或操作的過程中容易毀壞和流失、數位資訊容易受到竄改或破壞。
Kranch認為數位資訊長期保存的方法有:保存原來技術、轉移至新技術、轉移至紙張或其他可瀏覽的媒上。[28]Muir的保存策略有:技術保存、轉置及模擬。[29]依據Lawrence等人的研究,認為轉置是最適合的方式,[30]然而Rothenberg在深入探討模擬方法後,認為模擬才是一個很恰當的方法。[31]
一般常被使用或討論的保存方法,包括更新、轉置、模擬、使用標準及技術典藏。
1. 更新(Refreshing)
資訊技術發展快速以及儲存媒體推陳出新迅速,儲存媒體容易過時,又可以讀取該媒體的軟、硬體汰換不存在。為了避免儲存媒體內的資料無法讀取,所以採用更新來解決這個問題。更新,指的是儲存媒體的更新,也就是說將數位檔從舊式的儲存媒體複製到新的媒體上,也是目前最普遍、簡單的一種方法。然而採用此策略亦有一定的限制,例如一定要定期更新,不然不能保證更新後的媒體可以繼續使用。再者更新時仍需要使用某種特定軟、硬體來讀取資料、格式的限制、軟、硬體相容的問題、以及儲存媒體本身容易因時間等因素,而降低儲存品質等,都是需要一併考量的因素。更新的觀念簡單易懂,在執行上也較其他方法單純,但此方法並不能確保資訊在未來能夠被檢索與處理。[32]
2. 轉置(Migration)
轉置是定期將數位檔從舊有的軟、硬體上轉移到新的軟體或硬體上,或是從舊有的資訊技術移轉到新的資訊技術上,使轉置後的所有檔案均在新的系統下運作。轉置的目的有二:(1)保存數位物件的完整性;(2)維持讓使用者可以在技術不斷轉變之下,仍可以持續進行數位資訊資源的檢索、展示與使用。[33]然而在規劃和執行上,轉置仍有其需考量的問題:例如無法預測新的技術何時會出現、或何種技術會成為市場主流;新的技術和儲存媒體將會為何、是否與現在系統相容;以及如何避免轉置所造成資料遺失的傷害等。[34]轉置與更新的方式是有些許不同;更新無法確保資料的完整拷貝,且較易產生新舊技術相容性等的問題,但較能節省時間、金錢,執行起來簡單許多;而轉置則可以保持數位文獻的原貌,並繼續提供往後的檢索使用。轉移(Migration)和更新(Refresh)的差別在於前者乃包括資料格式、結構或標準的轉換,而後者指的是儲存媒體的更新。[35]
3. 模擬(Emulation)
所謂「模擬」是指在軟硬體中建置模擬過程,讓新一代的系統可以透過模擬軟體與過程,模擬舊系統的運作與呈現,確保資料不會遺失,使得數位檔的外觀、感覺和特有的行為,與在舊系統時保持一致,讓所有檔案在新的設備與環境下,維持在舊有相同的環境下作運用。不可免除的模擬技術一樣有其問題點,模擬技術雖可以讓一個數位檔保持在最原始的狀態下作運用,但模擬技術無法保存所有的相關文件,除非能完整的模擬資料與軟、硬體,以及確保模擬系統能被完善的操作與使用。
4. 標準化(Standardization)
數位化的標準甚多,數位檔資料本身所包括的建立與應用者,就有許多種不同的格式與標準,譬如:資料庫、字碼標準、後設資料、數位化格式、檢索。故標準化主要著重在資料的標準格式上,因此須考量數位檔的標準格式資料是否仍然適用、是否有一併保存下來,以及數位檔資料可能因格式的更新而有所受損、遺失,或因標準修改而降低其原有的意義。
5. 技術典藏(Technology Preservation)
類似電腦博物館,除了將所需要的硬體資訊保存,以進行模擬之外,保存硬體本身亦為可行方案。這種方法將過時必備軟硬體保存起來,電子檔案以其最原始的格式儲存。所有檔案與設備都是在原來老舊環境下運用。也就是將數位檔資料原始存在運作的環境,包括相關應用程式、作業系統、平台環境等完整典藏。
(二) OAIS與永久保存
OAIS是一個置於生產者(Producer)、消費者(Consumer)和管理者(Management)之間的一個存檔體系。如圖4-5、OAIS的環境模型所示。
圖4-5、OAIS的環境模型[36]
OAIS參考模式可同時支援數位物件(Digital Object)的和實體物件(Physical Object),以及這兩種形式組成的資料物件(Data Object)。
OAIS參考模式針對資料物件的保存,定義了所謂的「資訊封包」的概念結構,包含以下三種:
1. SIP:Submission Information Package(提交資訊封包):在OAIS中,SIP會被轉換成AIP以供長久保存之用。
2. AIP:Archival Information Package(檔案資訊封包):因典藏需求所產生的封包;有完整的內容資訊與保存描述資訊。
3. DIP:Dissemination Information Package(傳佈資訊封包):為使用者的使用需求所產生的封包;提供使用者所需的資訊封包。
圖4-6、OAIS 的流程[37]
簡單的說明OAIS 的流程:SIP 是由生產者產生,並交給擷取實體;擷取實體再把SIP 轉換成AIP,遞交到檔案儲存實體,然而SIP 相關的描述資訊,則送到資料管理實體。當使用者利用正確的描述資訊和檢索工具來索取資料時,檔案儲存實體將提供符合要求的AIP,經由取用實體轉換成DIP,傳送給使用者。[38]
為確保能夠長久保存與取用數位資源,發展結構化的描述與記錄方式,用來管理典藏物件所需的資訊,此概念通常被稱為preservation metadata,即管理性詮釋資料,利於資料的管理工作,如存取、控制、典藏及轉置等。不同於機讀編目格式(MARC)、都柏林核心集(Dublin Core)等用在發掘與識別數位物件的描述性詮釋資料,Preservation Metadata屬於管理性詮釋資料的類別之下,或被稱為技術性的詮釋資料,主要協助管理資訊與取用數位內容。[39]
而開放式檔案資訊系統(OAIS),定義數位典藏資料庫的功能與需求,依據標準提供系統間詮釋資料互通的架構,讓不同類型的詮釋資料得以交換與再使用。此模式可確保包含有典藏應具備的相關資料,故許多方案用此OAIS模式發展其中的Preservation Metadata。[40]
數位物件雖然易於建立、修正與傳佈,但其儲存媒體卻不如傳統媒體如紙本的穩固健全。因此,數位典藏的成果若要能持續被取用與典藏,就必須典藏關於建立與使用數位物件的技術及情境資訊。preservation metadata即為提供數位物件技術資訊的重要方法,並可支援數位物件長久保存的基本策略,如更新(Refresh)、轉移(Migration)、模擬(Emulation)、標準化(Standardization)以及技術典藏(Technology Preservation)數位物件。也可謂OAIS為永久保存提供的參考規範。
所以OAIS 是由人員和系統所組織成的模型,負責為特定的社群作資訊的長期性保存(ISO, 2003)。也就是說,OAIS 是藉由人員與系統的配合,來達到數位典藏的長久保存與維護。
為了要確實達到永久保存,各典藏單位可以依據行政管理制定的政策,發展出典藏計畫的保存方法,並且確保管理者與使用者可以取用OAIS 的資訊。而且在規劃保存的同時,必須注意資訊科技對數位檔案儲存的衝擊,也就是作長久性的保存計畫。
< 返回目錄 >
[16] 來源 :Reference Model for an Open Archival Information System (OAIS). CCSDS 650.0-B-1, Blue Book, January 2002
[18] 蔡永橙、黃國倫、邱志義等著,《數位典藏技術導論》,台北市:台大出版中心,2007年11月,頁18-19。
[19] Ingeborg Verheul, Networking for Digital Preservation: Current Practice in 15 National Libraries.(Munchen: K.G. Saur, 2006), pp.21.
[20] 陳昭珍,〈電子資源的長久保存〉,佛教圖書館館訊,第25/26期,2001年6月。
[21] 陳昭珍主持。〈國內外影音資料數位典藏現況與趨勢暨我國影音資訊平台建置相關規範研究〉,行政院新聞局委託,93年11月。
[22]TELDAP WIKI: http://wiki.teldap.tw/index.php 。2010年1月檢索。
[23] 資料來源:楊易玲、林彥宏,〈地圖圖資數位化工作流程參考標準〉,台北:數位典藏國家型科技計畫──內容發展分項計畫,2006年。
[24] 蔡永橙、黃國倫、邱志義等著,《數位典藏技術導論》,台北市:台大出版中心,2007年11月,頁70。
[25] 同上註,頁83-85。
[26] 同註24,頁350-353。
[27] 歐陽崇榮,<數位資訊保存之探討>,《檔案季刊》,1(2),2002年,頁36-47。
[28] Kranch, D.A.(1998). Preserving electronic documents, Proceedings of the third ACM conference on Digital Libraries:295-296.
[29] Muir, A. (2001). Legal deposit of digital publications: A review of research and development acitivity, Proceedings of the first ACM/IEEE-CS joint conference on digital libraries:165-173.
[30] Lawrence, Gregory W., William R. Kehoe, Oya Y. Rieger, William H.Walters, and Ann R. Kenney. Risk Management of Digital Information:A File Format Investigation, Council on Library and Information Resources, June 2000.
[31] Rothenberg, Jeff. “Avoiding Technological Quicksand: Finding a Viable Technical Foundation for Digital Preservation,” Council on Library and Information Resources, Jan 1999, pp. 1-35.
[32] 陳雪華、洪維屏,〈數位資訊資源長久保存之探討〉,台北:學生書局,2004年出版。
[33] 陳和琴,〈Metadata與數位典藏之研討〉,《大學圖書館》,5:2,2001年,頁2-11。
[34] 周欣鶯,〈數位館藏的維護與保存〉,《書苑》,51期,2002年,頁72-82。
[35] 歐陽崇榮,<數位資訊保存之探討>,《檔案季刊》,1(2),2002年,頁36-47。
[36] 來源:Sawyer, D., Reich, L., Giaretta, D., Mazal, P., Huc, C., Nonon-Latapie M., et al. (2002). The Open Archival Information System (OAIS) Reference Model and its Usage. Retrieved Dec. 3,2008, from http://www.aiaa.org/Spaceops2002Archive/papers/SpaceOps02-P-T5-39.pdf。
[37] 來源:Sawyer, D., Reich, L., Giaretta, D., Mazal, P., Huc, C., Nonon-Latapie M., et al. (2002). The Open Archival Information System (OAIS) Reference Model and its Usage. Retrieved Dec. 3,2008, from http://www.aiaa.org/Spaceops2002Archive/papers/SpaceOps02-P-T5-39.pdf。
[38]Sawyer, D., Reich, L., Giaretta, D., Mazal, P., Huc, C., Nonon-Latapie M., et al. (2002). The Open
Archival Information System (OAIS) Reference Model and its Usage. Retrieved Dec. 3,2008, from
http://www.aiaa.org/Spaceops2002Archive/papers/SpaceOps02-P-T5-39.pdf
[39] National Library of Australia, Preserving Access to Digital Information(PADI),“Preservation
Metadata”, (http://www.nla.gov.au/padi/topics/32.html)。
[40] 張懷文,<詮釋資料與數位典藏長久保存取用-淺談Preservation Metadata>,檢索:2010年
1月,http://www2.ndap.org.tw/newsletter06/news/read_news.php?nid=352。
數位化工作流程整合性工作流程指南全文下載 (3.3 MB, 2,802 hits)