肆、典藏數位化之準備工作
數位化工作開始前,須考量經費、人力及空間大小等影響數位化方 式 之因素,包含(1)影像數位化:選擇影像數位化設備及人力空間;(2)文字數位化方式:軟硬體及人力等;(3)後設資料建置方式:除考慮專家人力,仍需依 其數位化要求及目的考量是否與國際接軌,對照國際標準DC或CDWA等欄位。
若典藏品尺寸多數不大,影像數位化方式建議以一般掃描器即可; 若原件脆弱則建議以仰面掃描器(一稱「平床式掃描器」)作為影像數位化設備;若典藏多為大型拓片可用數位機背拍攝(one shot )或數位機背掃描;若資料脆弱或尺寸過大,則只能以先拍攝後掃描底片的數位化方式,如原件甚大,建議以高規格數位機背或像機進行拍攝,也使拓片影像能完全 納於一影幅中,拍攝時儘量避免分區拍攝後再接圖,以免曲度而影響接合處之契合,造成影像失真,但是,如果將大型拓本拍攝於大型底片中(如4×10底片)再 透過分區掃描底片的方式接圖,則不會有曲度問題。 (參照表3、附錄二)。詳見第六點「設備分析」。
表3、影像數位化方式建議
原件大小
影像數位化方式
|
小於A3
(資料狀況良好)
|
大於A3
|
資料脆弱或尺寸過大
|
影像數位化設備
|
平台掃描
|
1.數位機背拍攝(one shot )
2.數位機背掃描
|
1.仰面掃描器
2先拍攝底片後掃描
|
二、確立影像檔案之格式
數位化方式選擇後,需依據各執行單位之使用需求、螢幕上呈現及 網路傳輸上的考量使用目的、影像品質,將使用目的、影像品質、檔案大小以及瀏覽器支援等問題作全方位考量,決定所需儲存的影像格式。建議經費許可範圍內, 掃描影像應符合典藏級圖檔要求,並數位攝影後由典藏級圖檔轉換為商務級圖檔或網路瀏覽級圖檔等各種格式的檔案加以儲存,方便日後需要擷取利用。
(一)影像檔可儲存格式有:
表4、數位化影像圖檔選擇
|
典藏級圖檔
|
商務級圖檔
|
網路瀏覽級圖檔
|
網路使用
|
列印輸出檔
|
RGB
|
24bit全彩
|
24bit全彩
|
24bit全彩
|
CMYK24bit全彩
|
解析度
|
600 dpi(搭配尺寸B4以下-600dpi,A2以下300dpi)
|
300dpi
|
150dpi
(網路參考小圖-呼應GIF格式)
|
72dpi
|
壓縮檔
|
TIFF(無壓縮)
|
JPEG(無壓縮)
|
JPEG(視情況決定壓縮比例,以不超過50%為原則)
|
JPEG
|
(二)「數位機背拍攝」與「平台掃描」之比較
平台式掃描價格較數位機背拍攝價格較低,建議在經費許可之下建議以 數位機背拍攝或掃描為優先考量。
1.掃描程序易於平台掃描、且不易損毀原件。
2.節省時間:不需人工接圖,且數位化所需時間較平台掃描短(其實是依原件尺寸vs.解析度的要求而異,如特別講究品質,新型的數位機背可以對一張文件或圖連拍8或12或更多次,再結合各次拍的檔,而產出極高品質的檔, 這種情形就頗費時。)
3.易於編管:圖檔大小一致,可依光碟或備份伺服器容量大小,計算編管儲存數量。
4.圖檔完整並忠實原拓:不需經過切割掃描及人工接圖,能夠呈現更完整而真實拓片原貌。.
相較於傳統攝 影,數位攝影不需耗材及沖印費用,拍攝結果可以馬上判別,省去底片維修、照片檔案手續及儲存空間,專業人才上,品質管控只有一道手續,不需控管拍攝、掃描 等兩道手續專業人員能力及工作品質;典藏級高解析度數位檔建立後,可無限次加值利用,數位掃描攝影節省最大成本即時間成本,如何減少拍攝所需時間,達到相 同品質,可減少支出費用。
表5、傳統數位化方式與數位掃描攝影比較
|
耗材
|
專業人員
|
設備添購
|
成本
|
加值利用
|
數位掃描攝影
|
不需
|
攝影(光學,)色彩等)
電腦(基本常識、影像輸出輸入等。)
|
相機、燈光、數位機背、高階電腦、儲存設備
|
第一年硬體設備購置成本+拍攝費用
|
網路瀏覽、出版或印刷、大幅海報、典藏等。
|
傳統攝影後再掃描
|
底片、沖印、檔案儲存櫃
|
攝影掃描數位化專業人員,(對於色彩的掌控。)
|
相機、燈光專業掃描設備達數百萬元以上
|
拍攝費用+掃描費用(如委外檔案以檔案大小,MB記)
|
不同作業需求,常重複拍攝一般彩照片、幻燈片、5×4底片
|
1.RAW檔
所謂RAW檔,是一個經過相機的感光原件,未經過壓縮及任何作業程序的檔案,若相機使用JPEG設定,會將設定過後的檔案壓縮並將色愈由12bit變成8bit,使用RAW檔,相機將維持12bit不變,便利圖檔軟體做改變,例:過度曝光、色彩及銳利度。
2. TIFF檔
TIFF檔廣泛應用不同平台、不同應用軟體,壓縮檔案不會造成影像的失真,唯一的缺點是開啟和儲存檔案的時間較久。因此適合作為原始資料的保存圖片,以供日後加工處理,不適合提供使用者下載。
3. GIF
GIF格式只能儲存最多256 色的色彩階數,無法完整保留原始圖片之影像內涵,因此GIF不適合作為原始資料的保存圖片,但因其檔案較其他格式小,故適合應用於網路上圖檔的傳輸(網路 上傳輸的圖檔可大別為1. 供閱覽與下載 2. 具提示參考作用的 thumbnail檔。GIF檔good for thumbnail 檔,但thumbnail 檔也可使用降階與降尺寸的JPEG檔-改寫一下)
4. JPEG
JPEG儲存的過程可以決定壓 縮的層級,如果選擇高壓縮的方式,則影像的品質會降低,而低壓縮的方式,會使影像的品質較接近原來的影像圖。由於JPEG格式會造成影像細節的流失,因此 也不適合作為原始資料的保存圖片。但因其(高壓縮率)壓縮方式使得檔案變得很小((TIFF檔較JPEG為小,壓為75%以利傳輸),因此適合放在網路上 供人瀏覽。
5.JPEG 2000
JPEG 2000與傳統 JPEG 最大的不同,在於它放棄了 JPEG 所採用的以離散餘弦轉換(Discrete Cosine Transform) 為主的區塊編碼方式,改以小波轉換(Wavelet transform) 為主的多解析編碼方式。漸進式傳輸功能:先傳輸圖像的大體輪廓,然後逐步傳輸其他數據,不斷地提升圖像質量。 JPEG2000的壓縮率比JPEG高約30%左右,並同時支援有損和無損壓縮,而JPEG 只支援有損壓縮。其糾錯能力很強。指的是在文件傳輸過程中,有恢復丟失的數據封包能力。JPEG2000能夠在用戶定義文件尺寸的情況下,保證再現較高圖像質量的能力。這將在無線應用領域得到廣泛應用。
6. BMP
BMP是Windows小畫家的檔案格式,此格式相容於大多數Windows和OS/2平台的應用程式。另外BMP在儲存時也可以使用RLE的壓縮格式,不過只有在256色或是16色時才能用此壓縮方式,壓縮效果較差。
7.PDF
PDF格式使用於Adobe Acrobat軟體中。這種格式可以應用於Unix、Dos、Macintosh、Windows等不同的平台。可考慮製作一系列的PDF檔結合影像跟文字再下傳給使用者透過Acrobat Reader來瀏覽文件。
8.PNG
PNG格式的發展主要是用來取代GIF格式,它保存了比GIF更多的色彩資訊,另外它也是採用非破壞性的壓縮方式,壓縮效果也比GIF更好一點。但是由於還未全面支援,因此這種檔案格式並未被普遍採用。
表6、影像格式比較
格式
|
檔案大小
(A4,全彩,RGB)
|
壓縮失真
|
瀏覽器支援
|
適用時機
|
TIFF
|
約25M
|
否
|
否
|
保存圖片
|
GIF
|
約3~5MB
|
否
|
是
|
網路上預覽
|
JPEG
|
約4~5MB
|
是
|
是
|
網路上瀏覽
|
JPEG
2000
|
約4~5MB
|
否
|
是
|
網路上瀏覽
|
BMP
|
約25M
|
否
|
否
|
保存圖片
|
PDF
|
約240K
|
是/否
|
否
|
下載
|
PNG
|
約5~6M
|
否
|
是
|
網路上預覽
|
由於文字資料與拓片上經數位掃描輸出後為一份影像檔案,若考慮全文檢索系統,則需另外以文字資料電子格式匯入資料庫系統;若拓片上之文字為古文字,如銘文、金文等,配合文字影像檔,可預覽原始文字原貌。
1. 原始資料式電子檔術
原始資料是以電腦打字的電腦檔,建議儲存一份原始檔外,可轉成一份HTML、PDF或RTF三種檔案格式。
2.原始資料為印刷品或手稿
原始資料為印刷品或手稿,如需做全文檢索,則需重新打字,其餘處理方式同上;若不做全文檢索,只需建立詮釋資料,並將原件掃描,並以不壓縮格式,儲存一份永久檔,再視須求轉成其他目的之格式,如網路下載格式及預覽格式,此三種格式規格建議如下:
表7、文字規範格式
檔案目的
|
說明
|
建議檔案規格
|
資料永久保存格式
|
將資料數位化典藏,保持原有風貌。提供使用者作重製、壓縮處理或其他交換之用
|
檔案格式:TIFF
色調深度:黑白,灰階,每像素8bit;彩色,24bit。
壓縮:不壓縮
解析度:300~600或更高dpi
|
網路下載格式
|
提供使用者網路上觀看列印用
|
檔案格式:JBIG或JBIG2。
色調深度:黑白,灰階。
每像素8bit;彩色,24bit。
壓縮:JPEG(灰階壓縮比約10:1,彩色壓縮比約10:1)。
解析度:150~300dpi或更高,從500×400至1000×700pixels。
|
預覽影像
|
提供使用者預覽及選擇欄位用
|
檔案格式:GIF
色調深度:黑白,灰階,每像素8bit
壓縮:原生影像GIF
解析度或影像大小:72dpi或影像大小從150×100至200×200pixels
|
四、檔案命名原則
(一)清晰明辨
資料數位化為使數數位資源有唯一檔名,避免資料重複或謬誤,所以數位化工作前加以規範檔案命名方式,此命名原則須滿足下列目的:
1.資料數位化過程可與Metadata建立分開執行。
2.依檔名可回溯找到數位化物件。
3.未來加入國際化既有命名系統時,如URN、DOI等,能直接由此檔名加上加識別碼,而成為國際間唯一的號碼。
數位資源由各單位分別數位化後,可能各自儲存各伺服器或集中至某一伺服器,大部分的數位資源都會以分散及集中方式儲存兩套以上,所以,必須分辨是出資料是由 哪一單位建立;此外,毎一原始物件為不同目的,也會轉成不同檔案式,因此檔名必須能顯示是那一物件的那種檔案格式。所以數位資源的命名原則包含:
1.由檔名中辨識此資料由何單位提供;
2.此命名方式可支援同一物件之多種檔案格式及其使用目的;
3.依命名原則在整個系統中,每一數位資源者皆有唯一之檔名;
4.檔案名稱與Metadata結合。
5.符合各種網路資源之命名原則:
(1)使用ASCII code命名;
(2)檔案名稱英文大小寫不做區分;
(3)不使用%、∕、?、#、*、–字元。
(二)與國際命名方式結合
資源命名是一項複雜的議題,網路資源永久名稱的指定是將網路資源管理非常重要的資源,未來各機關的命名與國際上各種命名結合方式主要如下:
命名方式 + 註冊機關代碼 + 註冊資源代碼
1.命名方式如以URN方式則為urn,DOI,doi。
2.註冊機關代碼如為URN informal方式,則由申請機關向註冊中心(IANA)申請分發為urn-d(d為數字),若為DOI,則向註冊中心(FDI或CrossRef)申請分發一代碼。
3.註冊資源代碼則由註冊單位內部自編,無一定格式但要內部唯一代號。
如URN則需提出內部編碼方式給IANA協會省查,而DOI只要資源識別碼註冊 時不與現有重複即可。
4.+為區分碼,如URN為「:」,DOI為「/」。
以上分析,不論何種網路資源組織,其註冊資源代碼是由註冊機關自訂,無論我們設計檔案命名方式為何,未來只要加上註冊機關代碼為國際間唯一識別碼即可,不管國際間盛行哪一種網路資源組織,都可以快速簡單的轉換命名方式,符合系統擴充及未來性[10]。
伍、物件數位化程序
一、拓片數位化工作流程
二、影像與文字數位化的相關問題
依據上述數位化方式選定後,正式進入數位化程序。物件數位程序旨在說明執行數位化工作中需注意之事項,分為前置作業、實體物件數位化之影像數位化與文字數 位化;數位化過程中可能遇及問題,包含色彩校正、銳利度及缺字問題等。前置作業包含選定欲數位化之拓片與目錄制定等;實體影像數位化必須考慮溫濕度控制及 專業提件程序;文字數位化包含高廣測量、校讀釋文及題記楷定等。
(一)前置作業
1.選定欲數位化之拓片
數位化工作為一繁複之工作,須先確立該館主題與目標、特色等,選擇具代表性之藏品;也須將拓片原件狀況納入考慮,檢視其是否能承受所有數位化中的提領、拍攝等過程,視其是否能承受數位化操作而不損壞原件。若拓片狀況不佳則需進行裱褙處理。
2.製定、校對目錄清冊
數位化工作之初,選定數位化物件後,需建立數位檔案清冊,方便數位化之進行,也有助於歸檔管理原件及後設資料統合時之必要欄位建立。
圖二、助理仔細校對完成制訂的目錄資料
(二)實體物件之影像數位化
選定數位化原件後,進入實體物件數位化階段,此階段分兩部份進行:影像數位化及文字數位化,影像數位化須根據執行單位之數位化方式選擇進行影像處理,詳參「第六點設備分析」。
1.提件
提領欲數位化之原件,由於拓片屬紙質文物,製紙的原料木材的成分含有纖維素、半纖維素與木質素;紙張年代太久將產生天然老化,若陽光照射、木質素產生氧化作 用使紙張變色、變酸、易脆。有鑑於文物年代久遠,拓片藏品紙質脆弱,加上蟲蛀等危機,工作人員須確保文物不因數位化而遭受二度破壞,工作人員需戴上無酸手 套保護拓片,提領過程中也需注意溫濕度控制,從庫房領取文物時,空間轉換,因此不論是掃描或拍攝拓片,應嚴格要求縮短距離、溫濕度控制。一般拓片典藏溫度 控制於20℃±2℃,濕度控制於53%±2%[11]。
如拓本文件以裱成軸則因漿糊.襯紙等使原件本身厚度增加且易硬化.溫度的控制須依檢是原件的曲化.硬化情形而研究調整至最適溫度
提件後若需以數位拍攝進行數位化,則由專業攝影師及助理將需戴上無酸手套保護拓片,並將拓片平整地置於掃描機或拍攝平台或於拍攝牆上,檢測平均曝光值(平台式掃描則無需測光),目的是為檢視光源是否穩定及平均,可使拍攝輸出效果清晰。
3.影像檢驗
使用軟體修圖後儲存,無論是以PC或MAC電腦操作皆可以Adobe Photoshop 7.0軟體操作儲存,稍後將介紹色彩管理模式。無論是掃描或拍攝,都必須保留原始檔後,另將數位檔裁切多餘部分後,經影像檢驗後,以決策之數位化檔案降 階、轉檔後儲存。保留原始檔,影像檢現牽涉到色彩管理等問題,對於拓片而言,一般皆為偏黑色之墨色,除了印記之外,色彩校正相較於一般書畫類型文物容易的 多。但由於拓本黑白對比較高,為求拓片掃描後之清晰度(反差比),可利用使用圖片編輯軟體Photoshop 7.0、ACDSee作銳利化動作。
文字數位化階段與影像數位化可同時進行,文字數位化是將拓片原件做記錄,分兩部分進行:第一階段為調件、檢視、測量拓片高廣、檢查印記;第二階段,著錄前置作業中所記錄的拓片相關資料於資料庫中。
1. 調件、檢視拓片
(1) 拓片原件紀錄為拓片內容的描述(如銘文、器物、拓片高廣、保存狀況、 題名等拓片資料),以了解拓片的保存狀況。為避免多次提件對拓片所造成的損害,工作人員需戴上無酸手套保護拓片。
(2)拓片原件記錄過程中,工作人員首先必須戴用無酸手套、口罩,以保護拓片及自己。進行拓片原件的檢視時,需先將拓片原件自收藏處取出。取件前要仔細核對保存櫃之編號是否與清單上之號碼相同。
2. 測量拓片高廣(包含印記高廣資料)
(1)軸裝拓片的高廣測量因必須考量是否需要參與展覽等因素,因此測量部分除了包括原拓片的高廣、內含器物、銘文、印記外,仍必須測量裱褙後的拓片尺寸。銘文的部分是測量字首與字尾、最左字與最右字之間的高廣距離,而器物的部分則是測量整個器物取其最大值,將印記資料建立成完整的印記資料庫。
(2)高廣測量後,檢視拓片的保存狀況,辨察拓片上是否有其他附著物、墨汁污損、蟲蛀、霉害等。若污損嚴重者則送裱修護。
(3)完成拓片檢視後,即將拓片歸架,記錄上述內容於「資料庫管理系統」或記錄於手寫表單中統一由專業人員進行見檔或批次轉檔匯入資料庫 中。
3. 制定釋文、題記楷定
(1)拓片內容廣泛,不但有影像資料也有文字資料,然因文字演變,許多珍貴的文章內容必須倚靠專業老師或教授定期舉辦釋文校讀,同時核對文獻資料,確定釋文之內容後,紀錄保存,同時解決「異體字」等相關問題。
(2)題記楷定為鑑定拓片真僞的要點,除考察書名資料仍須有專業背景之研 究人員確認,可以確立其擁有人、發掘地點及辨別真偽等。
圖三、助理需進行收藏印的比對
數位掃描之後,需將影像檢驗至最接近拓片原件色彩,以1:1比例拍攝或掃描後,為避免數位影像檔失真,影像檢驗為數位化之重點工作,影像檢驗涉及色彩校正 問題。色彩管理可以提供色彩的一致性,減少爭議,近而減少重覆測試的浪費;另外,拓片本為文字與圖像結合之組合,全文數位化,常遇及缺字處理,中國文字經 朝代更替、累月變化,許多原件的文字於電腦輸入法中無法顯示字型,若使用造字功能,受限於計算機中預存的字型太少,檢索文件面臨異體字檢索難題,以致無法 共享資源,若大幅增加缺字資料的工作,將造字管理不易,造字空間不足等問題,而異體字也將造成文件檢索和處理困擾,也造成資訊共享障礙。另外,為保護數位 化影像於網路中被竊取或竄改,另有浮水印設計及XML數位簽章,降低網路駭客入侵並且有保有原始影像著作權。
彩色與黑白色的選擇,若是純拓(墨色),色彩校正相較於書畫及器物等原件比重降低。色彩校正原因及步驟如下:
(一)、色彩校正
1.數位攝影的常見問題有:
(1)不同的顯示器有不同的輸出結果
(2)顯示器與輸出結果不一致
2.原因分析
(1)偏色原因:螢幕色溫不同
(2)曝光原因:螢幕光度不同
3.問題的根源:
(1) RGB或CMYK的色彩模式不是絕對:同一RGB值在不同螢幕上顯示可 能是不同顏色
(2)溝通的橋樑:L*a*b 色彩模式(附註二)
4.儀器之色彩校正:
(1)螢幕:螢幕校正需要使用貼在螢幕上之光學儀器,藉由讀取螢幕上特定 色塊之顏色值來修正。
(2)掃描器:掃描器則必須使用該掃描器專用的校正用色卡,經由比對理論 顏色與實際掃描得到的顏色來作修正。
(3)印表機、印刷機:依然必須執行色彩校正才能在可能範圍內得到最佳的輸出品質。
5.色彩校正方式
就 桌上型掃描器而言,是依照國際照明協會(Commission Intornation De’l E’ clairage,簡稱CIE或International Commission on Illumination,簡稱ICI)於1976年將CIE Yxy以數理方式轉換成新的CIE Lab模型為基準,並以色彩工業標準─IT8標準色彩導表來作為桌上型掃描器校色之基礎。而近年來則因為數位相機的誕生,便出現取代傳統相機底片的電子光 學元件,即感光耦合元件(Charge Coupled Device,簡稱CCD),而隨著CCD或互補性氧化金屬半導體(Complementary Metal-Oxide Semiconductor,簡稱CMOS)技術的進步,各設備皆有其相對專用之色彩導表以進行色彩校正,並產生裝置色彩描述檔ICC Profile,根據此影像標準格式檔與前、後端設備做連結,盡可能保持輸出的一致性。倘若儀器設備狀況有任何變動的話,則必須重新進行色彩校正與調整。
1.解決缺字問題的原則:
原則一:不可以為解決缺字問題而犧牲資訊共享的能力
原則二:要能照顧到任何地區使用的漢字
原則三:建立登錄、檢索、表達及共享「缺字」的能力,以便儘早利用電腦協助管理缺字
原則四:建立電腦中關於字、字形、字體的表達,將必要的相關資料,放入電腦,包括異體字之間的對應。
原則五:以ISO 8879通用標識語言,來描述文件檔案及缺字。
原則六:所建立之系統應考慮到文件 「文字學資料庫」擴充可行性。
原則七:研擬「字碼代替」技術,無論以後交換碼擴充,希望利用字碼自動代替技術做到目前維持16位元的漢字處理環境。
(1)造字
一般處理缺字問題大多於電腦字集的外字區找一個碼位,造一個所缺的字型,雖然得以在電腦上顯示缺字卻造成資源無法共享及造字空間不足的問題,不建議使用此方式製作文字資料庫。
(2)增加電腦軟體字集
由於現有軟體字庫有限,若要在短時間內增加所有的字元,有 執行上的困難,無法完整收集所有字集,而改寫應用軟體之成本過高,無法徹底解決缺字問題。
(3)現有文字取代
以台灣大學之「台灣古拓碑」為例,由於影像已全部數位化,若文字資料庫以現有文字取代,使用者以影像檔案對照文字有助於資料查詢比對。
(4)建構軟體例
目 前中央研究院解決缺字問題開發一套構字式軟體,收錄漢字的字形結構,將一漢字視為一個二度空間圖案,在由部件以橫連、執聯、包含三法則拼湊而成。可以用來 表達缺字也可作為漢字的交換碼;構字式包含《說文解字》的9353個小篆字頭及1163個重文以銜接古今文字,陸續收集甲骨文、金文、楚簡等字-體解決異 體字問題[12]。也解決「資訊共享」的問題。
(三)備份 異地備援
若文物大量數位化,因檔案容量大且檔案數目龐大,將產生儲存空間不足、網路速度慢且佔用內部網路頻寬及考慮到安全疑慮[13]。 因為同時進行大量數位化影像,皆傳送到儲存備份主機,如果同時傳送,會因頻寬不足或易產生網路封包之碰撞等因素,導致時間傳送過久,並且造成主機的負載過 重;再者,為節省人力、精簡備份步驟,固定一段時間每次備份一次數位化檔案,而為了製作磁帶與光碟備分,需移動幾百GB的檔案兩次,耗費時間超過十個鐘 頭,相當浪費時間;雖建置儲存區域網路,但因數位影像檔成長快速,且儲存空間成本無法不斷擴充儲存空間,導致儲存空間將不敷使用;同時必須考慮伺服器維修 等安全問題[14]。
1.建置暫存工作儲存區:
暫 存工作儲存區主要目的可以提供前端數位化流程之大 量影像檔暫時存放,加以浮水印、影像格式等後處理工作,以及同時燒錄光碟與備份磁帶等多項備份工作,未能符合上述工作需求,可以光纖介面、具有高速傳輸特 性之儲存區域網路做為暫存工作儲存區,解決工作空間不足、傳輸快速與處理大量影像檔等問題。
2.建置永久備份儲存區:
永 久備份儲存區,是將影像檔後處理與備份完畢後用來存放最高階典藏等級影像檔之用。主要目的為儲存備份但無即時作業之需求,故可採用較低速但高容量之硬碟, 如SATA規格之硬碟。備份好之儲存影像檔傳送到此區域儲存,仍須快速的儲存網路。同樣需採用光纖網路為基礎之儲存區域網路且具高擴性與高容量之特性,方 便未來繼續擴充使用。
3.結合磁帶備份與光碟備份:
為降低移動大量影像檔案所浪費之時間,將磁帶備份與光碟備份結合於同一台機器上,減少移動大量影像檔之次數,未能同時備份光碟與磁帶,需搭配上述提及高速儲存空間,以防止備分失敗。
4.建置兩個影像檔後處理工作區:
影 像檔後處理工作區的目的位轉換各種影像檔格式、加浮水印及備份光碟與磁帶等,因光碟與辭大備份速度較慢,即使前端數位化後之檔案可以很快傳送到後端,但備 分光碟與磁帶備份時,仍成為整體備份效率的瓶頸;建置兩套備份主機光碟櫃與磁帶機等,形成兩個影像後處理工作區,以加速光碟與磁帶備份,且多一份光碟與磁 帶備份,分散大量影像檔資料流,達到負載平衡(load balance)之效用,更兼具容錯(failover)之優點,提高整體系統的可用性與信賴度[15]。
浮 水印自1950年代開始一些研究報告或專利發明,於史料中加入典藏單位的浮水印此技術只能保護單一的圖片以防竄改。將代表原創作者的資料或是一組特別的資 訊,嵌入到數位多媒體資訊中,將來若發生版權爭議時,就可以透過此一技術,將嵌入在數位多媒體中的認證資訊取出,作為版權認證的依據。這一種技術就稱之為 數位浮水印。
當所嵌入之資料或資訊在視覺上是無法察覺的,稱為「隱性浮水印」;如果加入的資料是視覺上可察覺的,稱為「顯性浮水印」。一般提到數位浮水印技術時,絕大部分的情況所指的都是隱性浮水印[16]。
1.設計浮水印考慮因素
表9、浮水印考慮因素
|
描述
|
透明度 (Transparency)
|
浮水印加入影像後,不能影響原始影像在視覺上的品質,此為浮水印的基本要求。
|
安全性 (Security)
|
所藏入的浮水印必須具有不可偵測的特性。即使知道了浮水印的架構,使用者仍必須擁其對相應之秘鑰 ( secrete key ) 才可以取出浮水印。
|
明確性(Unambiguous)
|
所藏入之浮水印應該清楚確認版權所有人。
|
強健性 (Robustness)
|
含有浮水印之影像在經過攻擊後,是否仍能存在於影像之中。
|
容量 (Capacity)
|
在原始影像中,能加入最多不同的浮水印長度或個數。一個好的浮水印技術必須能使原始影像盡可能容納更多的資訊,但這個條件通常和透明度的要求背道而馳。
|
是否需要來源的比對(Blindness)
|
在抽取浮水印時,是否需要原始來源資料或相關資訊。
數位浮水印的應用分類 。
|
2.根據不同的需求,數位浮水印可以區分以下不同類別的應用
表10、浮水印不同類別應用
類別
|
描述
|
(1) Copyright Protection
|
版權保護是最常見的數位浮水印應用類型。為了辨識所有權,在影像在公佈前事先加入一組可以代表所有權人資訊的數位浮水印到其中,以便將來發生版權上的爭議時,可以用來驗明影像的所有權。
|
(2)Authentication
|
數位浮水印也可以拿來當成數位資料真確性驗證及竄改偵測。在此種應用模式中,數位資料會被加入一組強韌性較低的脆弱浮水印(fragile watermark)。在進行數位資料的傳遞時,如果數位資料遭到第三者的截取並進行修改,則隱藏在其中的浮水印將因遭到破壞而無法抽取,也因此數位資料 的接受方得以驗證資料之真確性,與查覺是否數位資料已遭到第三者的竄改。
數位浮水印的應用分類(cont.)
|
(3) Tracking / Traitor Tracing
|
為了追蹤數位內容非法使用情況及來源,賣方在釋出數位內容之前可以事先嵌入一組數位指紋 ( Fingerprint ) 至其中。數位指紋為一個獨一無二的識別碼,就像指紋一樣,當為了追蹤使用者或購買者非法地將產品轉賣或移做其它用途時,則通常會在數位資料交給使用者之 前,就在每個釋出的版本中放入數位指紋,以供日後辨別。日後發覺了非法的散播產品時,就可以取出數位指紋,以查明是誰將數位資料做了非法的用途。
|
加入浮水印工具
表11、加入浮水印工具
廠商
名稱
|
Alpha-Tec LTD
(www.alphatecltd.com)
|
Digimarc
(www.digimarc.com)
|
不詳
|
產品
|
數位浮水印系列相關產品
|
數位浮水印系列相關產品
( 該技術為Corbis 採用 )
|
pictureshark.exe
|
費用
|
要收費
|
要收費
|
免費
|
功能
|
EIKONAmark
提供隠性數位浮水印的嵌入
Authentication Check
提供數位影像的竄改偵測
AlphaCrawler
網路機器人,負責在網路上收集資訊,並偵測有違法侵權數位內容的網站,以協助使用者進行犯罪追蹤。
|
Digimarc watermarking
提供隠性數位浮水印的嵌入
Digimarc MarcSpider™
網路機器人,負責在網路上收集資訊,並偵測有違法侵權數位內容的網站,以協助使用者進行犯罪追蹤。
|
可批次加入
顯性的圖片浮水印
|
浮 水印技術僅為數位內容安全機制的一部份,具財產權宣示作用,但現有技術強健性不足,不能絕對保障加入浮水印的典藏品不受非法利用。使用單位採行浮水印時, 宜同時建立資訊安全及數位產權管理等機制,朝向由數位內容製造的起始端即開始進行保護,包含其間的傳遞、使用存取與行為紀錄,使用者驗證等。
除 上述之外,浮水印也並非證明智財權擁有者的唯一證據,相關的數位智慧財產法律配套措施更為重要,唯有結合技術與法律層面的保護,才能使數位典藏品得到有效 保護。雖然浮水印並不能解決數位智慧財產的所有問題,但該技術仍可被定義為數位智財的最後一道防線,除此,若能善用其所帶來之嚇阻作用,對智財權的保護將 可發揮莫大之效果[17]。
(四)XML數位簽章
由XML安全架構裡最基本的組成元件,它可以在 web services提供驗證基本數據的可靠度,對於網路上的每筆交易可靠度進行確認。XML數位簽章的最大特色是其可以在XML文件之部份分區段進行簽章,而非僅能針對整份文件進行簽章[18]。
(五) DjVu影像壓縮格式
1996年由Yann LeCun開發,2000年Lizardtec公司購買其技術。DjVu原理是結合DjVuText(類似 JBIG2)、DjVuPhoto(類似 IW44)、DjVuLayerd,三種壓縮模式, 將掃描的文件或是圖片切割成background layer(背景層) foreground layer(前景層),紙的紋理和圖片 (解析度約100dpi)文字與線條(解析度約300dpi),DjVu圖片可以使用標準瀏覽器打開。 與傳統的圖像壓縮格式相比,DjVu壓縮比更大,壓縮速度更快(在同樣條件下,其壓縮速度比PDF格式快150倍,比JPEG或者GIF格式要快上20 倍)。由於壓縮速度快,該技術甚至可以應用於實時播放。 另外,DjVu文檔可以透過關鍵字條件進行檢索。在圖書和檔歸檔方面的應用意義也非常大。通過 DjVu 壓縮格式,以 300dpi 的解析度掃描的彩色頁面可以從 25 MB 縮小到 30 KB 至 80 KB ,而且圖像質量十分優秀。
對於同時包括文字和圖像的彩色檔來說, DjVu 檔在同等質量下通常比 JPEG 檔小 5 ~ 10 倍。對於黑白頁面來說, DjVu 檔通常比 JPEG 文件小 10 ~ 20 倍,比 GIF 文件小 5 倍。對於那些由掃描檔製作而成的黑白 PDF 圖像來說, DjVu 檔也要比它們小 3 ~ 8 倍。
除了掃描檔之外, DjVu 也可用於電子檔,如Adobe的 PostScript 檔或 PDF 文件。以這些檔為物件壓縮而成的 DjVu 檔,在 300dpi 的解析度下其每頁大小通常在 15KB 到 20KB 之間。
高 質量的彩色掃描頁面的大小直逼普通的 HTML 頁面 (平均 50KB) ,透過plug-in, DjVu 頁面可以在瀏覽器視窗中任意放大和縮小,不須佔用 25MB 的記憶體來對圖像進行全解碼。透過將解碼的圖像部分儲存在一種只占 2MB 記憶體的資料結構,實際顯示在螢幕上的圖元是在傳輸過程中被解碼的。如此使得圖片下載的功效大幅度高。
採用分層顯示,而不是等到整幅圖片都被解碼之後才顯示,也使得圖片顯示的速度大大提高,用戶在兩三秒之內就能夠迅速看到文字,其他的圖像資訊也會在幾秒鐘之內陸續顯示出來。
DjVu是 一個公開標準。其解碼程式和部分編碼程式可在網上免費獲得。 DjVu 網路流覽器插件,也即 DjVu 檔的解碼軟體,可直接在 LizardTech 公司的主頁上下載 ,而且有針對 Linux, Windows 95/98/NT, Mac, 和各種 UNIX 作業系統的不同版本可供選擇。
1. LizardTech的官網有DjVu的相關軟體可下載 http://www.lizardtech.com/
2. Expervision開發的OCR( Optical Character Recognition ) engine支援DjVu-3.x.
3. Feith Systems and Software Inc. 開發的DjVuer™ 和 DjVuer™ Pro.可以掃描, 觀看, 以及建立 DjVu-2.0 檔案。
4. ACDSee:一般常用看圖軟體,目前已經支援DjVu-2.0。
5.IrfanView:一套免費的看圖軟體,必須下載plug-in才會支援DjVu-3.9
〈目錄〉
[11] 註: 趙冬升等編,《文獻典藏與保護》,北京:文津,1993年3月,初版。
[13]劉家銘、游孝國、謝俊科、林國平,2005年9月〈能快速處理大量文物影像之數位化儲存備份機制-以故宮為例〉,收錄於《第四屆數位典藏技術研討會論文集》。
[14]劉家銘、游孝國、謝俊科、林國平,2005年9月〈能快速處理大量文物影像之數位化儲存備份機制-以故宮為例〉,收錄於《第四屆數位典藏技術研討會論文集》。
[15]劉家銘、游孝國、謝俊科、林國平,2005年9月〈能快速處理大量文物影像之數位化儲存備份機制-以故宮為例〉,收錄於《第四屆數位典藏技術研討會論文集》。
[16]陳心渝、李政宏、邱一航、林韋伶,94年9月1.2日〈數位版權管理機制實做-以數位典藏管理系統為例〉,收錄於《第四屆數位典藏研討會》。
[17]陳心渝、李政宏、邱一航、林韋伶,94年9月1.2日〈數位版權管理機制實做-以數位典藏管理系統為例〉,收錄於《第四屆數位典藏研討會》。
[18]曹偉駿.林宜進.劉經緯.曾逸鴻.94年1~2月〈數位典藏環境之資料安全保護機制〉收錄於《第四屆數位典藏研討會論文集》
金石拓片數位化工作流程指南 (1.7 MB, 1,633 hits)
評分:
Loading ...