1024x768 1280x800   Decrease font size for  - 拓展台灣數位典藏 - 數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫網站 Reset to normal font size for  - 數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫網站 - 拓展台灣數位典藏 Increase font size for  - 拓展台灣數位典藏
 


微縮資料數位化工作流程指南

Tags: none 發表: 2008-01-10, 點閱: 42,645 , 加入收藏櫃 , 列印 列印 , 轉寄 轉寄

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

陸、品質管理

一、數位影像規格說明

二、影響品質的要素

三、數位影像品質檢驗

 


一、數位影像規格說明

     數位影像規格主要涉及影像的色調、解析度及格式等,至於如何決定數位影像的規格標準,其考慮因素則是根據其日後使用目的來決定。此點在上文中已進行說明,下文則針對數位影像規格中,主要的項目進行說明,以提供數位化工作者,設定數位影像標準規格及選購掃描設備時的參考:

 

(一)色調(Tonality)

     色調是構成影像可讀性的重要參數之一,約可包含三種等級:

 

1.低階色調(1- bit,單色調)

     1位元的象素只有二個值,黑色或者白色。單色調掃描產生最小的檔案。對象通常為色調在原物裡不重要的膠捲影像,如印刷品有線藝術插圖,或是攝製微縮膠捲的時候,在原物裡的色調已經失去。這種類包括在膠捲中以高反差複製。若是插圖在膠捲複製品中已經很差,希望創造優質的複製品則是無益的嘗試。

2.中階色調(8- bit,灰階色調)

     提供灰階256種色度,從純白到純黑。色調在原件裡非常重要的那些,墨水和鉛筆標記的資料手稿、半色調的插圖、連續調的其他類型插圖、表面上黑白的檔案材料,但是實際上包含變化和墨水密度的種類以及紙的色調。通常資料越老,彩色可能比灰階更合適。

3.高階色調(24- bit,彩色色調)

    提供的色調範圍大約1600萬種不同的顏色,例如,色調在原件裡非常重要的那些,墨水和鉛筆標記的資料手稿,密度顯著變化非常大,非常深的紙顏色和/或可見紙的質地。這種類包括手稿,亮度和對比一張張都不同,凹板印刷,平版或者半色調的印刷品。
 

(二)影像解析度

     除了色調之外,解析度是構成影像可讀性的另一個重要參數,影像檔案的解析度代表該檔案所內含的像素數量,其單位為ppi(Pixel Per Inch,每英吋像素數),表示該影像每1英吋(橫向或縱向)的距離內的像素點數。
1. 影像解析度設定依據:
(1)人的眼睛對影像鑑別率最高為300ppi,因此以300ppi解析度為標準。
(2)視輸出場合不同,得有不同解析度之要求。解析度一旦超過標準之要求,對於影像品質亦不會有所幫助,但過大的檔案反而造成儲存及影像處理之負擔,亦即造成經費的浪費。
   

表5、輸出解析度一覽表[20]
輸出場合
輸出解析度
電腦螢幕
72~100 ppi
噴墨印表機
240~360 ppi
平面印刷
266~300 ppi
相紙印刷
200~400 ppi
報紙
125~250 ppi
模造紙
200~265 ppi
銅板紙
250~350 ppi
 
        

2. 解析度與檔案大小:

(1)特定面積裡所擁有的像素點數量愈高,影像的品質就愈高,影像檔案也就愈大,而影像檔案的編輯處理作業也就愈慢,儲存空間需求也愈大。
(2)檔案大小的計算公式:高度(像素)x寬度(像素)x每個像素的位元組=位元組總數。如果要轉換到百萬位元組(MB),需要除以1,048,576。
 
3. 微縮資料的解析度:
     各種各樣的方法可以用來確定適合於數位影像的解析度的水準。 最開始,當然是膠片實際「交付」的解析度測定。膠片所交付的解析度測定可以檢查膠片的技術註記,出現在膠片裡,或者其他可測量特徵,如縮率。有時分析必須基於創造和比較在不同的方法和/或不同的掃描解析度水準,所產生的影像。美國國會圖書館在1995期間與少數圖書館微縮膠捲進行的非正式試驗。在測試中掃描膠片,使用從1200ppi到4000 ppi範圍內的解析度進行測量,並產生灰階等級的點陣圖。報告中指出,當1200 ppi和2700ppi影像比較時,可觀察明顯的不同,在2700 ppi和4000 ppi影像之間的差別則是微小的,甚至可以忽視。在這建議裡,很多圖書館膠片可能沒有包含3000 ppi的水準以外可取回的數據。對於在12︰1的縮率的材料來說,這表明就原先的資料而言,可取回的解析度可能250ppi。[21]

     但是有時候不一定能知道微縮膠捲的縮率,因此很難說明關於原始文件的數位化影像的解析度。這時最佳解析度的選擇,取決於影像中值得注意的細節,能被清楚的閱讀到,然而什麼是值得注意的細節的最小水準?對文字來說可能是讀者需要能看見的最小字母、數字或符號,能被清楚的區分。在印刷的書裡,這將經常在附注裡被發現。 但是在地圖和線段裡,對象可能是一所個別的房子或者製圖符號。在手稿裡它可能需釐清這張上等皮紙的質地。照片或者圖畫更加難確定,這可能要倚賴用戶的釋義方式決定。因此,什麼是最小的有意義的要素,一部分還需取決於誰使用掃描的影像,以及用何種方法。但是如果透過上面的建議,決定這個膠片參考解析度的數值,但卻導致輸出如郵票般大小尺寸,或者其他不正常尺寸的複製品,將不會被紀錄,並且需要調整。

     因此就膠片而論,解析度有可能只是一個名義上的解析度,代表原先的資料解析度的近似值。當膠片的縮率或者原先的資料尺寸被知道時,名義上的解析度將和是實際的一樣準確。當膠片的縮率或者原先的資料尺寸不知道時,將提供一個合理的估計。在每種情況裡,名義上的解析度將與之前膠片的分析期間一致。可以在掃描日誌或者其他報告過程中,紀錄名義上的解析度。
     另外,若在進一步考量色調,將使問題更為複雜,因為8位元的象素比一個1位元的象素,擷取更多的訊息,24位元的象素則擷取更多。這表示與黑白相比,使用灰階或彩色,可用比較低解析度,取得相同可讀性。
 
(三)影像格式 [22]
1.TIFF廣泛應用不同平台、不同應用軟體,壓縮檔案以LZW演算法[23] 不會造成影像的失真,唯一的缺點是開啟和儲存檔案的時間會比較久。因此適合作為原始資料的保存圖片,以供日後再加工處理,不適合提供給使用者下載。

 

2.GIF格式只能儲存最多256色的色彩階數,無法準確的紀錄原始圖片,但因其檔案較其他格式小,故適合應用於網路上圖檔的傳輸。

 

3.JPEG儲存的過程可以決定壓縮的層級,如果選擇高壓縮的方式,則影像的品質會降低,而低壓縮的方式,會使影像的品質較接近原來的影像圖,由於JPEG格式會造成影像細節的流失,因此也不適合作為原始資料的保存圖片。但因高效率的壓縮方式使得檔案變得很小,因此適合放在網路上供人瀏覽。

 

4.BMP是Windows小畫家的檔案格式,此格式相容於大多數Windows和OS/2平台的應用程式。另外BMP在儲存時也可以使用RLE的壓縮格式,不過只有在256色或是16色時才能用此壓縮方式,壓縮效果不是很好。    

 

5.PDF格式使用在Adobe Acrobat這套電子出版軟體中。這種格式可以應用在Unix、Dos、Macintosh、Windows等不同的平台。可以考慮製作一系列的PDF檔結合影像跟文字再下傳給使用者透過Acrobat Reader來瀏覽這些文件。

 

6.PNG格式的發展主要是用來取代GIF格式,它保存了比GIF更多的色彩資訊,另外它也是採用非破壞性的壓縮方式,壓縮效果也比GIF更好一點。但是由於還未全面支援,因此這種檔案格式並未被普遍採用。

 

 

表6、影像格式比較表
格式
檔案大小
A4,全彩,RGB
壓縮
失真
瀏覽器支援
適用時機
TIFF
25M
保存圖片
GIF
35M
網路上預覽
JPEG
45M
網路上瀏覽
JPEG
2000
45M
網路上瀏覽
BMP
25M
保存圖片
PDF
240K
/
下載
PNG
56M
網路上預覽

 

 

(四)數位影像規格選擇

     上文介紹影響影像可讀性的重要因素-色調及解析度,以及檔案格式,其實可以發現,並沒有最佳的標準存在,往往需對各種不同的實際問題,有不同的處理及回應,並考慮數位影像的使用目標及方式,因此也產生不同的規格組合,以下列出一些專案或專家推薦之規格,以供參考
       
表7、數位影像規格選擇
單位/專家
計畫名稱
建議規格
 

University of Sydney Library、National Library of Australia、State Library of New South Wales、Monash University

 

Australian Cooperative Digitisation Project, 1840-45(1995)

8bit greyscale、400dpi、TIFF[24] 
Yale University Library
Project Open Book(1996)
1-bit、600dpi、TIFF
Columbia University Library
OVERSIZE COLOR IMAGES PROJECT PHASE II(1996)
典藏級(master):1-bit、600dpi、TIFF
瀏覽級:120 dpi 、GIF
印刷:300 dpi、PDF [25] 
LIBRARY OF CONGRESS(1996)
 
1-bit、300-400dpi、TIFF 6.0
8-bit grayscale、300-400dpi、JPEG[26]
Hartmut Weber、
Marianne Dr(1997年)
 
1-bit、350-400dpi、TIFFG 4
8-bit grayscale、250-300dpi 、TIFFG 4[27]
Tuzzy Consortium Library
The Tundra Times Newspaper Digitization Project(2005)
典藏級:8-bit grayscale、400dpi、TIFF
降階:(1)4-bit grayscale、400dpi、TIFF
     (2)8-bit、125dpi、JPEG
網路傳輸:PDF(合併JPEG、OCR文字及後設資料) [28]
Margie Barram(2005)
 
1 bit、300 ppi、TIFF[29] 
國家圖書館(1991)
 
1 bit、300 ppi、TIFF.G4
8bit greyscale、400dpi、TIFF(針對不清楚的原稿)[30]  
世新大學
北平世界日報內容數位化開發計畫(1992-1994)
典藏級:1 bit、300 ppi、TIFF
瀏覽級:(1)1 bit、150ppi、JPG
        (2)1 bit、75 ppi、GIF
 
      從以上列表不難發現,微縮資料掃描目前仍以單色調(黑白)為主,尤其是對後續需進行OCR的文件而言。灰階掃描主要針對希望獲得較高品質,或由於早期資料內容較不清晰,需要擷取更豐富的內容訊息,但相對的需負擔較高的檔案儲存空間。執行單位需在高品質與儲存空間作一綜合判斷,以作最後決定。同樣情況也發生在解析度的選擇上,一般而言,300-400 dpi已經足夠,但若希望獲得較高品質,或由於早期資料內容較不清晰,需要擷取更豐富的內容訊息,亦可提升至600dpi,但仍須以較昂貴的處理及儲存成本為代價。至於檔案格式方面,目前皆認同使用TIFF作為典藏級的儲存格式,但在降階轉檔方面,則根據使用目的而有不同的規劃。
         

 

二、影響品質的要素

     在進行微縮資料數位化時,影響到最後是否有高品質的數位影像產出,原因相當多,最主要的有:在微縮資料中原始物件(如文獻手稿、報紙、印刷品、地圖等)的特性、微縮資料自身的品質、物件數位化的操作程序以及設備的選擇等,物件數位化的操作程序可參見前面章節,而設備的選擇,尤其是對掃描設備來說,將於後面章節介紹,本節主要針對原件特性及微縮資料品質進行說明。
 
(一)原件特性

     下列是從微縮膠捲變換為數位影像時,對品質最有影響的原件特性:

 

1.紙的色調和物理狀態。有變黃和/或易脆的邊緣,折角的頁和參差不齊的邊緣的書,干擾掃描器的邊緣察覺軟體。或是在片幅之間的捻接,可能引起軟體失靈。

 

2.字體的尺寸、清晰和對比,是在掃描過程裡的重要變量。

 

3.若是以文字訊息為主的材料,如報紙,只須清楚而完整的傳送內容的意思。與像插圖或照片那樣複雜的視覺資料相比,要求較簡單。而插圖的存在,例如線段、刻版和半色調,可能需要特別的掃描器設置,會影響文字的易讀性。例如半色調物件的掃描,通常印刷的半色調也是單色調原物,由黑色的墨水在白紙上。但是點的格字花樣,允許人眼睛以灰色度看他們,需要被不同對待。半色調是你在報紙裡看見的黑白照片。如果你仔細看,你將看見他們由黑色的小圓點組成;濃密包裝近似黑色,稀少包裝近似灰色,和缺席近似白色。當列印半色調的小圓點圖案,遇到掃描器使用光柵(raster)或者格子,由於兩者「頻率」影響,結果影像有稱為雲綢紋圖樣(moiré patterns)的黑色波紋圖案,一種失真的形式。因此必須調整作法,例如使掃描器的圖案隨機化,因此導致影像平滑和壓抑moiré圖案。

 

4.像地圖和插圖那樣的折頁,會以整個35毫米片幅複製,不可避免的會影響數位化變換,如需要重新設置設備參數,調整容納全部片幅,然後重新安放恢復個別頁的變換。

 

5.在高對比的微縮膠捲上,很多彩色複製品質不好。如果顏色對理解內容不可缺少,如通常像地圖那樣,很可能並不適合單色調(黑白)的數位化影像變換。

 
(二)微縮軟片的特性
     微縮軟片的特性,對最後變換的品質有驚人影響,微縮膠捲天生是高對比的複製媒介。第一代膠捲,作為負片母片,並且創造第二代副本。第二代膠捲,用於生產正片使用副本,以及變換數位化影像,下列是最重要的微縮軟片特性:

 

1. 極性︰掃描微縮膠捲複製負片,比掃描正片更能產生高品質的影像。

 

2. 解析度:軟片的解析度主要受攝製時鏡頭品質、對焦、震動、軟片材料特性,同步性運動等重要因素 影響,而解析度數值計算與縮小倍率具有密切關係,以下以公式表示,並舉例說明:

(1)解析度數值計算:

RR代表縮小倍率

P代表微縮片內解析度試驗卡可辨認之指數

Rf代表微縮片解析度數值
計算公式:RR x P = Rf
舉例說明並代入公式:設微縮片縮小倍率(RR)為24倍,解析度試驗卡可辨認之指數(P)為5.0代入公式:RR x P = Rf
24 x 5.0 = 120條/毫米(mm)
    
(2)解析度標準:
解析度在微縮系統中,有國際性標準,每毫米清晰辨認100~120條線,方符合世界各國標準,如下所述:
低於79條線/毫米——不可允收標準
90~100條線/毫米——允收標準(合理解析度)
100~120條線/毫米——高品質(解析度)標準
高於120條線/毫米——極佳品質(解析度)標準

3. 密度

     微縮片密度是製作上一種表示及測試曝光程度方法,由於背景密度直接影響微縮片使用性,在要求條件上,較其他因素更為重要。密度是兩光度比之對數值。換句話說,在一物體上照射之光度,此光線穿透該物體之光度,其比值之對數即為密度式:
 
        P0為照射在軟片上光度
        P1為穿透過軟片之光度
        D為散射透光之密度
        密度式:D=log(P0/P1)
 
     具體地說,密度通常由原始物件的對比所決定,例如微縮軟片(負片)無字跡部分,於拷貝複製片(正片)時,光線不透過底片,使正片無字跡部分,形成透明極佳之介質。而微縮軟片有字跡部分,希望光線盡量穿透。使正片字跡完全感光,形成純黑字跡,軟片無字跡部分,便為背景(Back ground),此透光性極為重要,一般常稱為背景濃度,或稱背景密度(Back ground Density)。一般來說,最大的密度-或者背景密度-是影像的深部分,那些最小密度是膠捲清楚的部分,那裡沒有影像。
微縮片理想密度數值,最大的密度在1.0到1.3範圍。不應該低於0.80。過低即屬不合格品質。
         0.80~1.40——允收限度(尚佳商製品質)
         0.90~1.30——甚佳品質
         1.00~1.20——極佳品質(工程圖微縮標準)
         0.80~1.00——極佳品質(原稿對比差文件)
         1.10~1.30——極佳品質(原稿對比強文件)
 
     不過就數位化轉換而言,在同一微縮膠捲內,密度是否前後能協調一致,比密度是否在1.0到1.3範圍內,更為重要。
 
4. 縮率
     微捲資料的縮率,會影響視覺資訊儲存於微捲上的總量,及數位影像中原始資料尺寸,因此與變換的品質有關,微縮資料軟片。主要有三種不同的類型:
(1)低倍率微縮資料軟片:微縮倍率在十五倍(15X)以下者,稱為低倍率微縮資料,早期流通者多屬之。
(2)中倍率微縮資料軟片:乃微縮倍率在十五至三十倍間的微縮資料屬之,最常使用者,唯一比二十四(1:24)倍的倍率。
(3)高倍率微縮資料軟片:就是微縮倍率在三十至六十倍間,均屬於高倍率微縮資料範圍,尤以一比四十二(1:42)倍的倍率,最受重視。
 
     除以上三種外,尚有特高倍率微縮資料軟片(60~90倍)及超級微縮資料軟片(150~210),但通常極少攝製,亦非一般閱讀機可供閱讀,實用性低。
與高倍率相比,通常低倍率容易獲得較高的轉換品質,而且最好,一項完整的拍攝的專案應該選擇一個縮率。如果這不可能,頂多單個膠捲應該用一縮率。變動的縮率,將引起轉換速度延遲。
 
5. 技術精確性:
     在早期攝製過程中,由於技術方面的不純熟或人為疏忽,影響微縮資料攝製品質,亦會影響數位化轉換的品質,應避免造成,或必須進行修整。
 
(三)由於微縮機保養不良所產生之疵病:
 
1.焦點不清晰:微縮機長久拍攝,而未善加保養,致使鏡頭上堆積灰塵。微縮片刮傷:微縮機運轉部分欠靈活。造成軟片刮傷,或部分邊緣擠傷。
2.文件影像重疊:微縮機進片運轉失靈,輪轉式微縮機文件自動餵料設備失靈,導致文件影像重疊。
3.影像內有異物:平枱式微縮機使用底光時,枱面不清潔而有污跡,或輪轉式微縮機內部反射鏡亦欠清潔。
4.文件密度不均:微縮作業室內自然光線,或其他照明設施未加控制,以致與微縮機照明光度重疊。
5.清晰度不均勻:由於微縮機放置不穩固,或微縮機老舊於操作時搖動,以及室內偶有震動,將產生全捲內焦點清晰度不均勻現象。
 
(四)由於作業員操作疏忽所造成之疵病:
 
1.文件歪斜:匆忙中放置文件,未待校正位置,即按踩拍攝鈕、爭取作業時間。歪斜失真應減到最小或者消除(2度以下)。
2.文件重疊:採用堆集原件拍攝方式時,未完成取走攝成文件,或未完成放置新文件,即行按踩拍攝鈕。
3.文件焦點不清:於拍攝書本式原件時,翻頁尚未完成,或翻頁後待放平整,即按踩拍攝鈕。
4.影像內有異物:微縮作業員匆忙操作,未待將鎮壓物放置妥當,甚至將操作者頭手攝入,均係作業程序未完成,即按踩拍攝鈕。
 

(五)操作手續

微縮作業人員,應針對機械因素及人為因素,以造成原可避免疵病之產生,於進行拍攝前需檢查微縮機運作狀況,並精心專意依序操作。

 
     針對微捲資料數位化趨勢,早期指導攝製微縮資料的標準及手冊,皆有補充說明,如IFLA的〈Microfilming for Digitisaton and Optical Character Recognition〉(2002),是針對《Guidelines for the preservation microfilming of newspapers》(1996)的補充,另外如〈RLG Guidelines for Microfilming to Support Digitization〉(2003),是針對《RLG Preservation Microfilming Handbook》(1992)《RLG Archives Microfilming Manual》(1994)的補充,透過這些補充說明,對於日後欲進行掃描而攝製的微縮資料,將有助於掃描速度及數位影像品質的提升。

 

三、數位影像品質檢驗

 

(一)逐張檢驗與抽驗
     關於檢驗的方式,通常必須至少有一次,由操作人員逐張檢驗掃描結果,但複驗的時候,或者委外數位化要進行驗收時,數量較少時,尚可逐張檢驗,但有時數量過於龐大,亦可採抽驗方式。若採分批抽樣檢驗方式,其抽樣方法及評量標準,必須依照中國國家標準(CNS2779):計數值檢驗抽樣程序及抽樣表,所規定抽樣數量做目視檢驗和客觀的量表檢驗。
 
(二)目視檢驗與量表檢驗:
     數位化影像品質管理的最好的方法,一方面包括主觀的目測,另一方面,也應該藉由客觀量度或測量軟體運作,為主觀的評量,建立客觀的規範和機制。
 
1. 目視檢驗
     多數情況下,對一幅影像首次評估瀏覽,是透過電腦顯示器觀看。有時候還必須重新修正掃描設備,並重新掃描,目視檢驗項目包括:
(1)檢查檔案是否可直接開啟。
(2)檢查各層資料夾、圖檔編號是否符合命名原則。
(3)檢查影像檔案大小及尺寸、色調、解析度、檔案格式。
(4)影像資料歪斜或歪斜度是否超過1度。
(5)是否有重複、漏頁、摺頁、皺折,是疏失造成或原件的情形。
(6)確認影像資訊的完整性,每頁影像邊緣留有0.5~1公分白邊。
(7)影像是否有干擾、雜訊或模糊不清。
(8)文字的可讀性。
(9)重要地方和陰影裡的細節。
 
2. 量表檢驗
     除了主觀的目測,亦需藉助測量表的使用,提升客觀性,並補充直接目測的不足之處,不過由於藉由量表評估分析影像品質甚為耗時,因此也必須考量評估的時效及花費。透過量表檢視項目包括:
(1)影像的解析度
(2)重要地方和陰影裡的細節
(3)色調值
(4)亮度
(5)對比
(6)銳利度
(7)噪音
 

    根據數位影像用途,及時間和花費考量,可選擇測量的項目。使用的測量表如RIT Alphanumeric Test Object、IEEE Std 167A.1-1995 Facsimile Test Chart、 AIIM Scanner Test Chart

2、Kodak Q13 Greyscale Control Bar、RIT and AIIM tests resolution,而AIIM亦建議使用RIT and AIIM tests resolution 、IEEE Std 167A-1987 Facsimile Test Chart校驗數位化的影像掃描器。

  

 
 <目錄>

[20]施威銘編,《數位相片編修聖經》,頁C-3

[21] RFP(96-5) for Conversion of Microfilm to Digital Images for the National Digital Library
[22]國家圖書館,〈數位資料委外製作需求規範〉,頁58
[23] 影像壓縮技術可分為兩大類:資訊保持的(information preserving)與耗損的(lossy)。採用無失真壓縮使得需被壓縮-解壓縮的影像沒有任何資訊的損失。如LZW編碼即為其中的一種方式。有損耗編碼則是犧牲重建影像的精確度去換取更多的壓縮。如果產生的失真可以被接受,其壓縮率是非常高的。對於影像壓縮更為詳盡的說明,可參看《數位影像處理》第八章,頁437554
[24] Australian Cooperative Digitisation Project, 1840-45
[25] Oversize Color Images Project Phase II
[26] RFP(96-5) for Conversion of Microfilm to Digital Images for the National Digital Library
[27] Digitization as a Means of Preservation?3
[28] The Tundra Times Newspaper Digitization Project
[29] Barram:A case study in local newspaper digitisation in Queensland
[30] 國家圖書館古籍文獻典藏數位化之現況與展望

        









Download: 微縮資料數位化工作流程指南  微縮資料數位化工作流程指南 (1.3 MB, 2,511 hits)



評分:

1 Star2 Stars3 Stars4 Stars5 Stars (No Ratings Yet)
Loading ... Loading ...

回應:


請輸入圖片中的文字
請按圖片取得圖片中文字的錄音檔
Click to hear an audio file of the anti-spam word