1024x768 1280x800   Decrease font size for  - 拓展台灣數位典藏 - 數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫網站 Reset to normal font size for  - 數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫網站 - 拓展台灣數位典藏 Increase font size for  - 拓展台灣數位典藏
 


微縮資料數位化工作流程指南

Tags: none 發表: 2008-01-10, 點閱: 42,597 , 加入收藏櫃 , 列印 列印 , 轉寄 轉寄

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

伍、物件數位化程序
        

 

一、微縮資料數位化步驟

二、檔案命名

三、數位影像後製

 


     「物件數位化程序」旨在說明說明數位化工作中,使用掃描設備之執行步驟和工作注意事項,及影像後製之工作執行步驟。工作包含一、建立色彩管理模式;二、文書檔案掃描程序;三、數位影像後製;四、數位影像備份及管理。建立色彩管理模式旨在說明藉由定期校色,使掃描影像之色彩能逼近於原始物件之色彩,包含電腦螢幕及掃描器的校色執行步驟。文書檔案掃描程序旨在說明檔案掃描之執行步驟及工作中需注意事項。數位影像後製旨在說明掃描完成後,影像校驗及轉檔工作之執行步驟和工作重點。數位影像備份及管理旨在說明數位影像完成校驗後,進行備份之工作重點,及備份載體之保存管理。
     

一、微縮資料數位化步驟

 

微縮資料數位化通常包含以下主要步驟:
(一)數位化複製品應該由微縮膠捲的副本製成,並且為一清潔過的第二代銀負片複製品。並將微縮膠捲的捲盤安裝在校正過的掃描器上,掃描器的各種參數,依據掃描試驗結果輸入及調整,並以一種連續的模式開始掃描。
(二)掃描技術規格的設置,包括解析度、格式、位元深度等,可參閱後面章節的說明,一般為400 dpi,1-bit,TIFF6.0無壓縮。或解析度300 dpi,8 -bit的灰階等級(與原始的材料有關)。
(三)用微縮法攝製之內容排列有所不同,掃描方式也略有不同,以捲狀微縮軟片為例,一般來說,影像組織排列方式,有單行橫式、單行直式、雙行單向式、雙行雙向式等多種組合排列方法,因實際需要不同略異:

1.單行橫式(Simplex-Comic Format):組合排列方法,係影像與軟片垂直,每幅影像間,保持有固定距離,依次連續攝錄。

2.單行直式(Simplex-Cine Format):組合排列方法,係所有影像全依次序連續攝錄,每幅影像間隔,十分均衡。
3.雙行單向式(Duplex Format):組合排列方法,係每幅影像攝錄在軟片的一半寬度內,全部文件平行攝影,依順序連續攝錄,直至軟片末端終止。
4.雙行雙向式(Duo Format):組合排列方法,係軟片的一半,依順序連續攝錄,直至末端,再反向按次序攝錄,在另一半的軟片上。

 

     除上列四種最基本的組合方法外,尚採用複合影像式(Multiple images),於三二倍至五四倍縮率攝製時,將原始文件每次二頁、四頁或八頁,同時曝光攝錄,形成複合影像,可以參見以下轉錄自ISO 6199的圖示:

 
 
 
資料來源:ISO 6199
 
 
 
資料來源:ISO 6199

 

 

      掃描時須特別注意的是每片幅兩頁以上之膠捲,應該被分成單獨的影像檔案(並且分發合適的後設資料)。通常作法是先掃描至書的末端,操作人員將膠捲倒轉到書的開始,並重新設置掃描器,以便片幅的下半部分,再次成為一單個頁,可以被掃描。

(四)在掃描階段期間,操作人員隨時可能重新掃描一幅不可接受影像,並且在舊的上面覆蓋這幅新近轉變的影像。 再掃描主要的原因包括:邊緣察覺軟體的失敗、 一張非常複雜的插圖的存在、在膠捲上的原物有一條突然不清楚的線,或者原物的歪斜超過10度等。

(五)為了改進外表和OCR準確性,影像有超過3度歪斜失真應該要校正。 

(六)每頁影像檔案應該被剪裁到頁邊緣(並不到文本邊界),保留實際邊緣約到1/4英寸遠處。

     

      除上述步驟外,當掃描時,拍攝的一些變化需要特別被考慮,以下列出十七點由美國國會圖書館提出的考量要素︰

 

材料已經被全部拍攝在膠片位置上,包括單行橫式、單行直式、雙行單向式或雙行雙向式。

 

在膠片裡原始材料的方向和項目或者頁的位置不同,每個捲盤也不同,基於原先尺寸,和不論在捲盤內的縮率保持一致被要求。

 

膠片縮率變化 - -從收集到收集,從捲盤到捲盤,以及有時在同一捲盤內。然而,通常在10︰1到14︰1 範圍內。

 

縮率的指示 - -用於捲盤的縮率經常不在解析度指標內表明,或者能夠被從尺標或比例拍攝解釋, 資料旁邊的解析度指標。更早期,解析度指標或者任何其他技術指標或者訊息,不可能在捲盤上任何地方拍攝。 此外,在捲盤內的縮率變化也很少被指示。

 

尺標或比例 - -對於大多數手稿材料來說, 在拍攝過程中使用的縮率被顯示,透過包括在相同的膠片裡和在相同的縮率, 一部分一英寸和毫米比例在第一個手稿旁邊出現至少3英寸(7.62毫米)長。 當材料尺寸在縮率要求變化,至少另一個尺標應被拍攝。

 

有時候,材料以淡的背景拍照,有時是黑色。這可能在確定資料的邊緣時引起一些困難,或者出現多重"邊緣"。 此外,膠片片幅在同一捲盤中突然從一白色背景移動到黑色內。

 

雖然少數捲盤有鏈輪洞或者孔眼,有時在照像機底片或者正片裡, 他們最經常在正片上出現,因為他們存在於照像機底片,在正面被沖洗時轉移。 孔眼位置決不是"下一"片幅的邊緣位置的可靠指南。 不過,資料可能被拍攝,因此他們的訊息的內容延伸到鏈輪。 因此,鏈輪將在數位化影像內出現。

 

複製暴光 - -原始的材料被在2A或者2個B 位置裡拍攝(每個片幅兩頁或者項目), 這有時導致正文和顏色或者連續色調或者半色調的黑白色的插圖存在於相同的片幅。 那個特別的片幅有時不止一次拍攝,使用不同的暴光,這幅雙頁的影像的每個部分可能被有效地擷取。 片幅在淡/ 黑暗背景的末端變化,也可能被不止一次拍攝。

 

在膠片的那些資料的大小,可能有很大變化, 反映出在原先的文件收集尺寸,或者在捲盤裡縮率方面的變化。

 

手稿和收集裡專題、連載小說和書的封面和封底,和為著作結束頁,可能被拍攝,如果慣例在那時提供書或者雜誌的一模一樣的摹本。

 

一些資料(地圖,圖表,插圖)在膠片中分開。 原物的大小改變,為了保持相同的縮率,資料在連續的膠片上被分開拍攝。 一張圖表或者指標指示正確的順序,可能在這卷微縮膠捲上出現, 但是經常它沒被提供。 (參閱頁J-14,分裂物質目標)

 

雖然在這卷微縮膠捲上的片幅不重疊,但是在軟片之間隔開在整個捲盤通常不完全一致。

 

在已經被拍攝的手稿收集裡,片幅計算號碼有時在片幅的右下角裡或者沿著片幅的底部被發現。在這些片幅裡出現的數目,由自動計數器提供。計數器在每捲盤的開始000000。手稿的第一個文件夾是000001,第一個資料是000002等等,過去幾十年,片幅計算器沒被一貫使用於產生所有手稿收集膠片,並且數目經常不能被鑑定或者容易讀取。 就掃描而論,這訊息將在一件件工作基礎上做。

 

空白頁可能被拍攝,經常絕對沒有訊息出現。

 

不規則事物目標︰ 異常或者不規則事物可能註明於出現於捲盤首位的說明材料, 但是關於特定頁/片幅的不規則會出現,代替材料和在跟隨的材料的第一個片幅之前出版。

 

影像色調的範圍︰ 圖書館的原始的原始資料和複製他們的微縮膠捲,就色調的範圍而言有變化。 雖然微縮膠捲是一種高的對比媒介,圖書館的膠捲,象很多圖書館和檔案生產的那些一樣,一定保護一些色調值。 因此,來自微縮膠捲的數位化的成像的最成功的方法,可能是在擷取時利用微縮膠捲的色調。[16]

 

操作人員需保持掃描日誌,表明掃描的材料、日期、一般的描述、例外的問題以及不規則事物和異常類型等。
   

 

二、檔案命名

     在檔案命名階段,操作人員有最好的機會執行一張張影像的品質管理,包括選擇的影像的檢驗印刷品的產生。不可接受影像可立即被重新掃描,或者標註,並在更晚的階段再掃描[17] 
操作人員依據檔案命名規則為數位化影像命名,檔案命名規則並沒有絕對,主要是提供檔案一個唯一的識別符號,並且透過符合邏輯的設計,可更容易從檔名瞭解檔案的基本屬性,使操作人員或管理人員,更容易掌握檔案的情況及管理。

     以下以美國國會圖書館編號的資料架構為[18] ,很多文獻有雙面書寫;因此一張可能「包含」兩頁。關於手稿收集的微縮膠捲,如果它包含任何種類的標明,背面邊已經被拍攝。在膠片,一頁的背面邊總是繼正面之后出現。根據收集的不同,檔案命名可有不同數目,例如這數目可以達到6位數字,例如140862。文件名由安裝碼組成,創建6位數字,前面按需要可增加零。另外,字母a被增加給6位數字,表明這幅影像複製前面頁或者編號頁。例如,前面頁435的的影像將被分發文件名000435a. jpg(或者000435a. tif); 頁140826的前面的影像將被分發140862a. jpg(或者140862a. tif)。

     而出現在膠捲的全部背面頁,將被建立數位化影像。這些將收到與前面相同的數目,用字母b代替字母a,作為在文件名裡的第7 字符。例如,如果這卷微縮膠捲包含前面的影像,和在435頁號后面,兩幅影像將被分發文件名000435a. jpg(或者000435a. tif)和000435 b.jpg(或者000435 b.tif)。在那時,為特定編號資料收集的工作被分發,圖書館將提供寫入教學,檢索的複製(已出版和/或用機器可讀形式),並且也將標明樣品捲盤,為捲盤標頭的訊息和相似的特徵,顯示典型的圖案。
    有頁碼的手稿收藏通常全部接連編號。但不超過200頁(100張),將被在交付的目錄裡歸類。 因此分發到每份目錄的名字,將表明包括在內頁碼。數量限制便於在圖書館處理變得容易。以下表格為林肯文件的一種目錄架構:
 

 

表4、目錄架構

分發目錄名字
影像

lp000000
注意到︰"lp"代表"林肯文件"

整個99頁的全部影像
(
例如,000001.tif直到000099.tif)

lp000100
100-199
lp000200
200-299
按需要繼續……

       

三、數位影像後製
     影像掃描完畢後,需針對影像需求,進行後製處理,並確實校驗,已確保掃描影像之品質,其步驟及要求如下:
(一)特定影像處理
1.對比:若後續需要進行文字辨識的處理(OCR),不管提供掃描的膠捲對比如何,全部交付的影像將複製原件的對比,如紙是白色的,墨水是黑色的。
2.旋轉:在被交付的數位影像內,原先資料的頂端,將在顯示器頂端出現,而不管在膠捲裡的資料的方向為何。
3.剪裁:在很多圖書館收藏的微縮膠捲,特別是手稿,真正的資料在一個更大的膠片內拍照,資料大約只佔膠片的一半,因此有需要進行影像剪裁:
(1)至少,數位影像複製微縮膠捲,即未剪裁的膠片。
(2)當收集(或者在收集內的整個膠捲)包含相同大小件(在一個更大的膠片內)的資料影像時,可以允許「剪裁視窗」建立,這剪裁視窗將用來生產一連串少於全幅膠捲的數位影像。
(3)實際資料在任何情況下都不能被剪裁,需要整張/頁展示。「在文件的邊緣以外裁切」可保證資料的完整性。即允許頁的邊緣在數位化的複製品裡顯示。另外,書的微縮膠捲經常顯示書頁的邊緣,這亦被認為是資料的部分而不裁切。
(4)當原始資料的影像擴大到膠片的扣連齒孔,扣連齒孔的部分將被歸入數位化影像,因此整個資料被擷取。
4.在片幅內的剪裁:一些微縮膠捲幀由兩頁組成,透過數位化程序可產生分開的單幅影像,但這往往需要更高的設備要求,這些任務細節於計畫初期即被確定。但若缺乏足夠的設備要求,亦可同時掃描兩頁,日後在進行裁切。[19]
 
(二)影像校驗
1.影像掃描完成或進行轉檔後,由作業人員進行校驗,並至少由專人逐件逐頁進行複驗一次以上。
2.如果發現有一個檔案有問題,應仔細檢查附近影像檔案。在很多實例裡,問題常成群出現,因此需查明問題的範圍,以便他們可能被修正。
3.校驗參考依據
初校主要為進行直接校驗,以人員直接用目力檢視,複驗除直接校驗外,還需藉由儀器或測試表進行檢驗,必須符合標準條件。
(1)直接校驗:
A.檢查檔案是否可直接開啟。
B.檢查各層資料夾、圖檔編號是否符合命名原則。
C.檢查影像檔案大小、解析度、檔案格式、色彩模式。
D.影像資料歪斜或歪斜度是否超過1度。
E.是否有重複、漏頁、摺頁、皺折。
F.確認影像資訊的完整性,每頁影像邊緣留有0.5~1公分白邊。若是接圖掃描影像,確認影像重複3~5公分。
G.影像是否有雜訊或模糊不清
(2)進階校驗
使用測量表進行測量,可參閱後文品質管理章節。

4.處理

(1)若原件有污點或歪斜,保留原件原貌,但需於清單上註記,以利後續處理。
(2)如發現非原件本有之影像瑕疵或其他異常狀況,應登記於校對紀錄表,重新掃描或修正:
A.檔名錯誤,需重新修正。
B.影像的資訊在掃描過程中丟失或歪斜,需重新掃描而不是利用影像編輯軟體去修正,以免導致影像的色彩範圍變窄。
 
(三)影像轉檔
    待影像校驗確認無誤後,可根據影像使用目的及規定之影像規格,進行轉檔或壓縮,並建立影像清單以方便管理,其處理步驟如下:
1.單張影像或多張影像批次轉檔或壓縮,可用相關影像處理軟體處理,其具體操作請參考軟體之操作說明。
2.轉檔完成之影像,需逐張進行比對校驗,已確保轉檔無誤及保證影像之品質。
3.依據原始影像檔及轉檔完成之影像,建立影像清單,欄位需包含:
(1)資料夾層級及名稱
(2)檔名
(3)影像規格
(4)影像大小
(5)製造日期
 
(四)數位影像備份及管理
    影像掃描完成,需以不同之儲存載體進行備份,以免發生意外時,造成數位影像完全損毀或遺失。
1.儲存媒體及燒錄
(1)儲存媒體包括CD光碟、DVD光碟、磁帶、硬碟及磁碟陣列。對影像圖檔至少需以DVD光碟進行備份一份,在經費許可範圍內,可再選擇磁帶、硬碟或磁碟陣列進行備份。
(2)同一卷之檔案影像需燒錄於同一片或編號相鄰之光碟內,並將每片光碟所包含之影像圖檔名稱、檔案大小、影像製作日期等,以readme. txt檔製成電子說明檔,燒錄於同一片光碟中。
(3)光碟備份需整理光碟清單,以核對光碟數量是否正確。

 

2.儲存媒體之外包裝

(1)每片光碟片需有單片塑膠硬式外盒包裝保護。
(2)備份之光碟盒需以雷射列印或書寫光碟專用之無酸軟毛筆等方式,註明單位名稱、檔案名稱、光碟編號及檔號起迄,以方便管理及查找。
 
3.儲存媒體保管之原則
(1)數位檔案進行轉製備份後,需進行校驗,檢視數位檔案的完整性、可讀取性、檔案大小、影像規格等與清單是否相符、若發現異常時,需登記於登錄表並重新製作。
(2)檔案影像備份之DVD光碟需置於具溫濕控制之儲物櫃中。
(3)建立光碟移轉機制,針對不同儲存媒體,訂定重新備份之政策,並每年對光碟進行檢測,若光碟有異常狀況,應立即進行備份,以免發生數位影像損毀。

(4)同一檔案影像若有不同備份媒體,應該分置於不同場所,以防特殊狀況發生時,造成資料同時損毀。

(5)光碟拿取及置放時,嚴禁觸傷光碟表面,以免造成資料損毀,無法讀取。


[16] RFP(96-5) for Conversion of Microfilm to Digital Images for the National Digital Library
[17] The Setup Phase of Project Open Book
[18] RFP(96-5) for Conversion of Microfilm to Digital Images for the National Digital Library
[19] RFP(96-5) for Conversion of Microfilm to Digital Images for the National Digital Library
                   









Download: 微縮資料數位化工作流程指南  微縮資料數位化工作流程指南 (1.3 MB, 2,507 hits)



評分:

1 Star2 Stars3 Stars4 Stars5 Stars (No Ratings Yet)
Loading ... Loading ...

回應:


請輸入圖片中的文字
請按圖片取得圖片中文字的錄音檔
Click to hear an audio file of the anti-spam word