微縮資料數位化工作流程指南
Tags: none 發表: 2008-01-10, 點閱: 42,597 , 加入收藏櫃 , 列印 , 轉寄伍、物件數位化程序
「物件數位化程序」旨在說明說明數位化工作中,使用掃描設備之執行步驟和工作注意事項,及影像後製之工作執行步驟。工作包含一、建立色彩管理模式;二、文書檔案掃描程序;三、數位影像後製;四、數位影像備份及管理。建立色彩管理模式旨在說明藉由定期校色,使掃描影像之色彩能逼近於原始物件之色彩,包含電腦螢幕及掃描器的校色執行步驟。文書檔案掃描程序旨在說明檔案掃描之執行步驟及工作中需注意事項。數位影像後製旨在說明掃描完成後,影像校驗及轉檔工作之執行步驟和工作重點。數位影像備份及管理旨在說明數位影像完成校驗後,進行備份之工作重點,及備份載體之保存管理。
1.單行橫式(Simplex-Comic Format):組合排列方法,係影像與軟片垂直,每幅影像間,保持有固定距離,依次連續攝錄。
除上列四種最基本的組合方法外,尚採用複合影像式(Multiple images),於三二倍至五四倍縮率攝製時,將原始文件每次二頁、四頁或八頁,同時曝光攝錄,形成複合影像,可以參見以下轉錄自ISO 6199的圖示:
(四)在掃描階段期間,操作人員隨時可能重新掃描一幅不可接受影像,並且在舊的上面覆蓋這幅新近轉變的影像。 再掃描主要的原因包括:邊緣察覺軟體的失敗、 一張非常複雜的插圖的存在、在膠捲上的原物有一條突然不清楚的線,或者原物的歪斜超過10度等。
(五)為了改進外表和OCR準確性,影像有超過3度歪斜失真應該要校正。
(六)每頁影像檔案應該被剪裁到頁邊緣(並不到文本邊界),保留實際邊緣約到1/4英寸遠處。
除上述步驟外,當掃描時,拍攝的一些變化需要特別被考慮,以下列出十七點由美國國會圖書館提出的考量要素︰
․材料已經被全部拍攝在膠片位置上,包括單行橫式、單行直式、雙行單向式或雙行雙向式。
․在膠片裡原始材料的方向和項目或者頁的位置不同,每個捲盤也不同,基於原先尺寸,和不論在捲盤內的縮率保持一致被要求。
․膠片縮率變化 - -從收集到收集,從捲盤到捲盤,以及有時在同一捲盤內。然而,通常在10︰1到14︰1 範圍內。
․縮率的指示 - -用於捲盤的縮率經常不在解析度指標內表明,或者能夠被從尺標或比例拍攝解釋, 資料旁邊的解析度指標。更早期,解析度指標或者任何其他技術指標或者訊息,不可能在捲盤上任何地方拍攝。 此外,在捲盤內的縮率變化也很少被指示。
․尺標或比例 - -對於大多數手稿材料來說, 在拍攝過程中使用的縮率被顯示,透過包括在相同的膠片裡和在相同的縮率, 一部分一英寸和毫米比例在第一個手稿旁邊出現至少3英寸(7.62毫米)長。 當材料尺寸在縮率要求變化,至少另一個尺標應被拍攝。
․有時候,材料以淡的背景拍照,有時是黑色。這可能在確定資料的邊緣時引起一些困難,或者出現多重"邊緣"。 此外,膠片片幅在同一捲盤中突然從一白色背景移動到黑色內。
․雖然少數捲盤有鏈輪洞或者孔眼,有時在照像機底片或者正片裡, 他們最經常在正片上出現,因為他們存在於照像機底片,在正面被沖洗時轉移。 孔眼位置決不是"下一"片幅的邊緣位置的可靠指南。 不過,資料可能被拍攝,因此他們的訊息的內容延伸到鏈輪。 因此,鏈輪將在數位化影像內出現。
․複製暴光 - -原始的材料被在2A或者2個B 位置裡拍攝(每個片幅兩頁或者項目), 這有時導致正文和顏色或者連續色調或者半色調的黑白色的插圖存在於相同的片幅。 那個特別的片幅有時不止一次拍攝,使用不同的暴光,這幅雙頁的影像的每個部分可能被有效地擷取。 片幅在淡/ 黑暗背景的末端變化,也可能被不止一次拍攝。
․在膠片的那些資料的大小,可能有很大變化, 反映出在原先的文件收集尺寸,或者在捲盤裡縮率方面的變化。
․手稿和收集裡專題、連載小說和書的封面和封底,和為著作結束頁,可能被拍攝,如果慣例在那時提供書或者雜誌的一模一樣的摹本。
․一些資料(地圖,圖表,插圖)在膠片中分開。 原物的大小改變,為了保持相同的縮率,資料在連續的膠片上被分開拍攝。 一張圖表或者指標指示正確的順序,可能在這卷微縮膠捲上出現, 但是經常它沒被提供。 (參閱頁J-14,分裂物質目標)
․雖然在這卷微縮膠捲上的片幅不重疊,但是在軟片之間隔開在整個捲盤通常不完全一致。
․在已經被拍攝的手稿收集裡,片幅計算號碼有時在片幅的右下角裡或者沿著片幅的底部被發現。在這些片幅裡出現的數目,由自動計數器提供。計數器在每捲盤的開始000000。手稿的第一個文件夾是000001,第一個資料是000002等等,過去幾十年,片幅計算器沒被一貫使用於產生所有手稿收集膠片,並且數目經常不能被鑑定或者容易讀取。 就掃描而論,這訊息將在一件件工作基礎上做。
․空白頁可能被拍攝,經常絕對沒有訊息出現。
․影像色調的範圍︰ 圖書館的原始的原始資料和複製他們的微縮膠捲,就色調的範圍而言有變化。 雖然微縮膠捲是一種高的對比媒介,圖書館的膠捲,象很多圖書館和檔案生產的那些一樣,一定保護一些色調值。 因此,來自微縮膠捲的數位化的成像的最成功的方法,可能是在擷取時利用微縮膠捲的色調。[16]
以下以美國國會圖書館編號的資料架構為[18] ,很多文獻有雙面書寫;因此一張可能「包含」兩頁。關於手稿收集的微縮膠捲,如果它包含任何種類的標明,背面邊已經被拍攝。在膠片,一頁的背面邊總是繼正面之后出現。根據收集的不同,檔案命名可有不同數目,例如這數目可以達到6位數字,例如140862。文件名由安裝碼組成,創建6位數字,前面按需要可增加零。另外,字母a被增加給6位數字,表明這幅影像複製前面頁或者編號頁。例如,前面頁435的的影像將被分發文件名000435a. jpg(或者000435a. tif); 頁140826的前面的影像將被分發140862a. jpg(或者140862a. tif)。
分發目錄名字
|
影像
|
---|---|
lp000000 |
整個99頁的全部影像 |
lp000100
|
100-199 頁
|
lp000200
|
200-299 頁
|
按需要繼續……
|
4.處理
2.儲存媒體之外包裝
(4)同一檔案影像若有不同備份媒體,應該分置於不同場所,以防特殊狀況發生時,造成資料同時損毀。
(5)光碟拿取及置放時,嚴禁觸傷光碟表面,以免造成資料損毀,無法讀取。
註[16] RFP(96-5) for Conversion of Microfilm to Digital Images for the National Digital Library
註[17] The Setup Phase of Project Open Book
註[18] RFP(96-5) for Conversion of Microfilm to Digital Images for the National Digital Library
註[19] RFP(96-5) for Conversion of Microfilm to Digital Images for the National Digital Library
微縮資料數位化工作流程指南 (1.3 MB, 2,507 hits)