文書檔案數位化工作流程
Tags: none 發表: 2007-11-16, 點閱: 26,448 , 加入收藏櫃 , 列印 , 轉寄
「前置作業」旨在說明數位化工作進行前的準備工作,包含一、數位化方案選擇;二、工作規劃;三、文書檔案編整[2]。數位化方案選擇旨在說明影響數位化方案的因素,其中應以使用目的作為主要考量,並依此考慮數位影像規格及符合規格要求的設備。文中並說明各影像規格意涵及掃描設備的主要技術指標,作為影像規格設定及掃描器選購的參考依據。工作規劃旨在說明瞭解數位化方案後(包含影像規格及掃描設備),仍須瞭解典藏檔案的概況,據此方能結合數位化方案,制訂數位化工作規劃。因此必須制訂盤點計畫,對典藏檔案進行全面性的清查盤點,並制訂相關的工作規範,如影像的掃描校驗規範、檔案命名規範等。此外,針對破損檔案則需於掃描前提送修護裱褙,以利掃描工作的進行。文書檔案編整旨在說明檔案掃描前,需完成立案、編目等工作,並逐頁進行編頁,以方便掃描文件的命名及管理,前置作業各相關流程說明如下:
數位化方式並非單一一種,根據數位化目的、檔案狀況及經費、設備等考量,而有不同選擇。尤其以檔案數位化情形而言,因為不同時期保存下來的檔案狀況差異非常大,檔案紙質、形式及尺寸也參差不齊,加上檔案本身的價值亦有非常大的差異,因此在進行數位化工作之前,對檔案分類並選擇相應的數位化方式,就顯得相當重要。而對決策者而言,除對檔案狀況的瞭解外,亦需在觀念上對數位化工作的主要目的、影像規格的設定及相關的技術指標有所瞭解,並作為工作流程規劃的基礎知識,方可規劃出適當的數位化工作流程。
(一)影響選擇的因素
根據使用目的,檔案狀況及經費,得設定不同之影像規格及掃描設備進行數位化工作。
1.根據使用目的:
(1)典藏級圖檔:根據檔案鑑定具有重要價值或特殊意義之檔案,可藉由數位化製作高品質的數位影像,其目的僅作永久典藏。影像品質要求不失真,盡量符合原件狀況。
(2)商務級圖檔:若檔案數位化目的需提供未來加值處理,如提供印刷、複製、單位間交換及販售、文字辨識等。影像品質需符合輸出印刷之要求。
檔案數位化之前,應根據其使用目的與以分類,並選擇相應的規格作為數位化的儲存標準。若有典藏之需要,則以典藏級圖檔作為數位化之標準,若僅以提供清晰完整的檔案內容為目的,則只需儲存商務級圖檔之規格即可。至於網路瀏覽級圖檔,可直接由典藏級圖檔或商務級圖檔轉換。藉由事先分類,可減少無謂的資源浪費並加快數位化工作的進展。
2.根據文書檔案之性質:
由於文書檔案之數量通常非常龐大,因此對於檔案數位化方式、影像規格等相關決策的考量,檔案的數位化必須同時考慮品質及數量,其影響將涉及日後數位化的速度及進度安排、數位檔案的儲存空間等。其次,就檔案的資訊價值來說,由於檔案包含手稿、鉛印字等,其字體大小亦有很大的差異,因此其數位影像應考慮以清晰完整呈現檔案內容為原則。第三點需注意的是,由於文書檔案為紙質文件,容易產生脆化、破損,因此在設備的選擇上,亦應以不傷害檔案為最優先考量。
3.根據檔案尺寸大小:
檔案尺寸大小除影響數位影像的規格外,亦直接影響到掃描設備及掃描流程的選擇:
(1)小於A3尺寸之檔案得使用平台式掃描器,大於A3尺寸之檔案得使用大尺寸彩色掃描器,大於A3尺寸之檔案且無法使用大尺寸彩色掃描器者,或由於經費有限,無法同時採購平台式掃描器及大尺寸彩色掃描器,得以平台式掃描器將檔案區分數次掃描。
b.需具有平台式掃描器及大尺寸彩色掃描器,先將大於A3尺寸之檔案取出,與小於A3尺寸之檔案分開處理,待檔案分別掃描完成後,再將大於A3尺寸之檔案歸回原檔案位置,或者不歸回原檔位置,而另行存放管理。[3]
(3)尺寸較小之檔案,需考量其日後放大輸出、印刷之使用,應提高其掃描之解析度。
(二)數位影像規格說明
數位影像規格主要涉及影像的色彩空間、解析度及格式等,至於如何決定數位影像的規格標準,其考慮因素則是根據其日後使用目的來決定。此點在上文中已進行說明,下文則針對數位影像規格中,主要的項目進行說明,以提供數位化工作者,設定數位影像標準規格及選購掃描設備時的參考。
1.色彩空間種類
(2)RGB
(3)CMYK
A:CMYK代表著Cyan(青)、Magenta(洋紅)、Yellow(黃)、與Black(黑)這4種減色系統列印墨色。
B:CMYK是一種「與裝置有關」(裝置相依)型色彩空間,最終會獲得怎樣的顏色取決於使用的裝置。
2.影像解析度
輸出場合
|
輸出解析度
|
---|---|
電腦螢幕
|
72~100 ppi
|
噴墨印表機
|
240~360 ppi
|
平面印刷
|
266~300 ppi
|
相紙印刷
|
200~400 ppi
|
報紙
|
125~250 ppi
|
模造紙
|
200~265 ppi
|
銅板紙
|
250~350 ppi
|
3.影像格式[5]
(3)JPEG儲存的過程可以決定壓縮的層級,如果選擇高壓縮的方式,則影像的品質會降低,而低壓縮的方式,會使影像的品質較接近原來的影像圖,由於JPEG格式會造成影像細節的流失,因此也不適合作為原始資料的保存圖片。但因高效率的壓縮方式使得檔案變得很小,因此適合放在網路上供人瀏覽。
(4)BMP是Windows小畫家的檔案格式,此格式相容於大多數Windows和OS/2平台的應用程式。另外BMP在儲存時也可以使用RLE的壓縮格式,不過只有在256色或是16色時才能用此壓縮方式,壓縮效果不是很好。
(5)PDF格式使用在Adobe Acrobat這套電子出版軟體中。這種格式可以應用在Unix、Dos、Macintosh、Windows等不同的平台。可以考慮製作一系列的PDF檔結合影像跟文字再下傳給使用者透過Acrobat Reader來瀏覽這些文件。
(6)PNG格式的發展主要是用來取代GIF格式,它保存了比GIF更多的色彩資訊,另外它也是採用非破壞性的壓縮方式,壓縮效果也比GIF更好一點。但是由於還未全面支援,因此這種檔案格式並未被普遍採用。
格式
|
檔案大小
(A4,全彩,RGB)
|
壓縮
失真
|
瀏覽器支援
|
適用時機
|
---|---|---|---|---|
TIFF
|
約25M
|
否
|
否
|
保存圖片
|
GIF
|
約3~5M
|
否
|
是
|
網路上預覽
|
JPEG
|
約4~5M
|
是
|
是
|
網路上瀏覽
|
JPEG
2000
|
約4~5M
|
否
|
是
|
網路上瀏覽
|
BMP
|
約25M
|
否
|
否
|
保存圖片
|
PDF
|
約240K
|
是/否
|
否
|
下載 |
PNG
|
約5~6M
|
否
|
是
|
網路上預覽
|
(三)掃描設備說明
影響掃描器的選擇主要包含檔案原件狀況、數位影像標準規格等,若從檔案原件狀況來考量,掃描檔案時適用的掃描器種類,主要為平台式掃描器和大尺寸彩色掃描器。若從符合數位影像標準規格而言,則需進一步瞭解掃描器的主要技術指標,以作為選擇的考量。而其技術指標主要為掃描解析度、動態範圍、色彩位元、感光元件等。
1.檔案適用的掃描器種類
(2)大尺寸彩色掃描器
大尺寸彩色掃描器專為大尺寸文件而設計,可以處理大尺寸彩色海報、建築圖、地圖、工程圖及美工圖形等。由於大尺寸彩色掃描器採用饋紙式進紙,因此紙質過於脆弱或厚度太厚之檔案,無法使用。
(3)特殊類型掃描器
2.掃描解析度
3.動態範圍
4.色彩位元
5.感光元件
6.掃描速度
(四)數位化選擇方案
基於數位影像使用目的、檔案狀況及影像規格、掃描器的說明,以下提出數位化方案,以供數位化工作之規劃之選擇。
1.根據檔案數位化之使用目的、影像品質的呈現、影像檔案大小及瀏覽器支援問題等,可儲存為以下三種格式:
(1)典藏級圖檔:RGB 24bit全彩,200~300ppi,TIFF(無壓縮):
若檔案數位化目的在於保存具有重要價值意義的檔案文件,數位影像應以盡量符合原件為原則,因此在選擇上以RGB 24bit全彩,TIFF不失真
的格式為優先考慮,至於在解析度的考量上,由於檔案內容多以文字、表格為主,因此雖然以300ppi為優先考慮,但若檔案數量龐大並涉及經
費及數位化時程的整體考量時,亦可考慮以200ppi作為儲存規格。
(2)商務級圖檔:RGB 24bit全彩,200~300ppi,JPEG(無壓縮):
說,200ppi,JPEG應是一種較符合經濟原則的規格。
(3)網路瀏覽級圖檔:RGB24bit全彩,150ppi,JPEG(視情況決定壓縮比例,以不超過75%為原則):
2.選擇掃描器應以不破壞原始文件為原則,若紙質較脆弱者,以平台式掃描器為宜。
3.小尺寸檔案之解析度,依其日後可能之放大倍率決定,其計算方式為:300 ppi×放大倍率=掃描之解析度
4.即使相同的影像規格,因搭配不同的掃描設備,其最後呈顯的數位影像亦會有不同的效果,因此仍須進行實際測試,以確定最後產出之品質。
檔案尺寸
|
圖檔等級
|
影像規格
|
掃描器
|
||
---|---|---|---|---|---|
色彩模式
|
解析度
|
格式
|
|||
A3以下
|
典藏級
|
RGB 24bit
|
200~300ppi
|
TIFF
|
平台式掃描器
|
商務級
|
200~300ppi
|
JPEG
|
|||
A3以上
|
典藏級
|
200~300ppi
|
TIFF
|
大尺寸色掃描器
|
|
商務級
|
200~300ppi
|
JPEG
|
|||
小尺寸檔案
|
典藏級
|
依放大倍率決定
|
TIFF
|
平台式掃描器
|
|
商務級
|
JPEG
|
在瞭解數位化相關方案後,還需對典藏檔案進行清查盤點,以瞭解檔案實際狀況及確立數位化方案,並據此制訂相關的工作規範,使工作人員執行工作時,有所依據。而破損檔案也需在掃描前,先進行修補或裱褙。
1.盤點準備
檔案管理單位應就所保管檔案,於數位化工作進行前,進行檔案清查作業,以利後續規劃數位化工作的進行。
h.浮貼張數
(4)檔案管理人員應就清查範圍,先確認檔案已依檔號順序上架並放置適當位置,以利清查作業進行。
2.盤點
3.處理
A.檔案盤點清單所列之案由或檔號確實有誤者,應依檔案編目規範,修正目錄之相關紀錄。
(二)檔案修護原則
(1)檔案所屬單位
(三)制訂工作規範
檔案掃描前需依據檔案管理相關法規及辦法進行整編,並依序逐件編頁,以利掃描工作進行。
(二)檔案編頁
文件左上角標明檔案編號(全宗號-系列號-宗號- 冊號- 文件號-頁碼),置於三孔透明夾內,再於透明夾上標明檔案編號。[10]
(三)建置目錄清冊
2.目錄清冊建置完畢需再次校對,以確認無誤。
<目錄>
[2]前置作業中,「工作規劃」及「文書檔案編整」之工作項目,可能涉及各單位進行數位化前之工作方式或行政管理流程,並且亦有許多與檔案管理相關之規範及專著可供參考,但為顧及流程的完整性,在本文中仍列入相關章節,僅供參考。
[3]大尺寸檔案通常是以折疊方式收藏於卷中,在進行掃描過程中,會將原檔展開掃描,必要時還會進行裱褙修補,因此掃描完成後,若要歸回原位,則勢必需重新折疊,若另行設計空間存放管理,則大尺寸檔案可避免再次折疊受損。
[4]施威銘編,《數位相片編修聖經》,頁C-3。
[5]國家圖書館,〈數位資料委外製作需求規範〉,頁5~8。
[6]影像壓縮技術可分為兩大類:資訊保持的(information preserving)與耗損的(lossy)。採用無失真壓縮使得需被壓縮-解壓縮的影像沒有任何資訊的損失。如LZW編碼即為其中的一種方式。有損耗 編碼則是犧牲重建影像的精確度去換取更多的壓縮。如果產生的失真可以被接受,其壓縮率是非常高的。對於影像壓縮更為詳盡的說明,可參看《數位影像處理》第 八章,頁437~554。
[7]以傳統電腦顯示器而言,解析度大多為75dpi,若以液晶螢幕而言,則為96dpi~120dpi之間。
[11]請參照中研院近史所檔案館,〈大於A3尺寸檔案掃描規範〉及洪淑芬著,《文獻典藏數位化的實務與技術》頁44~45。
文書檔案數位化工作流程參考標準 (361.4 KB, 2,775 hits)