地圖圖資數位化工作流程指南
Tags: 地圖, 指南, 數位化工作流程 發表: 2009-10-06, 點閱: 61,927 , 加入收藏櫃 , 列印 , 轉寄
「前置作業」為執行數位化前的準備工作,物件整理編目、決定成品未來應用方向、選擇機備、評估成本、設計資料庫等,簡言之即為「數位化工作規劃」。事前規劃越清楚詳細,對於之後實際執行數位化工作有很大的助益。因數位典藏國家型科技計畫大部分的計畫,數位化資料量極多,作業時間長,參與人員也多,為使工作始終有具體之規則可依循,確保工作前後一致性,並保障數位化工作的品質,事前規劃擬定規範是必要的。然而在執行數位化工作的過程當中,遇到特殊的狀況或是評估錯誤,需檢討與回溯調整,或多或少會發生,但就上述而言,事前規劃越詳盡,考量越清楚,發生錯誤的機率就降低,即便須回溯調整也能快速掌握問題所在,縮短修正時間。主要工作可分為四部份:一、數位化物件資料狀況了解;二、評估設備及成本效益(數位化方案選擇);三、訂定數位化規格標準;四、制定數位化工作流程規範。
(一)盤點及建立清單[10]
盤點並製成詳細清單和表格是了解數位化物件資料狀況的最佳方式,仔細將件數、尺寸、保存狀況等依照卷、冊、件順序紀錄清楚。詳細的註記方式亦可詢問博物館或圖書館之資深管理人員,因其有豐富經驗且長期處理相關工作,可以給予許多參考意見。例如:整理時會遭遇的問題、何種狀況該如何註記、檔案的編排等等。之後將這些盤點清單登錄電腦中,以便日後檢視。
(二)整理編目
在對地圖資料編目整理時,必須考慮其資料特徵,以達到透過目錄揭示資料、方便使用之目的。地圖與普通圖書檔案相比,在文獻的性質上既有同一性,例如:都是記載自然和人類社會的活動,都有紙質和非紙質的材質。但特殊性在於,地圖多種類的形態,如:單幅地圖,地球儀,立體模型圖,布、絹等織物上繪製的地圖;不同的表現方法和技術,如:有其獨特綜合歸納地理事物的方法,有系統的製圖符號,對自然和人類社會活動有獨特的研究視角等,須加以考量,可參閱地圖類編目原則。[11]
(三)檔案的命名
圖資檔案的命名方式,是以特定的文數字、區段,盡可能表達資料所有的狀況,此步驟有助於後續數位化工作,可立即辨別是否需修補及採用何種機備進行數位化,便於未來的分類規劃。需注意的是,檔案的命名的設計應該配合資料庫系統的建置,以便利未來撰寫檢索程式,行政院文化建設委員會「國家文物資料庫」有簡易檔案命名規則可供參考。此外,檔案命名時還需注意電腦作業系統的命名規則,以免後續轉入資料庫或於網路上顯示時產生錯誤訊息。例如WindowsXP/2000系統下,檔名加附加檔名的最大長度不能超過255字元,允許空白和數字,但不允許出現*/<>”\:|?之字元和Aux、Com1、Com2、Com3、Com4、Con、Lpt1、Lpt2、Lpt3、Prn、Nul等檔名。
(四)選定數位化物件
對數位化物件有一定了解之後,再進行選件,依:1.文物珍貴性、2.保存難易度、3.應用價值三個層面去考量,通常以較珍貴、保存不易,應用價值高者,為優先數位化之物件。此步驟是爲考量成本與效益,若只有少量且單純之物件,當然可以全部進行數位化,反之大量且繁雜的圖資檔案,在時間與成本限制的條件下,應考量如何妥適規劃,以免無法如期完成所有物件,徒留遺珠之憾。然而,評估選件此一過程不易,除了要具備相當專業知識也應有豐富市場經驗之人,才能正確評斷出優先順序,建議不妨多請教圖資領域中經驗豐富之學者、博物館館員,或尋找相關資料以獲得最好的決策。
在規劃數位化方案過程中,評估成本與效益是最為數位化工作者所關切的課題。譬如:應採用何種軟硬體設備?價格多少?人力配置成本?時間效率問題等。不同的狀況須採用的設備不同,規劃的人力與採用設備也有關係,關於地圖掃描軟硬設備規格及介紹,將於後專章說明。
(一)評估設備
在評估成本之前,可先了解地圖圖資物件的幾個分類方式,據以選擇適合的設備:
1. 樣式分為:紙類媒材、底片或相片。
一般所見之地圖大部分為紙類媒材;航空影像則為相片、底片。以掃描器機構而言,紙類及相片皆為反射稿,適用一般的掃描器;底片則為透視稿,需有加裝光罩或光板的平台掃描器或是底片專用掃描器。
2. 保存狀況主要可分為:平整完好、摺痕或破損輕微(需修補)、破損嚴重不掃描三種。保存狀況亦會影響掃描器之選擇,紙質脆弱狀況不佳者,不應使用饋紙式掃描器,以免損壞原稿;若折痕過於明顯,得用特殊數位化方式如:真空吸氣台整平,以數位機背翻拍。
3. 圖幅大小:≦A3;≦A3~≧A0;>A0
圖幅小於A3者,選用一般平台的掃描器;≦A3~≧A0者,可採用大尺寸饋紙式掃描器;大於A0之特殊大圖,則改以高解析度數位機背翻拍。
4. 色彩:彩色稿、黑白稿。
視其需要選用不同模式的掃描器,如:彩色或黑白型掃描器。
依據不同分類方式,數位化方案選擇可用簡易流程圖來說明:
圖3-1、地圖掃描方案選擇流程圖
資料來源:《技術彙編2002》,地圖數位化相關設備與規格4-1
(二)基本人力規劃
1. 前置作業階段
從盤點清單之建立到檔案之命名作業,只要事先訂定規則及對照表,再視資料量大小,假由數名工讀生進行即可,惟須有專業人員陪同監督及校驗,以確保資料無誤。
2. 物件數位化階段
一至兩名掃描人員,因其工作較簡單且重複性高,在預算不足情況下,可聘請工讀生進行,後續圖像校驗工作則須由具備專業圖像處理技術的人員。
3. 後設資料及資料庫建置階段
資料庫或網頁的設計應聘請具備此專長或經驗之資訊人員,後設資料的著錄需稍具相關專業背景人員執行,或制定著錄規範細則,交由工讀生登錄。
(三)其他耗材成本
此外,數位化工作也需要一定量之耗材成本,譬如:紙張、圖套、棉質手套、清潔刷、清潔液、口罩、光碟片、修補膠帶等。
(一)數位圖像檔案規格
依據使用目的的不同可以分為三個層級:典藏級圖檔、商務級圖檔、瀏覽級圖檔。
1. 典藏級圖檔
作為永久典藏之用,圖像品質及解析度應力求最高,以因應未來可能之需求。
2. 商務級圖檔
提供印刷、複製、商業應用等。圖像品質需符合印刷輸出之要求。印刷品質是依據網線密度決定,一般而言,印刷網線約為圖像解析度之1.5~2倍,各種出版品要求網線可參考下表:
表3-1、出版品網線對應表
資料來源:《技術彙編2002》,數位化技術規範4-1
3. 瀏覽級圖檔
提供網路上展示及瀏覽。圖像品質需符合電腦螢幕瀏覽及網路傳輸之要求,大部分為72dpi。
(二)數位檔案格式
掃描後的圖檔因原設定、處理軟體或因不同的運用可能出現不同格式,其中TIFF檔為最適合長久保存之格式,以LZW不失真模式的壓縮技術,且因支援CMYK模式可輸出,用途較廣,但檔案容量較大(A4大小、全彩約25M);JPEG和GIF則因其容量較小(A4大小、全彩約3~5M),為適用於網路瀏覽之格式,JPEG亦可作為備份儲存及檔案管理之用。目前常見應用於GIS的圖像壓縮格式有MrSID(Multiresolution Seamless Image Database)、ECW(Enhanced Compressed Wavelet)、及JPEG2000,分別說明如下:
(1) MrSID
MrSID是由LizardTech公司開發的新一代圖像壓縮、解壓、存儲和提取技術。它利用離散小波變換對圖像進行壓縮、拼接和鑲嵌,通過局部轉換,使圖像內部任何一部分都具有一致的解析度和良好的圖像品質。MrSID格式之特點如下[12]:
1. 具有較高的壓縮比
其壓縮比決定於圖像內容和彩色深度,對於灰階圖像壓縮率為15-20:1,對全彩色圖像可以達到30-50:1,壓縮後對視覺品質而言,幾乎沒有可感知的損失。而且其壓縮比可調,可以把壓縮的圖像設置成完全無損失至適度有損,也可以將多幅圖像壓縮為一個檔,建立大型的圖像資料庫。
2. 可支援多種解析度顯示圖像資料
可以把一幅圖像的不同解析度壓縮到一個單獨的檔案中,從而得到各個解析度下的清晰圖像。
3. 採用選擇性的解壓技術
能夠只解壓縮需要流覽的一部分,解壓速度快,而且可以快速地打開和流覽大的圖像,這在GIS中有著非常重要的意義。因為這意味著只需較少的系統資源就可以達到對圖像進行快速方便地流覽和縮放等高要求。資料量的低要求,使得用MrSID壓縮後的圖像非常適合在網路上傳輸。
4. 使用無縫壓縮方式
可實現即時、無縫的大量圖像流覽,全自動地把幾百幅具有地理座標資訊的圖像無縫地鑲嵌成為一幅,並可在這一幅範圍完整的圖像中漫遊和縮放,而不需要在很多小圖之間切換。
由於MrSID技術具有以上特點,因此廣泛應用於GIS當中,不過由於MrSID為專利技術,因此需採用特殊軟體方能進行壓縮/解壓縮,而且所費不貲,因此在考量經費的前提下,亦可考慮採用其他格式。
(2) ECW
ECW 是ERMapper 所設計的壓縮格式,以小波為其核心演算法,其可以支援的格式有:ERMapper 系列、JPG、GeoTif/Tif、USGSOrtho Quad…等。壓縮介面為簡易的視窗介面,此壓縮格式之特點如下[13]:
1. 可壓縮大型影像
在Microsoft Windows NT平台下可以壓縮之影像大小超過2GB,並且在壓縮的過程中可以將檔案鑲嵌起來。
2. 免費的外掛程式
提供免費外掛程式讓許多軟體可以支援ECW 壓縮的影像,相關工具可以在ERMapper 公司網站中下載,其壓縮率是在1-100之間作選擇,壓縮完成後會提供實際壓縮率與壓縮時間。
l JPEG 2000
JPEG 2000 為國際標準,正式名稱為「ISO 15444」,同樣是由JPEG 組織負責制定。目前JPEG2000已逐漸被運用在網路、印刷、掃瞄、數位影像、遙感探測、數位圖書館、電子商務,無線網路與手持式電子產品等領域。而JPEG2000具備以的特點[14]:
1. 失真和非失真的壓縮
在單一演算法的架構下,離散餘弦轉換不能達成非失真的壓縮,而離散小波轉換可以做非失真和失真的壓縮。藉由小波轉換可以單一壓縮法從事失真和非失真的壓縮,而不須如JPEG 採用Huffman 編碼進行非失真的壓縮。
2. 位元錯誤的容錯、改錯能力(Robustness to bit-errors)
JPEG200 在網路應用上的能力。以無線的方式來傳輸資料時,需要有容錯並改正的能力。利用儲存在一個獨立且相對的小區塊中的非一致性記號,提供每個區塊偵測並隱藏錯誤,而組織過的資料流則提供改正錯誤的能力。
3. 依解析度或SNR(Signal-to-Noise Ratio)做漸現式展圖
這個技術主要是不須將整張影像暫存到記憶體,可以直接透過瀏覽器讀取。依SNR 的方法是先傳輸整幅影像的輪廓,然後藉由提高影像檔案的大小讓影像由朦朧到清晰。而依解析度的漸現式傳輸,則是先傳依解析度低的影像小影像,隨著資料量的累積則提供更大更清楚的影像。
4. 感興趣區特性(Regions of Interest,ROI)
由於JPEG2000 採DWT 為主的多解析編碼方式,因此透過尺度的變化,可以提供在感興趣的區域有良好的解析度(較低的壓縮比),而背景則採用較低的解析度(較高的壓縮比)。
5. 開放式的架構
開放式的架構,讓編碼的工作只須針對資料流編寫語法與核心工具,使系統更有效率且更符合目標需求。
6. 保護影像的私密性(Protective image security)
運用浮水印(Watermarking),標籤和加密讓影像資料保持完整性不被竄改。由於標籤的方式已經規範在SPIFF 中所以可以很容易的運用到JPEG2000 的檔案中。
7. 以內容為基礎的描述(Content-Based description)
在影像處理的領域中,有關影像的搜尋與索引是很重要的應用。以內容為基礎的描述,等於是建立影像的Metadata,在搜尋與索引的時,提供更有效率且具正確性的結果。
由於JPEG 2000 為國際標準,而且目前大多數圖像處理軟體皆有支援,如ACDSEE、PhotoShop最新版本等,因此採用JPEG 2000亦是可考慮的選擇之一。
(三)色彩模式及色彩深度
色彩模式決定數位圖像由何種色頻方式來構成,色彩深度則決定數位圖像層級的變化及檔案的大小,以下介紹幾種常運用之色彩模式:
1. RGB
RGB為所謂的「加法色」系統,由R(紅色)、G(綠色)、B (藍色)三原色組成,透過不斷加入色彩混合,最終呈現白色,適用於電腦、電視螢幕的顯色,色彩表現力佳。
2. CMYK
CMYK為所謂的「減法色」系統,有C(青色)、M(洋紅)、Y(黃色)三原色,當光線射入某物體,該物體吸收了某些波長之光線,並反射其餘波長的光線,最後眼睛經由反射光裡的剩餘波長,解讀出該顏色,應用於印刷製品,例如:紙張上所呈現出的色彩,即是因墨水吸收特定光線後的結果。
3. LAB
以人類視覺感知之空間為主軸的色彩模式,其由明度(L),視覺互補色軸(a)、(b)構成三維色立體空間。
4. 雙色調
用兩種主色的深淺變化來混合圖像的層次。
5. 單色調
只用一種顏色的層次變化來構成圖像,一般以灰色調來表示。
表3-2、色彩模式與深度一覽表
資料來源:徐明景2001,《數位攝影技術》
(四)圖像解析度
在說明圖像解析度規格之前,先說明各種常見解析度[15]所表示的意義:所謂的「解析度」指的是單位長度中,所表達或擷取的像素數目,主要分為三類。
輸入階段:掃描器解析度、數位相機解析度。
呈現階段:螢幕解析度。
輸出階段:圖像解析度、印表機解析度。
1. 「圖像解析度」使用的單位是 ppi ( Pixel per Inch ) ,意思是每英吋所表達的像素數目。圖像的解析度會影響列印時,列印品質及大小,但不會影響它在螢幕上所呈現的品質,圖像解析度是可以透過PhotoImpact 、 PhotoShop 等圖像處理軟體加以改變。圖像解析度ppi一般常與輸出解析度dpi混用。
2. 「掃描器解析度」指的是掃描器辨識圖像細節的能力,又可分為「光學解析度」及「軟體解析度」,其中,「光學解析度」才是掃描器真正的解像能力,而「軟體解析度」使用的是數學上的外插運算法,據以放大既有的掃瞄圖像,實際上可以提昇的品質相當地有限。
3. 和掃描器相當類似的是,數位相機也有所謂的「軟體解析度」,因此,要分辨數位相機真實的解析度時,應依據感光元件( CCD ) 的有效像素來推算。
4. 「列印解析度」使用的單位是 dpi ( Dot per Inch ) ,意思是「每英吋所表達的列印點數」。
5. 「螢幕解析度」換句話說就是Windows桌面的大小。以 17吋 的螢幕為例,當我們將螢幕解析度由 640×480 調整成 1024×768 時, 17吋的螢幕上必須容納更多的像點,所以原本的圖像看起來會更加地細緻,但尺寸則縮小為桌面的 40% 。
從擷取設備 ( 例如:掃描器、數位相機 ) 的角度觀之,解像能力越高者,譬如:掃描解析度或數位相機解析度越高者,所能擷取圖像的解析度也就越高。從列印設備的角度觀之,圖像的解析度越高者,所印出來的圖像也就越細緻。數位圖像的「成像品質」其實決定於擷取的階段,如果原稿的品質很精緻,掃描器的光學解析度也不錯,通常便可以得到較好的數位圖像。
表3-3、數位典藏國家型科技計畫建議數位化檔案格式
依地圖原稿件大小不同,為確保圖像未來可能進行向量化分析的應用,解析度亦可提升至400dpi~600dpi以上。
選定方案後應開始訂定數位化工作流程的規範,建立一系列的工作守則和規則對照表交由人員進行,下一章即要談到物件數位化工作程序中的各項要點,可參考作為訂定規範之依據。
[10] 洪淑芬,《文獻典藏數位化的實務與技術》,數位典藏國家型科技計畫 訓練推廣分項計畫,2004年2月,頁25。
[11] 蘇品紅、陸希泰,《測繪製圖資料機讀目錄格式使用手冊》,北京圖書館出版社,2004年11月,頁17。
[12] 梁軍,〈MrSID對GIS應用的影響〉,地理信息系統論壇,檢索:2005年12月,http://www.gisforum.net/show.aspx?id=867&cid=32
歐貴文,〈MrSID技術在GIS中的應用〉,地理信息系統論壇,檢索:2005年12月,http://www.gisforum.net/show.aspx?id=868&cid=32
[13] 吳鴻謙,《應用JPEG-2000於航空影像壓縮》,國立交通大學土木工程系碩士論文,2003年6月,頁26。
[14] 同上註,頁23。
[15] 〈影像解析度〉,DC view數位視野,檢索:2005年12月,http://www.dcview.com.tw/photoclass/res/02-res-image.htm
地圖圖資數位化工作流程指南全本下載 (1.9 MB, 5,215 hits)