貝類標本數位化工作流程指南
Tags: Metadata, 中央研究院, 後設資料, 指南, 數位內容, 數位典藏, 數位化, 數位化工作, 數位化工作流程, 數位學習, 數位攝影, 智慧財產權, 著作權, 資料庫, 資訊 發表: 2011-08-29, 點閱: 35,566 , 加入收藏櫃 , 列印 , 轉寄
附錄一、中央研究院台灣本土貝類數位典藏計畫後設資料表單
資料來源:中央研究院後設資料工作組,http://metadata.teldap.tw/。
後設資料標準的對照是作為後設資料欄位與國際標準的接軌,以及國際間其他貝類主題計畫的 XML 資料交換的關鍵機制。以下為台灣本土貝類資料庫後設資料欄位與 Species 2000 及 NBN(National Biological Network) 後設資料標準的對照表。貝類數位典藏計畫的物種名錄表單,採用 Species 2000 之後設資料標準,其比對結果如下所示:
貝類數位典藏計畫的物種生物資訊、標本資料、文獻資料與媒體資料表單,皆採用 NBN(National Biological Network) 之後設資料標準,其比對結果如下所示:
附錄二、認識貝類
資料來源:中央研究院台灣貝類資料庫,http://shell.sinica.edu.tw/
一、貝類的分類
我們常見的九孔、笠螺、寶螺的大家族。從外表來看,它們在形態上有很大的差異,但基本的身體構造則是相同的,它們均有柔軟、光滑、濕潤而不分節的身體。主要由內臟團、外套膜及足部所構成(大部分種類也具有貝殼及頭部)。根據貝殼的數目、鰓的構造、神經的結構及體制的型式等重要特徵,目前較合理的分類系統是將軟體動物門分為八個綱。
二、貝殼各部位名稱
當熟悉正確觀察貝殼及統一測量貝殼的方法之後,還要瞭解貝殼的各部位名稱,才能利用分類檢索表將貝殼一一加以鑑定與分類。
(一) 腹足綱各部位名稱
(二) 雙殼綱各部位名稱
三、正確觀察貝殼的方法
腹足綱和雙殼綱的總和,已然約佔軟體動物的百分之九十左右,因此建立正確觀察腹足綱和雙殼綱的觀念,是認識貝類的首要課題。
(一)腹足綱的觀察
手持貝殼,殼頂向上,殼口面向自己,如果殼口在殼軸的右側,則此貝殼稱為右旋螺 (Dextral shell) ﹔反之殼口在殼軸的左側,則此貝殼稱為左旋螺 (Sinistral shell)。或者手持貝殼,殼頂向上,觀察殼頂的螺紋,如果螺紋是順時鐘旋轉,則為右旋螺﹔若螺紋是逆時鐘旋轉,則為左旋螺。
(二)雙殼綱的觀察
將兩殼完全閉合,殼頂向上,自己觀察殼的後端(有外韌帶的一方),此時在右邊的殼稱為右殼﹔在左邊的殼,則稱為左殼。或者觀察殼的內面,使殼頂向上,如果套線彎 (Pallial sinus)在右側,則此殼為右殼﹔如果套線彎在左側,則此殼為左殼。
四、正確測量貝殼的方法
正確測量貝殼方法是研究貝類的第一步驟,建立正確而客觀的測量方法,才能獲得完美而合理的結果。
(一)雙殼綱的測量
殼長 (Shell length) ﹕兩殼完全閉合時,由殼的前端到殼的後端最長水平距 離。殼高 (Shell height) ﹕兩殼完全閉合時,由殼頂到腹緣的垂直距離。殼寬(Shell width) ﹕又稱為殼幅,兩殼完全閉合時,左右兩殼的最寬距離。
(二)腹足綱的測量
殼長(Shell length)﹕由殼頂到前水管的垂直距離。殼寬(Shell width)﹕在殼口面上,殼的最寬水平距離。
附錄三、數位典藏標本影像浮水印處理技術
資料來源:《水試專訊》,15期,2006年9月,頁19-22。
一、 前言
「數位典藏國家型科技計畫」中擁有數量大且珍貴的數位典藏品,因此必須重視及考慮如何以各種保護機制,以有效防止數位典藏品被非法的複製及濫用。其中,「數位浮水印技術」是目前用來保護數位典藏品的主要方法,典藏單位將代表數位智財擁有者的資料,嵌入數位多媒體資訊中,將來若發生版權爭議時,可反向取出嵌入在數位多媒體中的數位浮水印,作為版權認證的依據(蕭等,2004)。本所執行「台灣沿近海海洋生物標本之數位典藏 — 魚、貝、甲殼類」研究計畫(編號 NSC 94-2422-H-056-002),截至 95 年 2 月,已完成 1,892 個標本及近2千幅標本影像上網,為防止被擅自複製他用之情況發生,本計畫嘗試進行簡單之顯性及隱性影像浮水印之處理,以維護本所標本圖像之版權。
二、 處理方法
圖片影像以顯性浮水印(Visible Watermark)及隱性浮水印(Invisible Watermark)兩種方式同時處理,以達到加強保護效果及保全版權之目的。顯性浮水印是在影像上直接遮罩白邊、中空、灰色陰影、30度旋轉、居中、43字級、Arial 字型之相關識別字串:「(c) Fisheries Res. Inst., Taiwan」。隱性浮水印(又稱數位浮水印,Digital Watermark),則嘗試比較兩種不同影像特徵分布域 (Domain) 之處理方式。一為空間域(Spatial Domain)(或稱為變換域,Transformation Domain),是將本所GIF格式Logo圖檔(288 × 288 解析度),以彩色靜止數字圖像的資訊隱藏(Information Hiding),或稱作數據隱藏(Data Hiding)演算法處理方式嵌入標本影像中。其嵌入方法為先將嵌入檔(檔案大小不得大於原始圖像的八分之一)轉化為二進制數據碼流,再將 BMP 文件圖像數據部分的每個位元組的高7位依次「異或 (XOR)」後,再與上述二進制數據碼流異或後的結果寫入最低位,嵌入訊息提取方法則反向進行(魏, 2002)。另一為頻率域(Frequency Domain),先選取原始影像,再選取 Binary Logo Scrambling 形式給予 pixel 總數不得大於原始圖像十分之一之 logo 圖(72 × 72 解析度),同時搭配 48-bit 授權鍵(Authentication Key)加密及浮水印可視等級之設定加以運算。
本文所使用之貝類標本圖像為本所海洋漁業組吳副研究員全橙所採集、鑑定及拍攝之馬蹄鐘螺 (Tectus niloticus maximus, (Philppi, 1844)),標本編號為 FRIM01220, 查詢網址為:http://www.tfrin.gov.tw/friweb/index.php?func=collection&act=ShowForm&num=1477。
三、 處理結果
(一) 顯性浮水印
顯性浮水印是直接在影像上以半透明、旋轉、中空字型、縮放、色調調整等方式合成處理一些文字(字串)或影像(如 Logo 圖),其會對原始影像造成破壞,但相對也對非法使用者較具嚇阻力。以本研究處理之馬蹄鐘螺之標本圖片為例(處理情形如附錄圖3-1所示),因為使用細字邊及中空功能,不至於對貝體外觀造成太大的視覺傷害,在網頁瀏覽上應可被接受,但經處理後的影像,其 JPG 檔案長度有增大(約 50% ~ 70%) 之情形,目前本所數位典藏之所有瀏覽大圖,均已完成顯性浮水印處理,至於小圖 (200 × 150) 則仍保持原樣。在批次處理1,954幅560 × 400等級網頁放大瀏覽之魚蝦貝標本大量圖像時,平均每張圖像耗時 0.85 秒(PentiumPC 1.2 GHz/512MB RAM/Windows XP 環境),所有圖像處理完畢約需 28 分鐘。
(二) 空間域隱性浮水印
以同一張貝類標本圖像為例,先將原JPG格式轉換為BMP檔,作為程式中Carrier檔案,再指定欲嵌入之訊息(Message)檔。訊息檔案可為任何格式之檔案,例如文字、聲音、圖片、影片等,雖然不拘格式, 但其長度須控制在原BMP格式長度的八分之一以下。在此,以本所所徽 (Logo) GIF圖檔為Message檔,經空間域隱性浮水印處理,最後可得嵌入(Embedded)之圖檔(附錄圖 3-2)。其處理後之檔案長度與原圖大小一致,且幾乎不影響原圖之色彩及圖像性質。而在使用反向功能,亦即對加入浮水印之BMP檔進行嵌入資訊提取(Extract) 時,可得到與原始Message完全一樣之檔案內容、色彩及大小,但前提為不可對嵌入後影像進行任何處理(例如調整大小、調整對比、另存其他檔案格式如JPG等)。但BMP為非經壓縮處理之圖片檔案格式,其檔案長度太大,且嵌入之版權識別資訊亦容易被破壞,因此一般而言,並不適合在網頁上應用。即使如此,典藏單位仍可用來管理或保存已被明確授權之高解析原始影像。
(三) 頻率域隱性浮水印
以同一張貝類標本圖像為例,當Watermark Level設定為More及以 TIF格式存檔時,其反向提取嵌入Logo圖之清晰度最佳;反之,Watermark Level設定越差(Less)或存成JPG且壓縮品質設定越低(壓縮比愈高)時,其Logo圖示則越模糊(附錄圖 3-3)。值得注意的是,經反向提取後的 Logo均會變成黑白圖示,但大小不變。因需考量網頁瀏覽速度及經浮水印後之檔案大小,以使用More及95% Quality之JPG存檔格式應為較佳選擇。 最後批次處理全部1,954張560 × 400解析度,且已經過前述顯性 浮水印處理過之網頁瀏覽大圖像,嵌入72 × 72之logo JPG圖、設定6位 數之加密鍵值及More之Watermark level,並存成95% Quality之JPG格式檔案上網。
四、 檢討與建議
數位(隱性)浮水印技術是將浮水印以資料隱藏的方式放置到需要保護的多媒體文件中,而不影響到多媒體文件的品質,讓使用者無法判別其和原圖間的差異。目前學術研究多往非破壞性之隱性數位浮水印方面進行,且以空間域以及頻率域兩種方法為多。空間域為主的浮水印技術能藏入的浮水印資料多,但較不具強韌性;頻率域為主者資料量雖較少,但一般較具強韌性。良好的數位浮水印必須至少能夠符合隱密性 (Invisible)、強韌性 (Robustness)、破解安全性 (Security)、最大資料量 (Capacity) 等要求(莊與鍾,2001;Jung et al., 2003)。
以上浮水印技術之特性與本文圖像處理之過程與結果一致,空間域之浮水印處理方式,可藏入較多的浮水印資料量(288 × 288 解析度以上),但幾乎不具強韌性,經簡單影像加工處理即會喪失嵌入資訊。另一方面,頻率域之浮水印處理方式,有極大之強韌性(如經 JPG 壓縮),但可嵌入的浮水印資料量相對較少(72 × 72 解析度以下)。
數位典藏國家型計畫下之技術發展分項計畫,近年來也有多項圖像數位浮水印技術方面的研究計畫正在進行中(蕭等,2004;吳與馮,2004),其中「數位典藏資訊之版權保護與驗證技術之研究」負責發展資訊保護家 (InfoProtector) 軟體(目前釋出 3.0 版),並已進一步成立數位浮水印驗證中心,負責協助數位典藏相關子計畫圖像之浮水印處理及公正中立的認證服務工作,並發展多家授權的機制,避免發生互相侵權的情況 (http://webmuseum.cis.nctu.edu.tw/index.htm)。
「資訊保護家」軟體,大致具四項功能,包括藏入註解資訊(或檔案)、不可視浮水印、可視浮水印以及驗證資訊等。可針對BMP、JPEG、GIF以及TIF無壓縮等不同格式的影像檔案及視訊檔案提供嵌入文字、數位圖像浮水印與驗證之功能。V 3.0 版之資訊保護家在實際操作上,其優點為了支援多種影像格式及影音串流檔、可支援 288 × 288 以上解析度之logo 圖片、可同時嵌入文字版權資訊、支援批次處理等,但其缺點是不保證反向提取原logo圖像大小、較高度壓縮(如 JPG 80% 左右 Quality 以下)後即無法反向提取,以及最重要的是雖有批次處理,但是卻無法執行成功等缺點。另依實際測試,TIF格式有最佳之反向logo提取之清晰度及保存性(黑白色階),因此對原始高解析標本影像,應仍有其可利用性。該軟體正發展 V 4.0 版中,可望修正 V 3.0 版之部分缺點。
本計畫目前僅對網頁瀏覽層級之圖像加以顯性、隱性浮水印處理,但對於高解析之印刷或加值層級之標本原始影像,則考慮送該驗證中心,以統一標準編號密碼,並與其他子計畫相同使用同一規格之內嵌後設資訊格式。
目前標本後設資料及影像上網處理(正常圖最大 560 × 400,縮小圖最大200 × 150)可用整批處理(其中資料方面為 Excel 轉 csv 再轉 MySQL,圖像部分以 Windows PowerToy-Image Resizer 處理大小轉換,再以 Windows Picture and Fax Viewer 旋轉)方式,但絕大部分之情形是為使用者直接以網頁管理模式上載圖像。因此,未來有需要發展線上即時浮水印處理程式模組,以方便使用。 其中顯性浮水印在PHP上較為容易 可行的方式為PHP影像函式+GD外掛影像函式,而隱性浮水印部分,將有賴資訊保護家發展Linux環境指令列處理版本。
貝類標本數位化工作流程指南全文下載.pdf (7 MB, 2,120 hits)