貝類標本數位化工作流程指南
Tags: none 發表: 2008-06-10, 點閱: 34,592 , 加入收藏櫃 , 列印 , 轉寄
台灣擁有非常豐富的生物多樣性資源及許多特有生物種類。如何妥善管理、運用這些特有資源,首要工作即建立完善的生物多樣性基本資料庫,透過數位化形式,整合資料庫,藉由網路迅速傳遞資訊,自由取用,乃提升學術教育水平最佳之管道,以加強國際性競爭。
典藏品數位化的主要目的是利用現代科技的進步,將歷史久遠且具有珍貴意義的物件進一步作永久的保存,再透過資訊技術,賦予典藏品數位化後產生的影像具有更深的內涵與價值,建置為可查詢利用的資料庫,增進利用的方便性,以使資料廣泛流傳,發揮其潛藏的文化與學術價值,卻是數位化工作所不可忽略的使命。[4]因此後設資料與資料庫之建置必須在事前先作完善的考量與規劃。
為了建立一套兼具文字與影像的台灣植物資源查詢系統提供各界人士使用,經過數位典藏計畫的資源彙整,以彰顯台灣地區的生物多樣性資源為基礎,成為資源交換中心,提升國際學術地位,資料庫的建設,參考國際間重要植物資料庫網路資料庫查詢欄位之互通性,由數位典藏國家型科技計畫,後設資料小組與內容發展分項計畫項下植物學組,共同討論討論與合作,將各資料庫資搜尋系統及後設資料不斷逐步調整與修正,並在資料整合與資料庫系統維持各單位特色及個別需求前提之下,建立通用、標準化之資料庫系統,並以作為建構國內單一窗口之基礎。[5]建置資料庫之主要目標是參考國際植物標本重要資料庫結構、考慮台灣本土之需求,開發國內植物標本館間資料流通共享的機制。以下就METADATA建置之考量與設計作說明。
有關Metadata的定義一般泛稱為「資料的資料」(data about data)[6],此一定義係源自在一九九五年三月由OCLC(Online Computer Library Center)、NCSA(National Center for Supercomputing Applications)兩單位共同主辦名為「Metadata Workshop」研討會,廣邀圖書館學、電腦科學、文獻編碼,以及相關領域學者專家等參加。在此會議中,提出了「資料的資料」作為Metadata的定義[7]。
後設資料(metadata)是一組結構化與標準化的背景資料,包括描述性、結構性與管理性三大類型,以及語義性、語法性與詞彙性三大屬性,用來描述每個數位典藏品的內涵與特徵,以便數位典藏品能夠在數位化環境或系統中,達到最佳化資源探索(resource discovery)的效能,並能有效率而精準地被檢索、呈現、管理、控制與執行相關功能,且順利地與其他數位典藏品進行資源的互通與共享,最後還能達成數位典藏品的永久保存目的。[8]因此,後設資料的規劃與建置被視為數位化過程中最基礎的資訊建設工作。數位典藏國家型計畫之推行除了開發國內跨機構相關資源數位化之交換、資料流通共享的機制,更寄望未來能與國際接軌。有鑒於此,後設資料(metadata)建置考量除本土需求外,應採用符合國際標準之格式。所訂定之資料庫的檢索功能愈詳細,對使用者查詢資料上提供愈多資訊,對使用者辨識資料也愈有幫助。這查詢功能方面的資料呈現,均決定於Metadata的欄位及欄位內的資料內涵。因此,規劃Metadata的欄位時,應事先就資料庫未來檢索功能、資料呈現等兩方面的需要進行了解,才能使必要的欄位無所遺漏[9]。[vi]標本資料欄位包括每一份標本的學名、採集地點、採集日期、採集者、鑑定者、採集編號、生育地資料、標本館編號、標本狀態等等。至於標本資料之輸入格式規劃及檔案結構,則需預先完成。一般
以建立通用、標準化及符合國際標準之資料庫系統為目標,依據後設資料小組與植物主題互相協助下,訂立了需求欄位建置表,內涵包括Dublin Core[10]個欄位為基礎,再依資料之性質,衍生出相關欄位。
以貝類標本資料庫而言﹝1﹞物種名錄欄位元素﹝2﹞標本紀錄欄位元素,二項為重要的資料架構。協助後設資料國際標準之策略規劃與應用。研究發展後設資料理論,包括後設資料方法論、後設資料註冊中心、知識組織系統等項目。
|
元素名稱
|
Element
|
說明
|
---|---|---|---|
1
|
標題
|
Title
|
作品的主題及/或主要概念之關鍵字,以及代表與本物件重要相關之人、地、事件、或其他背景資料等資訊之詞彙。
|
2
|
著作者
|
Creator
|
作品的創作者。
|
3
|
描述
|
Description
|
關於物件的摘要或內容敘述。
|
4
|
出版者
|
Publisher
|
負責發行作品之個人或機構,例如博物館。
|
5
|
貢獻者
|
Contributor
|
藏品原所有人。
|
6
|
日期
|
Date
|
創作時期、年代。
|
7
|
資料類型
|
Resource Type
|
作品的類型或所屬的抽象範疇,例如文字、聲音、影像、實體物件、事件、原 件或代理物件等。 |
8
|
格式
|
Format
|
本欄位描述存取、呈現、或使用此作品時,可能所需之軟、硬體工具。
|
9
|
資料識別
|
Resource Identifier
|
登錄號或編目號。
|
10
|
關連
|
Relation
|
相關出版品資訊。
|
11
|
範圍
|
Coverage
|
作品所涵蓋的時期和地理區域。
|
12
|
管理權
|
Rights Management
|
作品版權聲明和使用規範。
|
13
|
主題 / 關鍵字
|
Subject and Keywords
|
作品被賦予之一個或多個名稱。
|
14
|
來源
|
Source
|
作品的其他衍生來源。
|
15
|
語言
|
Language
|
作品使用的語言。
|
下表為中研院貝類資料庫之後設資料建立欄位
〈目錄〉
[5] 數位典藏國家型計畫後設資料小組
http://www.sinica.edu.tw/~metadata/project/project-frame.html
http://www.oclc.org/oclc/research/conferences/Metadata/dublin_core_report.html
[10] Dublin core後設資料標準,是一組簡單卻有效的核心元素集。源起於1995 年OCLC (Online Computer Library Center)與NCSA (National Center for Supercomputing Application)聯合召開的第一屆Metadata Workshop,為了加速網路電子資源的整理與組織,並加強網路資源的找尋與檢索的精確性,集合了圖書館界、資訊科學等各領域專家,制定一套專為描述網 路電子資源的後設資料格式。因此其制定初始,既設定了簡單易產生或維護、通用易瞭解的語意、全球通用、彈性高等四項原則。因DC元素(共15項)具有核心 (core)和通用(universal)的特性,觀察近來的應用趨勢,一方面應用於描述機構內部典藏或產生的資源,以支援入口網站(portal)的服 務或內部的知識管理;另一方面作為各式Metadata 的交換格式,以達到開放的資訊環境中,跨學科領域的資源互通。
貝類標本數位化工作流程 (1.7 MB, 2,142 hits)