1024x768 1280x800   Decrease font size for  - 拓展台灣數位典藏 - 數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫網站 Reset to normal font size for  - 數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫網站 - 拓展台灣數位典藏 Increase font size for  - 拓展台灣數位典藏
 


正片數位化工作流程指南

Tags: none 發表: 2008-07-15, 點閱: 31,834 , 加入收藏櫃 , 列印 列印 , 轉寄 轉寄

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

伍、後設資料庫建置
 

一、後設資料的欄位制訂與資料著錄
二、系統開發與資料庫建置

 


 

     數位典藏最終能否成功的關鍵在於,「功能與領域具整合性」的資料庫,以有效管理知識,達成資源的快速擷取與尋找。為達成效率性地資料檢索,Metadata的完備規劃是十分必要的。

     在發展Metadata之前,有許多重要因素與條件,必須事先考量清楚並進行前置規劃。首先是典藏單位本身的組織目標與發展方向,會影響博物館典藏品數位化所需具備的功能,間接影響藏品後設資料之深度、廣度及未來與其他資料庫連結的可能發展。此外,必須針對藏品屬性及所歸屬的特定知識領域有一明確掌握與確立。為兼備上述二點,Metadata發展的初期工作是召集特定學科領域的學者、系統開發人員、後設資料小組,針對典藏品研究、管理、維護等層面之基本元素內涵,共同討論與溝通,以期呈現典藏品不同層面的知識內涵。[31]
 
 一、後設資料的欄位制訂與資料著錄
(一)後設資料的定義:
     後設資料(metadata)是一組結構化與標準化的背景資料,包括描述性、結構性與管理性三大類型,以及語義性、語法性與詞彙性三大屬性,用來描述每個數位典藏品的內涵與特徵,以便數位典藏品能夠在數位化環境或系統中,達到最佳化資源探索(resource discovery)的效能,並能有效率而精準地被檢索、呈現、管理、控制與執行相關功能,且順利地與其他數位典藏品進行資源的互通與共享,最後還能達成數位典藏品的永久保存目的。因此,我們可以將後設資料的規劃與實施,視為數位典藏工程中最基礎的資訊建設工作。[32]

(二)
後設資料的欄位建立:Metadata設計的主要目的有如下八項:
1. 資料架構與模式(structure & model):設計一個共通性組織結構,以容納不同資料類型與學科領域的Metadata。
2. 資料輸入與描述整理(input & descriptive organization):為典藏品資料建立一套詮釋性的記錄。
3. 檢索與索引(retrieval & indexing):讓使用者很有效率地進行查詢這些記錄。
4. 展現與辨識(representation & identification):從查得的記錄中,使用者可以清楚地獲得所需的訊息及制訂呈現方式。
5. 串聯與互動關係(linkage and interactive relationship management):建立不同文獻間的串聯架構、方向(雙向與多向)、模式與管理等。
6. 取用與認證(access & authentication):作為系統安全控制的機制功能之一,以區分不同身份的使用者,包含智財權(intellectual property rights)的管理與控制。
7. 交換與儲存(interchange, mapping & exchange and storage):這些詮釋性記錄可以因各種不同需求(包括書目與全文兩部份)而進行交換及儲存。
8. 整合XML(eXtensible Markup Language)、RDF與Z39‧50不同協定的應用:除了致力於Metadata的制訂,因應文獻結構的制訂、交換、檢索與展現的需求,另結合XML、RDF與Z39‧50等協定的應用,以發揮Metadata的功能。
(三)Metadata設計原則  

     基於典藏資料及文物的調查和研析,為能建構一套兼容台灣本土典藏的特質,又能兼顧學術研究需求的功能,最後並能符合網路資源的國際化,後設資料小組乃訂定以下八項原則,作為規劃Metadata之依據:

1. 符合國際標準要求,包括Metadata格式、網路協定、檢索(如Z39‧50)等。
2. 依據本土需求採用既有標準進行修改,不再另行重新研發。
3. 容易使用,包括資料的建立、展現、檢索、詮釋與串聯關係的互動。
4. 具備多語文能力。
5.因應不同學科領域需求採用不同的Metadata格式,而非試圖設計一套單一、一致性的Metadata格式,以容納不同的Metadata格式於一身。
6. 採用不同Metadata格式,同時利用XML建置Metadata基礎骨幹與結構來容納、整合不同的Metadata格式,包含現有圖書館自動化系統的結合,以利一次查詢所有館藏資源。
7. 設計系統管理機制功能以因應不同的需求,包括取用限制、智財權的保護。
8. 具有相當的延展性,包括不同資料格式間的轉換、儲存與展現,以及資料欄位的制訂與修正。[33]


(四)
後設資料的欄位建立
     在擬定任何metadata前,都必須對藏品有相當深入的認識。所以仔細研讀數位化前置作業所整理的資料與清單後,搭配圖檔與其它參考資料,如研究筆記與田野日誌等相關資料,仔細了解藏品的時空背景、內涵與意義後,再擬定適切的欄位來突顯藏品的主題性與特質。所以該提供哪方面的知識、要描述到多細緻的訊息、書寫格式的統一等問題,都是在制定metadata及著錄的規則時必須面對的。


     又照片資料的分類與詮釋是決定此metadata未來價值上的關鍵。故如何使類別項目一方面符合主題性的知識架構,另一方面又能與一般使用者的概念銜接,增進資源檢索的精確度,快速提供使用者的資訊需求,是一大挑戰。在擬定metadata時,還有一個重點必須考慮到,那就是典藏單位本身的組織目標與發展方向,並滿足未來可能的跨資料庫連結。所以metadata的訂定除了學科知識的確定外,亦得考量典藏單位為管理藏品實體而有的物質性描述欄位。擬訂後的後設資料欄位會依資料庫連結的需求與分類體系的變更等問題於日後修訂補足。[34]

     針對人類學照片而言,「數位典藏國家型科技計畫」內容發展分項計畫下的「人類學主題小組」,整合人類學組裡不同相片類藏品的metadata,耗時近兩年討論出—數位典藏人類學組共通欄位,以下是為影像資料庫的共通欄位,提供參考。

 
(表十二)數位典藏人類學組共通欄位
影像資料庫
中文
欄位名稱
英文
欄位名稱
定義
多值
必填
著錄規範
著錄範例
一致性資源描述識別碼
URN
Handle System所給予該筆記錄的編號
 
Y
系統自動產生
 
登錄號
Inventory Number
該物件入藏登錄號
 
Y
依各單位入藏登錄號之登錄規範填寫
A12003
標題
Title
標題或名稱
Y
Y
著錄時以文字表示
年輕的偕叡廉牧師夫婦
相關人物
People
影像內容所涉及之人物
Y
 
著錄時以文字表示
偕叡廉牧師夫婦
拍攝者
Recorder
拍攝者之人名
Y
 
著錄時以文字表示
陳宏文
研究者
Researcher
研究者名稱
Y
 
著錄時以文字表示
陳宏文
內容描述
Description
影像內容之綜合描述或摘要
Y
 
著錄時以文字表示
取用向水是平埔族宗教信仰的一環
攝製時間
Record Date
影像攝製的時間
 
 
年代與日期標註分為中曆(含日治)與西曆,且需遵循以下的規則:
 
1.中曆的格式:朝代、年號年/月/日,中文之間不加標點符號,若無完整日期,可僅填入朝代或朝代/年號
例1:清代
例2:清代光緒
例3:清代光緒26年1月1日
2.西曆的部份:年/月/日,阿拉伯數字填入yyyy/mm/dd,若無完整日期,可僅填入年份或年份/月份,若有紀元前年代,在最後標註B.C.。
例1:2002/05/17
例2:2002/05
例3:2002
例4:50/03/02B.C.
攝製地點
Record  Place
影像拍攝地點之土名、通俗名稱或舊地名、今地名
Y
 
著錄時以文字表示
土名:埤仔腳
行政隸屬
Administration unit
拍攝地點所對應的清代、日治或民國行政區位
Y
 
著錄時以文字表示
台南縣大內鄉頭社村
相關文獻
Related Publication
描述多媒體資料內容所參考的相關文獻或相關出版記錄
Y
 
著錄時以文字顯示,著錄規範可參考中研院民族所台灣人類學刊之著錄規範。
陳宏文著,《馬偕博士在台灣》,台北:基督中國主日,1998,附圖頁9。
相關族群
Related Ethnic Group
該筆多媒體資料的內容所涉及的相關族群
Y
 
著錄時以文字表示
西拉雅族
原始素材格式
Media Type
原始素材的媒體種類與材質
Y
 
著錄時以文字表示
Tape
數位檔案格式
Format
數位化後可供瀏覽之檔案格式
Y
 
採用電腦通用的檔案格式表示法,如JPEG影像檔表示為image/jpeg;若為MPEG視訊檔則表示為video/mpeg
image/jpeg
典藏單位
Repository Name
資料原件之典藏單位
 
 
著錄時以文字表示
國立科學博物館
後設資料提供單位
Metadata Provider
該筆後設資料之提供單位
 
Y
著錄時以文字表示
中央研究院民族學研究所
著作財產權人
Copyright Holder
擁有該物件之著作財
產權人
Y
 
著錄時以文字表示
 
備註
Note
其他相關資訊或補充說明
 
 
著錄時以文字表示
 

 

  

 

 
〈表十三、「台灣視覺記憶數位典藏」Metadata欄位〉

 

MAAT初步調整主題計畫需求欄位
元素
次元素
數位典藏編號
 
作品【Work】
資料類型
 
標題
原有標題
解讀標題
登錄卡標題
創作者
類別
名稱
主題
主題類別
主題
細目
關鍵詞
內容
原有文字說明
提供者撰文
出版品文字
補充
修正
引文資料
時間
時間別
朝代
年號
年月日
朝代
年號
年月日
西
年月日
年月日
地點
地域
原地名
行政區
其他
今地名
行政區
其他
【Manifestation】
資料格式
 
原件【Manifestation】
原始典藏號
 
藏品層次
 
規格
尺寸
單位
色彩
品質狀況
 
出版
類別
團體名稱
個人名稱
出版
時間
朝代
西元
相關連結
屬於
包含
出處
名稱
編著者
出版地
出版者
出版時間
圖檔編號
替代品【Manifestation】
原始典藏號
 
藏品層次
 
規格
格式
尺寸
單位
色彩
品質狀況
 
創作者
 
相關連結
屬於
包含
出處
名稱
編著者
出版地
出版者
出版時間
圖檔編號
電子檔【Manifestation】
規格
屬性
影像類型
解析度
色彩
檔案
名稱
大小
典藏管理【Item】
入藏
取得方式
使用權
提供者
權限管理
典藏者
版權所有
使用限制
展覽記錄
展覽時間
展覽名稱
展覽單位
展覽描述
登錄記錄
登錄人
登錄日期
核對人
最後更新日期

修改註記

 

(五)後設資料著錄程序

     當後設資料的欄位擬訂好之後,隨即進行藏品圖檔與後設資料貼上和著錄的工作;著錄者須具備典藏物件相關專業知識與基本文書處理能力。圖檔對應結束後,檢查是必要的動作,可以確保資料的正確性,尤其是文字著錄資料與圖檔影像資料的對應。完成藏品後設資料之著錄後,需由專業研究人員進行後設資料著錄內容校對;檢視填入欄位是否正確、輸入資料是否無訛。已著錄之後設資料若發生錯誤,則修正後再行校對;另外,若後設資料內容需要補充,在此一階段一併補充及完成校對。

     在後設資料著錄裡,需要特別注意的欄位是照片內容的「內容描述」欄位。此欄位的設計目的是為了向使用者解說影像內容。也就是說,透過「內容描述」欄位,把影像放在更大的社會文化脈絡之下,讓使用者透過照片了解更多影像後面的當地知識。「內容描述」欄位實際上是替已經去脈絡的影像內容進行再脈絡。我們不僅必須小心處理再脈絡化可能的錯誤與過度詮釋,同時也牽涉對影像內容、被拍攝族群、該族群的社會組織及生態環境等方面的複雜知識。這些知識,當然最理想地是能拿到當地聽取當地人如何的詮釋或說明,次之則是請熟悉此區域人群的學者或專家做說明。

    「內容描述」欄位的重要性在於期望通過文章式的文字描述,補充其他metadata欄位所無法提供的重要影像訊息。可是,說明欄位的描述性文字不可能無限制的延伸與擴展。一方面可能有過度詮釋的疑慮,此外則顧及資料庫本身的負載能力,說明欄位的資料越多,系統就必須花更多的時間逐一比對相符合的資訊,如此將延緩查詢的速度,大大減低檢索的便利與時效性。因而,我們亦得要求描述長度的節制與核心句子的提出,以最簡潔而周全的方式傳達影像內容。[36]

 

 

二、系統開發與資料庫建置

(一)系統與資料庫架構規劃

     資料庫在不同架構下有不同的使用模式,故先分析資料庫的主要使用對象為何,得到的結果為:資料庫的使用者大多分為一般使用者、進階使用者、內容建置與資料庫維護者及決策者,四個主要設定權限控管的對象。

1. 一般使用者:即是為前端瀏覽的使用者,可利用網際網路的方式來呈現各種藏品影像資料,使其能幫助使用者累積自我的知識需求。

2. 進階使用者:主要為欲檢索搜尋藏品資料的工作者或研究人員,此類使用者的需求不僅僅是瀏灠最簡單的影像畫面可以滿足的,此類型的使用者多數希望在透過檢索動作得到藏品更多更深入的資料。

3. 內容建置及資料庫維護者:是為提供完整性核心技術的人員與藏品資料著錄人員,技術的人員除了負責資料庫與檢索系統的開發、建置與管理以外,還包括藏品資料匯入、前端頁面設計等,藏品資料著錄人員則需利用此開發系統,進行線上著錄和校對等工作。

4. 決策者:主要是內部高階決策人員的決策分析,此部份著重於文化資產的保存及知識的推廣。[37]

     資料庫的整合與連結也是設計前必須考量的。跨資料庫連結有兩個意義,一是與他館資料庫資訊交換的需要,另外則是不同類型資料庫的連結。由於資料庫越來越多,倘若每一個資料庫只滿足自身的管理便利與檢索需求,而無須考量其他單位的做法,則「使用者會浪費許多時間在選擇與專指性的資訊檢索介面的學習上,造成使用障礙」,形成一個個的資訊孤島。[38]

(二)系統與資料庫開發程序:

1.需求分析:系統分析師在軟體開發計畫限期內,根據訪談,分析並適時引導出使用者確切需求,並參考後設資料需求規格書,完成軟體需求規格書,規格書內容主要包含系統概述、功能需求、計畫時程。完成時,系統分析師、受訪者與需求單位主管簽名並確認。
2.資料庫與檢索系統設計:系統設計師應在軟體開發計畫書限期內,根據後設資料需求規格書、軟體需求規格書,完成軟體設計規格書,規格書內容主要包含系統設計規格(系統架構、系統環境、資料異動流程)、操作介面規格設計(網頁架構、欄位分析與設計)與資料庫設計規格(Entity Relationship Diagrams、Table Definition)。完成時,系統分析師、受訪者與需求單位主管簽名並確認。
3.網頁與檢索系統製作:依據主題特色,製作符合其風格的網頁呈現。
4.資料庫開發:根據軟體需求規格書、軟體設計規格書,進行資料庫系統程式開發。
5.資料庫與檢索系統測試修改:測試小組應依階段審查工作作業指導書規定進行審查與修改,完成測試後應填寫測試報告交由負責人員審核。

(三)資料匯入與校對:

系統和資料庫建置完成後,接下來就是要將資料匯入資料庫中。

1. 資料轉入:將已完成數位化之物件資料,轉入資料庫中。
2. 檢索系統:待數位化物件資料轉入後,進行檢索系統測試,觀察是否能順利檢索物件資料。
3. 檢索系統上線:上述相關程序完成後,則可將網站開放,以利公眾使用此系統檢索其所需之資料。
4. 複製備份、異地備援:為了防止資料庫資料在往後開放運作之後,可能遭遇突如其來、不可預測的事件而導致資料的損失,所以有必要尋找另一個安全的場所將所有的資料予以備份保存。


三、系統管理與開放應用

     依據上述系統與資料庫架構規劃建置出來的系統,最好為一致化整合性功能的系統,透過整合的介面依各單位作業特性來建置具相容性的系統,所建議應具備的功能大致上有:

1. WEB 環境:具有電子商務上的應用,並能提供各項加值性服務,且透過瀏覽器就完成全部作業管理的程序。
2. 搜尋檢索:提供分散式檢索及強大資料庫之檢索能力,以提供使用者檢索文物內容的資訊。
3. 流程管理:動態更改作業管理,可做網路作業流程的控管,使其作業管理能一致化且透明。
4. 內容建立:來自於Metadata 系統的建置,可整合Metadata 系統功能,以做為資料庫內容資料。
5. 管理作業:一般藏品資料的新增、維護、修改、刪除、設計及文件的產生。
6. 資料庫整合:可整合來自於各個不同的分散或異質資料庫。
7. 權限控管:依各處需求針對各子功能做帳號權限的控管。
8. 跨平台環境:其系統必須能具有跨平台的功能。
9. 其他:展覽提件的控管、多人多工的平台、友善的使用者介面、便利的資料維護及管理機制、以及整合性強可連結原先其他各即有的管理系統等等。[39]

<目錄>

 


[31]黃宛瑜、蔡淑韻,〈史語所「民族學調查照片資料庫」後設資料之擬定〉,收錄於《人類學知識的數位典藏與加值應用研討會》,2004年5月。
[32]中央研究院MetaData工作小組,

http://www.sinica.edu.tw/~metadata/introduction/introduction-frame.html
[33]中央研究院MetaData工作小組第一、二階段報告–中文Metadata的規劃與實作試驗探討。
[34]黃宛瑜、蔡淑韻,〈史語所「民族學調查照片資料庫」後設資料之擬定〉,收錄於《人類學知識的數位典藏與加值應用研討會》,2004年5月。
[35]詳見:數位典藏人類學組共通欄位3.2版。

http://content.teldap.tw/main/vision_brief.php?class_vision=4
[36]黃宛瑜、蔡淑韻,〈史語所「民族學調查照片資料庫」後設資料之擬定〉,收錄於《人類學知識的數位典藏與加值應用研討會》,2004年5月。
[37]故宮博物院–數位典藏文物管理系統之雛型架構。
[38]黃宛瑜、蔡淑韻,〈史語所「民族學調查照片資料庫」後設資料之擬定〉,收錄於《人類學知識的數位典藏與加值應用研討會》,2004年5月。
[39]故宮博物院–數位典藏文物管理系統之雛型架構。










Download: 正片數位化工作流程  正片數位化工作流程 (1.6 MB, 3,760 hits)



評分:

1 Star2 Stars3 Stars4 Stars5 Stars (No Ratings Yet)
Loading ... Loading ...

回應:


請輸入圖片中的文字
請按圖片取得圖片中文字的錄音檔
Click to hear an audio file of the anti-spam word