1024x768 1280x800   Decrease font size for  - 拓展台灣數位典藏 - 數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫網站 Reset to normal font size for  - 數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫網站 - 拓展台灣數位典藏 Increase font size for  - 拓展台灣數位典藏
 


古籍線裝書數位化工作流程指南

Tags: none 發表: 2007-11-28, 點閱: 50,011 , 加入收藏櫃 , 列印 列印 , 轉寄 轉寄

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

伍、後設資料與資料庫建置

 

一、後設資料

(一)後設資料的意義

      Metadata在臺灣翻譯為「後設資料」或「詮釋資料」,意思是「描述資料的資料」或「詮釋資料的資料」(data about data)。制訂metadata,是為了記下某一筆數位化資料的特性,例如:用數位相機拍攝的照片,可以有照片名稱、主題、拍攝者姓名、時間、地點、描述…等簡單欄位,而這些欄位資訊,就是這張照片的後設資料。metadata最好能達成三項目的:
1. 描述數位藏品的內涵、特色。
2. 在網路上或電腦上,易於檢索到使用者所需的一筆或數筆資料。
3. 容易與其他資料庫互通、交換資料。當然,依照資料庫建置的目的、使用對象…等不同的考量,達成不同的目的。
 
(二)古籍線裝書後設資料建議欄位
     善本古籍核心後設資料元素依據其所具有的功能性概分為兩大類:描述性後設資料元素與紀錄管理性後設資料元素,茲分述如下:
 

 

 

 

8、數位典藏國家型科技計畫後設資料欄位建議
描述性後設資料元素
(共12元素)
 
類型
 
識別號
登錄號、排架號、索書號
題名
正題名、其他題名、拼音題名
著者
姓名、朝代年號或國別、著作方式
其他貢獻者
姓名、朝代年號或國別、著作方式
出版資訊
責任者、地點、時間、責任方式
數量
 
簡述
版本、裝訂、裝潢、圖像、行格、避諱等
主題
主題、關鍵詞
語文
 
關連
叢書、子目、合刊、原件複製品、影像檔
現藏者
 
紀錄管理性後設資料元素(共1元素)
建檔紀錄
 
建檔人員、建檔時間、修改人員、修改時間

二、資料庫建置

(一)資料庫建置
     粗略地區分,資料庫的metadata 可以分為兩種情況:一、如數位化物件不多,或者只需要簡易註記與搜尋功能,meatadata就可制定得很簡單;二、若針對學術、研究用途,則可以制訂較 嚴謹完整的metadata,用數十個甚至上百個欄位來描述一筆資料。目前參與「數位典藏國家型科技計畫–內容發展分項計畫」的單位所制訂的 meatadata,通常是第二種情況。
     在制訂meatadata時,各單位通常是依照自己的需要,參考某種較為通用的metadata標準,將之修改後再加以使用。如此一來,在進行資料交換時,雖仍需對應不同資料庫的欄位,但過程較為簡便。
以「數位典藏國家型科技計畫容發展分項計畫」中的「善本古籍」主題小組為例,其中,「中研院史語所傅斯年圖書館藏善本圖籍」計畫,就是參考圖書館界常用的「機讀編目格式」(Machine Readable Cataloguing Record,MARC)再予以增加古籍線裝書之特性,來制訂資料庫的metadata,而「國家圖書館古籍文獻典藏數位化計畫」,則是參考另一個常用的 metadata標準「都柏林核心集」(Dublin Core)[23]
 
(二)資料庫建置流程

     基本上是每日進行此項建檔工作,建檔完後執行校對工作。以下提出兩種方式建議。使用原先的書目系統建立清單者,此時可將主要書目轉入metadata資料庫中,已進行更細緻影像的描述及展現。若在原有資料庫並無建置基本欄位者,此時須將建置頁碼圖檔之對應。由於古籍線裝書之書頁篇目繁多,為使讀者能得到更詳盡的資訊,因此需進行細部的篇目建檔。可於檢查完圖檔後進行古籍篇目建檔及校對工作。

 

  

 9、數位典藏國家型科技計畫後設資料工作組所製[24]

三、數位化工作之挑戰

(一)罕見字問題
     在篇目建檔 時,由於許多文字已非現今生活中經常使用之文字,因此會出現有罕見字的問題。關於罕見字的處理,目前數位典藏國家型科技計畫技術研發分項計畫研發出「中文 缺字技術」。採用中研院資訊所文獻實驗室之構字式作為交換碼,其架構遵循漢字構形原理,將漢字拆解為最小單位之基礎部件,再由部件拼湊而成,利用有限的部 件來表達數以萬計漢字,不會再有交換碼不足之問題,而且目前已提供小篆、楷書、異體字之對應。
 
(二)影像檔案產出時效
     在校對圖檔時,由於需要校對的檔案繁多,須特別留意,建議每日完成當日所建置的影像檔,以避免累積過多的數量。
 
(三)人員流動率高[25]
     由於數位化工 作會雇用工讀生處理掃描的工作,但工讀生流動率高,為確保工作品質館內應給予適當的教育訓練。其中應包括數位化工作之目的,原件整理及數位化工作掃描時應 注意的事項,螢幕校正的方法,品質檢核的原則和流程。利用短期密集的訓練讓新進工作人員能夠瞭解其工作的重要性,並且快速進入狀況。此外,當改變工作流程 或數位化設備時,也應注意人員工作上安全的管制與檢查。藉由上課講解和實際操作的練習,確認每一個步驟的一致規範。為確保人員流動率高建議應有專職人員統 籌負責,並且將古籍線裝書數位化工作列為例行性的工作。
 
(四)規範修正即時性
     定期檢討與協調無論訂定工作流程與規範前的思考,是多麼周密與嚴謹,皆可能因種種因素而與現實不符,必須瞭解品檢狀況並掌握進度。
 
(五)計畫管理的執行[26]
     制度化的工作流程有助於提升數位化工作的效率及數位影像的品質。事前的準備規劃工作需要仔細的考量,並且進行小量測試,以確保無思考不周全的部分。
 ( 1 )數位化設備
 數位化工作流程由於檔案原件的尺寸大小、保存狀況或有不同,使用的數位化設備因此有異,各種不同的數位化設備所需注意的項目亦有不同,數位化工作流程上會有些微的差異。
 ( 2)品質校驗
 數位影像品質檢核流程 除需進行初步校驗外,各單位應有專人進行數位影像的二校,並再以程式確認數位影像是否可被正常開啟使用。而為了確保數位影像之品質,一校與二校應逐筆與原 件對照校驗,以免有疏  漏。且需在確認數位影像無誤後,方進行燒錄的工作,以免造成人力和物力的浪費。
 ( 3)工作場所內規範
 其他工作規範除了數位化工作和數位影像品質檢核時的注意事項外,工作場所內的規範與原件使用規範亦影響工作效率以及檔案原件的保護。
 ( 4)電腦化系統控管數位化流程
 電腦化的流程控管目前許多單位仍以紙本表單的方式進行各項工作流程的控管。研究發現將掃描/數位攝影、品質檢核與光碟/磁帶製作等工作流程以電腦系統控管使數位化流程的管控更加清楚,並且可進行統計分析,以利資源有效配置。
 
(六)相關技術的掌握
     由於科技日新月異,數位化相關掃描以及資料儲存設備汰換率高,除了注意設備保存年限外,也應瞭解目前科技發展現況,以利設備間的相容性。
 
(七)數位化智財權議題及資料安全問題[27]
1. 隱性浮水印面臨的困境
1)無法在黑白的數位影像中加入,或是勉強加入了,一經轉檔就不見了。
2)部分隱性浮水無法處理TIFF檔
3)檔案過大亦無法加入(中研院研發的隱性浮水印,超過 80MB 即無法加入)
4)於原始的數位影像中加入隱性浮水印,會破壞原本的圖像,現已發現有產生波紋的情況。
 

2. 資料竄改

為避免數位影像遭到被竄改,可以在典藏用的數位檔案中加入一個時間,或將原始的數位影像製作兩份光碟,一份為永久保存不供外借,另一份才是供轉檔等後續處理使用。若以此方式,有一不外借的對照的版本,亦可作為數位影像內容有疑義時比對之用。

 
3. 智財權議題

智慧財產權在進行數位化工作前,除了要確定該影像檔是否處於開放狀態,另要注意其是否含有智慧財產權,如照片、圖片等。即使是歷史資料,仍然有許多智慧財產權、著作權、隱私權等問題要處理。 

目錄


22.江仁傑 著〈如何建置數位化資料庫的metadata:以「善本古籍」的數位化工作為例〉,台北:數位典藏國家型科技計畫 內容發展分項計畫,2005年9月。
23.Dublin Core可參考官方網站http://dublincore.org/的介紹,或參考吳政叡繁體中文譯介:http://dimes.lins.fju.edu.tw/dublin/,與上海圖書館簡體中文譯介:http://dc.library.sh.cn/,或數位典藏國家型科技計畫 後設資料工作組(MAAT)譯,【參考規範:Dublin Core】,2002年http://www.sinica.edu.tw/~metadata/standard/standard-frame.html
24.同,註7。
25.同,註21。
26.同,註21。
27.同,註21。

 









Download: 古籍線裝書數位化工作流程指南  古籍線裝書數位化工作流程指南 (636.8 KB, 3,405 hits)



評分:

1 Star2 Stars3 Stars4 Stars5 Stars (No Ratings Yet)
Loading ... Loading ...
引用通告

回應:


請輸入圖片中的文字
請按圖片取得圖片中文字的錄音檔
Click to hear an audio file of the anti-spam word