數位化工作流程指南-以數位典藏聯合目錄為導向的最佳實踐
Tags: 後設資料品質, 成果盤點, 指南, 數位化工作流程, 聯合目錄匯入 發表: 2009-12-30, 點閱: 26,607 , 加入收藏櫃 , 列印 , 轉寄
1. 定義「一筆」資料:
典藏機構的藏品匯入聯合目錄,是以物件為基礎單位,一個藏品物件產生一筆資料XML檔。若很多數位檔都是出自同一個物件,則應該視為同一筆資料。
2. 完整XML的定義:
一筆完整的資料XML必須包含四個部分:分類架構、對應(聯合目錄所採用的)DC欄位的metadata、至少一張圖檔(或為其他種類型的藏品數位檔如影音檔、全文資料等,數量上也可接受更多)、可連回原始資料庫的連結。
3. 聯合目錄品質需求
聯合目錄品質需求可區分為內容與格式兩部分:
3.1 內容方面的需求:
聯合目錄在內容部分的品質需求,可依據聯合目錄品質指標作為基礎,共區分為「預期符合性」、「來源性」、「完整性」、「正確性」、「存取性」,在資料匯入後,亦會依此進行匯入資料的品質檢驗與評估:
表8聯合目錄品質評核指標
指標 |
定義 |
算式 |
權重正規化 |
O.I.1. 藏品數量 |
計畫「當年度」實際新增匯入多少筆藏品XML |
計畫當年度實際新增匯入之藏品XML record總數 |
O類指標為預期符合性品質指標,為雷達圖第一部份。以年度新增匯入record總數與計畫實際達成的record數相除求取提交率(O.I.2.)得O部分的分數,再視數位檔提供的多寡(O.I.3.)予以調整 |
O.I.2. 藏品匯入比例 |
計畫「當年度」確實新增匯入筆數佔實際產出總數之比例 |
年度確實新增匯入record總數/計畫當年度實際產出之藏品XML record總數 |
|
O.I.3. 數位檔/紀錄匯入比例 |
平均每筆紀錄包含的數位檔數量,若提供數位檔越多則此項得分越高 |
數位檔匯入總數 /計畫當年度確實新增匯入之藏品XML record總數 |
|
P.I.1. 提供單位資訊 |
Publisher or Rights欄位是否填值? |
Publisher or Rights欄位非空白的紀錄總數 / 紀錄總數 |
P類指標為產生來源性品質指標,為雷達圖第二部份。四項指標(P.I.1, P.I.2, P.II.1, P.II.2)各佔25%,加總得P部分的分數 |
P.I.2. 元素著錄規範的採用 |
是否有採用著錄規範進行元素的著錄?如:CCO、AACR/RDA、ISAD(G)。或內部自行發展的著錄規範? |
人工判斷 |
|
P.II.1. 控制詞彙、索引典或權威檔的採用 |
是否有使用控制詞彙、索引典或權威檔等現有標準,以著錄特定元素的內容?如:LCSH、LCNAF、AAT、TGN、ULAN等。或內部自行發展的控制詞彙、索引典或權威檔,乃至於代碼表? |
人工判斷 |
|
P.II.2. 記錄元素資料值之著錄規範 |
是否採用著錄規範進行記錄元素資料值的著錄?如:AACR、DACS、CCO等。或內部自行發展的著錄規範?(L1) |
人工判斷 |
|
C.I.1. 元素使用完整性 |
Title = 計畫有使用Title的藏品record總數 / 計畫藏品record總數 DC十五個元素都計算一次 |
Title = 計畫有使用Title的藏品總數 / 計畫藏品總數 DC十五個元素都計算一次 |
C類指標為資料完整性品質指標,為雷達圖第三部份。以C.I.1為基礎計算百分比得C部分的分數 |
A.I.1.元素使用正確性 |
元素是否正確使用?亦即元素的實際使用情形是否符合每一個Element的定義?如:Format & Type、Subject & Description、Source & Relation等。 |
人工判斷 |
A類指標為資料正確性品質指標,為雷達圖第四部份。以A.I.1為基礎計算百分比得A部分的分數 |
記錄的取用效能 Ac.I.1. a. 原始資料庫連結存在比例 |
所有記錄包含原始資料庫連結之比例 |
計畫原始資料庫連結總數 / 計畫藏品總數 |
Ac類指標為存取性品質指標,為雷達圖第五部份,由原始資料庫連結與數位檔存取性兩類指標組成。指標得分由原始資料庫連結及數位檔兩部分之得分平均求得。 1. 原始資料庫連結部分的指標計算方式為:先以原始資料庫連結存在比例(Ac.I.1 a)乘以原始資料庫連結有效比例(Ac.I.1 b),再乘以原始資料庫連結相異比例(Ac.I.1 c)得有效又相異原始資料庫連結之比例。 2. 數位檔部分的指標計算方式為:先以數位檔存在比例(Ac.I.2 a)乘以數位檔有效比例(Ac.I.2 b),再乘以數位檔相異比例(Ac.I.2 c)得有效又相異數位檔之比例。 |
b. 原始資料庫連結有效比例 |
所有原始資料庫連結中有效的比例 |
計畫原始資料庫有效連結總數 / 計畫原始資料庫連結總數 |
|
c. 原始資料庫連結相異比例 |
原始資料庫連結不重複 (扣除連結至同一頁面)的比例 |
(計畫原始資料庫有效連結總數-重複連結總數 )/計畫原始資料庫有效連結總數 |
|
Ac.I.2. a. 數位檔存在總數 |
數位檔連結總數 |
計畫提供的數位檔連結總數 (ex: 有提供70筆數位檔連結) |
|
b. 數位檔有效比例 |
數位檔連結有效的比例 |
有效數位檔連結總數 / 數位檔連結總數 (ex:70筆數位檔共有65筆數位檔有效) |
|
c. 數位檔相異比例 |
扣除多筆連結其實指向同一個數位檔連結者 |
(有效數位檔連結總數–有效數位檔重複的連結總數)/ 有效數位檔連結總數 (ex:60筆圖檔URL不重複 / 65筆圖檔URL有效 ) |
3.2 格式方面的需求:
3.2.1 數位檔案的格式 (待確認)
各計畫數位化成果,在物件方面,應至少提供「公共瀏覽級」的數位檔案,且應該符合以下規格的最基本要求:
表9聯合目錄公共瀏覽級定義
類型 |
規格 |
收錄範圍 |
|
數位化物件 |
後設資料 |
||
文字 |
TXT或XML |
全文提供 |
全部 |
靜態影像 |
檔案格式:JPEG 影像大小:至少500*500像素 |
一筆後設資料,至少需有一張對應影像 |
全部 |
錄音 |
檔案格式: MP3 或 AAC 或WMA 取樣頻率:至少44.1KHz 資料傳輸率:至少128-192kbps |
檔案時間:完整 |
全部 |
影片 |
檔案格式:H.264(MPEG4-AVC) 或WMV 影像大小:至少320*240像素 資料傳輸率:至少150-300kbps |
檔案時間:完整 |
全部 |
其他 |
除以上所列之其他格式,如3D、Flash等 |
全部提供 |
全部 |
3.2.2 後設資料的XML格式
3.2.2.1 XML欄位內容遇到下列字元時,需改用跳脫字元表示:
- 「&」à「&」
- 「<」à「<」
- 「>」à「>」
- 「"」à「"」
- 「,」à「'」
- 其中需要注意若是遇到類似「&#1234;」的時候,&則不需要轉成跳脫字元,因為&後面帶數字編碼代表本身就已經是跳脫字元。
3.2.2.2 Project欄位中的GenDate屬性,請標註該批XML匯出的時間,例如「GenDate="2005-03-24"」,聯合目錄將依據此時間屬性來判斷此筆資料是更新還是新增的XML。
3.2.2.3 <Record>欄位中的內容主題、典藏機構與計畫需用半形冒號「:」隔開,匯出時需小心類似這樣的錯誤:「內容主題:人類學::::雅美(Yami):器物」,正確範例如下:
- <Record>內容主題:人類學:臺灣原住民族:高砂族群:雅美(Yami):器物</Record>
- <Record>典藏機構與計畫:公開徵選計畫:國立政治大學:民族學系:國立政治大學民族博物館數位典藏計畫</Record>
3.2.2.4 時間請遵照以下任一種格式[6]
- yyyy-MM-dd hh:mm:ss.S
- yyyy/MM/dd hh:mm:ss.S
- yyyy-MM-dd hh:mm:ss
- yyyy/MM/dd hh:mm:ss
- yyyy-MM-dd
- yyyy/MM/dd
3.2.2.5若缺少時間或地理資訊,可不需在<Record>欄位中產生時間、地理架構。
3.2.2.6 <DigiArchiveID>欄位為必備欄位,且內容必須為唯一碼(Unique Identifier),若是變更編碼可能造成下次匯入時,筆數無故增加的問題。建議直接採用機構為藏品所編的「館藏號」、「典藏號」、「藏品編號」或「登錄號」等的唯一識別號碼。
3.2.2.7匯入前,請測試<Hyperlink>與<ICON>欄位,是否可以與XML內容與圖片正確連結。原則上此二欄位不可為空值(數位檔為文字性全文資料除外)。
3.2.2.8 <MetaDesc>部分請在各DC欄位的tag中,標註機構資料庫原始欄位名稱,例如:
◆ <Subject field="功能">裝飾具</Subject>
3.2.2.9內容單位匯出的XML若是有DTD宣告,請附上DTD檔案。若每筆XML 要加上DTD驗証的 Tag,也就是文件型別宣告(DOCTYPE),請注意其DTD檔案位置的正確性,尤其當XML與DTD是放在不同的目錄時,要注意其XML是否可正確參考到DTD檔案的所在位置。
例如:<!DOCTYPE AnthropologyContract SYSTEM "..\AnthropologyContract_v1.0.dtd">
3.2.2.10若匯出大量XML 時,請以五千筆為一個單位放入個別目錄,目錄名稱可自由命名。
例:1~5000可放入名為01的目錄中,5001~10000 可放入名為02的目錄中,以此類推。
3.3 授權標示欄位說明(圖與文的授權可分開標示)
欄位 |
內容 |
範例 |
公眾授權 |
A. CC授權(附件一:CC授權模式表) |
a. 採用創用CC「姓名標示-非商業性-相同方式分享」2.5台灣版 b. 採用創用CC「姓名標示-非商業性-禁止改作」2.5台灣版 c. 採用其它CC授權條款 |
B. 其他方式之公眾授權(條款如:XXX) |
a. 公眾得無償使用但需標示典藏單位管理權:採用授權條款為「對於本網站上之單純數位化物件,使用者可非營利使用,惟於使用時請標示其出處。但若是重製、散布部分或全部網頁,非經本單位許可,不得為之。其單純數位化物件所標示之權利管理電子資訊,未經許可,亦不得移除或變更。」 b. 公眾在限制情況下(如:教育、教學目的)得無償使用,然須向本單位申請同意,否則將追究一切法律責任,授權聯絡窗口:XXX |
|
1. 非公眾授權 |
請洽授權窗口 |
|
2. 不可授權(不公開) |
A. 開放免費瀏覽,僅限合理使用 |
a. 由於法律約束、機密保護、學術倫理、契約限制等原因,所有著作權保留,限制性使用方式。 b. 只能瀏覽,不得為重製、散佈、公開傳輸等行為 c. 開放目錄瀏覽及後設資料,詳細內容請至本單位申請使用 |
B. 不匯入聯合目錄(暫鎖) |
本計畫將於XXX年開放部分授權(機密保護法、著作權法) |
全文下載 (359.3 KB, 1,435 hits)