What’s數位典藏聯合目錄
內容發展分項計畫/江仁傑
我們正在作什麼?
數位典藏聯合目錄(以下簡稱「數典聯合目錄」),目前累積的數位化物件約120萬筆,收集了參加「數位典藏國家型科技計畫」的國家級研究/典藏機構與各大學、各文化單位將近100個子計畫的數位化藏品,種類繁多,包含動物、植物、地質、人類學、檔案、器物、書畫、地圖與遙測影像、金石拓片、善本古籍、考古、新聞、語言學、漢籍全文、影音……等各種類型,目前數量仍在持續增加。
數典聯合目錄的建置,有以下四個目的:
1.為「數位典藏國家型科技計畫」所建置的目錄性展示平台。
2.提供單一入口的整合性檢索功能。
3.展現「數位典藏國家型科技計畫」的成效。
4.達到資訊共享的目的。
跨越人文社會與自然科學的整合
為了盡力達成這些目標,我們決定把將近100個子計畫的不同資料庫,整合成為一個集中式資料庫,並且為了使用者能有一致的瀏覽習慣,要將各資料庫的不同後設資料欄位(Metadata),整合成一種目錄式的綜合性欄位,並且能夠以滑鼠點選來進行分類瀏覽、以鍵入文字來進行查詢……,這些都是數典聯合目錄系統應有的基本功能。這是我們在技術層面的努力。
此外,我們在實際執行時,必須整合自然科學與人文社會之不同領域的內容,既有蟲魚鳥獸、花草化石,也有古物卷籍、書畫影像。這是一項嶄新的挑戰。而且還必須在既有的計畫架構之內,找出可行的工作方式。
開放式組織架構下的集中式資料庫
數典聯合目錄的重點工作,即在整合各機構各學門的不同資料庫,而這些不同的資料庫,又各自採用不同的後設資料欄位。依照數典計畫所預設的目標,各資料庫的各種欄位,必須對應為同一種後設資料欄位,以整合為集中式的聯合目錄資料庫。同時,原本的各機構資料庫仍保持獨立運作,不因製作聯合目錄而更改系統設定或增刪後設資料欄位,因為數典計畫中的各個分項計畫、機構計畫、子計畫之間,是互相合作而非上下層級的關係。
正因如此,建置集中性的數典聯合目錄資料庫,必需花費相當多的時間進行欄位對應、規劃瀏覽架構、資料匯出與匯入方式……等等方面的聯繫。這是一項龐雜但重要的工作。
九十一年度到九十四年度的回顧
建置數典聯合目錄的工作,由「數位典藏國家型科技計畫_內容發展分項計畫_聯合目錄系統建置子計畫」負責,自民國91年度開始執行。當時,將各種不同系統、不同欄位的資料庫整合為一個集中式資料庫,國內極少既有的相關經驗可供參考。歷年來的不斷摸索之中,終於逐漸確立了建置的模式。
(一)九十一年度
1.計畫主持人:陳昭珍教授(國立臺灣師範大學圖書資訊學研究所)
2.團隊:國立臺灣師範大學、「數位典藏國家型科技計畫」內容發展分項計畫、「數位典藏國家型科技計畫」技術研發分項計畫
3.協助參與:國立台灣大學、國立自然科學博物館、國立故宮博物院及中央研究院
在草創初期,數典聯合目錄舉辦了「聯合目錄系統說明會」,宣布以OAI(Open Archives Initiative)技術為架構,並預計將建置系統雛形。同時,面對每個機構與計畫所建置的不同資料庫,也面臨了許多挑戰,例如:如何連結各典藏單位資料庫?如何透過後設資料擷取數位物件?如何設計資料服務端介面?……等。
(二)九十二年度
1.計畫主持人:楊美華教授(國立政治大學圖書資訊學研究所)
2.團隊:國立政治大學、內容發展分項計畫、技術研發分項計畫
3.協助參與:國立台灣大學、國立自然科學博物館、國立故宮博物院及中央研究院
第二年主要任務,是研訂《聯合目錄系統需求書》,著手建置聯合目錄系統原型(prototype),訂定15個欄位的「都柏林核心集」(Dublin Core)為聯合目錄的共通欄位,並確立XML(eXtensible Markup Language,可擴展標示語言)與 DTD(Document Type Definition,文件型別定義)資料輸入格式。九十二年度結束前,已經開始進行250筆的資料匯入,以測試與系統修正。此時所面臨的最大問題,是各子計畫匯入資料至數典聯合目錄的過程中的溝通、共識、工作分配等細節的確認。
(三)九十三年度
1.計畫主持人:黃銘崇副研究員(中央研究院歷史語言研究所)
2.團隊:內容發展分項計畫、技術研發分項計畫
3.協助參與:國立台灣大學、國立自然科學博物館、國立故宮博物院及中央研究院
自數典計畫進入第三年度起,數典聯合目錄以理解各個機構與計畫的內容產出為前提,進行各資料庫的對應欄位,並推動內容發展之各主題小組確認分類瀏覽的架構;同時主動增加與各計畫的聯繫次數,每次主題小組會議皆派員到場瞭解狀況;製作數典聯合目錄手冊,詳細說明各計畫匯出資料時的具體步驟。在以上工作的基礎上,完成了聯合目錄系統正式版的建置。
至九十三年度計畫結束前,數典聯合目錄系統已收錄27萬筆資料,但各計畫所產出的內容也逐漸增加,更需加快腳步與各計畫溝通,協助其進行匯出。另外,在系統功能與網頁介面上,也仍需要逐步加強。
(四)九十四年度
1.計畫主持人:劉錚雲研究員(中央研究院歷史語言研究所)
2.團隊:內容發展分項計畫、技術研發分項計畫
3.協助參與:各機構計畫與內容開發公開徵選計畫
這個年度的工作,除了持續匯入資料(目前已有120萬筆)、針對部分計畫的匯出工作進行技術協助、進行欄位比對與確立分類架構之外,也必須處理各資料庫收錄時所產生的各種顯示、字碼的問題;同時,也加強字串查詢功能,剔除系統錯誤;另外為了增進以滑鼠點選瀏覽的可看性,開始試驗新的分類方式,例如時間分類瀏覽、地理分類瀏覽、具有特色的藏品以「熱門關鍵字」的方式加以整理……等等。
「數位典藏國家型科技計畫」總計畫的「公共展示系統」也開始建置,數典聯合目錄因而提供所收錄的龐大資料與系統運作經驗,作為公共展示系統的基礎。為了提昇使用率,我們也與商業搜尋引擎Yahoo!奇摩討論合作方式,使數典聯合目錄能被一般使用者接受。
新年度的挑戰與期許
在新的年度,數典聯合目錄即將公開展示,直接面對社會大眾,因此在技術方面,我們將繼續提高檢索效度、改善使用者介面方面,將投入更大的努力,並且提高系統穩定度以支撐更大的網路流量。
在組織架構方面,數位內容與數位技術將更緊密的結合,使展示、功能開發都有更靈活的表現,也將考慮的計畫延續的問題,規劃系統後續維護的方式。
而在藏品數量持續增加的趨勢之下,數典聯合目錄也應以豐富的內容為後盾,有更多的展示、研究等方面的產出,同時配合更大規模的推廣工作,使數典計畫的成果能透過聯合目錄系統,更廣為社會大眾所知。
數典聯合目錄計畫歷經不同的工作團隊,執行了四年之久,終於稍具成果。未來,希望在數位典藏的聯合目錄之中,能涵蓋更多采多姿的藏品,更豐富多樣的知識內容,提昇網路世界的質量。