數位典藏聯合目錄的嘗試:跨學科整合

內容發展分項計畫/江仁傑 2005.07

  數位典藏聯合目錄(以下簡稱「數典聯合目錄」)在製作過程中,一方面嘗試整合不同的機構與計畫的後設資料,另一方面也參考許多國內外網站的作法。我們發現,在國內或國外的例子裡,雖然也有許多整合性的資料庫,但如同數典計畫的聯合目錄,整合十五種不同主題的資料,涵蓋動物、植物、地質、人類學、檔案、地圖與遙測影像、金石拓片、善本古籍、考古、器物、書畫、新聞、影音、語言、漢籍全文等領域,則不多見。因此,當「數典聯合目錄」已經進入五年計畫的第四年之時,應可回顧、反省整合上的經驗,提供給國內外相關機構與計畫參考。

  整合跨眾多主題的內容,主要有兩個方面的考慮,第一,不同型態資料庫的數位資料,如何整合在一個系統中;第二,在一個系統介面上,不同類型的資料要如何呈現。

與各單位聯繫與解釋,是主要工作之一

  第一個問題,雖然牽涉到技術上的資料庫匯出匯入問題,但在技術上並沒有不可解決的困難,但主要問題,是必須聯繫各個無上下隸屬關係、各自發展的單位,解釋匯入聯合目錄的工作過程,並排定時程來進行資料庫匯出作業。

  而參與數位典藏的機構計畫、公開徵選計畫,總數量有七十多個,而每一個計畫,可能針對不同資料性質,設計出不同的欄位,甚至可能由不同的研究者或助理負責。所以,我們針對技術、版權、管轄情況各不相同的單位與資料庫,一一進行聯繫,必然需要大量的時間來進行聯繫溝通。

  第二個問題是,原本各資料庫的系統、欄位等都有差異,那麼在數典聯合目錄上,應當如何顯示各種不同類型的資料?

不同資料庫的內容,如何在一個系統、一個介面上呈現?

我們有以下幾種選擇:

  第一種,設定所有計畫之間的共通欄位,再將各個不同的資料庫欄位,全部對應成此一共通欄位。例如,將A資料庫的「生態狀況」欄位,與B資料庫的「花紋樣式」欄位,全部對應成「數典聯合目錄」共通欄位之中的「描述」欄位。

  第二種,不設定共通欄位,各資料庫在數典聯合目錄的介面上,直接呈現出原本各不相同的欄位資訊,只設定共通的檢索欄位,例如,只設定「題名」、「關鍵字」等為共通檢索欄位。

  第三種,設定部分欄位為共通欄位,而各計畫得以在共通欄位之外,再自行發展其他欄位項目。例如,設定各計畫的共通欄位為:「題名」、「關鍵字」、「管理權」三種欄位為共通欄位(並可規定為必填欄位),而各個計畫可以在自己的資料庫之中,再附加符合自己需求的欄位。

以上三種方式,各有優缺點。

  第一種方式,所有不同欄位整合為一種共通欄位,優點是在數典聯合目錄上的欄位顯示,較有統一風格,使用者容易熟習欄位架構,閱讀欄位資訊的速度較快;缺點是較為耗時,要將所有不同欄位,對應成同一欄位,各單位並需要在匯出資料時,匯出為數典聯合目錄所需的欄位。

  第二種方式,直接呈現出各不相同的欄位,可以保留原資料庫再描述該筆資料的原始特性,欄位名稱較為明確合理,而且,不需要耗費人力進行欄位對應;缺點則是在同一系統上,呈現的風格不一致,使用者較不容易熟習欄位。

  第三種方式,設定少數共通欄位,其他欄位由各計畫自訂。這種方式,必須在數典計畫一開始時,就決定共通欄位,否則就要各計畫更改自己資料庫中一部份的欄位,各計畫將耗費額外時間人力,以目前數典計畫的型態,並不合適。

  以上三種方式,究竟應採用哪一種?經過民國91年度、92年度兩個不同的工作團隊加以試驗、測試之後,到了計畫的第三年,在93年度的工作團隊手中仍有爭論,最後才明確決定,採用第一種方式。此後,雖然會耗費更多時間進行欄位對應工作,但是在介面上呈現資料時,會比較一致。

共通欄位標準:Dublin Core的應用

  數典聯合目錄所採用的共通欄位,是國際間正在發展中的欄位標準:Dublin Core(DC),DC是一種簡易的包含15個欄位的標準,它可以在15個簡易欄位之下,再發展更細緻複雜的欄位。但數典聯合目錄的需求,只是要作一目錄性質的簡單資料,讓使用者查出簡易資訊之後,再連結至原始資料庫貨源班為,觀看更詳細的資訊。

  因此,數典聯合目錄只採用簡易DC,然後在各欄位之內,加上「先行詞」,以表現不同型態的資料特性。例如,原計畫資料庫與某物件名稱有關的欄位,可能有「主要題名」、「次要題名」或「英文名稱」、「俗名」等等欄位,而在數典聯合目錄DC欄位上,只有「題名」一個欄位與之對應。此時,為了保留這些不同欄位的特性,我們把「主要題名」、「次要題名」或「英文名稱」、「俗名」都放在DC的「題名」,再加上先行詞來修飾:

欄位名稱  顯示結果 
題名  主要題名:金鄉祠堂畫象十一

其他題名:朱鮪石室畫象-人事類宴享之屬

其他題名:朱鮪石室畫象(其十一)

其他題名:朱鮪墓祠堂後壁上部 宴飲畫像 

  並且,在「題名」的顯示結果上,加上原資料庫顯示該筆資料之頁面的URL,可直接點選,進入原資料庫完整的顯示資訊,或者更清楚的數位化圖檔、影音檔等。在數典聯合目錄,原則上只讓使用者檢視每一筆資料的簡明資訊,以及瀏覽用的圖檔,較詳細資訊與更清晰之圖檔、影音檔,仍保留在各計畫各單位的資料庫中。

欄位整合的三個特色

總之,目前欄位整合的方式,可歸納為三點特色:

  1. 採用固定的共通欄位標準:簡易Dublin Core,顯示各種不同性質資料庫的簡明資訊。
  2. 簡易Dublin Core內,可使用先行詞,以保留原資料特性。
  3. 每一筆簡明資訊,原則上必須附上原資料庫顯示頁面之URL,使使用者可以看到更詳細的欄位資訊與圖檔或影音檔,或者到原單位的使用介面,獲得進一步的相關資訊。

  每一個單位的資料庫,由於狀況不同、考量各異,因此數典聯合目錄在現階段,不一定都能使每一筆資料,都能呈現較完整的資訊。不過,仍能在盡力而為的前提之下,整理經驗,提出問題,讓國科會、總計畫辦公室或其他相關與類似的計畫、機構來參考,共同尋找更好的工作方式。

加入書籤
  • Digg
  • del.icio.us
  • Facebook
  • Google Bookmarks
  • Hemidemi
  • MyShare
  • Live
  • Technorati
  • TwitThis
  • RSS
  • Funp
  • Haohao
  • MySpace
  • plunk

回應

*
請輸入圖片中的文字
按下圖片中的文字取得錄音檔

Click to hear an audio file of the anti-spam word

  • Loading...


    Loading...

    Login






    註冊 | 忘記密碼

    Register





    A password will be mailed to you.
    登入 | 忘記密碼

    Retrieve password





    A confirmation mail will be sent to your e-mail address.
    登入 | Register