資料與知識
內容發展分項計畫 / 曾鈺絜
數位典藏在過去五年的不斷努力之下,已累積許多寶貴的經驗與豐富的數位內容,如何將這些片段資訊串連成更具結構的知識,是第二期數位典藏的首要任務,預計會以「主題式知識庫」來表現台灣特色,並嘗試加入Web 2.0的共建、共享精神,使其數位內容更加完整。
然而在現今資訊爆炸的網路時代,經由網際網路找尋知識已相當普及,只是在這訊息的銀河,何謂知識庫?不外乎是將內容經過篩選過濾,然後匯集而成。知識庫並不限定任何領域,皆能擁有其專有的知識庫,小至一般的FAQ,大至整個電子圖書館藏,主要功能就是協助解決問題,讓以往前人的經驗能夠繼續傳承。
資料檢索與知識檢索看似相同,但實質卻相異的不同個體,這之間的差異有待更精確的探討,如圖一所示。數位典藏國家型科技計畫在一期的重點產出之一,聯合目錄公共展示系統,它的資訊檢索功能已經不能滿足我們的需求,然而在二期計畫的知識庫,我們期待它能在知識層級裡有更明確的組織分類,加強精確性及個人化,並提供更具有價值性的輸出。
圖一、檢索層次圖
1. 資料庫
定義:針對某一主題將其相關的資料,以特定的方式有系統地將這些大量、複雜且多樣的資料加以收集、整理、儲存,以提供使用者作查詢。資料庫能在最短的時間以極快的速度作資料的檢索,並選擇出使用者所需之資料。資料庫所蒐錄的資料範圍相當廣泛,但相對來說容易造成檢索結果雜亂。
2. 知識庫
定義:知識庫系統的主要工作搜集人類的知識,有系統地表達或模組化,使電腦可以進行推論、解決問題。知識庫中包含兩種型態:一是知識本身,即對物質及概念作實體的分析,並確認彼此之間的關係;而另一則是人類專家所特有的經驗法則、判斷力與直覺。
知識庫與傳統資料庫在資訊的組織、併入、執行等步驟與方法均有所不同,概括來說,知識庫所包含的是可做決策的「知識」,而傳統資料庫的內容則是未經處理過的「資料」,必須經由檢索、解釋等過程才能實際被應用。知識庫包含人類在特定應用領域內的經驗和過去解決問題的方法,著重於資訊之間的整合,能有效並迅速找尋到適切的答案,那麼您搞清楚這其中的關連了嗎?