淺談知識網技術運用相關範例 (文/郭東益)
Tags: 搜尋, 搜尋引擎, 數位內容, 知識網 發表: 2008-01-07, 點閱: 9,003 , 加入收藏櫃 , 列印 , 轉寄
相關範例:從「搜尋」談起
要尋找一個利用資訊處理技術結合知識本體與關鍵概念搜尋的機構,Vivísimo公司成立的「clusty」搜尋引擎或許可以當作一個切入的例子。這間公司採用自己開發的「極速平台」The Velocity Platform資訊搜尋技術,以叢集性的呈現方式來處理廣大網路內容的大量資訊搜索。這個技術結合了三大功能:
- Velocity Search Engine 搜尋引擎
- Velocity Content Integrator 內容積算器
- Velocity Clustering Engine 群集引擎
透過三大功能的結合,極速平台能在一個搜尋動作中執行文件的尋找、處理(extract)、與分目(index),管理者有權力管控內容分目的方式以及比重,可隨領域與使用對象調整,且可搜尋多種形式檔的文件,更特別的是,第三方可以透過提供與訂閱加入極速引擎的執行,這個採用網路介面的平台,讓管理者可以提供使用者一個理想的搜尋介面。
整合且具知識本體建構性的資料格式
搜索架構是系統建置與管理者和使用者之間功能性互動的重要介面與橋樑,在完整且具彈性的檢索系統外,知識形成的重要元素-資訊-如何加以有效處理,進而成為我們規劃架構下知識內容可供系統性檢索,這也是一個重要的環節。這和語意網核心技術:「知識本體」的類型、語法,與應用有關。其中,語法的應用十分重要,因為除了建立知識本體架構語彙及關係外,知識本體還需要標準的語法以表達該知識的本體架構。目前已經有許多學識領域為了知識處理、共享與檢索的發展,已經規劃基於其知識領域本體架構整理出的知識整理工具,例如美國國家醫學圖書館的「統一醫學語言系統(Unified Medical Language System,UMLS)」或是普林斯頓大學發展的WordNet。不過同樣是管理工具,這些例子有著各自的組織層次,例如UMLS是可供醫學領域各單位知識庫發展時利用的語法系統,而WordNet則是運用自然語言處理技術專注於文字句法分析,藉此建立知識本體架構的語意網(Semanitc Web),其架構甚至可以幫助建立電腦科學感知技術的知識本體。這些例子各有裡面都需要語法工具的建立來系統性詮釋處理輸入的資料。
在XML環境中,已經有一些用來表達知識本體架構的標準:如以表達主題地圖(topic map)的XTM語法,和由標準機構W3C所推動的網路本體性語言Web Ontology Language (OWL)等等。以OWL為例,它結合了從XML、XML Schema、RDF、RDF Schema一路發展以來對語意網架構的功能性整合,OWL新增了更多描述屬性與關係的辭彙 ,同時又可以套用既有如RDF元件加以發展。另一個由W3C發展的簡易知識組織系統(Simple Knowledge Organization System, SKOS)也是一個和OWL有著管理知識架構的功能,是一個用來知識組織系統使用的規範與標準。
在這裡在舉一個用OWL建構知識庫的例子:Wine Agent。這是一個用來處理酒類與相關食品資料的計畫,而這個計畫在內容上的發展起點,來自一個專門提供酒類相關訊息的入口網站"Wine-Portal.com",這類網站成立之初和很多資訊提供網站一樣,提供一些相關主題與資訊的集合為目標概念,不過這些網站在內容建構過程中組織出的知識本體架構,卻不容易顯現出來。