文章分類 ‘觀察室歷史文章’

國外數位典藏網站探索報導—京都大學電子圖書館「貴重資料畫像」

星期二, 五月 27th, 2008

內容發展分項計畫/溫淳雅

 

  京都大學電子圖書館(圖一)始自於1998年,主要的數位化內容有「貴重資料畫像」、「數位化文本」、「博士學位論文資料庫」、「校內研究成果」等部分。本文主要介紹其中的「貴重資料畫像」(圖二)。

 

圖一

 

 

 

圖二

 

  京大「貴重資料畫像」所公開的內容,包括「京都大學附屬圖書館所藏古地圖」、「維新資料畫像資料庫」、「繪卷物、奈良繪本收藏」、國寶「今昔物語集」、「國女歌舞妓繪詞」、「伽草子」等日本重要的史籍文獻,如國寶「今昔物語集」,便是日本故事文學的代表作,被考據為傳世的抄本中最原始的版本,為日本指定的重要國寶。此外也有部分如「中國清代民國公私文書收藏」、「法國建築、地誌收藏」、「伊斯蘭學貴重資料」等他國資料。

 

  在介面方面,主要可分為「瀏覽」與「檢索」兩個部分。由於京都大學在設定上是呈現貴重資料的「畫像」,也就是說,以數位化影像為主要呈現內容,在數位化的內容上也有絕大部分屬於繪卷、照片等圖象式的資料;因此一進入該網站,便可見到以各資料庫的代表性圖象所組成的頁面(圖三),使用者可以很自在的藉由圖象式的印象,去搜尋有興趣的內容觀看。

 

圖三

 

  在影像方面,書冊與照片類型的藏品,大致上提供了單邊長500像素大小與單邊長1000像素大小以上的兩種尺寸圖檔,解析度為72dpi,以網路瀏覽而言已十分清晰可觀。另外在地圖、繪卷等類型的藏品,除了上述兩種尺寸的圖檔外,還提供單邊長1000像素大小以上的「局部放大」圖(圖四)。整體而言,京大電子圖書館「貴重畫像資料」所提供的數位化內容都非常精彩,有利於教育、研究方向的使用。

   

 

 

圖四、局部放大示意圖

 

  不過或許是因為歷年建置情況不一,在不同的主題畫像的瀏覽介面上,雖有大同卻也有小異。如有些以滑鼠點選500像素瀏覽圖,會呈現1000像素大圖,有些則是點選後呈現局部放大圖、整體大圖需另外點選畫面以外的按鈕。但基本上而言功能單純,不至於令使用者感到迷惑。

 

  此外值得稱道的是,各方面主題的資料,或多或少提供了詳細的解說,包括該主題資料的詳細歷史、京大所藏版本源由、延伸的人物與歷史介紹等等(圖五)。

 

圖五

 

  檢索介面大量利用下拉式選單(圖六),其實是文字化的瀏覽介面,令使用者可迅速進入所欲瀏覽的重要書冊內容,做圖象的閱覽,可惜進入後並沒有單獨針對該書冊的檢索介面。真正的檢索則分成簡單檢索與進階檢索(圖七),並有「檢索具圖象的資料」之功能,如無特別選取該功能,則檢索結果會將具有圖象者優先排列,但可惜在檢索結果列表上沒有特別表示這一點,使用者可能在點選進入觀看內容後,才會清楚是否具有圖象。檢索後的單筆結果欄位單純,最主要是題名與描述(圖八)。

 

 

圖六

 

 

 

圖七

 

 

 

圖八

 

  除了具有資料庫的功能外,京大「貴重資料畫像」也在展示上也做了許多嘗試。例如英文網頁部分,提供了四種內容的全英文化介紹(圖九),包括「伽草子」、「法國建築、地誌收藏」、「國女歌舞妓繪詞」、「博物學的時代」。以大量英譯介紹文的方式(圖十),將京大所收藏的重要文物介紹給全世界,在推廣效果上應有很大的助益。

 

 

圖九

 
 圖十

 

  而在介面上花心思的以達到展示目的的,以下舉兩個例子進行說明。其中之一為國寶「今昔物語集」的呈現方式。由於今昔物語集為日本重要的故事文學代表作,雖然京大所藏版本的重要性無可取代,但坊間要找到當中的內容十分容易。因此京大電子圖書館做了展示上的功能開發,提供了三種抄本影像與文本內容並列的方式,分別是:

 

  1.「標準版」——jpeg圖象與html並列的方式,優點是文本可任意的複製,圖象亦可以大圖顯示,缺點則是以大圖顯示時,需要花費力氣不斷去拉選網頁捲軸,可視畫面亦較小(圖十一)。

 

 

圖十一

 

  2.「文本影像連動版」——以JavaScript方式,令使用者在捲動影像或文本任一視窗的捲軸時,另一方可以同步移動;此方式也有提供瀏覽圖或詳細大圖兩種閱覽方式,文本皆可同步移動,但同樣有可視畫面較小的缺點,文本的複製則需額外點選「翻刻」功能方可選取(圖十二)。

 

 

圖十二

 

  3.為最新的「透視重疊版」——以flash方式製作,滑鼠在影像上瀏覽時,可同步出現相對應的正楷文本,就如同放置一塊玻璃版在典藏品上即時顯示,對照性最高,可視畫面也最大,介面清晰流暢。文本的複製則如同前一版,點選「翻刻」功能進行選取(圖十三)。

 

 

圖十三

 

  其二要介紹本網站最近推出的典藏「太平洋戰爭期間泰國新聞典藏」。此典藏包括了「Krungdeb Varasab Daily News」、「The Siam Rashdra Daily News」、「Lak Mueang」等三種報紙的內容,並提供了iPallet/Lime JPEG與JPEG兩種方式呈現。前者可以直接縮放大圖(圖十四、十五),可在主畫面上隨意拖曳,也有導覽小圖(圖十六),同時也提供列印功能。後者則提供大小兩種尺寸圖檔。小圖約為350*500像素以上,大圖約為1800*2650像素以上。兩種方式都可開放圖檔單張下載。

 

 

圖十四

 

 

 

圖十五

 

 

 

圖十六

 

  最後,在版權宣告方面,京都大學同意以教育、研究為目的之列印與下載,其他方面的利用需先行通知,印刷出版則需付費使用。

關於道經數位化的幾個想法

星期二, 五月 27th, 2008

內容發展分項計畫 / 怡真

 

  碩士論文的題目寫了仙人,從上古的仙人姿態至中古的神仙形象,就此跟道經似乎就此結下不解之緣,因此就過去研讀道經時所面臨到的一些狀況,以一個研究、使用者的角度來思考道經的數位化,希望能有助於道經數位化工作的進行。

 

  由於道經目前進行的數位化工作是採取全文輸入的方式進行,因此相當多的困境其實與一般古籍在進行全文輸入時的問題差異不大,然而其中還是有幾點狀況不同於目前漢籍資料庫中的古籍全文。

 

  其一是標點的問題。目前國內研究史學、中文的學者、研究生人數眾多,其學術傳統由來已久,眾多古籍標點斷句多有定論,然而道教學研究相較之下,尚處於萌芽階段,且道經帙多篇繁,其中又多儀軌、咒語,在解讀上本就較一般古籍不易,如何斷句標點在當前階段實尤困難。文哲所針對道經數位化本就採取以研究生組織讀書會讀經,並加以討論標點,而後交由李豐楙老師進行最後決斷的方式來暫時解決斷句的問題,然而以其人單勢薄,目前得以上線使用的道經篇幅甚少,主要以類書為主。就日前參與「數位寶典」會議,得知所內漢籍工作室正針對道經進行數位化,採取的方式是暫不標點,先以全文上線為首要目標,這固然造福諸多研究者,然而卻無法解決標點的問題,更無法透過建立對道經的斷句,進而建立起道經的詮釋傳統。或許可以考慮與其他單位建立策略聯盟的方式,針對目前有進行道經全文數位化的文哲所、京都大學人文科學研究所(其網站為道氣社http://www.zinbun.kyoto-u.ac.jp/~dokisha/)合作,開放資料庫使用的同時,也允許這些道教學者可以針對資料庫中道經的內容進行標點的工作,甚至日後或許還可邀請法國、美國方面的學者加入。

  …詳全文

關於Million Book Project

星期二, 五月 27th, 2008

內容發展分項計畫 / 李佩瑛

  

  Million Book Project(以下簡稱MBP)由Carnegie Mellon University資訊工程學系與圖書館領導,為一大型書籍數位化計劃,目標於2007年完成百萬本書籍的數位化工作,希望能提供大眾全文檢索與免費網路瀏覽的功能。主要參與國家為美國、印度與中國大陸,並於印度、中國大陸設有大型的掃描中心,印度計有22所,中國大陸計有18所,除了前述兩地之外於埃及、夏威夷、Carnegie Mellon University也有掃描工作進行。

 

  不同於Google Book Search內含商業機制並著重於強而有力的書籍檢索,MBP較傾向於知識的流通、永續性與促進新知識的形成,是以書籍內容為主的數位化計畫 。除此之外MBP也重視數位化技術,如:光學符號識軟體(Optical Character Recognition, OCR)的準確性、建構性後設資料的自動產生、智慧型索引…等。

 

  由於MBP含有書籍全文檢索的功能,因此在書籍的版權方面也須格外注意,MBP的書籍來源多半為大學院校圖書館的書籍,或是技術報告、政府文件之類,某些由大學院校自行出版的出版品取得版權較為容易,並會在掃描後歸還圖書館,其他書籍則部分來自募款單位或是於圖書館更新書籍時取得部分淘汰的書籍。但大致來說MBP所收藏的書籍與Google不盡相同,除上述來源之外,MBP也收藏聯合國食品與農業組織與的相關文件。

  …詳全文

網路新貴-VLOG

星期二, 五月 27th, 2008

內容發展分項計畫/淑惠

  

  繼部落格(BLOG)、無名小站快速竄起後,現在又發展出另一個新興產業-VLOG。所謂的VLOG (Video Blog)-影音部落格,簡單來說就是會動的部落格。早期的Blog靠的是作者的豐富文字能力及圖片的表達,才能傳達出要表現的內容,但總覺得好像還少了點真實感,也就是因為如此,才加速了VLOG的發展。另一方面VLOG主要都是以動態的內容呈現,對民眾來說動態影片所表達的內容遠遠超過於靜態,所以接受度也相對來的較高。只要利用DV、手機、相機等簡單的工具每個人就可以成為VLOG上的主角。透過VLOG,增加了大家show出自己的機會,有人利用它來記錄生活、也有人利用它來當作表演的舞台,所以在VLOG中各式各樣有趣的影片內容都有,因而成為新新人類中熱門的網路活動之一。VLOG是由國外開始發展起的,在台灣目前還算是剛起步而已,投入發展的公司有年代數位媒體的「I’m TV」、遠創的「Play Blog」等,知名入口網站奇摩、蕃薯藤、新浪網等,也紛紛投入VLOG服務的開發。目前以「I’m TV」的發展最為成功,該網站的影片數已達7.4萬個;網友自行開設的VLOG也有3.14萬個,短短時間,已造成台灣一股VLOG風潮。放置於網站上的影片都是採可免費公開播放、重製的,所以藉由這樣一傳十、十傳百、百傳千的力量,想必在不久的將來,台灣又會多出許多出色的網路明星。

 

  目前台灣最先發展VLOG的是年代數位媒體的「I’m TV」,網站會員主要分為一般會員及升級VIP會員,差別在於VIP會員是需要付費的,但相對來講所提供的功能及權利也要來得較多。

  …詳全文

從Web2.0時代看Metadata新應用模式-Folksonomy

星期二, 五月 27th, 2008

內容發展分項計畫 / 高芷彤

 

網站介紹:www.Flickr.com

 

  當Web2.0時代來臨,使用者擁有網站內容架構的主導權時,傳統資訊分類方式是否仍適合使用者建構網站資料庫的內涵?以Flickr相片社群網站為例。

 

Web2.0時代

 

  「Blogger」一個新的名詞誕生,引爆網路世界的革命現況。Blogger顧名思義是指網誌作者,寫Blog的人,也稱作部落客、博客等解釋。繼九十年代網路泡沫化後,網站經營者開始重新思考過去的失敗並吸取成功者的構想以及經營模式,網站逐漸從傳統以銷售轉為提供服務建構平台為導向,網站釋出內容的主導權,用戶從被動瀏覽網路到主動參與網路架構內涵,使用者開始有了擁有權利以及姓名。此模式源於O’Reilly Media公司CEO Tim O’Reilly所提出的Web2.0概念,在此概念下網際網路從「靜態網頁集合」轉向「提供軟體服務」的演進概念,特別是一些支援自助出版或參與協作的服務。網站不再是靜態,而是能和使用者互動了解使用者的需求進而提供服務。以「無名小站」為例,國內交大大一學生成立創立於1999年,最初無名小站以BBS概念結合BLOG以及相簿,提供全台灣超過四十五萬的上網人口一個園地,網友透過網路相簿放上自己的相片show自己,透過網誌紀錄心情點滴,更成為出版業者發掘新書的重要來源,彎彎的《可不可以不要上班》、化名Lowes撰寫的《原來我不帥》等書便是如此。當時無名小站站如其名,2005年「無名小站」已是台灣上市公司,目前台灣使用人口更超過250萬人,從全球網站流量排名顯示擠入全球前100大網站。

 

  Tim O’Reilly和John Battelle舉出Blog、社區照片共用服務(以Flickr為代表)、集體編輯服務(Wikipedia為例)和社會性書籤服務(Delicious)等以使用者為中心的Web現象,促使資訊在網路的產生、共用以及擴散的傳統概念轉變,同時也影響軟體業者的開發。Yahoo!奇摩總經理鄒開蓮表示,「Web 2.0的精神是將原本單向的服務,轉變成由網友共同參與互動的網路溝通。而Yahoo!奇摩Widget工具正是Web 2.0精神的展現」。

 

資訊分類-Metadata的新面貌

 

  資訊分類是在期望能在大量的資訊中達到在混亂和有序之間的動態平衡。Metadata是關於資料的資料,為建構網站「Information」數據來源,用來描述、組織以及發現網際網路大量訊息,隨著Web2.0時代的來臨傳統依照學科對資料作分類的等級是分類法或依照不同屬性來查找資料的分面分類法是否仍適用?依照Tim O’Reilly以及Battelle在Web2.0會議中總結關鍵原則指出Web2.0是分享和參與的架構趨動的網路效應、是以Web作平台將數據變為「Intel Inside」等特色,降低分類技術門檻勢在必行,以提供使用者容易架構網站內容提高參與。Google專注於用戶需求以及發展核心技術,憑藉用戶鏈結網站-PageRank,而非資料的本身Metadata來判斷訊息的價值。2005年初,一種由用戶參與和主導的資料組織的方法-Folksnomy自由分類法,被廣泛關注,迅速在Technorati、Myspace等多個系統中推薦應用。自由分類法降低了應用門檻,用戶只需通過平面化的自由關鍵詞進行分類,再以網路共享的方式分享,同時影響傳統資訊組織,呈現另一種面貌。

 

Flickr vs. Folksonomy(自由分類法)

   

 

 

(圖表 1、資料來源:www.alexa.com。)

 

  Flickr.com是一個提供使用者擺放照片的相片社群網站,由加拿大魁北克Ludicorp公司所設計於2002年成立,提供一個能分享數位相片的平台網站,採用網際網路目錄機制,用戶可自行對自己感興趣的資料定義相片的關鍵下進行分類,並與他人共享標籤的過程以及結果。「資訊的民主化是該網站最有趣的部份」解答搜尋網站GuruNet執行長Bob Rosenschein表示。「他們不一定每次都很精準,但這都是網友所談論的真實主題,若數量夠龐大,也是有數字的可信度,這就是群眾的智慧」。此網站於2005年3月被美國Yahoo.com公司所併購。

 

  網際網路的多元化提供使用者不同服務,以目前備受注目的搜尋引擎Google為例,其專注於技術的研發,有別於Yahoo、微軟等大型入口網站以提供各種不同領域之服務為主,希望能留住使用者,Google提供一簡單的檢索框介面,協助使用者在大量的資訊中迅速搜尋到正確的訊息為主,專注使用者需求並提供專業技術則較似於網站出口,開創另一新局面。Flickr的相簿社群網站同樣專注於技術,Yahoo發言人Joanna Stevens表示,決定購買Flickr的主因不在於數位照片,更重要的看在Flickr的技術與其聰明的創始小組。「在那麼龐大的資料庫中尋找東西時,網友需要的不只是搜尋而已,而是需要更多面向來尋找資料。」Stevens表示,「Flickr的優點是能彌補Yahoo下一代服務的不足。」

 

  在Flickr的Hot Tags將文字大小與對應圖片的多少採用正比的方式呈現,圖像化地貼近使用者視覺感官。使用者可標識(Tag)感興趣的內容,提供一至多個Tags,無需了解傳統專業的DCMI或查詢杜威十進制分類法的分類原則,Flickr相對降低了資訊分類的門檻。當檢索者看到Tags不適合時可增加或修改,另外常用的Tags則會依字順形成圖表。也就是說在Flickr中標識(Tags)是隨用戶使用不同標識(Tags)而有內容動態的更新,Tags圖表中有些大有些淡出,用戶可隨時發現目前分類的趨勢。使用者經驗公司Adaptive Path創始人Peter Merholz表示,「Flickr這類網站的衍生效應是資訊的全球目錄化」。

 

  

 

  Tags的自由分類法滿足用戶的視覺偏好以及讀圖的心理,較搜尋引擎的輸入框更直接。雖自由分類較無傳統分類來的有等級結構且有較無法精確描述資訊,但從全球網站流量排名顯示,成長速度相當穩定,也許在現今網路成熟且逐漸開放式的環境下,Tag的自由分類法會更貼近使用者需求以及偏好,RSS技術繼Epinions創始人R.V. Guha表示,自由分類法理念在於,「我不強迫大家使用相同標籤,也因此整個系統會更豐富,呈現原創者所沒有想到的突出現象。」

  • Loading...


    Loading...

    Login






    註冊 | 忘記密碼

    Register





    A password will be mailed to you.
    登入 | 忘記密碼

    Retrieve password





    A confirmation mail will be sent to your e-mail address.
    登入 | Register