1024x768 1280x800   Decrease font size for  - 拓展台灣數位典藏 - 數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫網站 Reset to normal font size for  - 數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫網站 - 拓展台灣數位典藏 Increase font size for  - 拓展台灣數位典藏
 


數位典藏立法規劃協調會會議摘要

發表日期: 2008-05-27, 點閱數: 0 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

林淑惠 94.9

 

  1. 數位典藏沿用科技基本法,毋須再建立新法。(國科會、數典計畫立場)
  2. 如以科技計畫補助經費進行數位化工作,則適用於科技基本法。
  3. 如藏品委託其他單位技術進行數位化,而該數位化檔案之copy right 由典藏單位和技術單位自行協商訂定。
  4. 如要設立統一投權機關,授權的程度為何?應列為考量要點。如成立是要以授權機關的名義還是數位典藏名義授權?
  5. 國圖有一批文物並非擁有所有的著作權,如借由數位典藏公開在網路上,恐會引起部份著作權人之異議,所以目前採用無償授權方式。建議可以整合統一授權窗口或機制,以協助各單位解決。
  6. 若在合理使用範圍內(如非商業使用等)不需授權金,則合理使用範圍為何?
  7. 文建會現執行之國家文化資料庫與國科會的數位典藏分別建立在二種不同的法津上,在日後執行上可能會造成困擾。
  8. 授權標準建議由主管機關訂定原則性規範,由各單位視各自情況自行訂定相關內容,並請主管機關核備或備查即可,以增加彈性作業。
  9. 民間單位在數位典藏單位進行應用合作時,建議由典藏單位先行取得授權,避免讓業界在合作時產生更多後遺症。
  10. 有關專屬授權與非專屬授權主要視典藏品內容之價值性為主,若典藏品本身價值性夠高,而採取高授權金之專屬授權,對於尋求對外廠商合作應不會造成太大問題。
  11. 應將授權資訊完全公開,才使得民間有管道得知合作消息,以利推廣數位典藏。
  12. 聯合目錄應建置在屬於官方支持,但不代表官方的網站,將文建會和數位典藏共同建構在同一個基礎上,有利於日後在對國外推廣時,有一整體的行銷。

OCR技術分析

發表日期: 2008-05-27, 點閱數: 0 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

 程婉如

 

  OCR在技術研發方面以文件分析與光學文字辨識研究為主,其中文件分析包括彩色背景的去除、文件區塊(文字、影像、表格)的分離、直橫排的偵測、閱讀順序的決定等;而光學文字辨識則包括文字切割、手寫或印刷字之判斷、印刷字體的偵測、手寫及印刷中文和英數字的辨認核心等。OCR的處理過程除了本身的辨識引擎之外,還可針對辨識前的影像圖檔或辨識後的結果做進一步的處理與分析。以下略為描述前處理、辨識引擎及後處理等步驟。

 

一、前處理

 

  期刊報紙等物件經由掃描成為影像檔至進入辨識引擎之前,這期間的處理過程均屬於前處理範圍。此步驟又可分為影像處理、版面分析與字元切割等三部分。

 

  (一)、影像處理

 

  本文曾說明物件本身的文字與底色反差明顯者較宜進行OCR,亦即直接以黑白文件且清楚而無雜點者進行掃描較佳,然而,為避免因掃描品質不佳而使得黑白文件影像檔中的字元產生破碎或模糊不清,如今OCR辨識系統已能允許彩色或灰階的文件影像輸入,並利用影像處理技術求得較佳的黑白影像檔,以提高辨識率的準確性。

 

  (二)、版面分析

 

  由於OCR辨識引擎通常只辨認單一字元,因此文件影像需先經過版面分析,而版面分析原理及使用技術敘述如下:

 

  1.版面分析原理

   將文件區分為影像、表格與文字三種區塊,其中影像區塊是不可辨認者,可經過壓縮予以儲存;表格區塊則經過格線抽取、交點偵測、欄位抽取等,將表格的格線與欄位分離,而表格的欄位和文字區塊,則需經過文字行的抽取與字元的切割,將每個字元抽取出來後再進入辨識引擎做辨認處理。

 

   2.版面分析使用技術

   (1).區塊分割

  在一般文件影像中,每個區塊均會以空白行(大小不定)做區隔,因此可以利用「遞迴投影法」(Recursive projection analysis) 或「相連元件偵測法」(Connected component detection)來做區塊切割。上述兩種方法在理想情況下,可將每一文字行切出,甚至切出每個字元,然而面對版面傾斜的文件,「遞迴投影法」則較無法獲得準確的切割位置。

   (2).區塊型態判斷

  上述區塊分割之後,通常會以下列三種區塊特性進行區塊的型態判斷:

   A.黑白點比例

    首先,先計算區塊內的黑白點比例,若黑點遠多於白點,則可能為影像區塊。

   B.線段的存在

    若區塊內可找到數段直線,則可能是表格區塊。

   C.相連元件的平均大小與間隔

    區塊內相連元件的大小與間隔分佈平均,且找不到直線,則應為文字區塊。

    (3).傾斜校正

  一般而言,OCR通常可進行些微傾斜字元的辨識(傾斜角度在正負0.5度以內),但若傾斜角度過大,將會影響版面分析與文字辨識率,因此在版面分析階段,通常會先做傾斜角度的偵測與校正。而目前新技術「地理性校正」已能克服不僅是頁面甚或內容文字傾斜時進行曲度修正,並盡量將影像頁面調整至水平以利後續OCR辨識作業。

 

  (三)、字元切割

 

  當版面分析將每行或段落文字切出後,在進行辨識之前,尚須將每一文字元切割清楚。在此可利用一些文字特性,來決定哪些是正確的切割位置。例如,中文字乃方正字,若採用某切割位置,則可能導致切出太狹長的字元而無法採用。但若辨識文件為中英文夾雜者,可將切出的非方正字先進行英文辨識,如果辨識結果符合原字元,則此切割位置方法將可採用。當辨識文件中的每行字元間距夠明顯,即可提高字元切割的效率與速度。

 

二、辨識引擎

 

  當字元切割完成後,即可將每個字元影像以辨識引擎進行辨認。最基本的辨認方式,即將字元影像與資料庫中每個中文字的影像比對,並計算相對位置的顏色是否相同,找出差異最小者即為辨識結果。辨識引擎的內部技術有特徵抽取、特徵比對與加速技術。

 

三、後處理

 

  一般而言,在文件本身的影像品質不佳的情況下,辨識率其實不易達到令人滿意的效果,然而在後處理的技術方面,加強OCR系統學習功能是有可能微幅提高辨識率的。此部份可採取字典查詢或者前後文相關方法來進行:

 

  (一)、字典查詢法

 

  針對辨識內容特定的需求與用途(例如名片辨識、新聞字幕等),可事先內建辭典以提供候選字做更正的步驟。以名片辨識而言,通常會有一欄位為「電話:」,而其後緊接的字元就可限制為阿拉伯數字及特定字(如#、轉、分機等),如此便能降低辨識系統誤認的情況。

 

  (二)、前後文相關法

 

  蒐集大量辨識字元,並統計每個字元前後相關聯字出現最頻繁者,讓OCR系統具備自動學習關聯字之功能,待完成辨識結果後,即可以本身字元的候選字加上前後文來判斷最有可能的辨識結果。

真知道你數位化了什麼嗎?(一)

發表日期: 2008-05-27, 點閱數: 0 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

 溫敏宇

 

  94年9月30日至10月2日「2005自然物標本與生物多樣性資料庫整合國際研討會暨Species 2000亞太地區論壇」一連進行三天,兩天中的會議討論了動物、植物、地質等多樣性自然物,10月1日邀請了國際知名生物多樣性之負責人或專家學者介紹其資料庫與資訊網,舉凡各國如何數位化、各國的重點著重何處等等..多項議題,他們花了數十年的專業做了幾十年,只將世界不到0.02%的生物變成可應用的數位資訊。兩天會議下來,雖有許多窒礙難行之處,我的感想是:一群人貢獻畢生寶貴的年歲和經驗正在「創造需求」。

 

  中央大學認知科學研究所所長洪蘭在「創造力神經機制」一文指出:在科學上,「發現」、「發明」與「創造」的層次是不一樣的。「發現」是東西原本就存在,他是第一個發現的人,比如哥倫布發現新大陸;「發明」在原創性的層次比發現高,他是東西不存在,因為這個人而使東西出現,比如愛迪生發明了燈泡、弗萊明「發現」了黴菌,「發明」了用途;「創造」帶有濃厚的個人色彩,沒有這個人就沒有這各東西,比如沒有畢卡索就不可能有畢卡索的畫,在科學的創造力叫發明,在藝術方面的創造叫創作;許多人在追尋自己人生的意義的同時,這群人在問自己:這些資產對「人類」有何意義!

 

  其實ㄧ個人真正的人生目的往往不是賺得一棟房子、成為億萬富翁、環遊世界,而是一個有意義的意涵,好像:成為一個解決問題的人、做一個有愛心的人…;世界首富微軟總裁比爾蓋茲體認到解決人類問題才能創造人生最大意義,所以放棄了哈佛大學開創微軟成為世界首富,不管他的財富有多少,他想的,是實現「解決一群人」的問題。

 

  我們所擁有的東西數位化的價值在哪裡?數位化之後提高了多少價值?使數位化物件成為有意義的意涵是值得我們思考的問題,這次的「2005自然物標本與生物多樣性資料庫整合國際研討會」正是為此而來,原本動植物就有界、門、綱、目、科、屬、種的分類,一個新動物或植物被發現時在生物學上是很容易界定的,那麼,其他種類的數位化物件是否有此需要?

 

  資訊社會帶領人類社會到達一個知識新領域,資訊變成垂手可得的濫觴,這些數位化成果現在看來也許是海底撈針般徒勞無功,也許在有生之年未臻完全,卻是許多學者與工作人員研究的心血結晶,愛迪生發明電燈改變人類日出而作日入而息的習慣;貝爾發明電話改變人類的通訊方式;萊特兄弟發明飛機縮短了人類距離與時空差距;我們建構數位化文件是否改變了人們對知識渴求或只是典藏了大量數位化物件?廣告創造了人們消費慾望,數位化是否創造人們知識渴求的慾望?

「兩兆雙星」的迷思

發表日期: 2008-05-27, 點閱數: 0 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

940926陳柏伸

 

  受到全球經濟不景氣的影響,台灣的經濟首度在2001年出現負成長率,在經濟稍復甦後,緊接著失業率攀升到近年來的高峰,又因顧及兩岸的政策下,政府的壓力可見一般。前幾天有一則新聞報導:「台灣最後一條筆記型電腦生產線已關閉。」,我們可以從這裡看出倪端,台灣的企業現今與中國大陸已產生密不可分的趨勢,特別是台灣的製造產業。除此而外,台灣整體的就業環境也受影響而變遷,資金、人力外流的情形亦是不爭的事實,當政府在推動「挑戰2008:國家發展重點計畫」的同時,是否已準備好下一波的政策,使台灣百姓安然渡過民生的問題?兩兆雙星的「產業高質化計畫」已邁入第三年,在未來的幾年裡,兩兆雙星的政策是否能達成預期的目標?我想這不是你我能評估的,畢竟環境的影響因素很大,反而是我們可以從中檢討過去的缺點,進而再造(Reengineering)此政策的相關作業流程。不過我們也看得出兩兆雙星的政策還是脫離不了過去已實施的政策,只是計畫的名稱不同而已(隨後說明)。

 

  台灣近年來的資訊科技業歷經多年的代工經驗,已累積不少相關生產、研發及行銷技術,逐步地走向推廣自我品牌的營運模式,無一不想與國際大廠一較長才,以提升台灣的產品在全球的競爭力。「家家戶戶有電腦」乃至「網路寬頻時代的來臨」,雖然這是業者在推銷產品的廣告詞,但無一不彰顯人類的通信方式已由類比轉至數位信號的處理,隨著資訊傳遞的品質提高,一般的大眾媒體,如報紙、書刊、電視、廣播等舊媒體傳播事業,現今已隨資訊高速公路(Information Highway)的發達走向新媒體時代。除此之外,人文與科技的結合方式,亦隨著近二十年的資訊革命,不斷帶給我們驚喜,如Nokia手機有名的廣告台詞:「科技始終來至人性」就是一個例子。從這裡我們可以察覺到3C產品(通訊、電腦、消費電子)已融入我們的生活,這也是過去政府大力推行「國家建設六年計畫」的結果,使台灣成為電子製造業王國,在政府嘗到甜頭後,於2002年啟動「產業高質化計畫-兩兆雙星」的發展計畫,期許台灣的國際競爭力能更上一層樓。

 

  「產業高質化計畫-兩兆雙星」是政府參考英、美、日、韓等國家發展所提出的政策,原因是政府想提升國內的經濟成長力,然而也因為「兩兆」產業是我國引以為傲的電子資訊產業帶領下,要達到預期的目標是指日可待,相較於兩兆產業,「雙星」產業則是被賦予台灣未來具有發展潛力的明星產業。不過兩兆雙星的發展計畫與過去的資訊、化學工業的格局差異性不大,例如雙星產業之一的生物科技計畫早在二十年前就已實行,且至今的應用層次還是健康食品及美容用品為大宗,高層次的藥物產品就顯得欲欲不振,原因在於新藥研發的時間過長,且與國際合作的技術模式需大量人力的投入,因此投資報酬率相對較低。另一個數位內容發展計畫,則較重視產業方面的發展卻忽略內容上的開發,且政府投資在數位內容計畫的比例似乎不平衡,特別是文化創意及出版典藏方面較低。至於兩兆雙星人才培育方面,雖然政府成立半導體學院及數位內容學院,但至今似乎成效不彰,原因在於投入數位內容產業的人才需長期性的栽培,而不是短期的學習即可開花結果。然而,兩兆雙星的政策解讀似乎有待釐清,如數位內容的定義已造成相關業者的反彈,因為數位內容產業涵蓋電腦遊戲、電影動畫、數位電視、數位學習、數位典藏及應用軟體業者,涉足的行業有軟硬體產業,因此已超出「內容」方面的規範。

 

  就我的觀點,兩兆雙星的政策只是過去發展計畫延伸的一部分,雖然兩兆雙星的政策或許在一時間,使政府暫時擺脫經濟負成長的陰影,但為了強調此政策是提升台灣經濟成長的不二法則,政府在規劃相關政策時,需三思而後行,歷經長時的審查與評估,爾後提出完善(具前瞻性)的政策與計畫也不遲。

如何建立色彩管理模式

發表日期: 2008-05-27, 點閱數: 1 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

內容發展分項計畫研究助理 林彥宏

 

  進行掃描工作前,需對螢幕及掃描器進行校色,以避免色偏,並盡量使影像色彩符合原件。

 

(一) 基本原則

 

  1.色彩管理乃利用ICC色彩描述檔來維持各輸入、輸出設備間的色彩一致性。其運作原理大致如下:

   (1)針對每一台輸入設備,都準備一個專屬的色彩描述檔,用來將輸入的色彩轉換為標準色彩。

   (2)針對每一台輸出設備,同樣要準備一個色彩描述檔,用來將圖檔的色彩轉換為符合輸出設備特性的色彩,然後輸出。

  2.每隔一段時間就要校色一次,視色彩準確度的要求而定,螢幕至少每週校色一次。

  3.若螢幕位置移動,或是工作環境改變,則需重新校色。

 

(二) 校色前準備

 

  1.確定螢幕已經開機超過半小時,已保證螢幕顯示的顏色較為穩定。

  2.需將工作場所的光線、螢幕角度、及座椅高度都調成平常工作的狀況。

  3.減少來自附近窗戶或牆壁的反光。

  4.將螢幕桌面的彩色背景或是影像移除,以避免在校色時受到桌面顏色的干擾。

 

(三) 螢幕校色

 

  1.校色方法的選擇

  每一台的顯示器都有獨特的色彩空間,必須取得其描述檔,以確保數位檔案中的資料可以準確地顯示出來。可以透過下面幾種途徑獲得顯示器的色彩描述檔:

   (1)向經銷商或掃瞄器生產廠商索取,或上生產廠商網站下載掃瞄器色彩描述檔。

    (2)利用色彩管理軟體自行製作色彩描述檔。

    (3)利用色彩管理硬體自行製作色彩描述檔。

 校色方式比較表

方法  簡介  費用  主要缺點  精確度 
廠商提供  上生產廠商網站下載的掃瞄器色彩描述檔  免費  少數廠商有提供  精確 
硬體校色  由顯示器顯示已知色彩數值的顏色,再用色度計加以測量,比較兩者的數值後,即可產生ICC描述檔  花費高  價格高  精確 
軟體校色  應用肉眼比較螢幕上的顏色,從而產生ICC描述檔  免費  1.憑肉眼來比對(並評估)色彩困難。 2.易受到觀看環境的干擾而失準。  不確定 

 

  2.硬體校色

   用專門的測量設備來做顯示器色彩描述檔才能獲得正確的色彩描述檔,通常需要配合專門的色彩管理軟體一起使用。具體操作方式可參照硬(軟)體操作手冊。一般操作原則如下:

    (1)啟動顯示器暖機一段時間;

    (2)設定明暗度、對比以及環境光至一般正常使用狀態;

    (3)開啟色彩管理軟體與測量儀器;

    (4)將測量數據讀進色彩管理軟體

    (5)由軟體分析數據,製作色彩描述檔

 

  3.用軟體Adobe Gamma校色

    (1)啟動Adobe Gamma並根據程式引導,逐步調校螢幕的對比與亮度、螢光體、Gamma值、白點、色溫等,並儲存色彩描述檔並套用之。

    (2)備份描述檔至另一顆硬碟上,以免系統硬碟發生問題,無須重新再做設定。

 

(四) 掃描器校色

 

  1.校色方法的選擇

    (1)向經銷商或掃瞄器生產廠商索取,或上生產廠商網站下載的掃瞄器色彩描述檔。

    (2)利用色彩管理軟體自行製作色彩描述檔。

 

  2.製作掃瞄器色彩描述檔

   (1)掃瞄器色彩描述檔具體之製作過程請參照各軟體操作手冊,其製作原則如下:

   (2)啟動掃瞄器暖機;

   (3)將日常使用掃瞄器的參數設定好(最好關閉所有與色彩調整有關的參數);

   (4)將1T8樣本嵌入掃瞄器;

   (5)視1T8樣本種類選擇掃瞄的解析度;

   (6)按應用軟體使用步驟操作;

   (7)開始掃瞄,把掃進來的影像以RGB色彩模式的TlFF檔儲存;

   (8)在色彩管理軟體內,指定好要讀取的色塊位置。由色彩管理軟體產生色彩描述檔。

數位典藏聯合目錄整合動植物主題內容之經驗分享

發表日期: 2008-05-27, 點閱數: 0 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

[缺圖][有表]

溫淳雅、江仁傑

 

  中央研究院歷史語言研究所

 

關鍵字:聯合目錄、metadata、數位典藏、跨主題式整合檢索

 

摘要:

 

  數位典藏聯合目錄因其跨領域、跨機構的特性,因此面臨了metadata欄位與分類方式統合的挑戰。透過介紹聯合目錄進行欄位整合與呈現的考量;在主題小組架構上進行分類瀏覽的統合;並舉動、植物主題內容整合的經驗,希望能提供參考並獲得迴響,以進一步改進聯合目錄持續進行工作的方式。

 

1.數位典藏聯合目錄系統之建置緣由介紹

 

  數位典藏國家型科技計畫(以下簡稱數位典藏計畫),是有關數位內容建置的重大科技研究計畫。參與單位包括中央研究院、國立自然科學博物館、國立故宮博物院、國史館、國史館台灣文獻館、國立歷史博物館、國立臺灣大學、國家圖書館等重要典藏單位,以及數十個具有內容價值的內容開發公開徵選計畫。其中所包含的內容縱貫古今、橫跨十餘種不同內容學科領域,至少包含生物、地質、檔案、書畫、器物、人類學、新聞等人文與自然類的典藏品,各個機構在建置自身的資料時,亦分別採用不同的Metadata標準與不同的資料庫系統。

 

  數位典藏計畫執行至今已四年,而累積的數位化物件相當豐碩。大量的典藏品數位化之後,需要透過一個介面,將龐大的資源提供給使用者,使得資源能有效利用、數位典藏產生積極意義[1]。所以,建立一套能夠整合分散於各個計畫與機構的聯合目錄,一方面可以達到資訊共享的目的,另外更可以彰顯計畫的執行成果。

 

  數位典藏聯合目錄(以下簡稱聯合目錄)為了統合上述不同學科領域與不同形式內容的資料庫,所採用的後設資料標準為都柏林核心集[2](Dublin Core,簡稱DC),這被普遍認為是一組簡單卻有效的核心元素集,包含十五個基本欄位以描述一件典藏品,具有「簡單易產生或維護、通用易瞭解的語意、全球通用、彈性高」等四項原則[3],應可運用來統合數位典藏科技計畫內龐大而複雜的內容。聯合目錄將數位典藏計畫中約90個資料庫的不同後設資料,與DC進行欄位定義上的比對,從對應中汲取其中的摘要資訊,匯入聯合目錄中,提供使用者目錄式瀏覽的功能。

 

2.聯合目錄如何進行整合工作

 

  為了在尊重各機構計畫之典藏內容與相關應用國際標準各有不同的基礎上建構聯合目錄,聯合目錄的建置工作並非採用由上而下的強制規範,而是透過細密的內容分析,以及勤於溝通協調的方式,歸納統合建立共識之後,才得以順利推行。

 

  聯合目錄要整合跨眾多主題的內容,主要有兩個方面的考慮,第一,不同型態資料庫的數位資料,如何整合在一個系統中;第二,在一個系統介面上,不同類型的資料要如何呈現。

 

  第一個問題,雖然牽涉到技術上的資料庫匯出匯入的問題,但到目前為止,技術上都能服務這方面的需求,不斷克服、解決困難。因此,這個問題最主要的,還是在於必須聯繫各個無上下隸屬關係、各自發展的單位,解釋匯入聯合目錄的工作過程,排定時程來進行資料庫匯出作業,並從旁協助解決匯出作業過程中所遭遇的問題。

 

  而參與數位典藏的機構計畫、公開徵選計畫的資料庫,總數量將近九十個,而每一個計畫,可能針對不同資料性質,設計出不同的欄位,甚至同一個資料庫由不同的研究者或助理負責不同的項目。所以,我們針對技術、版權、管轄情況各不相同的單位與資料庫,一一進行聯繫,必然需要大量的時間來進行聯繫溝通。

 

  第二個問題是,原本各資料庫的系統、欄位等都有差異,那麼在聯合目錄上,應當如何顯示各種不同類型的資料?這又可細分為兩個部分,其一是要讓使用者看到每一筆資料的哪些內容?呈現哪些欄位?其二則是網站的分類瀏覽應如何呈現。

 

  首先討論關於欄位的部分,我們有以下幾種選擇:

 

設定所有計畫之間的共通欄位,再將各個不同的資料庫欄位,全部對應成此一共通欄位。例如,將A資料庫的「生態狀況」欄位,與B資料庫的「花紋樣式」欄位,全部對應成「數典聯合目錄」共通欄位之中的「描述」欄位。

不設定共通欄位,各資料庫在數典聯合目錄的介面上,直接呈現出原本各不相同的欄位資訊,只設定共通的檢索欄位,例如,只設定「題名」、「關鍵字」等為共通檢索欄位。

設定部分欄位為共通欄位,而各計畫得以在共通欄位之外,再自行發展其他欄位項目。例如,設定各計畫的共通欄位為:「題名」、「關鍵字」、「管理權」三種欄位為共通欄位(並可規定為必填欄位),而各個計畫可以在自己的資料庫之中,再增加符合自己需求的欄位。

 

  以上三種方式,各有優缺點,分述如下。

 

  第一種方式,所有不同欄位整合為一種共通欄位,優點是在聯合目錄上的欄位顯示,較有統一風格,使用者容易熟習欄位架構,閱讀欄位資訊的速度較快,降低進入的門檻;缺點是較為耗時,要將所有不同欄位對應成同一欄位,各機構並需要在匯出資料時,匯出為聯合目錄所需的欄位。

 

  第二種方式,直接呈現出各不相同的欄位,可以保留原資料庫再描述該筆資料的原始特性,欄位名稱較為明確合理,而且,不需要耗費人力進行欄位對應;缺點則是在同一系統上,呈現的風格不一致,且欄位內容屬於各學科領域的專門知識,使用者較不容易熟習欄位。

 

  第三種方式,設定少數共通欄位,其他欄位由各計畫自訂。這種方式,必須在數位典藏計畫一開始時,就決定共通欄位,否則就要各機構更改自己資料庫中一部份的欄位,各機構將耗費額外時間人力進行著錄,以目前數位典藏計畫的型態,並不合適。

 

  表一 資料庫欄位呈現方式比較

欄位對應方式  優點  缺點 
採用單一套共通欄位 
  1. 以使用者導向,有利於閱讀欄位資訊
  2. 介面顯示統一 
  1. 欄位對應難度較高,與機構間往來溝通耗時
  2. 需有專人進行,人力需求較高 
不設定共通欄位 
  1. 保留原始欄位名稱與特性,欄位名稱明確合理
  2. 較節省人力 
  1. 使用者需花額外心力學習不同學科欄位的定義
  2. 呈現風格不統一 
設定部分欄位為共通欄位 
  1. 有相同欄位以利檢索
  2. 仍可維持各計畫原始欄位,保留學科特性 
  1. 需及早制訂,方便各計畫著錄欄位內容
  2. 目前執行會增加計畫額外工作 

 

  以上三種方式各有優缺點,對於正在準備發展跨機構或跨領域的聯合目錄,可以作為整合方式的參考。但對於較機構進行實體數位化工作要晚開始的數位典藏聯合目錄,究竟應採用哪一種方式進行整合?在經過2002年度、2003年度兩個不同的工作團隊,在原型建立過程中加以試驗、測試之後,到了計畫的第三年,在2004年度新的工作團隊正式執行系統建置,仍對此產生許多討論;最後才明確決定,採用第一種方式,以聯合目錄的原始目標:使用者的查詢、瀏覽需求為導向,採用國際間咸認簡單、明確的metadata欄位標準:Dublin Core(以下簡稱DC),克服欄位間的差異,以欄位定義的對應方式,來取得一般性的資料內容。此後雖然工作團隊耗費更多時間進行欄位對應工作,但是在介面上呈現資料時,會比較一致。

 

  不過,2004年度工作團隊在執行欄位對應的過程中,產生了一種折衷的方式,那就是主題小組先發展共通欄位,再將共通欄位與DC欄位進行對應。由於部分主題小組互動頻繁密切,且比聯合目錄有更強烈的學科整合需求,因此主題小組間往往會自行討論欄位的對應或互通。而會互通的欄位,往往也是該領域資料重要或核心的內容。所以,在主題小組的同意下,聯合目錄發展部分主題小組欄位對應的方式,便是直接對應已確認的共通欄位,而可減少分別對應各欄位的複雜度。

 

  但同時為保留原始資料庫內容性質,聯合目錄除採用上述的DC欄位標準外,在各欄位之內再加上「先行詞」,以表現不同型態的資料特性。例如,原計畫資料庫與某物件的「描述」有關的欄位,可能有「型態特徵」、「棲所生態」或「世界分佈」等等欄位,而在聯合目錄的DC欄位上,只有「描述」一個欄位與之對應。此時,為了保留這些不同欄位的特性,我們把「型態特徵」、「棲所生態」或「世界分佈」都放在DC的「描述」,再把原始的欄位名稱當作先行詞來修飾:

 

  表二 聯合目錄欄位表現方式示意

  欄位名稱  顯示結果 
例一  描述  描述 發育階段:Adult
標本部位:全魚 
例二  範圍  採集地:屏東,東港
採集緯度:22.48
採集經度:120.46 
例三  著作者  學名命名者:Linnaeus’ 1776
鑑定者:張鎮國 
例四  描述  型態特徵:頭胸甲呈圓方形,額向下彎,額後具有四個隆脊。
體色藍綠或草綠色密布白點及白色條紋,步足淺黃綠色雜著按紫色斑塊。
棲所生態:棲息活動在岩礁海岸潮間帶高潮線附近的沙岸石塊區或消波塊堆
世界分佈:廣泛分布於印度─太平洋熱帶區 

 

  並且,在「題名」的顯示結果上,加上原資料庫顯示該筆資料之頁面的URL,讓使用者可直接點選,進入原資料庫完整的顯示資訊,或者更清楚的數位化圖檔、影音檔等。在聯合目錄,原則上只讓使用者檢視每一筆資料的簡明資訊,以及瀏覽用的圖檔,較詳細資訊與更清晰之圖檔、影音檔,仍保留在各計畫各單位的資料庫中。這也有利於讓使用者查出藏品的簡易資訊之後,再連結至原始資料庫或原機構,觀看更詳細的資訊。

 

  此外由於幾個主題小組如動、植物;人類學;檔案等主題,在主題小組內部的互動已經十分密切,積極討論例如:同主題所採用的metadata標準是否能與國際接軌?如有一致的著錄規範將有利於主題領域間的互動等議題,有關分類架構,亦都有學科方面原初的學術標準,可彼此互通。因此,聯合目錄其中一項重要的建構方式,便是配合數位典藏科技計畫的內容主題小組,透過主題小組建立共識的方式,達到領域整合的目的。

 

  所以,在分類瀏覽的部分,2004年的聯合目錄工作團隊接手之後,便從經驗豐富的主題小組方面吸收經驗,並同時推動其他主題小組在小組會議中,討論同主題共通的分類架構概念。由於學科領域相同,對於分類的學理也大約一致,除了少數類目在定名上有所差異外,分類方面往往可以比對出意義相同之處;或者各機構的分類切入點雖有不同,但統合的分類卻可截長補短。在工作團隊不斷推動下,目前已完成所有主題分類的分類架構,但仍有新加入的主題需要再加以組織分類,或者原有主題分類需要調整。

 

3.聯合目錄進行動、植物主題小組整合過程介紹

 

  數位典藏計畫為了使整個計畫有效執行,在計畫辦公室下設立五個不同功能的分項計畫:內容發展分項計畫、技術研發分項計畫、訓練推廣分項計畫、應用服務分項計畫、維運管理分項計畫;其中,內容發分項計畫[4](以下簡稱內容分項)負責數位典藏內容之管理、規劃及各機構間的橫向聯繫、協調等事宜。因此,內容分項依八大機構計畫的典藏內容及所屬領域,區分為15個主題小組(見下圖),以建立橫向的溝通聯繫。並依加入的數位典藏科技計畫藏品的特性,再予以隨時增加新主題,如下圖中語言、漢籍全文、影音三個主題,便是94年度根據新加入數位典藏計畫的內容,而新增的主題小組。

 

  

 

圖一、內容主題小組示意圖

 

  動物、植物主題小組的成員極多,囊括了整個數位典藏計畫三分之一的機構計畫與公開徵選計畫。包括:中央研究院;國立臺灣大學;國立自然科學博物館;農委會農、林、水產試驗所;國立海洋大學;國立中興大學;國立臺灣博物館;國立海洋生物博物館等。

 

  動、植物主題小組在內容發展分項計畫所組織的主題小組之中,是較早發展的兩個主題小組。因為數位典藏計畫中有大量此類型藏品,且主題內部的互動密切、良好,也因此早在聯合目錄建置之前,動、植物主題小組便已經開始進行統合的前置作業。

 

  在欄位方面,原本參加動植物主題的計畫,有TaiBIF、GBIF等整合方式,不過欄位內容較為學術性,且中文說明文字較少,而數位典藏聯合目錄,依照計畫的精神與設定的目標,必須兼顧到中小學教師、學生、社會大眾..等需求,因此聯合目錄的欄位內容,應盡量保留各單位原本較詳細的著錄文字,例如棲所生態、型態特徵、漁業利用、可食性/不可食性…等。所以,聯合目錄還是與各計畫的資料庫分別進行欄位對應的工作,將各資料庫的欄位,與聯合目錄的Dublin Core欄位進行對應。

 

  在分類架構方面,由於動植物主題小組學科特性的緣故,因此在聯合目錄的「內容主題分類瀏覽」上,以「生物」的方式整合呈現,採用的分類架構乃是學科原本的「界門綱目科屬種」。此種分類的優點是完全符合學科的知識本體,具有教育使用者、線上學習的意義。不過相對而言,對於生物學瞭解較淺的一般使用者而言,已知名稱的生物,以檢索方式搜尋出結果,並從中獲取該生物所屬科、目、綱等知識較為容易;但如果要從此分類下去瀏覽,則不易找到特定生物。聯合目錄面對此一問題,可能採取兩種方式來加以解決,其一就是目前正在推動的「特色藏品」,將各館藏品挑選部分做主題特色展示,以一般俗名或較簡易的分類呈現給一般大眾;其二則是與動、植物類的整合資源庫,如TaiBIF,進行資料庫間的合作,以符合學理的不同角度切入進行新的分類。

 

4.從聯合目錄以內容主題整合推動的建置經驗所產生的建議模式

 

  由聯合目錄整合的發展經驗來看,主題小組由於在內容上具有共通性,並且成員多為學科專家,對於建置統合性的檢索資料庫所需的Metadata共通標準、分類瀏覽層次分析等等,都可以做更深入的討論。由內容主題專家來就資料庫間的差異進行溝通,其效果會遠勝於聯合目錄工作小組以外加的分析方式去強行規範內容。

 

  在共通欄位方面,由於聯合目錄所採用的是DC欄位,其普遍性雖然可以處理異質資料庫間的共通,但主題間可能會討論出搭配該學科更需要凸顯的共通欄位,由此整合的共通欄位再行對應DC欄位,並搭配聯合目錄對個別資料庫欄位的分析,將可提高聯合目錄上所呈現內容的目錄價值。

 

  而在分類架構方面,主題統合的效果與意義更加明顯。透過學科專家討論統合後的分類架構,將更具有權威性,並可建立知識本體(Ontology),讓使用者獲得對知識全面性的瞭解。

 

  此外,主題小組為整合所進行的運作,如由會議的方式決議共通欄位與分類架構,在共識的取得上較能關照全局,但是由於內部細節繁雜,僅由會議討論以做決議,需仰賴主題小組的密切互動。以人類學主題小組為例,其發展人類學的聯合檢索目錄與檔案聯合檢索在時程上也十分相近,但因為人類學主題開會密集而頻繁,每月皆有工作會議,共識極高,因此其發展聯合檢索目錄的整合所採取的方法便是會議決議。而以檔案主題小組的經驗而言,在會議上就大原則取得共識,會議後再以訪談方式進行細節溝通,在執行上也頗具效率。

 

  不過相對應的,主題小組必須要有專責人員能投入進行訪談以及後續的分析研究工作。在聯合目錄的情況來說,對內容發展的各主題而言,並不一定具有相同的基礎可以進行相似工作,此時便需要聯合目錄進行積極的介入與支持,推動主題小組進行相關議題的整合。以2004年聯合目錄的推動工作而言,便是積極建議各主題小組進行核心欄位或分類架構整合的討論,例如:協助進行分類架構資料收集、分析比對主題各成員不同分類架構之異同、分類名稱定義的對應、欄位比對工作等等。

 

5.結語

 

  整合性的聯合目錄系統之發展與建置,其最主要的挑戰便是整合異質資料庫,尤其是跨領域的整合更是艱難。數位典藏聯合目錄在檢討過去的基礎上,學習主題小組發展、共識的經驗,建立了以溝通協調為主、以內容主題方式深入各種藏品特性與內涵的工作方式。並由聯合目錄的工作小組協助推動主題小組進行分類架構比較與整合、欄位比對等工作。藉由對整合工作考量點的說明與分析,希望能與打算建置整合目錄的先進交換意見,以做未來工作的改進方向。

 

  參考文獻:

 

[1]陳昭珍,「數位典藏異質系統互通機制:以OAI建立聯合目錄之理論與實作(上)」,數位典藏國家型科技計畫:電子通訊第九期,http://www.ndap.org.tw/NewsLetter/content.html?subuid=450&uid=23,2003/2/7。

[2]都柏林核心集元素名稱與定義:http://www.dublincore.org/documents/dces/,或者可參閱數位典藏後設資料工作組所翻譯的Dublin Core元素清單:http://www.sinica.edu.tw/~metadata/standard/dublincore-chi.htm。

 [3]後設資料工作組,Dublin Core簡介,http://www.sinica.edu.tw/~metadata/standard/standard-frame.html。

 [4]數位典藏國家型科技計畫內容發展分項計畫,「計畫簡介─前言與組織」,http://content.teldap.tw/main/introduction.php,2005/4。

如何建置數位化資料庫的metadata:以「善本古籍」的數位化工作為例

發表日期: 2008-05-27, 點閱數: 0 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

數位典藏聯合目錄系統建置計畫研究助理 江仁傑 2005.09

 

  Metadata在臺灣翻譯為「後設資料」或「詮釋資料」,意思是「描述資料的資料」或「詮釋資料的資料」(data about data)。制訂metadata,是為了記下某一筆數位化資料的特性,例如我用數位相機拍攝的照片,可以有照片名稱、主題、拍攝者姓名、時間、地點、描述…等等簡單欄位,而這些欄位資訊,就是這張照片的後設資料。

 

  metadata最好能達成三項目的:

 

  1. 描述數位藏品的內涵、特色。
  2. 在網路上或電腦上,易於檢索到使用者所需的一筆或數筆資料。
  3. 容易與其他資料庫互通、交換資料。

 

  當然,依照資料庫建置的目的、針對的對象…等不同的考量,資料庫的metadata也許只需要達成上述一、兩個目的即可。

 

  粗略地區分,資料庫的metadata可以分為兩種情況:一、如數位化物件不多,或者只需要簡易註記與搜尋功能,meatadata就可以制定得很簡單;二、若針對學術、研究用途,則可以制訂較嚴謹完整的metadata,用數十個甚至上百個欄位來描述一筆資料。目前參與「數位典藏國家型科技計畫–內容發展分項計畫」的單位所制訂的meatadata,通常是第二種情況。

 

  在制訂meatadata時,各單位通常是依照自己的需要,參考某種較為通用的metadata標準,將之修改後再加以使用。如此一來,在進行資料交換時,雖仍需對應不同資料庫的欄位,但過程較為簡便,不需對應所有的欄位。

 

  以「數位典藏國家型科技計畫-內容發展分項計畫」中的「善本古籍」主題小組為例,其中,「史語所傅斯年圖書館藏善本圖籍」計畫,就是參考圖書館界常用的「機讀編目格式」(Machine Readable Cataloguing Record,MARC)來制訂資料庫的metadata,而「國家圖書館古籍文獻典藏數位化計畫」,則是參考另一個常用的metadata標準「都柏林核心集」(Dublin Core)。

 

  而參加善本古籍主題小組的三個機構計畫(中研院史語所傅斯年圖書館善本圖籍、國家圖書館古籍文獻典藏數位化計畫、故宮博物院善本古籍數位典藏子計畫),也參考「都柏林核心集」制訂出三個計畫之間的共通欄位,並且以這個共通欄位分別與三個計畫的欄位進行對應,因此,這三個計畫的資料庫都可以將資料匯出成「都柏林核心集」的matadata,便於資料交換。

 

  試圖建置善本古籍相關資料庫的人士,可以聯繫已經參加過「善本古籍」主題小組的單位,以他們的meatdata做為參考,來制訂自己的metadata。或者,直接聯繫後設資料工作組(MAAT),請該小組協助制訂。

 

  另外,在一般性、數量不多,或只需要簡易描述與搜尋功能的情況下,建議採用簡易的「都柏林核心集」(如下)。也可參酌這15個欄位,自行制訂更簡易的metadata欄位:

 

簡易「都柏林核心集」

欄位名稱  定義 
題名Title  典藏品的名稱,例如:動植物的學名、中英俗名,物件名稱,文件資料標題…等等。 
著作者Creator  編輯、創造該筆資源內容的主要負責人、團體、機構等,例如:作者,照片攝影者,地圖測匯者,標本鑑定者…等等。 
主題與關鍵字Subject & Keywords  資源內容的標題,例如:相關族群,礦物類別…等等,也可能是原典藏單位直接著錄之關鍵字。 
描述Description  資源內容的說明,例如:器物用途解釋,生物習性,圖畫流派意境,古文字、圖像釋文或解說,新聞報導內容…等等,通常是一小段文字。 
出版者Publisher  使資源能廣泛使用者,包括出版的個人與團體、機構。 
貢獻者Contributor  對於資源內容形成貢獻者,責任次於「著作者Creator」,例如:被攝影的對象,被調查、被描述的對象,文書中提及的對象,標本採集者…等等。 
日期Date  資源週期的事件日期,例如:製造日期,書寫日期,測繪日期,出版品發行日期,發掘日期…等等。 
資料類型Type  資源內容的性質或類型,例如:原始典藏品的素材種類,錄音帶、照片…等等。 
格式Format  關於資源的實際或數位的形式,包括媒體類型或資源的度量資料,例如:jepg檔,長寬高50×10×13,放映時間5分鐘…等等。 
資料識別Resource Identifier  該典藏品資源的明確辨識資料,例如:登錄號,典藏號,URI…等等。 
來源Source  敘述目前資源的衍生資源,例如:某一筆數位化物件的原始物件相關資訊。 
語言Language  資源所使用的語言,例如,內閣大庫檔案使用的語言類型是「漢文」或「中文」,部分文書可能是「原文:英文,譯文:中文」。 
關聯Relation  說明相關的資源,例如:參考書目,圖片登載出處…等等。 
範圍Coverage  資源內容的廣度或範圍,包括時、空的因素,例如:時期(時間名稱、日期或期間),空間地點(地理座標或地名),或行政區域。 
管理權Rights  描述資源權利相關的資訊,例如:原始物件典藏單位,數位化後物件典藏單位,後設資料著錄單位等。 

(以上欄位,若沒有著錄之必要時,可以不填)

數位典藏聯合目錄,採取的就是簡易的「都柏林核心集」,請上網點選任一筆資料,參考其使用方式:http://catalog.ndap.org.tw/。

<數位典藏,創意教學>論及故宮博物院文化產業行銷策略

發表日期: 2008-05-27, 點閱數: 2 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

[有表]

高芷彤

 

一、前言

 

  為縮短數位典藏落差,開啟藝術創意教學,教育部、國立故宮博物院與數位典藏國家型科技計畫與特別合作舉辦此活動,期望以增進學校教師對於數位典藏的認識與運用。此活動主要目的在於鼓勵教師及學生結合地方特色,並應用諸此數位資源於發揮創意,實行創造力教育,並進行教育多媒體之創作研習、實驗學校篩選,和教師培訓,以促成數位典藏資源融入學校教育中,以及使校園得以善用文化資財之目的。並舉辦企劃書製作相關多媒體教材徵選活動,期望能讓文物保存的基本工作目的以及內容除了專家外能讓觸角延伸到全國師生,期望國人除了參與和能珍視多元應用寶貴的文物資源。以下本文概敘故宮數位典藏新生命之行銷手法。

 

二、故宮數位典藏新生命:

 

  (一)計畫概念:

 

  繁瑣以及相互牽連等基礎工作的數位典藏為數位博物館計畫提供資源,而數位博物館為數位學習以及加值應用提供基礎,藉由環環相扣的資源建設,期望能以國際觀成就台灣文物典藏的新生命。

 
  科技 博物館功能 數物化計畫 
內容   收藏
展覽
研究
教育
數位典藏 文物數位化、metadata
數位博物館 電影、主題網站和光碟
線上瀏覽及遊戲(約1年半製作期)
數位學習
(教學為主)
e-learning
線上無限導覽系統

  (二)數位博物館之行銷策略:

 

  有鑒於目前環境上在行銷方面的問題例如,無專業部門研發設計、行銷及品牌管理,且故宮屬行政文化單位較於趨於保守,再者國內博物館文化商品在館際之間重複性過高,且文化商品市場不大,因此為突破現階段的困境,故宮除以成立藝術發展基金以及成立法務小組處理著作權相關問題和配合未來行政法人化,以調整基金定位外,更成立實業家俱樂部,以推動投資媒合,並且擴大故宮社教功能以及營運效益,其又以三大主軸為行銷策略:

 

  1.創意研發:

 

  配合文化以及科技結合的「兩兆雙星」計畫以及研發和行銷通路掌握的「微笑曲線」下,以了解文化消費群的需求為基礎,將歷史典藏融入生活中,透由創意例如不在侷限於文化設施,而是包羅萬象的概括工藝產業、電影產業、出版產業、設計產業等跨領域結合。

 

  2.企業管理:

 

  結合企業管理的實質做法,使得行銷更具有投資和金融相關實戰概念,故宮以「基金定位及預算編列」、「基金募集、保管及運用」、「開發生產以及經營管理」等三方面同時進行,以「開發生產以及經營管理」為例,故宮已與日本NISSHA以及台灣EPSON合作開發高品質複製畫、欲行銷海內外博物館而與躍獅影像科技合作製作的「清明上河圖」5D電影作品、在101大樓開設以故宮典藏為主的精品旗艦店、中正機場內展示以及在精品店內拓建、影像商品製作委託經營、以基金自製商品開發計畫(馬克杯以及BenQ合作的空白光碟)、網路商程建制和營運(預計94年度6月對外開放)、與台灣菸酒股份有限公司以及郵局合作製作郵票、故宮之友認同卡(台灣企銀)等多元化觸角發展。

 

  3.品牌行銷:

 

  實體品牌行銷以整體行銷品牌管理規劃、數位內容和商標授權管理計畫等為主力。例如前者則是製作三支分別請侯孝賢導演(盛事裡的工匠技藝)、王小棣(歷史典藏的新生命)、鄭文堂(經過)等台灣名導演來執導影片,另外也和太極影音以及彭文淳導演合力製作「翠玉白菜」、「毛公鼎」、「象牙球」三支短片以及和日本動畫大師宮崎俊合作的動畫。另外更以複製品以及時尚傳媒結合的晴山家具、LA VIE雜誌推廣典藏。在基礎上則有研習會以及和宏碁開發多套系統期望除能歸廣更能降低數位落差的目標。以執行的三個電影概況,以紀錄片和院線片形式的架構為主,另外短片則會在全台國泰世華銀行ATM、公共電視、各大戶外電視牆(西門、光華、紐約紐約及龍門商圈)、捷運月台及捷運轉運站之大電視牆與公車Bee tv播映。最後,歷史典藏新生命目前則是在華航飛機上撥放,有利於國際行銷。

 

三、結語:

 

  最後,故宮更有E學園、線上遊戲、無限導覽學習系統、數位學習示範中心、行動博物館服務、動線式導覽、故宮文物數位導覽、互動式導覽、感應式導覽等系統的開發與研製,期望能善用國家珍貴文物資源提升文化產品的附加價值,更能激起設計業投入文化產品開發,擴大故宮社教功能以及開拓國際行銷通路,建立故宮國際品牌的形象,使典藏不再是陳列在博物館中,而是活在生活中,並且賦予文物新生命,使學術知識不在侷限於實體館藏內,能藉由科技的進步,使知識無遠佛界的賦予更多價值。

影音之數位化規格

發表日期: 2008-05-27, 點閱數: 0 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

林淑惠 94.08

 

  8/15召開了影音小組第一次會議,會中分別就影片和聲音的部份進行數位化規格制訂,主要是參考國家文化資料庫已完成之規格,再配合各計畫之需求來訂定。大制上將影片及聲音檔案分為永久保存和網路流覽二種型式,在影片方面以MPEG2為主要格式,李道明老師表示為因應數位電視的發展,未來5-10年後影片檔案格式會升級為MPEG4,但因該技術目前仍不盛行,故目前仍維持MPEG2;聲音方面則是以WAV為主,相關數位化製作規格如下表所示。

 

  在本次會議中李道明老師強調了一個很重要的觀念,即任何資料進行數位化後,不代表檔案資料就可以高枕無憂的保存了。因為現今媒體的不穩定因子很大,有可能一個小問題就會導致整個資料內容因而消失,加上時代快速的變化,檔案的規格格式年年進步,也許之前所制訂的規格在幾年後就不適用了,基於上述種種因素,因此數位化檔案必須每五年就要重新備份一次,才能完整的保存辛苦所建立起的數位典藏資料。也許大家目前都在致力於推廣數位典藏這個概念,但別忘了在努力典藏之餘也要將資料完整的保存下來,才不會將前人所建立起的珍貴資料給遺失,而造成更大的損失。

 

數位典藏國家型科技計畫

內容發展分項計畫-影音主題小組

數位化製作規格

94.8.18訂

 

一、數位化規格:視訊檔

檔案目的  檔案格式 
永久保存檔  檔案格式:WAV
取樣率:44.1kHz / 16-24bit/sample
聲道:立體音 
聲音串流檔 (網路瀏覽用)  檔案格式:WMA或Mp3
取樣率:44.1 kHz / 16bit/sample
聲道:立體音 頻寬:64Kbps-128 Kbps
檔案時間:聲音前端30秒至60秒間或完整 

二、數位化規格:聲音檔

檔案目的  檔案格式 
永久保存檔  檔案格式:MPEG 2
影像大小:720*480像素
音效解碼為立體雙聲道
資料傳輸率:8Mb/sec 
視訊串流檔 (網路瀏覽用)  檔案格式:WMV
影像大小:320*240像素
資料傳輸率:150-300kbps
檔案時間:1-5分鐘或完整(具有代表性或主題畫面呈現) 

語言主題小組之【台灣手語研究計畫】簡介

發表日期: 2008-05-27, 點閱數: 1 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

佳旻

 

前言:

 

  數位典藏國家型科技計畫內容發展分項計畫於民國94年新成立之語言主題小組,其中參與單位為中央研究院語言學研究所語言典藏計畫、國科會專題研究計畫-台灣兒童語料庫及國科會專題研究計畫-台灣手語研究計畫。

 

  但手語是不是語言?以往,不少語言學家認為手語不是語言,致使手語無法獲得應有的重視。事實上,手語是一個有結構的語言系統。手語具有人類語言所應具備的所有成份。其中唯一不同之處是:手語這樣的語言系統是以視覺─動作的管道而不是聽覺─發聲的管道作為溝通方法(郭譽玫,教育資料與研究 第二期,84/01/01)。為讓讀者更瞭解語言主題小組參與單位:國科會專題研究計畫-台灣手語研究計畫,以下對該計畫做小小的介紹。

 

目標:

 

  國科會專題研究計畫-台灣手語研究計畫(以下稱為本研究計畫)執行期間為民國90年8月1日至94年12月31日,本研究計畫的目標是對台灣手語做一個最完整的描述及分析,包括編纂一部有學術與實用價值的參考語法書,以及製作一部架設在網際網路上的數位影像辭典。

 

  本研究計畫是由戴浩一教授負責統籌、規劃、執行和督導。蔡素娟教授和麥傑教授負責計畫中音韻、構詞與心理語言學實驗的部分,戴浩一教授和張榮興教授負責詞彙與句法的部分,而電機所陳自強教授則負責數位影像辭典的網站架設部分。

 

計畫重要內容及研究成果:

 

  • 台灣手語參考語法
  • 台灣手語線上影像辭典
  • 台灣手語與中文文法手語之比較
  • 台灣手語語言學國際學術研討會
  • 「手語與手勢」研習課程
  • 《語言暨語言學─台灣手語語言學特刊》中央研究院語言學研究所

 

台灣手語線上影像辭典:(測試階段,未正式上線)

 

內容

 

  台灣手語線上影像辭典的網站已架設完成,為方便日後網站的更新及維護,網站以Internet Information Services (IIS) 架設,但由於內容包括中文及英文版本,現在正在進行英文版本之手語動作描述之核對工作,還未正式上線。本計畫之影像辭典現有手語詞彙影像共計二千三百個,中文詞項約三千九百個(包括近義詞),英文詞項約三千一百個(包括近義詞)。

 

使用介紹

 

  a.中英文版本之介面,如下圖所示:

 

  b.以筆劃搜尋:如下圖所示

 

  c.其他搜尋功能:除了筆劃的搜尋功能外,還包括中文、漢語拼音、英文等關鍵字的搜尋功能,以方便使用者查詢之便利性。如下圖所示。

 

  d.搜尋結果:以詞項「交通」為例

 

  「交通」之「交」字為六劃,在六劃之類別下,點選「交通」此詞項,得出網頁左方詞項「交通」之台灣手語打法,及右方之中文描述。

 

  

 

台灣手語和中文文法手語之比較:

 

  我們目前除了持續修訂參考語法的內容外,正在進行比較台灣手語和中文文法手語的心理語言學實驗。

 

實驗依據

Bellugi & Fischer (1972)

Bellugi, Fischer & Newkirk (1979)等

 

實驗目的

 

  檢視台灣手語和中文文法手語系統在溝通效率上的差異。

 

實驗進行步驟

 

  a.表達圖畫書「Frog, where are you」之故事

  b.聾人以自然手語說故事

  c.聽人以文法手語、中文講述、和口語及手語同時表達等三種方式說故事

 

結果分析

 

  進行各類語料的描述並檢視以下兩個主要變數:

  a.故事的平均長度以及使用每種語言之單位時間內詞素的平均數

  b.中文文法手語與口說中文的相似度。

 

  以上為國科會專題研究計畫-台灣手語研究計畫之簡介,希望本文之描述對內容發展分項計畫之語言主題小組,能有更深入之認識。

 

參考資料

 

國科會專題研究計畫-台灣手語之研究:音韻、構詞、句法與影像辭典之簡介

手語新知 http://www.socialwork.com.hk/artical/educate/e000791.htm

行政院國家科學委員會 http://web.nsc.gov.tw/default.asp?mp=1