文章分類 ‘觀察室歷史文章’

臺灣原住民數位典藏國家型計畫資料庫之簡介與分析(一)

星期四, 一月 24th, 2008

內容發展分項計畫/陳美智95.04.24

一、 計畫簡介:

  「臺灣原住民數位典藏國家型計畫」為「數位典藏國家型科技計畫」中央研究院機構計畫下的計畫之一。主要目的在於典藏中央研究院民族學研究所博物館、圖書館以及研究人員所蒐集的臺灣原住民文物、文獻與影音資料,進行各類型藏品的數位化、典藏管理,並將這些完成數位化的藏品,建置資料庫及搜尋機制,以提供研究人員、教育人員以及社會大眾在研究、教學以及相關資訊交流方面的便利,除了將這些珍貴的資料典藏起來以外,更希望能藉此促進族群之間的相互了解與尊重,以及不同文化間的交流。

 
  「臺灣原住民數位典藏國家型計畫」依照中央研究院多媒體美術設計與資料處理小組的數位化技術規範將數位化後的數位影像檔分成以下三種格式做典藏與呈現。

超高品質格式 R.G.B 24bit(全彩)400~600dpi TIFF(非壓縮);相當於印刷品質的200 ~ 300 線(高解析度印刷);適用原稿種類 – 對品質的要求非常精細之原稿、物件;檔案大小 – 100 MB(A4)以上。
高品質格式 R.G.B 24bit(全彩)300dpi TIFF(非壓縮);相當於印刷品質的175線(圖片印刷品質);適用原稿種類 – 反射稿掃描、正、負底片掃描、物件拍攝、相片掃描;檔案大小 - 20MB(A4)以上。
網路瀏覽格式 R.G.B 24bit(全彩) 150dpi JPEG(壓縮50%),檔案大小 -230kb(A4) ;GLAYSCALE(灰階256)8bit 150dpi JPEG(壓縮50%)檔案大小-200kb(A4);B&W 300dpi,檔案大小 - 60kb(A4)。

二:計畫成果:
   「臺灣原住民數位典藏國家型計畫」的數位化成果頗豐,迄今已累計:
1. 文物部分,91年整理平埔族文物,92年整理布農族、鄒族與邵族文物,93年整理排灣族、卑南族與魯凱族文物,共累積資料2110筆以上。

 
2. 表格部分,從91年度至今,已包含平埔族、布農族、邵族、鄒族、排灣族、魯凱族、卑南族等諸族,未來將繼續建置更完備的相關資訊。

 
3. 契約部分,共典藏1818筆契約數位資料,分別存放成典藏級(600dpi的tiff檔)與瀏覽級(150dpi的jpg檔)兩種數位格式加以典藏。內容方面契約分成開墾、典租貸借、買賣找洗、鬮分合約等四大類。

 
4. 地圖部分,包含泰雅族、排灣族、魯凱族、卑南族、布農族、阿美族、邵族、鄒族、平埔族等諸族,未來將繼續建置更完備的相關資訊。

 
5. 影像部分,目前收錄的族群包括平埔族群、布農族、鄒族、邵族、魯凱族、排灣族及卑南族,其餘各族資料也正陸續按進度數位化典藏收錄中。

 
6. 口述訪談部分,是以中央研究院民族學研究所博物館與平埔工作室典藏之研究人員的訪談錄音為主,迄今為止,已收錄共有一千五百筆數位化資料,包含泰雅族、排灣族、魯凱族、 卑南族、布農族、阿美族、邵族、鄒族、平埔族(凱達格蘭、噶瑪蘭、道卡斯、巴則海、西拉雅、大武壟、馬卡道)等諸族,未來將繼續新增其他民族並建置更完備 的相關資訊。

 
7. 音樂資料部分,已收錄共有八百七十八筆數位化資料,已包含泰雅族、排灣族、魯凱族、卑南族、布農族、阿美族、邵族、鄒族、平埔族(噶瑪蘭、道卡斯、西拉雅)等諸族,未來將繼續新增其他族社並建置更完備的相關資訊。

 
8. 影音資料部分,已收錄共有一千零七十三筆數位化資料,已包含泰雅族、排灣族、魯凱族、卑南族、布農族、阿美族、邵族、鄒族、平埔族(凱達格蘭、噶瑪蘭、道卡斯、巴則海、西拉雅、大武壟、馬卡道)等諸族,未來將繼續新增其他民族並建置更完備的相關資訊。

 
9. 人口資料部分,(布農族、鄒族、邵族)和(魯凱族、排灣族、卑南族),共8000多筆。

 
10. 聚落資料部分,(布農族、鄒族、邵族)和(魯凱族、排灣族、卑南族),共250筆。

 
11. 人名權威檔部分,人名權威檔主要是支援各典藏計畫對於人名資料儲存的需求而產生的目前已著錄4460筆。

國外數位典藏網站探索報導——京都大學電子圖書館「貴重資料畫像」

星期四, 一月 24th, 2008

內容發展分項計畫/溫淳雅2005/12/5

     京都大學電子圖書館(圖一)始自於1998年,主要的數位化內容有「貴重資料畫像」、「數位化文本」、「博士學位論文資料庫」、「校內研究成果」等部分。本文主要介紹其中的「貴重資料畫像」(圖二)。

 

                                                                              圖一

                                                                          圖二
    
     京大「貴重資料畫像」所公開的內容,包括「京都大學附屬圖書館所藏古地圖」、「維新資料畫像資料庫」、「繪卷物、奈良繪本收藏」、國寶「今昔物語集」、「國女歌舞妓繪詞」、「伽草子」等日本重要的史籍文獻,如國寶「今昔物語集」,便是日本故事文學的代表作,被考據為傳世的抄本中最原始的版本,為日本指定的重要國寶。此外也有部分如「中國清代民國公私文書收藏」、「法國建築、地誌收藏」、「伊斯蘭學貴重資料」等他國資料。
    
     在介面方面,主要可分為「瀏覽」與「檢索」兩個部分。由於京都大學在設定上是呈現貴重資料的「畫像」,也就是說,以數位化影像為主要呈現內容,在數位化的內容上也有絕大部分屬於繪卷、照片等圖象式的資料;因此一進入該網站,便可見到以各資料庫的代表性圖象所組成的頁面(圖三),使用者可以很自在的藉由圖象式的印象,去搜尋有興趣的內容觀看。

 

圖三

    
     在影像方面,書冊與照片類型的藏品,大致上提供了單邊長500像素大小與單邊長1000像素大小以上的兩種尺寸圖檔,解析度為72dpi,以網路瀏覽而言已十分清晰可觀。另外在地圖、繪卷等類型的藏品,除了上述兩種尺寸的圖檔外,還提供單邊長1000像素大小以上的「局部放大」圖(圖四)。整體而言,京大電子圖書館「貴重畫像資料」所提供的數位化內容都非常精彩,有利於教育、研究方向的使用。

 

圖四、局部放大示意圖

    
     不過或許是因為歷年建置情況不一,在不同的主題畫像的瀏覽介面上,雖有大同卻也有小異。如有些以滑鼠點選500像素瀏覽圖,會呈現1000像素大圖,有些則是點選後呈現局部放大圖、整體大圖需另外點選畫面以外的按鈕。但基本上而言功能單純,不至於令使用者感到迷惑。
    
     此外值得稱道的是,各方面主題的資料,或多或少提供了詳細的解說,包括該主題資料的詳細歷史、京大所藏版本源由、延伸的人物與歷史介紹等等(圖五)。

圖五

    
     檢索介面大量利用下拉式選單(圖六),其實是文字化的瀏覽介面,令使用者可迅速進入所欲瀏覽的重要書冊內容,做圖象的閱覽,可惜進入後並沒有單獨針對該書冊的檢索介面。真正的檢索則分成簡單檢索與進階檢索(圖七),並有「檢索具圖象的資料」之功能,如無特別選取該功能,則檢索結果會將具有圖象者優先排列,但可惜在檢索結果列表上沒有特別表示這一點,使用者可能在點選進入觀看內容後,才會清楚是否具有圖象。檢索後的單筆結果欄位單純,最主要是題名與描述(圖八)。

圖六

圖七

圖八

    
     除了具有資料庫的功能外,京大「貴重資料畫像」也在展示上也做了許多嘗試。例如英文網頁部分,提供了四種內容的全英文化介紹(圖九),包括「伽草子」、「法國建築、地誌收藏」、「國女歌舞妓繪詞」、「博物學的時代」。以大量英譯介紹文的方式(圖十),將京大所收藏的重要文物介紹給全世界,在推廣效果上應有很大的助益。

 

圖九

圖十

    
     而在介面上花心思的以達到展示目的的,以下舉兩個例子進行說明。其中之一為國寶「今昔物語集」的呈現方式。由於今昔物語集為日本重要的故事文學代表作,雖然京大所藏版本的重要性無可取代,但坊間要找到當中的內容十分容易。因此京大電子圖書館做了展示上的功能開發,提供了三種抄本影像與文本內容並列的方式,分別是:
1.「標準版」——jpeg圖象與html並列的方式,優點是文本可任意的複製,圖象亦可以大圖顯示,缺點則是以大圖顯示時,需要花費力氣不斷去拉選網頁捲軸,可視畫面亦較小(圖十一)。

圖十一

2.「文本影像連動版」——以JavaScript方式,令使用者在捲動影像或文本任一視窗的捲軸時,另一方可以同步移動;此方式也有提供瀏覽圖或詳細大圖兩種閱覽方式,文本皆可同步移動,但同樣有可視畫面較小的缺點,文本的複製則需額外點選「翻刻」功能方可選取(圖十二)。

圖十二

 

3.為最新的「透視重疊版」——以flash方式製作,滑鼠在影像上瀏覽時,可同步出現相對應的正楷文本,就如同放置一塊玻璃版在典藏品上即時顯示,對照性最高,可視畫面也最大,介面清晰流暢。文本的複製則如同前一版,點選「翻刻」功能進行選取(圖十三)。

圖十三

    
     其二要介紹本網站最近推出的典藏「太平洋戰爭期間泰國新聞典藏」。此典藏包括了「Krungdeb Varasab Daily News」、「The Siam Rashdra Daily News」、「Lak Mueang」等三種報紙的內容,並提供了iPallet/Lime JPEG與JPEG兩種方式呈現。前者可以直接縮放大圖(圖十四、十五),可在主畫面上隨意拖曳,也有導覽小圖(圖十六),同時也提供列印功能。後者則提供大小兩種尺寸圖檔。小圖約為350*500像素以上,大圖約為1800*2650像素以上。兩種方式都可開放圖檔單張下載。

圖十四

圖十五

圖十六

    
     最後,在版權宣告方面,京都大學同意以教育、研究為目的之列印與下載,其他方面的利用需先行通知,印刷出版則需付費使用。
1 http://ddb.libnet.kulib.kyoto-u.ac.jp/minds.html
2 http://ddb.libnet.kulib.kyoto-u.ac.jp/exhibit/index.html
3 內容以圍繞著田地、房屋、魚池的典賣、租佃、所有權、稅契、借貸、遺囑等相關文書為主。
4 為京都大學附屬圖書館自法國教育部所接手有關巴黎周邊王宮、教堂、道路、廣場、名勝、景觀等圖象與地誌資料,以木版畫、銅版畫與藍圖為主,記錄了法國近代建築史、文化史、技術史等。

「Official Information System of?the Český Krumlov?Region」介紹

星期三, 一月 23rd, 2008

                           內容發展分項計畫助理  林彥宏

一、Český Krumlov文化歷史簡介
  
  Český  Krumlov座落於捷克南部的伏爾塔瓦(Vltava)河深谷中,並於1992年被列入世界文化遺產,對於喜愛旅遊的人而言,Český Krumlov更是歐洲旅遊的必經之地,當地的彩繪塔幾乎成了捷克共和國旅遊的標誌性建築。
  伏爾塔瓦河的流動在這區域很早就是一個自然的運輸入口。根據傳說,Krumlov來自德語「Krumme Aue」,被翻譯為「彎曲的草地」,名字來自鎮的自然地形,特別是指蜿蜒的伏爾塔瓦河所形成的大彎曲。
 

(圖片來源:本篇文章中之照片,皆轉載自OIS)

…詳全文

【Machine Translation】

星期三, 一月 23rd, 2008

內容發展分項計畫/李佩瑛

      Machine Translation機器翻譯(簡稱MT)為一種電腦應用系統,可以將文章由一種自然語言翻譯成另一種自然語言。MT並非新興技術,其構想起於40年代末期,由於科學家、工程學家、經濟學者、企業家…等人有閱讀大量文件或使用非母語溝通的需要,如遇此種情形,具有翻譯能力的人往往供不應求,而機器翻譯正好可以紓解這樣的供需。再者,學者專家一向有去除語言障礙能促進國際之間的合作與和平的理想,機器翻譯於焉誕生。

  在這樣的構想還頗為模糊的時期,Warren Weaver(1894–1978)可謂機器翻譯的先驅,他於1947年寄給電腦控制學家Norbert Wiener的信件,以及與英國放射結晶學家Andrew Booth的對話中首先提出機器翻譯的構想,並在兩年之後撰寫了闡述相關理念的備忘錄「Translation」,並成為日後的The Weaver memorandum(1949),堪稱當時較為具體兼具代表性的文章。

  機器翻譯雖然是由簡單的概念而來,但其背後的運作方式卻是相對的複雜,需透過文法、語義學、語法、片語…等分析,經拆解成符號後再重新組合。這種類型的機器翻譯需要龐大的辭彙,包含形態學、語法規則與語義資訊,但單一的機器翻譯形式並不能完全滿足需要,於是逐漸產生因應各式需求的機器翻譯形式。

  1954年由美國喬治城大學與IBM合作的實驗,成功的將超過60句俄文翻譯成英文,雖然只簡單使用六種文法規則與250種字彙,無疑這也展現了機器翻譯的可行性,同時啟發了全球對於機器翻譯的興趣,尤其是當時的蘇聯。

  後續的十年有許多不同的政府機構與學術團體致力於MT的研究與開發,如IBM替美國空軍完成的俄翻英系統。其他的學術團體如麻省理工、哈佛大學、柏克萊大學…等則致力於理論研究,也開發出早期的人工國際語言與轉換系統(e.g. MIT與Cambridge Language Research Unit, CLRU)。

  但1964年由美國政府贊助的機構ALPAC(Automatic Language Processing Advisory Committee)卻於1966年撰寫的一份報告中扼殺了MT的發展,報告中指出MT並未能正確有效的翻譯,與人工翻譯相較之下成本為其二倍,並沒有迫切發展的需要。自此之後MT於美國發展趨緩,而加拿大、歐洲等地則因當地的語系較繁雜逐漸產生需要,與當初美國針對俄文與技術層面的發展不盡相同。

  後期的MT則逐漸全球化,在80年代左右則有跨國合作的商用MT系統出現,如Systran這樣的電腦翻譯軟體也廣泛的被國際組織與企業採用。在80年這樣的市場熱潮領導了人們對於MT的一些省思與注意,無論是結合人工智慧與新的語言學理論,MT的前景令人期待,但最終都是希望能提供人際溝通之間便利的工具,與文化之間的融合了解。

參考連結:
1.Machine Translation: past, present, future
http://ourworld.compuserve.com/homepages/WJHutchins/PPF-TOC.htm
2. Machine translation - Wikipedia, the free encyclopedia
http://en.wikipedia.org/wiki/Machine_translation
3. INFOAM?RICA > El portal de la Comunicaci?n > O Portal
http://www.infoamerica.org/
4. Warren Weaver memorandum, July 1949
http://ourworld.compuserve.com/homepages/WJHutchins/Weaver49.htm
5. EAMT(European Association for Machine Translation)
http://www.eamt.org/
6. Machine translation and computer-based translation - publications by John Hutchins
http://ourworld.compuserve.com/homepages/wjhutchins/
7. SYSTRAN Language Translation Technology
http://www.systransoft.com/index.html

Television News Archive電視新聞典藏計畫

星期三, 一月 23rd, 2008

內容發展分項計畫/程婉如

  Television News Archive成立於1968年,座落於美國田納西州的范德堡大學內校園一角,其彙集國內外電視晚間新聞及廣告時段,主要包含ABC、CBS、NBC、CNN、FBCi等廣播及有線電視新聞頻道等,不僅完整側錄及典藏新聞時段資料,並且建立良好的檢索系統提供查詢。自1968年起,該計畫人員便已著手進行新聞節目的典藏品清單、摘要及敘述等資料蒐集,而善用此資源整合於資料庫中,不僅能提供做影像內容之典藏,亦為研究歷史或政治事件時的最佳參考來源。
  該計畫典藏類型包含晚間新聞及專題報導等,以下介紹此兩種節目類型:
◎ 晚間新聞
  計畫典藏約含30,000則的電視新聞詳細資訊,每則新聞片段都有內容摘要之介紹,亦提供報導的起訖時間,通常基本資訊包括新聞主播、記者以及與該事件相關的人名、敘述等,而透過網站搜尋系統也能獲得完整的節目清單。
◎ 專題報導
  從1968 年開始,此典藏機構即進行政治會議、總統記者會、競選活動以及國際相關重大事件等相關新聞之數位化,例如:水門事件、美國人質於伊朗的情形、波斯灣戰爭、恐怖份子對美國的攻擊以及ABC《夜線Nightline》節目等,蒐集超過8,000小時的新聞議題可供使用。儘管晚間新聞裡未詳加描述各事件的發生細節,然而在該計畫資料庫裡皆收錄了所有資訊,以記錄歷史事件的真實性。
  Television News Archive計畫網址為http://tvnews.Vanderbilt.edu/,在此計畫資料庫中擁有超過705,000筆有關每則新聞內容的描述,而約8,000筆記錄皆彙集於專題報導之中,其餘則為一般晚間新聞的簡單摘要敘述。若對此資料庫有興趣之讀者,也歡迎隨時親自體驗搜尋之樂趣。以下便針對計畫資料庫的檢索介面作進一步的操作與介紹:
  (圖一)為此網站首頁,其提供搜索引擎(TV News Search)以查詢電視新聞資料,點選進去之後連結至(圖二),得以免費註冊為會員之後進行檢索。

圖二、Login to TV-News

  (圖三)為登入會員後進入資料庫之頁面,在此有基本查詢、進階查詢以及依日期查詢三種方法,筆者以「TAIWAN」作為關鍵字查詢,截至95/06/06為止,共得1232筆資料,頁面如下(圖四)。

  點選每一筆搜尋結果,皆有下述基本資料:新聞標題、內容摘要、新聞類型、時段類型、紀錄編號、起訖時間等,也提供關於此筆新聞報導的播放頻道、日期、時間秒數、敘述等等,另外使用者也可依照自己的需求付費索取拷貝錄影帶等,至於使用者付費機制為何?以下即針對繳納金額、付費方式、運送及使用條款等詳加說明:
首先說明計畫內所典藏的電視新聞會以錄影帶形式寄發給付費索取之使用者,其中又分為兩種選擇方式:
◎ 直接複製
  此方式為該機構提供最簡單且便宜之服務,使用者可依照自行所需申請複製夜間新聞時段、特別新聞集錦等,索取費用如下表:

使用者類型 索取費用(每半小時)
范德堡大學(Vanderbilt University)學生 美金US $25元
范德堡大學(Vanderbilt University)職員 美金US $25元
范德堡大學(Vanderbilt University)全體教員 美金US $25元
贊助機構 美金US $25元
各大教育機關 美金US $50元
K-12各級學校師生、職員 美金US $50元
個人研究機構 美金US $100元
政府機關 美金US $100元
非營利組織 美金US $100元
商業團體 美金US $100元
公立圖書館職員 美金US $100元
聞媒體傳播業(電視、廣播、印刷) 新美金US $100元

《譯自Television News Archive計畫官網》

◎ 間接編輯
1. 使用者可視需求而申請多個新聞片段資料彙整於同一錄影帶內。
2. 編輯錄影帶的費用計算方式無關乎片長(時間長度),而是依照使用者索取新聞片段的數量多寡而定。
3. 每捲錄影帶可編輯最長時限約為一小時,而收取費用為美金US $10元。
4. 錄影帶中所編輯的每則新聞片段之索取費用如下表,其依照使用者類型不同而有所區別。

使用者類型 索取費用(每半小時)
范德堡大學(Vanderbilt University)學生 美金US $12元
范德堡大學(Vanderbilt University)職員 美金US $12元
范德堡大學(Vanderbilt University)全體教員 美金US $12元
贊助機構 美金US $12元
各大教育機關 美金US $17元
K-12各級學校師生、職員 美金US $17元
個人研究機構 美金US $27元
政府機關 美金US $27元
非營利組織 美金US $27元
商業團體 美金US $27元
公立圖書館職員 美金US $27元
新聞媒體傳播業(電視、廣播、印刷) 美金US $27元

  該方法屬複雜且勞力密集之服務,因此其製作費用較為昂貴,且須先收到貨款後才進行新聞片段挑選、編輯錄影帶等工作,索取者亦可自行準備錄影帶供該機構製作。
  上述說明為Television News Archive計畫典藏品之使用者付費機制,亦為該計畫進行典藏所需預算的最大收入來源。此機制對於隸屬於范德堡大學(Vanderbilt University)之成員或贊助機構等,皆提供最高的折扣及優惠。隸屬於各級教育機關之成員亦擁有適度的折扣,而其餘的使用者類型則比照一般標準之價格付費。另外,關於錄影帶運送、付費方式及使用條款等相關事宜,筆者亦整理如下:
◎ 物品包裝及運送
  
* 凡是范德堡大學(Vanderbilt University)全體師生或職員皆能直接獲收從該計畫典藏中心寄發的索取物品。
* 其餘使用者之索取物品若無特別註明的話,則一律委由UPS (United Parcel Service)託運,此運費已含於收取費用內。
* 顧客可額外付費要求快遞方式為隔日送達目的地。
◎ 付費方式
每筆訂單在運送之前皆須先取得貨款,而建議付費方式為信用卡或大專院校所核發之訂購單。恕不接受一般商業公司用途之訂購單。
◎ 使用條款說明
* 所有寄發的錄影帶皆視為該計畫典藏中心之資產,請務必擇期歸還。
* 凡逾期不還者,將罰款美金US $50元。
最後,值得一提的是,Television News Archive計畫進行電視新聞檔案數位化至今已近乎四十年載,此機構將所有新聞(含廣告時段)都錄下來,以典藏足夠且完整的資料,並且建立完善的檢索目錄,便於使用者進行查詢,而此種提供大眾查詢資料的公開機制也能讓國內相關典藏單位作為參考,以建立在地化的數位新聞資料庫。

《以上撰文資訊皆來自Television News Archive計畫官網http://tvnews.vanderbilt.edu/,若有任何翻譯上之誤解,敬請不吝告知,感謝您的閱讀。》

i以下列舉美國主要電視新聞的概況:
‧ 美國國家廣播公司(National Broadcasting Company,簡稱NBC)
‧ 美國哥倫比亞廣播公司(Columbia Broadcasting System,簡稱CBS)
‧ 美國廣播公司(American Broadcasting Company,簡稱ABC)
‧ 福克斯廣播公司(Fox Broadcasting Company,簡稱FBC)
‧ 有線電視新聞網(Cable News Network,簡稱CNN)
‧ 美國公共廣播局(Corporation for Public Broadcasting,簡稱CPB)

  • Loading...


    Loading...

    Login






    註冊 | 忘記密碼

    Register





    A password will be mailed to you.
    登入 | 忘記密碼

    Retrieve password





    A confirmation mail will be sent to your e-mail address.
    登入 | Register