1024x768 1280x800   Decrease font size for  - 拓展台灣數位典藏 - 數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫網站 Reset to normal font size for  - 數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫網站 - 拓展台灣數位典藏 Increase font size for  - 拓展台灣數位典藏
 


< D-Lib Magazine>網站簡介

發表日期: 2008-01-24, 點閱數: 0 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

網址:http://www.dlib.org/                     
                                                 梁美珍

  D-Lib Magazine是由DARPA 和美國國家科學基金會經費支持下,結集了數位圖書館的研究與發展訊息的電子雜誌。於每月的十五日出刊,一年出版11期,其中七月出版的是七八月的合刊;每月出版有關電子圖書館研究的成果,評論、
簡報,會議的消息以及資源整理等。
  它提供每月當期出版有關數位圖書館的革新和研究課題的期刊。主要包括期刊版本、書評(Book Review),並且提供期刊內容的檢索、所有過期期刊之內容瀏覽、期刊單篇著作作者之索引、期刊書名索引等。
  此電子雜誌主要目的在於提供數位圖書館一個適時、有效率的交流平台,讓進行圖書館數位化的研究員及學者交換訊息,吸收新知,並發展在分散式環境下有關數位圖書館的使用評估。其中有舊刊專區(自1995至今的現刊),讀者不但能查詢到美國相關圖書館數位化歷程重要的資料,其中值得參考的文獻資料也可藉由此網站作連結,甚至是各國的相關題材,不但可以在網站上找到當期及歷史的議題,並可藉由關鍵字查詢到所需要的相關資料。此網站幫助從事數位化工作的成員從各方面去了解圖書館數位化所涵蓋的各項範圍。
  在數位化工作的學術研究上,D-Lib Magazine的貢獻是不容置疑,作為現今數位化圖書館的一個論壇,它扮演一個吃重的角色,主要特點如下:
(一)刺激數位化圖書館共同的基礎設施的發展,及對公眾評論的研究作一個協調溝通的角色。
(二) 在進行數位化圖書館工作裡,它提供所有的研究及最新發展資訊的交流,尤其是國家所贊助的研究計畫。
(三)鼓勵和協助這些研究努力成果,並納入全國數位化圖書體系的創作成果。
(四)在其網頁上,詳列了所有各國有關數位化的研究或技術方面的國際會議、座談和工作坊等等之連結,讓有興趣的讀者參考。
(五) 在技術上,D-Lib Magazine強調的開放使用,就如任何讀者可在世界各地使用瀏覽器作連結。
(六)在使用介面上,它提共了一個方便查詢的方式,如很多的資料文章皆開放下載閱讀。

 

TEI Tutorial心得紀要

發表日期: 2008-01-24, 點閱數: 1 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

◎謝筱琳

    2006年3月6日至9日於中央研究院舉行之「TEI Tutorial」,為交通大學資訊工程系教授傅心家邀請,數位典藏國家型科技計畫計畫辦公室主辦之教育訓練課程。為培育臺灣文件符碼化(TEI)種子教師,特邀文件符碼化協會(TEI Consortium)主席法蘭德斯‧朱麗亞(Julia Flanders),與文件符碼化協會北美地區編輯席‧包曼(Syd Bauman)專講授課。課程分為四天(表1),內容包括:
   1.文件符碼化及標誌介紹(Introduction to Text Encoding Initiative and markup)
   2.文件符碼化教學介紹(Introduction to Teaching TEI)
   3.文件符碼化格式與驗證:DTDs(Document Type Definitions)and Schemas
   4.未來文件符碼化教學議題(Further Issues in Teaching TEI)

表1、TEI Tutorial 課程表

 

36

3 7

38

39

0900

 

1200

單元一:
簡介文件符碼化及標誌( Overview TEI and markup

單元三:
中級標誌使用教學( Intermediate Markup

單元五:
了解文件符碼化格式設定與驗證方式( TEI DTDs and Schemas

單元七:
報告、討論 Presentations

1400

 

1700

單元二:
標誌介紹( Introduction to Markup

單元四:
文件符碼化教學介紹( Introduction to Teaching TEI

單元六:
未來文件符碼化教學議題( Further Issues in Teaching TEI

單元八:
結論( Further Presentations

 

    課堂以教師授課與分組討論進行,學員約20名,分別來自中研院史語所、語言所、近史所、資訊所,台灣大學圖書館特藏組、中華佛學研究所,以及數典計畫維運分項計畫之出版子計畫、技術研發分項計畫,與後設資料工作小組。前三天課程均為教師授課為主、學生提問為輔,教師並隨學生需求增減教材;最後一天開放全天討論,由教師列出小組討論問題(詳見附件1),學員自行分組準備,後上台口頭簡報,全體提問討論,教師總結。四天密集訓練結束,授與結業證書。

 

TEI新舊版本更替

    總計辦TEI Tutorial為文件符碼化協會每年預定工作項目之一,只要會員提出教育訓練要求,他們就會提供師資課程,舉辦世界巡迴講座;此次講座即為傅心家教授邀請,首次登台授課。
    「今年不是學習TEI的最好時機……」,講師第一堂課即開宗明義道出軟體程式隨時代變革的無常。在最新版本──TEI P5──釋放之前,學界、圖書館、博物館早以TEI P4或TEI Lite版本標記全文,例如中華電子佛典協會(CBETA)即以P4版本詳細標記佛經的段落層次與內容;然隨2006年P5版本出現,新增缺字(gaiji,日文「外字」)處理模式,修訂、增補各種標籤、描述的定義,更新更完整的標記方式逐漸成形,標記者被迫面臨版本更新與轉換的抉擇,此變革亦產生教師教授TEI必噓新舊版本並呈之困難。不僅TEI Tutorial將課程內容先從P4版本切入,後以P5補充,本計畫漢籍全文主題小組舉辦之TEI Workshop也同樣授與P4與P5兩版本,並提供輕量版(TEI Lite)供學員輕鬆上手。
    兩方講師皆建議,若已使用P4(或Lite)版本標記文本之研究單位,可繼續使用舊有版本,也可選擇轉換成P5版本(CBETA如是);而將要進行全文標記之單位,則建議直接採用P5版本。P4與P5兩個版本差異不大,後者較前者功能完善且新增缺字模組;TEI Lite為TEI P4之輕量版,其功能則較不適用於繁複的文本。

  
 
新增缺字功能

    缺字與異體字的問題,一直是非西洋語系國家使用電腦儲存文本之的難題。許多漢文文本歷經時代的流變、筆者錯用、抄手誤植等變遷,一字衍生多形,而電腦因為編碼不足無法顯示,形成研究者研讀考據、甚至數位化障礙。
    TEI P5版本新增缺字處理模式,以其日文發音命為gaiji(日文「外字」),其概念約為將原文使用字之圖檔與現行通用的異體字並呈,便利後人查閱標記即可並觀不同時代的字形字義。由於缺字模組為新增功能,TEI Tutorial特別請到日本京都大學人文科學研究院維習安博士(Dr. Christian Wittern)專講「缺字」課程。
    維習安博士認為,在全文數位化過程裡,將單字的字形、字義劃開是必要的,因為文本常出現同字(義)卻外型不同的單字。TEI P5的缺字模式能將文本原有字形連結或是指向現行通用字,並於其後標記該字為萬用碼(Unicode)缺字,免去電腦無法顯示,直接反應缺字問題於標記語言裡,標記者或研究者可輕易查覺。

 

TEI Modules(模塊)

    TEI大致可分為表頭(header)與標籤(tags)兩大部分。表頭類似書籍的版權頁,除記載原始文本的來源、出處、作者、出版資訊等基本書目資料,也記錄標記者的姓名、身分、標記年份、以及用途。標籤為標記時使用的元素,諸如<作者>、<引用>、<新增>、<刪減>、<異體字>、<名稱>、<段落>、<行>、<篇章>……等等。TEI標籤數目達到上百個,採用單位可視預標記文本之複雜度選用所需標籤,就像制定後設資料的著錄欄位一樣。眾多標籤,可依其標記之功能、用途歸納出核心、文件結構、表頭等標籤的集合,組成一個個模塊(module),而核心元素、文件結構、表頭等模塊,正為詮釋文本的基本必要欄位。
    有了TEI模塊,使用者可以免去傷神一一選擇標籤的煩惱,直接選取適用自己文本的模塊,組合成一個完整的TEI schema(包含必備模塊與單位特別需求模塊),即為使用單位與機構之專用TEI語法,且此專用語法仍不失其國際、館際交換流通之標準特性。TEI的妙用正在於提供一套國際通用的標準規則,使用者可在大準則下自行制定修改細節,而不損壞其標準架構。

用Roma建立屬於自己的TEI Schema   

    TEI並非封閉,而是公開程式碼的免費標記語言,任何機構或是單位都可採用該標準詮釋他們的文獻資料,工程師、學者、研究者也可以針對TEI的指南、程式闕漏與刊誤,提出意見修正。目前有一線上系統Roma(圖一),提供全球所有人士免費登入,於其中創造、修正所需TEI模塊,並組合成一套TEI模組的服務;而此系統創始人並非文件符碼化協會相關人員,只是自願研發、設計TEI應用軟體的工程師。

圖一、Roma首頁
    進入Roma(http://tei.oucs.ox.ac.uk/Roma/),可新增模塊或是選擇資料庫已有模塊。在選擇模塊介面上(圖二),左邊選單列出適合詮釋不同文本的模塊,例如drama(戲劇)、figures(圖表)、gaiji(缺字/外字)、corpus(語料)……等;右列為已選擇模塊。使用者所選模塊都會顯於右列,若要刪去,可點選romove(移除)字樣。為確保所有登入者創造之模組符合TEI標準結構,Roma系統將core、tei、header、teistructure四個主要模塊強制加入右列,使用者可對其小幅修改,但無法刪去。不論是必備模塊(核心的、結構的…)或是特殊模塊(適用語料、戲劇的…),登入者皆可直接點入進行屬性修訂(圖三)。


圖二、Roma Modules選擇介面


圖三、core module修改畫面
    所需模塊全數修訂與選擇完成後,可點選schema(模組)與documentary(文件檔案)(圖四圈選處),產生獨立的TEI模組與TEI文件,前者為標記規格(規則),後者為說明定義的文件,兩者皆可轉換成德文、西班牙文或英文三種語言。
    漢籍全文主題小組TEI Workshop講師馬德偉博士,在參加維習安博士的缺字專講與Roma教學之後,也將此兩項納入漢籍全文主題小組第四次與第五次工作坊的授課項目。


圖四、建立模組畫面

TEI在台推廣可能面臨的桎梏

    課程最後一天,講師要求學員自行組團,循「附件1」的問題分組討論。
    與其他學員互相交流討論才發現,原來技術研發分項計畫的後設資料工作小組許婉蓉小姐,曾經翻譯過TEI Guideline(TEI指南),且作業範圍和目前正從事TEI Lite與TEI P4編譯的馬德偉老師有所重疊,不過後設資料小組現已停工。
    另外,許小姐也表示他們不了解漢籍全文主題小組舉辦的TEI Workshop,建議未來兩分項或可一同商討TEI開課事宜,技術分項可支援技術,加強兩分項合作聯繫的互動關係
    技術研發與內容發展皆為數位典藏國家型科技計畫之分項計畫,由於身負數位化工作的技術支援與標準匯整使命,兩分項學員約4人集合成一團體,合力討論如何在台灣推廣TEI,以及可能面臨的問題。
    首先,推廣TEI必須先向受眾宣傳TEI的價值─使用TEI標記可利於文本分析、互換資料以及保存。然而,並非單向推廣就能達成效果,依照漢籍全文主題小組運作近一年狀況來看,我們自去年(94年底),已不斷向史語所漢籍電子文獻資料庫、柳立言老師帶領的台灣宋史研究網、語言所語料資料庫、國史館、國史館台灣文獻館等提倡TEI標記,漢籍電子文獻資料庫助理參加TEI Workshop後也曾表示TEI與他們現行的標記法相比,會是比較合宜的語法(目前使用的XML語法難於標記表格,TEI則有標格專用模塊);但礙於計畫的執行時間、經費、人力,甚至施行方法限制(去年漢籍電子文獻資料庫才將原有的自訂標記轉換成XML語法),要求數位化已久的計畫單位重新採用新的標記語言,即使可以電腦批次轉換,仍可能會對計畫單位施予更加沉重的負擔。撇下執行中計畫不談,就即將進行數位化單位而言,依舊有其施行困難,而此入門門檻為「語言能力」。
    TEI由歐洲和北美的5所大學以及全球81所學術單位組成,預設語言是「世界共通」的英文,所有TEI介紹、指南、工具軟體(例如Roma),都以英語製作。對於處理漢籍全文數位化、慣於使用中文介面的工作者來說,即使具有基本語言能力,但以不熟悉語言學習新科技、新事物,恐怕還是一大難關。對此,講師皆認為TEI的中文化作業是刻不容緩的,解決進入障礙最好辦法即是將英文的TEI編譯成國內使用者慣用的介面與語言。若達成此舉,或可提高單位計畫採用TEI通用標準的興趣。
    關於TEI中文化與區域化之推廣,已由中華佛學研究所圖書資訊館館長杜正民先生以及馬德偉博士向國科會申請計畫,規劃將之納入數位典藏二期計畫內,提升台灣漢籍全文數位化的國際競爭力。

TEI Tutorial vs. TEI Workshop

    總計畫辦公室辦理的TEI Tutorial,講師皆為北美文件符碼化協會成員,故以全英語授課;或許是英文能力形成進入障礙,開放50個上課名額,實際僅召收約20位。相較之下,漢籍全文主題小組舉辦之TEI Workshop,講師馬德偉博士雖為德國人,但能以中文講解,採大家熟悉的中文授課,報名較為踴躍,且學員多表示能夠明瞭上課內容。
    TEI Tutorial之巡迴目的在於推廣TEI、協助會員認識TEI相關議題,其功能較偏向概念的推展;TEI Workshop顧名思義為工作坊性質,旨在介紹推廣TEI,並且教導學員使用TEI,理論與實作並進。為減輕學員學習困難,馬德偉博士特別摘錄大家較為熟悉的中文文本,例如一般書信體、佛教篇章、或是魯迅《狂人日記》,全都可見於工作坊教材裡;TEI Tutorial則因教師學術文化背景,以及概念推展因素,採用英文的戲劇、小說、散文等文本為例。
    此次總計辦的TEI Tutorial未設報名資格,參與學員除數位典藏計畫相關單位,還有一些民間的、退休的、業餘的個體參加;漢籍全文TEI Workshop本著訓練TEI標記好手的目標,首先開放數位典藏全文數位化相關單位人員參加,若名額有餘,則向外開放其他主題小組或是計畫單位、一般大眾。
    兩課程最不同之處在於TEI Tutorial於最後一日頒發結業證書,為數典計畫背書之書面證明,TEI Workshop則未有此項認證手續;另,TEI Tutorial大量提供分組討論空間,較TEI Workshop的個人實作具互動學習效應,TEI Workshop業已習之將小組討論劃入課程,望提高學員課程參與感。詳細課程比較可見表2。

表2、TEI Tutorial與TEI Workshop比較表

 

總計畫辦公室

TEI Tutorial

內容發展漢籍全文主題小組

TEI Workshop

主辦單位

數位典藏‧總計畫辦公室

數位典藏‧內容發展分項計畫

講師

TEI協會主席法蘭德斯朱麗亞

TEI協會北美地區編輯席‧包曼

中華佛學研究所馬德偉

地點

家驛館研討室(需自備電腦)

生命科學圖書館電腦教室

時間

2006.3/6-3/9(連續四個全天)

2005.12/202006.1/164/185/156/13(五個半天、間隔約一個月)

授課語言

英語

中文

應用範例

英文文本

中文文本

授課內容

介紹TEI、如教授TEI

介紹TEI、訓練標記好手

參加人數

20

每堂20-30

學員來源

史語所漢籍電子文獻資料庫

史語所柳立言老師計畫

語言所黃居仁教授計畫

近史所檔案館

台灣大學圖書館特藏組

資訊所

中華佛學研究所

數典計畫出版子計畫

技術研發分項計畫

後設資料工作小組

內容發展分項計畫

華僑銀行外匯交易員

史語所漢籍電子文獻資料庫

史語所柳立言老師計畫

語言所

國史館台灣文獻館

中華電子佛典協會

國史館

中華佛學研究所

數典計畫出版子計畫

史語所傅斯年圖書館

中研院民族所

內容發展分項計畫

民族所

結業證明

上滿兩天課程,授予結業證書

上課方式

教師授課與分組討論

教師授課與個人習作

活動紀實

錄影

拍照

課後回饋

發回饋單

Email詢問

未來TEI Workshop可改進之處

    有鑑觀摩TEI Tutorial之經驗,日後舉辦類似工作坊,建議可:
     1.若課程為一系列訓練內容,可排定連續數日之工作坊,加深學習記憶,避免間隔上課(隔週、隔月)容易遺忘前次上課內容。
     2.工作坊除教師授課與個人習作,還可加入分組討論,要求學員自行分組(最好能以單位分組)。小組需將各別工作內容套入所學,並於課堂口頭報告,全班可互相熟悉工作項目,並提供可能協助與建議。
     3.製作回饋單(或問卷),請學員於課後填寫並繳交。依據回饋單,能適度調整下次上課內容或授課方式。
     4.全程錄影。不過拍攝教師授課部分必須徵詢其是否同意公佈之意願。
     5.上完課程可授予結業證明,許能吸引更多相關人員參與。

 

 

 

 

 

 

 

 

 

 

 

 

【附件1】
Group Presentations:Questions for Discussion
For the final group exercise, we would like you to form into groups including 3-6 people. The colleagues from each institution or project ( Academia Sinica, NDAP, Chung-Hwa Institute, MATT, etc.) could each form a group. Anyone who is here alone without ant colleagues should join one of the other groups. Please see Julia or Professor Fu if you need help finding a group.

On Thursday morning, the groups will meet to discuss the application of TEI to their project’s work.

Please consider the following questions. Each group should prepare a short (10 minutes at most), informal presentation to share the results of your discussion with the rest of the class. There is no need for any slides or prepared materials.

‧ What are the goals of your project, and (if appropriate) the materials that are being included in your digital collection. What are the significant informational features that will need to be represented?
‧ Describe the primary audiences who will be using the digital collection: are they experts, academics, general readers, schoolchildren? What special needs will they have?
‧ Describe the functions you want to provide for your audience: what kinds of searching? What kinds of navigation? Do you need to provide support for multiple languages in the interface?
‧ What kind of text encoding will you need to support these functions? What kinds of metadata will you need?
‧ What areas of the TEI do you think will be necessary to this project, and what areas might fall outside the boundaries of the TEI? What kinds of customizations might be necessary to support the kind of encoding you propose?
‧ What kinds of training will you need to provide to those involved in digitizing these materials? What expertise or subject knowledge will they need?  

 

 

〈2006 TEI Tutorial Group Presentations〉
20060306~0309TEI Tutorial訓練課程心得報告

 

Television News Archive使用者付費機制

發表日期: 2008-01-24, 點閱數: 2 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

撰文‧程婉如
  繼「Television News Archive資料庫查詢介面」一文介紹檢索介面之操作後,本文針對此計畫內使用者付費機制再進行探討。首先說明計畫內所典藏的電視新聞會以錄影帶形式寄發給付費索取之使用者,其中又分為兩種選擇方式:
一、 直接複製
  此方式為該機構提供最簡單且便宜之服務,使用者可依照自行所需申請複製夜間新聞時段、特別新聞集錦等,索取費用如下表:

使用者類型

索取費用(每半小時)

范德堡大學(Vanderbilt University)學生

美金US $25

范德堡大學(Vanderbilt University)職員

美金US $25

范德堡大學(Vanderbilt University)全體教員

美金US $25

贊助機構

美金US $25

各大教育機關

美金US $50

K-12各級學校師生、職員

美金US $50

個人研究機構

美金US $100

政府機關

美金US $100

非營利組織

美金US $100

商業團體

美金US $100

公立圖書館職員

美金US $100

新聞媒體傳播業(電視、廣播、印刷)

美金US $100

 

 

 

 

 

 

 

 

 

            《譯自Television News Archive計畫官網》

二、 間接編輯
1. 使用者可視需求而申請多個新聞片段資料彙整於同一錄影帶內。
2. 編輯錄影帶的費用計算方式無關乎片長(時間長度),而是依照使用者索取新聞片段的數量多寡而定。
3. 每捲錄影帶可編輯最長時限約為一小時,而收取費用為美金US $10元。
4. 錄影帶中所編輯的每則新聞片段之索取費用如下表,其依照使用者類型不同而有所區別。

《譯自Television News Archive計畫官網》

使用者類型

索取費用(每半小時)

范德堡大學(Vanderbilt University)學生

美金US $12

范德堡大學(Vanderbilt University)職員

美金US $12

范德堡大學(Vanderbilt University)全體教員

美金US $12

贊助機構

美金US $12

各大教育機關

美金US $17

K-12各級學校師生、職員

美金US $17

個人研究機構

美金US $27

政府機關

美金US $27

非營利組織

美金US $27

商業團體

美金US $27

公立圖書館職員

美金US $27

新聞媒體傳播業(電視、廣播、印刷)

美金US $27

《譯自Television News Archive計畫官網》

  該方法屬複雜且勞力密集之服務,因此其製作費用較為昂貴,且須先收到貨款後才進行新聞片段挑選、編輯錄影帶等工作,索取者亦可自行準備錄影帶供該機構製作。
  上述說明為Television News Archive計畫典藏品之使用者付費機制,亦為該計畫進行典藏所需預算的最大收入來源。此機制對於隸屬於范德堡大學(Vanderbilt University)之成員或贊助機構等,皆提供最高的折扣及優惠。隸屬於各級教育機關之成員亦擁有適度的折扣,而其餘的使用者類型則比照一般標準之價格付費。另外,關於錄影帶運送、付費方式及使用條款等相關事宜,筆者亦整理如下:
◎ 物品包裝及運送
* 凡是范德堡大學(Vanderbilt University)全體師生或職員皆能直接獲收從該計畫典藏中心寄發的索取物品。
* 其餘使用者之索取物品若無特別註明的話,則一律委由UPS (United Parcel Service)託運,此運費已含於收取費用內。
* 顧客可額外付費要求快遞方式為隔日送達目的地。
◎ 付費方式
  每筆訂單在運送之前皆須先取得貨款,而建議付費方式為信用卡或大專院校所核發之訂購單。恕不接受一般商業公司用途之訂購單。
◎ 使用條款說明
 * 所有寄發的錄影帶皆視為該計畫典藏中心之資產,請務必擇期歸還。
 * 凡逾期不還者,將罰款美金US $50元。

 

 

《以上撰文資訊皆來自Television News Archive計畫官網http://tvnews.vanderbilt.edu/,若有任何翻譯上之誤解,敬請不吝告知,感謝您的閱讀。》

日本文化遺產オンライン(Cultural Heritage Online)簡介

發表日期: 2008-01-24, 點閱數: 3,944 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

內容發展分項計畫/陳秀華

  

  平成十五年(2003年)四月,有鑑於網際網路技術的發展迅速,許多博物館、美術館也對自身藏品進行數位化,日本文化廳與總務省為了積極公開這些數位化後的相關資訊等目的,推動了「文化遺產Online」,將日本文化遺產的總覽呈現於網際網路上,希望在平成十八年(2006年)時,達到1000個收藏單位的藏品匯集。

  此網站內容的架構主要提供使用者三個部分的資訊:

(more…)

內容發展分項計畫 典藏成果展示與宣傳子計畫

發表日期: 2008-01-24, 點閱數: 1 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

撰文 高鈺茹 2006.5.4

【數位典藏計畫宣傳影片】
   您也許已聽過數位典藏計畫,也曾運用過它豐富的網路資源,但您或許不曾思考過,需要花多少時間與人力,才能將幾千年來保存的檔案文獻數位化,也並不知道,一張可以在網路上任意翻轉的3D動物標本影像,是拍攝了432張圖像後,再一一組合而成的…
   影片中除了呈現數位典藏計畫執行四年以來產出的豐碩成果之外,更帶領觀眾一探數位化工作背後的艱辛歷程。數位典藏計畫所做的努力,?的不只是將一件件實體的物件數位化,更希望能再現文物新生命,綻放臺灣的文化魅力!

動物主題影片拍攝現場(2005.11.11)
地點:臺灣大學昆蟲館

植物主題影片拍攝現場(2005.11.15)
中研院生物多樣性研究中心研究員彭鏡毅先生(左)與助理人員於中研院植物溫室協助影片拍攝

人類學主題影片拍攝現場(2005.11.07)
地點:國立自然科學博物館

整體計畫宣傳影片拍攝現場(2005.11.09)
中研院歷史語言研究所研究員黃寬重先生接受訪談拍攝

◎ 數位典藏整體計畫宣傳影片
數位典藏計畫總主持人曾志朗先生:「數位典藏把我們過去的文物、我們文化裡面最重要的寶藏和遺產,利用現代科技的方式保存下來。讓廣大的民間人士、學生、甚至是幾百年以後的人,都能看到我們現在的作為跟我們以前所保存的面貌…」【瀏覽影片預告:http://content.teldap.tw/main/doc_detail.php?doc_id=862

◎ 植物主題
國立臺灣大學生態學與演化生物學研究所謝長富教授:「在進行植物標本的數位化過程中,掃描器是有問題的。因為掃描一般都是正面朝下,但是將標本翻面會導致上面的葉子與果實脫落,我們必須花很多的時間人力重新再把標本固定…現在的解決方式便是做架子,將掃描器翻過來…」
【瀏覽影片預告:http://content.teldap.tw/main/doc_detail.php?doc_id=858

◎ 動物主題
中央研究院生物多樣性研究中心邵廣昭研究員:「像魚的話,我們要去數牠的?條、看牠有幾個鱗片,甚至還要看牠牙齒的型態等。在進行數位化時,我們可以把這些特徵描述出來,甚至做一些描繪或拍攝一些詳細的照片,這些都可以達到幫忙鑑定的功能…」【瀏覽影片預告:http://content.teldap.tw/main/doc_detail.php?doc_id=857

◎ 人類學主題
中央研究院民族學研究所潘英海教授:「人類學的藏品之所以這麼多而且不斷在更新,基本上是牽涉到人的一個基本特性。人是一個未完成的動物-unfinished animal,人常常會根據他的時代環境變遷,不斷地去調整創造新的物品,因此即使是舊的物品,人也可以重新賦予新的意義,使其變成新的物品…」
【瀏覽影片預告:http://content.teldap.tw/main/doc_detail.php?doc_id=859

◎ 善本古籍
中央研究院歷史語言研究所傅斯年圖書館陳鴻森主任:「對任何一個圖書館而言,典藏空間的不足,永遠是圖書館必須面對的困境。但經由現代科技,圖書文獻數位化,大大減緩了典藏空間缺乏的壓力。二十年前已有一些學者預見到,未來的圖書館可能是一個並沒有書的空間…」
【瀏覽影片預告:http://content.teldap.tw/main/doc_detail.php?doc_id=861

◎ 檔案主題
「淡新檔案是1776至1895年間,淡水廳、臺北府及新竹縣的行政與司法檔案,總共有1143案,19281件。經過統計,如果將全部的《淡新檔案》案件連接,其展開後的全長約有10400公尺,比台灣地標台北101大樓要高上20倍以上…」【瀏覽影片預告:http://content.teldap.tw/main/doc_detail.php?doc_id=860

 

從Web2.0時代看Metadata新應用模式-Folksonomy

發表日期: 2008-01-24, 點閱數: 1 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

網站介紹:www.Flickr.com
   高芷彤
   當Web2.0時代來臨,使用者擁有網站內容架構的主導權時,傳統資訊分類方式是否仍適合使用者建構網站資料庫的內涵?以Flickr相片社群網站為例。

Web2.0時代
   「Blogger」一個新的名詞誕生,引爆網路世界的革命現況。Blogger顧名思義是指網誌作者,寫Blog的人,也稱作部落客、博客等解釋。繼九十年代網路泡沫化後,網站經營者開始重新思考過去的失敗並吸取成功者的構想以及經營模式,網站逐漸從傳統以銷售轉為提供服務建構平台為導向,網站釋出內容的主導權,用戶從被動瀏覽網路到主動參與網路架構內涵,使用者開始有了擁有權利以及姓名。此模式源於O’Reilly Media公司CEO Tim O’Reilly所提出的Web2.0概念,在此概念下網際網路從「靜態網頁集合」轉向「提供軟體服務」的演進概念,特別是一些支援自助出版或參與協作的服務。網站不再是靜態,而是能和使用者互動了解使用者的需求進而提供服務。以「無名小站」為例,國內交大大一學生成立創立於1999年,最初無名小站以BBS概念結合BLOG以及相簿,提供全台灣超過四十五萬的上網人口一個園地,網友透過網路相簿放上自己的相片show自己,透過網誌紀錄心情點滴,更成為出版業者發掘新書的重要來源,彎彎的《可不可以不要上班》、化名Lowes撰寫的《原來我不帥》等書便是如此。當時無名小站站如其名,2005年「無名小站」已是台灣上市公司,目前台灣使用人口更超過250萬人,從全球網站流量排名顯示擠入全球前100大網站。
   Tim O’Reilly和John Battelle舉出Blog、社區照片共用服務(以Flickr為代表)、集體編輯服務(Wikipedia為例)和社會性書籤服務(Delicious)等以使用者為中心的Web現象,促使資訊在網路的產生、共用以及擴散的傳統概念轉變,同時也影響軟體業者的開發。Yahoo!奇摩總經理鄒開蓮表示,「Web 2.0的精神是將原本單向的服務,轉變成由網友共同參與互動的網路溝通。而Yahoo!奇摩Widget工具正是Web 2.0精神的展現」。
資訊分類-Metadata的新面貌
   資訊分類是在期望能在大量的資訊中達到在混亂和有序之間的動態平衡。Metadata是關於資料的資料,為建構網站「Information」數據來源,用來描述、組織以及發現網際網路大量訊息,隨著Web2.0時代的來臨傳統依照學科對資料作分類的等級是分類法或依照不同屬性來查找資料的分面分類法是否仍適用?依照Tim O’Reilly以及Battelle在Web2.0會議中總結關鍵原則指出Web2.0是分享和參與的架構趨動的網路效應、是以Web作平台將數據變為「Intel Inside」等特色,降低分類技術門檻勢在必行,以提供使用者容易架構網站內容提高參與。Google專注於用戶需求以及發展核心技術,憑藉用戶鏈結網站-PageRank,而非資料的本身Metadata來判斷訊息的價值。2005年初,一種由用戶參與和主導的資料組織的方法-Folksnomy自由分類法,被廣泛關注,迅速在Technorati、Myspace等多個系統中推薦應用。自由分類法降低了應用門檻,用戶只需通過平面化的自由關鍵詞進行分類,再以網路共享的方式分享,同時影響傳統資訊組織,呈現另一種面貌。
Flickr vs. Folksonomy(自由分類法)

(圖表 1、資料來源:www.alexa.com。)
   Flickr.com是一個提供使用者擺放照片的相片社群網站,由加拿大魁北克Ludicorp公司所設計於2002年成立,提供一個能分享數位相片的平台網站,採用網際網路目錄機制,用戶可自行對自己感興趣的資料定義相片的關鍵下進行分類,並與他人共享標籤的過程以及結果。「資訊的民主化是該網站最有趣的部份」解答搜尋網站GuruNet執行長Bob Rosenschein表示。「他們不一定每次都很精準,但這都是網友所談論的真實主題,若數量夠龐大,也是有數字的可信度,這就是群眾的智慧」。此網站於2005年3月被美國Yahoo.com公司所併購。
   網際網路的多元化提供使用者不同服務,以目前備受注目的搜尋引擎Google為例,其專注於技術的研發,有別於Yahoo、微軟等大型入口網站以提供各種不同領域之服務為主,希望能留住使用者,Google提供一簡單的檢索框介面,協助使用者在大量的資訊中迅速搜尋到正確的訊息為主,專注使用者需求並提供專業技術則較似於網站出口,開創另一新局面。Flickr的相簿社群網站同樣專注於技術,Yahoo發言人Joanna Stevens表示,決定購買Flickr的主因不在於數位照片,更重要的看在Flickr的技術與其聰明的創始小組。「在那麼龐大的資料庫中尋找東西時,網友需要的不只是搜尋而已,而是需要更多面向來尋找資料。」Stevens表示,「Flickr的優點是能彌補Yahoo下一代服務的不足。」
    在Flickr的Hot Tags將文字大小與對應圖片的多少採用正比的方式呈現,圖像化地貼近使用者視覺感官。使用者可標識(Tag)感興趣的內容,提供一至多個Tags,無需了解傳統專業的DCMI或查詢杜威十進制分類法的分類原則,Flickr相對降低了資訊分類的門檻。當檢索者看到Tags不適合時可增加或修改,另外常用的Tags則會依字順形成圖表。也就是說在Flickr中標識(Tags)是隨用戶使用不同標識(Tags)而有內容動態的更新,Tags圖表中有些大有些淡出,用戶可隨時發現目前分類的趨勢。使用者經驗公司Adaptive Path創始人Peter Merholz表示,「Flickr這類網站的衍生效應是資訊的全球目錄化」。

   

Tags的自由分類法滿足用戶的視覺偏好以及讀圖的心理,較搜尋引擎的輸入框更直接。雖自由分類較無傳統分類來的有等級結構且有較無法精確描述資訊,但從全球網站流量排名顯示,成長速度相當穩定,也許在現今網路成熟且逐漸開放式的環境下,Tag的自由分類法會更貼近使用者需求以及偏好,RSS技術繼Epinions創始人R.V. Guha表示,自由分類法理念在於,「我不強迫大家使用相同標籤,也因此整個系統會更豐富,呈現原創者所沒有想到的突出現象。」

臺灣原住民數位典藏國家型計畫資料庫之簡介與分析(一)

發表日期: 2008-01-24, 點閱數: 1 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

陳美智95.04.24

一、 計畫簡介:

  「臺灣原住民數位典藏國家型計畫」為「數位典藏國家型科技計畫」中央研究院機構計畫下的計畫之一。主要目的在於典藏中央研究院民族學研究所博物館、圖書館以及研究人員所蒐集的臺灣原住民文物、文獻與影音資料,進行各類型藏品的數位化、典藏管理,並將這些完成數位化的藏品,建置資料庫及搜尋機制,以提供研究人員、教育人員以及社會大眾在研究、教學以及相關資訊交流方面的便利,除了將這些珍貴的資料典藏起來以外,更希望能藉此促進族群之間的相互了解與尊重,以及不同文化間的交流。
  「臺灣原住民數位典藏國家型計畫」依照中央研究院多媒體美術設計與資料處理小組的數位化技術規範將數位化後的數位影像檔分成以下三種格式做典藏與呈現。

超高品質格式

R.G.B 24bit(全彩)400~600dpi TIFF(非壓縮);

相當於印刷品質的200 ~ 300 線(高解析度印刷);

適用原稿種類 – 對品質的要求非常精細之原稿、物件;

檔案大小 – 100 MB(A4)以上。

高品質格式

R.G.B 24bit(全彩)300dpi TIFF(非壓縮);

相當於印刷品質的175線(圖片印刷品質);

適用原稿種類 – 反射稿掃描、正、負底片掃描、物件拍攝、相片掃描;

檔案大小 - 20MB(A4)以上。

網路瀏覽格式

R.G.B 24bit(全彩) 150dpi JPEG(壓縮50%),檔案大小 -230kb(A4) ;

GLAYSCALE(灰階256)8bit 150dpi JPEG(壓縮50%)檔案大小-200kb(A4);

B&W 300dpi,檔案大小 - 60kb(A4)。

二:計畫成果:
   「臺灣原住民數位典藏國家型計畫」的數位化成果頗豐,迄今已累計:
1. 文物部分,91年整理平埔族文物,92年整理布農族、鄒族與邵族文物,93年整理排灣族、卑南族與魯凱族文物,共累積資料2110筆以上。
2. 表格部分,從91年度至今,已包含平埔族、布農族、邵族、鄒族、排灣族、魯凱族、卑南族等諸族,未來將繼續建置更完備的相關資訊。
3. 契約部分,共典藏1818筆契約數位資料,分別存放成典藏級(600dpi的tiff檔)與瀏覽級(150dpi的jpg檔)兩種數位格式加以典藏。內容方面契約分成開墾、典租貸借、買賣找洗、鬮分合約等四大類。
4. 地圖部分,包含泰雅族、排灣族、魯凱族、卑南族、布農族、阿美族、邵族、鄒族、平埔族等諸族,未來將繼續建置更完備的相關資訊。
5. 影像部分,目前收錄的族群包括平埔族群、布農族、鄒族、邵族、魯凱族、排灣族及卑南族,其餘各族資料也正陸續按進度數位化典藏收錄中。
6. 口述訪談部分,是以中央研究院民族學研究所博物館與平埔工作室典藏之研究人員的訪談錄音為主,迄今為止,已收錄共有一千五百筆數位化資料,包含泰雅族、排灣族、魯凱族、 卑南族、布農族、阿美族、邵族、鄒族、平埔族(凱達格蘭、噶瑪蘭、道卡斯、巴則海、西拉雅、大武壟、馬卡道)等諸族,未來將繼續新增其他民族並建置更完備 的相關資訊。
7. 音樂資料部分,已收錄共有八百七十八筆數位化資料,已包含泰雅族、排灣族、魯凱族、卑南族、布農族、阿美族、邵族、鄒族、平埔族(噶瑪蘭、道卡斯、西拉雅)等諸族,未來將繼續新增其他族社並建置更完備的相關資訊。
8. 影音資料部分,已收錄共有一千零七十三筆數位化資料,已包含泰雅族、排灣族、魯凱族、卑南族、布農族、阿美族、邵族、鄒族、平埔族(凱達格蘭、噶瑪蘭、道卡斯、巴則海、西拉雅、大武壟、馬卡道)等諸族,未來將繼續新增其他民族並建置更完備的相關資訊。
9. 人口資料部分,(布農族、鄒族、邵族)和(魯凱族、排灣族、卑南族),共8000多筆。
10. 聚落資料部分,(布農族、鄒族、邵族)和(魯凱族、排灣族、卑南族),共250筆。
11. 人名權威檔部分,人名權威檔主要是支援各典藏計畫對於人名資料儲存的需求而產生的目前已著錄4460筆。

 

國外數位典藏網站探索報導——京都大學電子圖書館「貴重資料畫像」

發表日期: 2008-01-24, 點閱數: 1 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

2005/12/5溫淳雅

     京都大學電子圖書館(圖一)始自於1998年,主要的數位化內容有「貴重資料畫像」、「數位化文本」、「博士學位論文資料庫」、「校內研究成果」等部分。本文主要介紹其中的「貴重資料畫像」(圖二)。
圖一
圖二
    
     京大「貴重資料畫像」所公開的內容,包括「京都大學附屬圖書館所藏古地圖」、「維新資料畫像資料庫」、「繪卷物、奈良繪本收藏」、國寶「今昔物語集」、「國女歌舞妓繪詞」、「伽草子」等日本重要的史籍文獻,如國寶「今昔物語集」,便是日本故事文學的代表作,被考據為傳世的抄本中最原始的版本,為日本指定的重要國寶。此外也有部分如「中國清代民國公私文書收藏」、「法國建築、地誌收藏」、「伊斯蘭學貴重資料」等他國資料。
    
     在介面方面,主要可分為「瀏覽」與「檢索」兩個部分。由於京都大學在設定上是呈現貴重資料的「畫像」,也就是說,以數位化影像為主要呈現內容,在數位化的內容上也有絕大部分屬於繪卷、照片等圖象式的資料;因此一進入該網站,便可見到以各資料庫的代表性圖象所組成的頁面(圖三),使用者可以很自在的藉由圖象式的印象,去搜尋有興趣的內容觀看。
圖三
    
     在影像方面,書冊與照片類型的藏品,大致上提供了單邊長500像素大小與單邊長1000像素大小以上的兩種尺寸圖檔,解析度為72dpi,以網路瀏覽而言已十分清晰可觀。另外在地圖、繪卷等類型的藏品,除了上述兩種尺寸的圖檔外,還提供單邊長1000像素大小以上的「局部放大」圖(圖四)。整體而言,京大電子圖書館「貴重畫像資料」所提供的數位化內容都非常精彩,有利於教育、研究方向的使用。

圖四、局部放大示意圖
    
     不過或許是因為歷年建置情況不一,在不同的主題畫像的瀏覽介面上,雖有大同卻也有小異。如有些以滑鼠點選500像素瀏覽圖,會呈現1000像素大圖,有些則是點選後呈現局部放大圖、整體大圖需另外點選畫面以外的按鈕。但基本上而言功能單純,不至於令使用者感到迷惑。
    
     此外值得稱道的是,各方面主題的資料,或多或少提供了詳細的解說,包括該主題資料的詳細歷史、京大所藏版本源由、延伸的人物與歷史介紹等等(圖五)。
圖五
    
     檢索介面大量利用下拉式選單(圖六),其實是文字化的瀏覽介面,令使用者可迅速進入所欲瀏覽的重要書冊內容,做圖象的閱覽,可惜進入後並沒有單獨針對該書冊的檢索介面。真正的檢索則分成簡單檢索與進階檢索(圖七),並有「檢索具圖象的資料」之功能,如無特別選取該功能,則檢索結果會將具有圖象者優先排列,但可惜在檢索結果列表上沒有特別表示這一點,使用者可能在點選進入觀看內容後,才會清楚是否具有圖象。檢索後的單筆結果欄位單純,最主要是題名與描述(圖八)。
圖六
圖七
圖八
    
     除了具有資料庫的功能外,京大「貴重資料畫像」也在展示上也做了許多嘗試。例如英文網頁部分,提供了四種內容的全英文化介紹(圖九),包括「伽草子」、「法國建築、地誌收藏」、「國女歌舞妓繪詞」、「博物學的時代」。以大量英譯介紹文的方式(圖十),將京大所收藏的重要文物介紹給全世界,在推廣效果上應有很大的助益。
圖九
圖十
    
     而在介面上花心思的以達到展示目的的,以下舉兩個例子進行說明。其中之一為國寶「今昔物語集」的呈現方式。由於今昔物語集為日本重要的故事文學代表作,雖然京大所藏版本的重要性無可取代,但坊間要找到當中的內容十分容易。因此京大電子圖書館做了展示上的功能開發,提供了三種抄本影像與文本內容並列的方式,分別是:
1.「標準版」——jpeg圖象與html並列的方式,優點是文本可任意的複製,圖象亦可以大圖顯示,缺點則是以大圖顯示時,需要花費力氣不斷去拉選網頁捲軸,可視畫面亦較小(圖十一)。
圖十一

2.「文本影像連動版」——以JavaScript方式,令使用者在捲動影像或文本任一視窗的捲軸時,另一方可以同步移動;此方式也有提供瀏覽圖或詳細大圖兩種閱覽方式,文本皆可同步移動,但同樣有可視畫面較小的缺點,文本的複製則需額外點選「翻刻」功能方可選取(圖十二)。
圖十二

3.為最新的「透視重疊版」——以flash方式製作,滑鼠在影像上瀏覽時,可同步出現相對應的正楷文本,就如同放置一塊玻璃版在典藏品上即時顯示,對照性最高,可視畫面也最大,介面清晰流暢。文本的複製則如同前一版,點選「翻刻」功能進行選取(圖十三)。
圖十三
    
     其二要介紹本網站最近推出的典藏「太平洋戰爭期間泰國新聞典藏」。此典藏包括了「Krungdeb Varasab Daily News」、「The Siam Rashdra Daily News」、「Lak Mueang」等三種報紙的內容,並提供了iPallet/Lime JPEG與JPEG兩種方式呈現。前者可以直接縮放大圖(圖十四、十五),可在主畫面上隨意拖曳,也有導覽小圖(圖十六),同時也提供列印功能。後者則提供大小兩種尺寸圖檔。小圖約為350*500像素以上,大圖約為1800*2650像素以上。兩種方式都可開放圖檔單張下載。
圖十四
圖十五
圖十六
    
     最後,在版權宣告方面,京都大學同意以教育、研究為目的之列印與下載,其他方面的利用需先行通知,印刷出版則需付費使用。
1 http://ddb.libnet.kulib.kyoto-u.ac.jp/minds.html
2 http://ddb.libnet.kulib.kyoto-u.ac.jp/exhibit/index.html
3 內容以圍繞著田地、房屋、魚池的典賣、租佃、所有權、稅契、借貸、遺囑等相關文書為主。
4 為京都大學附屬圖書館自法國教育部所接手有關巴黎周邊王宮、教堂、道路、廣場、名勝、景觀等圖象與地誌資料,以木版畫、銅版畫與藍圖為主,記錄了法國近代建築史、文化史、技術史等。

「Official Information System of?the Český Krumlov?Region」介紹

發表日期: 2008-01-23, 點閱數: 3,924 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

                           內容發展分項計畫助理  林彥宏

一、Český Krumlov文化歷史簡介
  
  Český  Krumlov座落於捷克南部的伏爾塔瓦(Vltava)河深谷中,並於1992年被列入世界文化遺產,對於喜愛旅遊的人而言,Český Krumlov更是歐洲旅遊的必經之地,當地的彩繪塔幾乎成了捷克共和國旅遊的標誌性建築。
  伏爾塔瓦河的流動在這區域很早就是一個自然的運輸入口。根據傳說,Krumlov來自德語「Krumme Aue」,被翻譯為「彎曲的草地」,名字來自鎮的自然地形,特別是指蜿蜒的伏爾塔瓦河所形成的大彎曲。
 

(圖片來源:本篇文章中之照片,皆轉載自OIS)

(more…)

【Machine Translation】

發表日期: 2008-01-23, 點閱數: 1 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

文/李佩瑛

Machine Translation機器翻譯(簡稱MT)為一種電腦應用系統,可以將文章由一種自然語言翻譯成另一種自然語言。MT並非新興技術,其構想起於40年代末期,由於科學家、工程學家、經濟學者、企業家…等人有閱讀大量文件或使用非母語溝通的需要,如遇此種情形,具有翻譯能力的人往往供不應求,而機器翻譯正好可以紓解這樣的供需。再者,學者專家一向有去除語言障礙能促進國際之間的合作與和平的理想,機器翻譯於焉誕生。

在這樣的構想還頗為模糊的時期,Warren Weaver(1894–1978)可謂機器翻譯的先驅,他於1947年寄給電腦控制學家Norbert Wiener的信件,以及與英國放射結晶學家Andrew Booth的對話中首先提出機器翻譯的構想,並在兩年之後撰寫了闡述相關理念的備忘錄「Translation」,並成為日後的The Weaver memorandum(1949),堪稱當時較為具體兼具代表性的文章。

機器翻譯雖然是由簡單的概念而來,但其背後的運作方式卻是相對的複雜,需透過文法、語義學、語法、片語…等分析,經拆解成符號後再重新組合。這種類型的機器翻譯需要龐大的辭彙,包含形態學、語法規則與語義資訊,但單一的機器翻譯形式並不能完全滿足需要,於是逐漸產生因應各式需求的機器翻譯形式。

1954年由美國喬治城大學與IBM合作的實驗,成功的將超過60句俄文翻譯成英文,雖然只簡單使用六種文法規則與250種字彙,無疑這也展現了機器翻譯的可行性,同時啟發了全球對於機器翻譯的興趣,尤其是當時的蘇聯。

後續的十年有許多不同的政府機構與學術團體致力於MT的研究與開發,如IBM替美國空軍完成的俄翻英系統。其他的學術團體如麻省理工、哈佛大學、柏克萊大學…等則致力於理論研究,也開發出早期的人工國際語言與轉換系統(e.g. MIT與Cambridge Language Research Unit, CLRU)。

但1964年由美國政府贊助的機構ALPAC(Automatic Language Processing Advisory Committee)卻於1966年撰寫的一份報告中扼殺了MT的發展,報告中指出MT並未能正確有效的翻譯,與人工翻譯相較之下成本為其二倍,並沒有迫切發展的需要。自此之後MT於美國發展趨緩,而加拿大、歐洲等地則因當地的語系較繁雜逐漸產生需要,與當初美國針對俄文與技術層面的發展不盡相同。

後期的MT則逐漸全球化,在80年代左右則有跨國合作的商用MT系統出現,如Systran這樣的電腦翻譯軟體也廣泛的被國際組織與企業採用。在80年這樣的市場熱潮領導了人們對於MT的一些省思與注意,無論是結合人工智慧與新的語言學理論,MT的前景令人期待,但最終都是希望能提供人際溝通之間便利的工具,與文化之間的融合了解。

參考連結:
1.Machine Translation: past, present, future
http://ourworld.compuserve.com/homepages/WJHutchins/PPF-TOC.htm
2. Machine translation - Wikipedia, the free encyclopedia
http://en.wikipedia.org/wiki/Machine_translation
3. INFOAM?RICA > El portal de la Comunicaci?n > O Portal
http://www.infoamerica.org/
4. Warren Weaver memorandum, July 1949
http://ourworld.compuserve.com/homepages/WJHutchins/Weaver49.htm
5. EAMT(European Association for Machine Translation)
http://www.eamt.org/
6. Machine translation and computer-based translation - publications by John Hutchins
http://ourworld.compuserve.com/homepages/wjhutchins/
7. SYSTRAN Language Translation Technology
http://www.systransoft.com/index.html