1024x768 1280x800   Decrease font size for  - 拓展台灣數位典藏 - 數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫網站 Reset to normal font size for  - 數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫網站 - 拓展台灣數位典藏 Increase font size for  - 拓展台灣數位典藏
 


機器翻譯之發展與使用-談SYSTRAN翻譯軟體

發表日期: 2008-01-21, 點閱數: 3,231 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

內容發展分項計畫/李佩瑛

 

  科學昌明不僅僅帶來工業上的進步,也逐漸的帶全球化,甚至演變成全球本土化的趨勢,各式文本的流通與人際傳播對於無暇聘請專業翻譯人才的機構、企業來說成為課題,於是使用由機器翻譯進化的翻譯軟體就成了一種迅速的解決方案。

  SYSTRAN可說是翻譯軟體的先驅,由匈牙利裔科學家Peter Toma發明,他於50年代末期移居加州,並於La Jolla成立了SYSTRAN,取自於System Translation的簡稱。公司成立之後曾在1969年為美國空軍研發俄譯英的系統,並陸續為美國國家空情局(US National Air Intelligence Center)研發出數套西歐語系的系統,並於南斯拉夫內亂時替美國政府研發出第一套塞爾維亞-克魯埃西亞文對英文(Serbo-Croation-to-English)的系統。

  而SYSTRAN的專利技術也不止用於美國,繼1974到75年美國太空總署的阿波羅聯盟號計畫(Apollo-Soyuz Test Project)俄英系統之後,也為未來歐盟所使用的系統奠定了良好的基礎,由最初的英譯法原型之後,陸續提供各種歐系語言的系統,至今已有17種翻譯系統於歐盟與其他歐洲相關機構使用。

圖一:M152翻譯系統

  (more…)

British National Corpus at glance

發表日期: 2008-01-21, 點閱數: 4,320 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

內容發展分項計畫//李佩瑛

  British National Corpus(以下簡稱BNC)為一英語平衡語料庫,廣泛收錄20世紀後半的文本與口語資料,其中文本約佔九成,包含全國與地方性的報紙、各種類別的期刊、學術論文、已出版或未出版之書信與手稿…等;口語部份約佔一成,包含大量非正式的日常對談、較正式的商業與政府會議、甚至於廣播節目與聽眾來電,日常對談的部份則徵求義工錄製而成,對談內容跨各年齡層、地區與階層。

  以語料庫的類型來說,BNC為單語語料庫,收錄以現代英式英語為主之語料,而非歷史性之英語,內容方面則不設限,平衡並多元收錄各式不同語料。

(more…)

可貴的淨土─Public Broadcasting Service

發表日期: 2008-01-21, 點閱數: 3,415 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

  內容發展分項計畫/ 程婉如

  
  美國電視業極度發達,不僅頻道眾多,內容亦五花八門,全國約有一千餘家電視台、數千個有線電視系統,而電視用戶也達一億多戶。如此眾多的電視台與頻道,為了拉攏更多的閱聽群、提高收視率,彼此競爭激烈,因此播映內容林林總總,各有千秋。

  
  一般來說,各頻道分佈情況大致分為以下三種:

一、 綜合性頻道:有新聞也有娛樂,內容全面多樣。
二、 部分側重性頻道:播報內容側重於某一大類,如新聞頻道CNN有時亦包含娛樂報導或體育賽事等相關新聞。
三、 專門性頻道:全部播映某一專門內容,如HBO(電影)、The Weather Channel(天氣)、Home & Garden TV(家居)、Country Music TV(鄉村音樂)、Black Entertainment TV(黑人娛樂)頻道等。

  在美國,私營電視約占所有電視台的百分之八十以上,其以追求利潤為宗旨,經營措施高度商業化,主要以播送廣告營利,而廣告節目大約占全部播映時間的四分之一至三分之一。於是在美國看電視經常被一波波接踵而來的廣告打斷了觀看節目的情緒,不論新聞或娛樂節目,不論是錄播還是直播,廣告常常同節目緊緊連接,根據統計,黃金時間穿插廣告的時間為10至20分鐘不等。因此,若您被沒完沒了的廣告壓抑得難以喘息時,不妨轉向公共電視頻道觀看,在美國除了高度商業化的私營電視外,亦存在三百多家公共電視台,其較為注重文化教育節目,內容正面且格調較高,一般而言極少播放廣告,實屬美國電視界中難能可貴的一片淨土。
  
  本文所介紹PBS(Public Broadcasting Service)成立於1969年,總部設於美國維吉尼亞州(Virginia)的亞歷山大市(Alexandria),由全國348個公共電視台所共同運作,屬美國公共電視台的全國性組織,一般由社區組織、大學、州政府創辦,其面向美國各州和波多黎各、維爾京群島等鄰近地區,覆蓋99%的美國家庭,每週將近有一億人收看。這些電視台由171家機構經辦,其中社區組織占51%、大學或學院占32%、州政府占12%、還有5%為地方教育機構或市政機構。筆者亦根據以上數據資料,顯示資料圖如下表:

美國公共電視台比例表

(more…)

古籍線裝書數位化工作流程指南

發表日期: 2008-01-21, 點閱數: 1 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

修改規劃書
                                       研究助理/高芷彤
950828
                                            

壹、 修改規畫
    本次古籍線裝書數位化工作流程指南預計將新增「計畫管理」、「委外製作」、「數位內容保護」等章節,修改「引言」、「流程圖」、「前置作業」、「物件數位化程序」、「後設資料與資料庫建置」、「數位化設備與成本分析」。在計畫管理部份將以文字概述整個數位化的過程,從實體物件整編到數位化後虛擬影像檔製作、儲存、保護、應用等相關層面,以古籍線裝書數位化之整體概念為主體論述。
    另外,在委外製作部份除了先讓讀者了解委外的意義和理由,其中更加入傅斯年圖書館、故宮博物院圖書文獻處、國家圖書館等單位之實際委外經驗,讓讀者對於委外製作的選擇能有更全面性的參考。最後在內容保護部份,有鑒於目前內容保護仍屬發展階段,探討議題多元化,因此筆者將針對浮水印以及智財權兩大與數位化最密切相關的議題,做深入探討。

貳、 新舊章節


引言 引言
數位化工作流程圖 計畫管理
前置作業 流程圖
物件數位化程序 前置作業
後設資料與資料庫建置 物件數位化程序
設備與成本分析 後設資料與資料庫建置
效益與展望 數位化設備與成本分析
結語 專題一:委外製作
參考文獻 專題二:數位內容保護
    專題三:數位化工作之挑戰
    參考文獻
附錄    

參、 流程圖
  關於流程圖的部份,首先將先呈現整體古籍線裝書數位化工作流程圖,並針對「管理系統」、「實體物件數位化」、「虛擬物件數位化」以及「資料庫系統開發」四區塊分別說明。另外,關於各區塊的細部流程圖則安排在各章節論述中。

 

肆、架構規劃

類別 內容
引言   (名詞定義於附錄中)
計畫管理 計畫管理 計畫規畫

計畫目的

經費規畫

    數位化工作規劃

古籍線裝書判別工作

古籍線裝書數位化之目的

古籍線裝書之主要流程

古籍線裝書數位化計畫之參考流程

    數位化系統規劃

數位化流程之系統導向

數位化系統之基本概念

 數位化系統規劃及選擇

古籍線裝書系統分析及選擇

流程圖 數位化工作 流程圖構想
計畫管理流程圖
 
數位化工作流程 前置作業

古籍線裝書整理

資料編碼建立清單

書況檢查與註記

古籍線裝書修復

 
  物件數物化程序

色彩管理

掃描方式判定與註記

掃描前判斷與註記

前置作業

掃描作業

校驗作業

資料備份作業與註記

 
  後設資料與資料庫建置

後設資料

資料庫建置

 
成本分析 數位化設備 主要數位化掃描設備
主要數位化儲存媒體
 
  成本分析 數位化掃描設備成本分析
數位化儲存設備本分析
 
專題 委外製作

工作規劃(人員、技術、經費)

數位化流程

 

數位畫品質檢驗工作

數位檔案備份

實務經驗分享

 

  數位內容保護

浮水印

智財權

 
  數位化工作之挑戰

罕見字問題

影像檔案產出時效

人員流動率高

規範修正即時性

計畫管理執行

相關技術的掌握

數位化智財權議題

與資料安全問題

 
備註 參考文獻    
 

附錄

   

伍、參考文獻
1. 林妙樺,《檔案數位化實務之探討》,檔案管理基礎班第四期,2006年,4月29日。
2. 林威妏,《數位化委外規劃與實務》,原住民數位典藏人才培訓研習營,2006年8月10日。

舊書新裝,閱讀模式大躍進
古籍線裝書數位化工作流程指南
◎文/高芷彤

    人類的文明,不外乎是發展出能增進人類生活的各種方式。日前中英船務集團宣佈將推出網上學習平台,推出三種課程「立體動畫」、「影片」及「文字」等方式將一些海事意外個案在電腦中重現,令海員在模擬環境下分析這些意外及學習危機處理。當科技與人類生活越來越密不可分的同時,對於書籍閱讀而言,相對也有新發展。當面對例如藏書空間的銳減、書況因環境而日漸受損、人類對於知識需求的增進等因素,圖書館的重要任務之ㄧ,使善盡保存資料之責,但對於藏有古籍的機構而言,「提供使用」、「保護古籍」二者之間的抉擇,是他們所共同面對的難題。因此圖書館員以及專家學者開始思考將書籍數位化後的優勢,不但可減緩典藏空間的不足,和避免書籍一再被提借使用,除此之外,書籍不但能流通且能創新其應用範圍,以Google print計畫為例,書籍數位化,在台灣就閱讀到不同國家的書籍,數位化後的書頁結合電腦技術,製作成線上閱讀的電子書,讓古籍活出新生命。

    在印刷術尚未興盛的年代,想要成就一本書籍,只能以人工書寫的方式,一直到印刷技術發明後,才改善人工書寫的不便,同時由於雕版印刷的興起,印刷出版書籍數量大增。當然,知識無遠弗界,該如何才能將一張張的紙張裝訂完整?最初漢、唐人想到將紙張左右粘裹在圓軸上,最後再以絲帶捆繞。到了唐代佛教盛行,解決捲軸裝展開且不便閱讀的缺點,佛教徒將紙張按一定長寬折疊。宋代雕版印刷興起,為適應一版一頁的特點,方便閱讀與保存,宋代人想出將有字的紙面為中心相互對摺,再將紙疊凹折處的背面以漿糊粘連,最後在以厚紙包裹避免受損。但由於以漿糊粘連,時常會發生書頁脫落問題,對閱讀無疑是一大障礙,南宋後期人為克服蝴蝶裝的不足,改將書頁正折,其中雖仍以漿糊粘連,更以紙釘加強之。雖然此種方式便於閱讀,但畢竟是以紙釘裝定,若反覆翻閱還是容易散脫,在明清兩代時,改進以穿線的方式來解決閱讀以及翻閱的困擾,此種裝訂方式稱之為線裝,由於此種方式易於整理修復和保存,目前是各大圖書館中最常見的一種裝訂方式了。
   
    為保存逐漸脆化的古籍資料內涵,並提供其內涵於學術研究以及大眾使用,數位化是目前最通行的方式。但由於其所需經費高昂,因此大多數機構採用漸次進行之。綜觀台灣目前現況,自中央研究院1984年7月開始的「史籍自動化計畫」迄今「數位典藏國家型科技計劃」(2006年)已有22年歷史。參與的單位從中央研究院到故宮博物院、國家圖書館、歷史博物館、台灣省文獻處、文建會……等政府單位,大學院校也陸續投入1,資料庫所建置的內容相當多元化,除了古籍資料庫外,中央研究院傅斯年圖書館的敦煌文獻網站更與大英博物館「國際敦煌項目」(IDP,International Dunhuang Project)簽定合作協議書,在「國際敦煌項目」可閱覽到各國相關文獻。另外,在國家圖書館的「認識中國古書」網站更附上精美的圖片,精簡扼要的簡介古籍內涵以及外觀,如同互動式教學一般帶領讀者一同認識古書。最後,若想要再一窺清代宮中藏書面貌,在國內你可以選擇故宮博物院圖書文獻處所建置的網站。

    如此豐富的中國古籍,如要進行資源分享,除了數位化外,完整的資料庫建置不可或缺。在建立資料庫之前,究竟該如何規劃古籍線裝書數位化、線裝形式的書籍在數位化時會遇到哪些困難、數位化後格式要如何選擇、數位化需選用哪些設備來等,將是本書逐一探討的議題。最後,再從後設資料規劃建置談到資料庫內容所面臨的危機,如「浮水印」、「智財權」等議題。本書匯整國內數位典藏國家型科技計畫之善本古籍主題小組成果,及再影像規格規畫方面加入大陸地區在數位化的規格,提供讀者在做規畫時能有更適切的規劃。以下將規畫出六大章節來描述如何進行數位化和該選用哪些設備來數位化,之後採用專題式的方式針對古籍線裝書在數位化時會遭遇到困難點。

1 羅鳳珠‧元智大學中語系,《臺灣地區中國古籍數位化的現況與展望》,2001年6月,《書目季刊》,第35卷第1期。

有名無實的協作機制?—臺灣大百科全書計畫(Taipedia)

發表日期: 2008-01-18, 點閱數: 1 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

文/陳秀華

2001年,維基百科2(Wikipedia)正式營運以來,透過來自世界各地的群眾力量,網站資料量不斷穩定成長。有鑑於web 2.0時代知識開放與共享的趨勢,文建會也於2002年時,採用了維基百科的協作模式,規劃執行「台灣大百科」編纂計畫,期望透過這樣的網路平台,讓生活在台灣的每一份子,都能參與編輯屬於台灣本土的百科全書,預計以四年的時間,達到3~4萬個詞條,並於最後出版成冊。但是,很快的四年過去了,線上詞條總數僅約9,000筆,連預期的一半都不到,
不禁讓許多民眾質疑這個計畫存在的意義何在,為何「維基百科」是如此的成功,而同樣理念的「台灣大百科」卻是乏人問津。以下筆者針對「維基百科」與「台灣大百科」的運作方式作說明與比較。

平台運作 維基百科 臺灣大百科
帳號申請 只需填入帳號、密碼與e-mail即可申請。 目前僅提供中華民國國民申請,以身份證字號為帳號,尚須填入姓名、性別、生日、學歷、職業、聯絡信箱、通訊電話。其餘如專長、自述、居住地、郵遞區號、通訊住址、行動電話等則為選填欄位。
內容建置方式 所有詞條的新增、刪除、修改與編輯方式,皆由使用者決定與討論。 先由學者、專家規劃類別與詞目;民眾於網站登錄後,選擇有興趣的詞條,以該計畫既定的撰寫規則3加以編輯,提供相關圖片與影音資料。
詞條審核機制 大多數的內容仍維持由一般使用者進行修改與討論,較具爭議性的條目則授權一些資深網友進行管理與限制,而維基百科創始人Jimmy Wales則握有最後的把關權力。 參與會員一次最多僅能上傳20個詞條,且需經專家審核通過後,才能再上下一批20個詞條。
瀏覽編輯介面 除首頁的主題式瀏覽介面外,使用者多採關鍵字搜尋方式,尋找所需的詞條。 網頁瀏覽層次太繁雜,從首頁大分類清單進入,還需經過次分類清單、條目清單、才看到詞條說明。尚未審核通過之內容,還需點選該詞條下的「展示園區」才能瀏覽。

由上表可見,維基百科從招攬會員、內容建置與審核,到呈現方式,對使用者來說都是簡單易懂的,使用者也有權利操縱平台的運作;相反的,台灣大百科網站的架構規劃與運作,仍由平台開發者來控制,且以既定編輯模式限制使用者分享知識,如此也限制住整體資料增加的速度。
在多元社會文化的台灣,的確很需要一個有個管道,讓大眾更容易了解台灣,認同台灣這片土地,這也是「台灣大百科」的重要理念之一,但很可惜的,這計畫並未學到維基百科的精髓,就是沒有將使用者當作共同開發者來信任(Radical Trust5),在維基百科中,不管你是販夫走卒,或是學有專精的學者,都是平等的,這也是「台灣大百科」計畫應該加強的地方。

1 http://taipedia.cca.gov.tw/
2 http://www.wikipeida.com
3 詞條撰寫規則。http://taipedia.cca.gov.tw/Html/howedit.aspx
4 http://zh.wikipedia.org/wiki/Wikipedia
5 日語稱為「進步的性善說」。小川浩等,Web 2.0 Book,2006.6,株式インプレスジャパン

淺談Discover Life在教育上的目標

發表日期: 2008-01-18, 點閱數: 2,364 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

內容發展分項計畫/梁美珍

 

  DL計畫欲在2012年達成結集百萬筆生物資訊的資料庫,其中技術上與品質上也有缺點存在,但目標遠大且明確,在John幾年來的推動下,得到廣泛的迴響,很多技術上的問題有待克服。站在研究的立場上,DL在教育方面也不遺餘力作出貢獻。

   DL開宗明義已說明希望每一個人多涉獵他們生活自然環境中的科普知識,故在最基本的教育方面著手,提升每一個人對自然科學的研究。與科學家們、資源管理者、教育專家一起共事,甚至獲得自願捐助者、商人及地方團體的支持;DL團隊正在改善教學技術與資源,培訓師資及制定課程方案及研究協議,以便學校老師及學生得以善用同時亦可從事科學研究。此一教育上的目標明確訂定:

* 透過學習上的實驗與實作,對科學與技術能產生高度的興趣。

* 有創意的思考、提出創新的問題、獨立地發現與提交對生活新發現的文件。

* 學習研究:執行及與良師益友互動。

* 嘗試挑戰:如何去構思實驗、蒐集資料、分析後獲得結論。

* 當他們經歷剛開始一次的失敗後,使他們產生好奇心,激發他們持續努力與嘗試新的方法去達到目標。

* 利用最新的軟體與設備去掌握蒐集、處理過程、提交數據等資訊時代的技術。

* 從圖書館或其他原始資料去檢索、分析與綜合資訊,更甚於僅僅背誦事實而已。

* 可對他們所居住社區特別的物種,提供科學研究上原始的、高質量的數據供他們學習。

* 最後,輪到他們分享他們所學,去幫助其他同學,表達他們不同的意見,進而修正及達成計畫推行的目標。

So who is Richard Wright?

發表日期: 2008-01-18, 點閱數: 3,252 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

內容發展分項計畫 / 李佩瑛

 

Richard Wright(以下簡稱RW)目前任職 BBC Information & Archives部門技術經理(1994~),1949年生於美國並於1974年移居英國倫敦,於美國完成大學與研究所教育,並負笈應英國取得博士學位(詳年表一)。RW主修領域為聲學(acoustics)、語音(speech)、訊號處理(signal processing),並於此方面有豐富的實戰經驗。

RW2002年的PRESTO多媒體資料庫工作坊中提出 “Preservation Factory”的概念,促成Presto Project能夠更有效運行。 Preservation Factory能夠更事半功倍,並節省將近50%的成本,基本元素包括: (1)對於整體典藏品有系統的認知。 (2)工作流程自動化。 (3)分類使自動化更有效進行。 這種技術的革新,不僅為影音典藏工作者帶來便利,由於成本較低,相對普及率也加以提升。

相關重要計畫:
PRESTO: 此計畫之動機是以Preservation Factory的方式,建立一高品質與高效率的影音資料庫。
Presto-space: 將影音資料庫的技術轉換為可負擔並普及於影音典藏擁有者,而非限於大型廣電業者。

圖一: The BBC Archive Treasure Hunt

  (more…)

國立歷史博物館委外數位化作業專訪

發表日期: 2008-01-18, 點閱數: 1 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

受訪者:國立歷史博物館廖康任先生
採訪:內容發展分項計畫助理 陳秀華、程婉如

  由於數位化技術與方式的快速發展,使得大多數單位未有人力、經費與時間追隨新科技的變化,而更新設備或改變工作方式,也因此適度的將部分數位化工作,委託外界專門從事該領域工作的廠商執行,便越顯重要,這不但可以減少成本的花費,也可提升數位化之品質與工作成效,以及增加產業界的活絡。
目前在數位典藏國家型科技計畫裡,大多數計畫仍採行自製數位內容的方式,或許也是因為計畫初期,各單位仍在摸索適合身的工作方式與技術,加上數位內容產業也正在起步
  在這樣一個無法自給自足的高度分工、專業化的時代裡,委外,的確是一種可以思考的工作方式,但如何選擇適當的供應商(Right Vendor)、適當的品質(Right Quality)、適當的時間(Right Time)、適當的價格(Right Price)與適當的數量(Right Quantity)1,以滿足消費或生產的需求呢?這次,本計畫採訪到國立歷史博物館國家歷史文物數位典藏計畫,負責該計畫之專案管理與技術發展負責人廖康任先生,與各位分享數位典藏計畫委外作業的方法及經驗,期望能為欲從事數位化委外工作之單位,一個參考範本。

問:計畫初始便採行數位攝影及委外掃描並行的方式進行數位化工作,是怎樣的因素而不將所有藏品重新以數位攝影方式作數位化呢?
就我們館方的文物管理政策來說,所有藏品,包括新進藏品,皆會委託專業攝影師拍攝傳統正片。在數位化計畫這一部分,則是先挑選館內已有之正片,若正片品質好的就進行委外掃描;品質不好的,才會另外提件,請計畫下所聘請的攝影人員,以數位相機進行拍攝。因為數位攝影的方式需要考量到場地、環境布置、燈光調整等步驟,會耗費大量的工作時間,加上計畫內人員並不多,所以並無考量將所有藏品重新以數位攝影的方式進行數位化。

問:決定委外之後,如何進行委外作業規格書的訂定?
我們計畫團隊在制訂規格書前,會多方的探聽與學習,以避免開出過於具獨佔性或無法達成的規範為原則,過濾坊間廠商所能達到之規格與所用技術,了解業界市場狀況,同時也參考了行政院文建會、台中國家美術館、台北美術館的委外數位化標準等相關文件內容。

問:在委外作業中,計畫內的同仁是否有需要全盤了解委外作業的方式?是否會影響計畫同仁學習數位化相關知識的機會?
因政府機關有一定的招標流程,所以本計畫先徵求計畫同仁意見,擬定委外作業規格書後,便交由館方採購人員進行公開招標作業的行政程序,因此需求單位與採購單位的作業是獨立分開。計畫內同仁雖不用全盤了解委外作業的方式,但平時亦邀請得標廠商至館內開辦課程,教導同仁掃描數位化作業,並進行技術交流。而數位攝影的部分,計畫本身便有進行,亦可隨時進行切磋討論,整體來說並不影響同仁在數位化作業的學習機會。

問:在招標過程中,是否有量化的評選標準來選擇適當的廠商,或者有其他的評選方式呢?
有的,基本上評選作業規範與標準有制式的格式,但仍需因每個案子的實際狀況,調整其細節的部分,一切依照政府採購規範公開進行,由多個評選委員對各家廠商評定分數。其中除非某數位化作業的專業性與特殊性,僅有一家廠商能完成工作,才可採行限制性招標,否則會被質疑有圖利廠商之嫌。委外招標當然會具有一定的風險,因此在招標審核前,需要求廠商將試掃正片交由委員作評估。

問:在委外作業中,計畫內人員與委外廠商之間是如何的工作配置各為何?
我們除掃描外,資訊系統的部分也是採委外作業。在委外掃描部分,計畫有四位助理作為計畫對廠商的窗口,負責正片的簽收與核對等工作;而資訊系統的部分,則有一為助理專責與廠商聯繫的行政作業與系統測試的工作。而廠商內部的工作安排,我們這邊就不清楚了。

問:廠商能完全遵循規格書的內容,無誤作業嗎?常會發生的錯誤是哪些呢?影像品質是如何控管?
原則上,委外廠商有義務遵循規格書內容進行作業,甚至必須做得比合約所規定的更好,若低於規格書的標準,則無法進行驗收,每張圖檔都帶有ICC Profile,以達到影像品質趨於一致。廠商也需對於合約書內容保密,驗收完畢後,隨即銷毀廠商所存的檔案,倘若正片遺失、損毀,廠商也要負起重拍的責任。目前為此,本計畫尚未遇到言行不一的不肖廠商,雙方依照合約書、規格書的內容進行作業,驗收的錯誤率也必須合乎標準的容許範圍內。
我們與廠商合作的過程中,掃描作業部分,幾乎不會出現圖檔掃描品質不好的問題,通常較常出現檔名輸入錯誤,因為廠商是以光碟片繳交數位檔案,便會要求廠商在更正錯誤後重燒。資訊系統的部分,比較會有呈現出來的功能不符合需求的問題,這些都需要請廠商做更改。雖然說資訊系統有保固一年,但這些測試的部分,最好是在驗收前就檢查完畢,避免廠商開始進行其他案子,而無較多時間負責系統的修改。

問:若計畫須告停止,數位化工作之成果及運作如何延續?
本館藏品是依照計畫所規劃的順位陸續進行數位化工作,若未來數位典藏計畫不再持續,數位化作業則將回歸館內持續進行,資訊技術的部分亦是如此。

問:對於委外作業有沒有什麼一定要提醒欲從事相關數位化工作者的忠告?
委外作業必須事前須蒐集坊間廠商資料,也不要單獨與某家特定廠商進行討論或溝通,須蒐集其他單位委外資料或市場技術規範後,才能進一步訂定符合館內要求之規範,招標作業完成後,必須隨時與得標廠商保持聯繫、定期驗收等。

結語:
在有限的人力或經費下,的確有時很難將所有數位化工作,全數由自己單位負責進行。在委託專業廠商進行部分數位化作業前,需針對未來成果產出訂定「委外作業規格書」,將需要的檔案規格、品質檢驗方式等等,詳細規劃,以作為自身單位與廠商間的作業依據。依照政府採購法規進行公開徵標,評選出能合乎要求的廠商後,隨時與得標廠商維持聯繫,彼此尊重,對於成品驗收也需依循規格書中的標準進行,以確保數位化後的圖檔之品質。

1 王忠宗,《採購》,台北:城邦文化事業股份有限公司,1998。

 

印記數位化工作專訪

發表日期: 2008-01-18, 點閱數: 1 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

中研院史語所傅斯年圖書館(初稿)

內容發展分項計畫/高芷彤
前言
  目前指南是規劃由秀華與芷彤共同撰寫,在計劃管理(工作規劃)、後設資料與資校庫建置兩部份是採合寫,另外,擬章節分別撰寫則分別為:以物件區分,秀華負責印章而芷彤負責印記;以數位化方式區分,秀華負責攝影芷彤負責掃描部分;而設備與成本分析雖分別擬定,但最後以整體觀點呈現。其次,在委外製作,則視各機構單位的不同分別屬實報導,包含決策、如何規劃進行、以及撰寫規格書等。

欄位已9.0為主。

紀錄:
故宮印章的狀況:
鼎本身有文字,因此METADATA的建置釋放在同一性質的藏品中。可能在類別中在區分,但沒有看到代碼錶也無法了解該如何整合印章印記。

印記本身的疑問:
為何要抽出印記來做
在善本古籍中描述也可以啊,因為METADATA建置時,可避免重複的資訊,也就是說資料庫中包容萬象,但卻無法做深度描述,以東巴京為例,瞄文怡雯等不同語文,當需要做不同主題特殊需求時,想要針對不同對象時則較無法區分。

一、考証源流
因原始藏品,當此印記為真時,項元變在善本書與書畫有其印記,表示其書或書畫是向元變所收藏的,以及藏品價值在宋代就存在了,此為其印記的價值所在。並且在印記的數量中,也可以了解其書或化的流動狀態,是動態的資訊。另外,其加值作用,因為有篆刻,也有書法之美的意涵在裡面。

假使今天印記是假的,真偽該如何認定。
若向原辯原始印章是我所收藏,則我就可以知道此印記之真假。以傅圖為例,當初只以史料收藏為主,非博物館因此並沒有收藏印章,因此紀錄印記後,真偽委請學者專家鑑定,因此紀錄印記希望留下線索提供給學者專家去鑑定。

印記的層次較善本(例子目一二三等)分類來的簡單,因此METADATA的建置較善本早,當初與故宮合作也是有此考量大家可以減少重覆並且能相互比對使的資料庫更完善。

沒有引章印記的何來真偽,引章資料庫沒有建置,印記資料庫之建置有何意義。由於各館的考量不同,因此在館際合作上有其難處。以每計畫或單位較為具有特色的會先做,例如故宮會先執行器物,但並非印記資料庫建置沒有意義,而是平行分別建置,並無期偏重之問題。而站在傅圖的立場上,印記資料庫的建置是希望能輔助善本古籍考證。

在印章現藏(p5)的欄位中,未來建議可以網址連結到原印章典藏處,此是當初在建置metadata有考量到整合資料庫的欄位。

在史博館的metadata建置欄位可看出,是就現有典藏為考量,未來若有新增物件,那原始的資料庫勢必會有變動的成本增加。在傅圖的印記資料庫中,系統設計應以使用者使用為主,當從善本古籍進入查出,考看到印文,印記就可連到印記資料庫,人名就會連到人名權威檔中,因此任何角度皆可查到相同的資料(資料庫的緊密度/關係),但此印記、人名以及善本皆為儲存在不同的資料庫中。

系統重新修改的例子,若新計畫要做印記,但就目前史博館目前的印章metadata欄位尚看不出印記可連結處,因此需要新增欄位連到印記,且程式設計師修改則會改到系統結構,並新增連結,會增加成本。因此建議在metadata的建置時要有完好的規劃,例如五年計畫,91年開始就先構想五年的資料庫建置,有多少東西要做,不以單一藏品為考量,可避免系統一再的修改。以metadata到系統節到考論規格書、建置、轉檔花了三年的時間,雖耗時久,但建置到目前為止,此資料庫仍能維持在91年的模組,而不需要在每一年因新計畫而將資料庫有所更動。

陳鴻森主任站在研究者立場而言,覺得用印記資料庫以及人名權威檔建置,由於有版本真偽的冒險性,但在館員立場,是希望能建置後提供線索給學者。例如前印處是讓使用者了解其印記典藏處,且能避免重複性,例如所裡的章接會出現在所收近來的書中,因此重複出現機率高,以拓片在執行數位化時就有此問題,出現許多相同重複的圖檔在資料庫中,相同印章所蓋出來的印記未何要儲存如此多的印記,目的是要知道此時本書所蓋的章是同一個,因此建議可取較為好的印記來作為代表,並未留下考證資料,留下可連結到十本書所鈐印處,資料庫除建累積,其資料的可信度也逐漸上升,書籍或印記的考證脈絡也因累積資料而清晰。(提供研究基礎,不一定完全正確但有經過比對的資料線索-蛛絲馬跡)

以傅圖陳主任出國前,為搜尋資料才能找到所要找的資料,為何不使用電腦,由於資料庫尚未建置完全。以研究人員為利,提供給使用者資料庫的特色:系統好查好用-要有單一入口(依屬性需求不同有不同的入口頁面)-資料庫分別儲存但metadata可相互連結。

一、 物件選擇
問:當初以印記為數位化物件的考量因素為何?有沒有特殊考量或注意事項?

答:因為可以考証源流,篆刻之美

二、 計畫管理
問:印記數位化判別工作是如何進行?如何挑選數位化物件?是否有遇到困難?

答:因為要把每頁影像看過才知道有沒有印記,例如傅圖的做法則是將先前91年產出影像在excel中記錄下來,因此過程是相當的繁瑣。並且印記的作法是先將書籍掃描完成後,提取印記在來做資料庫的建置。就學者而言,書籍應是所典藏的重點,印記是其書籍的加分作用,因此並不可能先做印記,且判讀也是一個問題(篆刻家年歷、印記是否相同、尺寸),因此事先作藏品完後再去看哪處有印記,因需要地毯式搜索。但畫則較書容易,因書籍不能夠準確猜測印記在哪一頁出現。但仍有例外,例如有些學者有些癖好會在某特定頁數蓋上印記,例如每午頁蓋印記,因此在資料庫建置時,會要求把頁數一同建置處,這個線索是很特殊的,建議未來要做數位化的機構可以注意。

問:印記數位化之主要流程為何?
答:如上

問:貴館在執行印記數位化過程中是否有委外製作的部份?
答:沒有,因為沒有效率。沒有好壞分別純粹是能不能判別。
有委外開發取圖系統,目的是節省取圖的時間。之前有做過實驗,將三個出處取出較為好的印記,但若此三個印記接蓋在字上或者是只找到一個印記,那光修圖並補上朱宏,一天下來只能完成一至兩個印記,若依天八百玩,一刻印記則為四百玩。因此能否批次節省時間,才委外請廠商言發此系統。
系統可節省取圖時間,但仍需要人工加上朱紅,但至省能提升一半的效能。
系統是「印記取圖模組」
並沒有花太多成本,算是一個類似於影像處理系統
且向小畫家一般,可攀別此印記原先的朱紅顏色,因此還可看出有些印記的朱紅色分布是不平均的,因此此系統會建議使用哪一種朱紅色來補足此印記。

問:印記的的影像解析度及色彩模式與書籍數位化要求有不同嗎?
答:一個相同印記蓋在拓片以及書籍上,取圖的解析度就會不同。因拓片過大,因此印記就顯的很小,取印記的解析度就不同,若想要在資料庫中放大查看,則會解析度會放大模糊。
在數位化時需要看元藏品的尺寸,因此在拓片中有插入印記另拍的流程。因拓片過大但希望輸出是相同尺寸,且有接圖問題。當初就資料庫能查看作為考量,較大的藏品流程為:先拍1:1尺吋供網站上瀏覽、拍重複的供往後可接圖使用、單拍印記。若在此之前以往上未遵循此流程則將拿回重新拍攝。

問:印記在數位化時,有些單位使用拍攝,而傅圖使用的是掃描,請問在設備選擇的決策因素為何?
答:印記取用哪種數位化方式則就現有典藏品數位化而有區別。旦印章就只能使用拍攝而無法使用掃描。書畫可只掃一小塊,但建議依循主流成的不同而插入「印記另拍」需求。

三、 數位化流程
問: 在掃描印記的同時,遇到尺寸不一的印記是如何進行數位化?
答:是人工裁大小嗎?此系統可點在對角線即可取此印記,可自動取圖並且能解須此朱紅,後再去背。

問:印記在校驗時,有針對哪些部分,例如摺痕、汙漬等項目?
答:有一加工過的代表性影像。但仍會呈現原鈐印處的可供考證的原印記。

問:是否可簡述一方印記從實體到虛擬的流程,包含路徑、人力、設備?
答:如上。

四、 後設資料建置
問:在後設資料規劃與資料庫建置時,由於印記與善本、書畫、器物、金石拓片主題相關,當初在擬定欄位時,有何考量?
答:鈐印處,大家鈐同一個印記只需在鈐印處注入即可避免重複建置的問題(可避免重複、可相互連結、著入)。當初在建置此資料庫就區別印章與印記是不同的資料庫,因此是相輔相成並無誰主誰副的關係存在。例如族譜,有脈絡但個體仍有其存在性的必要,其印記的存在是對於此藏品的加分作用。

問:對於整合印記相關主題,並建置整合性資料庫之構想有何建議?
答:如上

問:目前印記資料庫是與資訊所一同開發,可否針對一旦委外停辦、資訊人員撤離,資訊系統將很難善後議題,分享您的經驗與建議?
答:這與系統規劃的好壞有關,例如生產線的建置,其重點在後續的加值才會改變,否則只有開發成本。除非有新需求產生則會有需要到原系統開發人員,否則不會更動元系統。
系統務必要備分,因此目前印記資料庫沒有太大的問題。
但若系統都是委外,將擔心廠商是否會倒,因此數典系統都是委外請數典系統開發,其有責任且若資訊所不維護,計中不維護那勢必傅圖需有人可以承接。

公開徵選委外請廠商該如何善後?
因此當初財會建議需要建置優良廠商名冊。例如掃校系統建置後,台史所等單位皆有購買,其可以省重覆開發的成本,且與廠商在商談價格時也較容易。另外若站在廠商的立場,當有十個機構均有負維護的費用,廠商會惡性倒閉的可能性較低。因此良性的互動是很重要的。例如當初未何要等資訊所開發依年至兩年的時間,而非委外請廠商能快速的開發。廠商會一不同單位而有不同價格導致多數成本的重覆浪費,當此系統有其效益可共享的價值時,也是當初委請資訊中心開發的原因。當初委外掃校系統時三個月就要完成,由於很急且資訊中心也無法在短暫的時間完成,因此才考慮委外。委外建議要有評選機制,避免典藏品二次傷害,建議可在合約擬定時納入:收到問題要多久回覆、回覆時要怎樣、處理時要如何、如果沒有達到約定要有哪些罰則,當然這些都與要花多少委外成本有關。建議每一個機構單位都要有資訊人員,避免維護人員還在維護的同時,計畫已經結束或人員已經離職的問題。因此常態性機構較少此類問題產生。例如某一位法施的紀念館要建置資料庫,當初是為了要宣揚法師的理念,會有許多加值品例如光碟網頁等,其目的在弘法,因此當目的不同時,系統的需求以及數位化的需求也相對不同,網站的建置較為簡單。當初藏品數量固定,其也無需建立系統,若只有五百件藏品,也建議可委外執行。在數位化中要強調共通性時,數位化的流程可制定,但仍需要考慮其藏品的數量以及計畫本身的規劃來擬定期該館的數位化流程。以國家檔案局而言,國家檔案法制定後,由於檔案包含許多典藏品,早期基層人員認定檔案就是公文時,公文要變為檔案時並非全數移轉,需要判別其價值性,例如中秋節請所有公務人員不苦收受廠商賄賂,每一人都有,此藏品有其收藏價值嗎?就算公文本身會是史料,建議是原發文單位做典藏,而發文單位只需要作一次典藏,而非每一收文單位重複典藏。
在執行典藏時,需要有文件鑑定,尤其是人事資料有其永久保存的價值,因此在典藏之前需要有判別工作,鑑定其價值性。又或是例如戶籍資料之公文搬遷、小孩子出生資料珍貴性在哪?之其在38年以前,其價值性可代表人口移動,永和地區是往何處搬移,遷徙活動呼之欲出,因此派別工作委請專家有其必要性。
鑑定原則:
一、 完整性
戶籍資料是戶政單位的命脈,其是完整的。
二、 時間性
是在哪個時間點的戶籍資料,此就為判別的重要依據。
可就最完整的先數位化,或最早期的數位化。但建議當要讓廠商測試或自己剛開始執行數位化時,建議先就目前較為近期公文來測試與實驗,之後才開始執行較有歷史價值的典藏品來做。

典藏品毀損是不可逆的,是並非金錢能衡量的。

五、 設備與成本
問:印記數位化與善本古籍數位化在設備上有何不同?

答:依循主流成來變動

六、 委外製作
問:請廠商協助開發影像裁切系統「印記取圖模組」時,是如何撰寫規格書?有哪些是需要特別注意?
答:當初沒有撰寫規格書,小畫家等影像系統。
此系統是委請掃校系統的同一個廠商開發,有其信心。建議委外廠商可考量:
一、 在評選時設計概念與其貴館的吻合度
二、 以往成品是否有技術門檻
三、 是否便於商談價格
四、 互動良好的廠商

問:決定此部分委外的因素為何?
答:同上

七、 內容保護
問:關於印記的內容保護方面,目前有進行哪些機制?
答:較於開放,目前只有圖檔沒有開放。只有權限控管,而沒有作浮水印的建置。權限是由該不同管所管制,因此當你有印記資料庫的權限,不太表你有人名權威檔的權限。
當初沒有考慮浮水印是因為主要想要呈現好的印記。
目前只要浮水印是可視的,分為破壞性與可逆的。破壞性即使消除浮水印,則此印記或圖檔將無價值存在。旦目前技術尚無法遏制偷圖的技術。
目前以敦煌文獻資料庫中,當初由於要讓國外學者能在資料庫中查詢,因此應變方式為置入「透明的浮水印」而非現成的浮水印機制,且至於正中央,是破壞性的但卻又不傷害此圖檔。但目前只限於書籍圖檔,書畫由於圖檔過大仍需要在測試。傅圖善本除書影外,都有加透明浮水印。
另外若書況不佳,但批次下來透明浮水印是一致的,因此有時書況不佳時浮水印需要更透明避免破壞到原圖像。建議在批次加浮水印前要先評估此套書的書況後,才加浮水印。

八、 其他
問:印記數位化工作有哪些待挑戰的議題?
答:專家學者的考證,技術性的都可以克服,但仍需要有專業的人員加入來判讀真偽。

問:對於未來其他單位欲進行印記數位化工作,有何建言?
答:計畫在進行數位化時,要考量本身藏品的數量以及價值,例如紙張式的印記在每本都可見,必要性需要在可量。當初建置印記是想要輔助善本考證版本,提供動態性的脈絡可供鑑定。建議全面性評估其典藏品有加分、有價值、有效益、目的及數量後,在進行數位化工作。
若故宮典藏印章對於傅圖的印記資料庫是否有幫助,由於故宮典藏室供中藏品,傅圖則是私家典藏,若是當初供中有搜羅民間藏品,如次資料庫的串聯有其價值性。

創用CC-Creative Commons Taiwan簡介及網站建議

發表日期: 2008-01-18, 點閱數: 5,255 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

內容發展分項計畫/  李姿穎0609

一、什麼是創用CC?

 

  在數位資訊如此流通發達的時代,人們藉由網際網路獲取大量的資訊,包含文字、圖片、音樂、影像等,都能藉由四通八達的網路系統,流通至全世界各個角落。但是,網路上有如此多的資源與素材,因為資訊的公開化,使用者可任意的複製、轉載、修改原有的創作作品。而大部分在網路上流通的種種資訊,皆未註明來源處,或可合理使用的範圍。此種任意複製、轉載、修改等現象,除了造成創作者本身的權益受損,而另一方面使用者,更可能因無清楚的授權標示,而造成侵權的行為。

Creative Commons組織於2001年成立,提出保留部分權利「Some Rights Reserved」的相對思考與作法。並提供六種不同的公共授權條款,創作者可挑選最適合的授權條款,透過簡易標示,就可將作品方便地釋出給大眾使用。而
中央研究院資訊科學研究所,因進行自由軟體相關的計畫,而接觸到 Creative Commons ,並在 2003 年 11 月成為 Creative Commons 在台灣的(Creative Commons Taiwan)的合作機構,進行 Creative Commons 授權條款華語(台灣)翻譯及公開討論,並與其他機構及創作者合作推廣 Creative Commons,希望能藉此參與 Creative Commons 所推動的建立全球性公共資源庫的工作。

 


二、創用CC的四個授權要素及六個條款

 

     Creative Commons組織,想要找出簡單的方法,讓願意分享作品的創作者,可以在特定的條件下,將作品開放給全世界的使用者使用,且自己又保留部分權利。分別利用「姓名標示」(Attribution)、「禁止改作」(No Derivative Works)、「非商業性」(Non-Commercial)與「相同方式分享」(Share Alike)四個授權要素。四個授權要素,搭配出六種不同的授權條款。
    
(一)「姓名標示」(Attribution)
您允許他人對您受著作權保護的著作及衍生著作,進行重製、散布、展示及演出等利用行為。但前提是對方必須保留您的姓名標示。
(二)「禁止改作」(No Derivative Works)
您允許他人對您的著作原封不動的進行重製、散布、展示及演出等利用行為,但不得產出衍生著作。
(三)「非商業性」(Non-Commercial)
您允許他人對您的著作原封不動的進行重製、散布、展示及演出等利用行為,但僅限於非商業性行為。
(四)「相同方式分享」(Share Alike)
只有當他人將衍生著作採用與您的原著作相同之授權條款時,您方允許他人散布衍生著作。
(more…)