文章分類 ‘觀察室歷史文章’

語言主題小組之【台灣手語研究計畫】簡介

星期二, 五月 27th, 2008

容發展分項計畫/佳旻

前言:

數位典藏國家型科技計畫內容發展分項計畫於民國94年新成立之語言主題小組,其中參與單位為中央研究院語言學研究所語言典藏計畫、國科會專題研究計畫-台灣兒童語料庫及國科會專題研究計畫-台灣手語研究計畫。

…詳全文

國立歷史博物館大型器物數位化工作紀要

星期二, 五月 27th, 2008

內容發展分項計畫/高鈺茹

 

一、物件選取:朱紅緞緙絲金龍袍-清代(圖一)

 

圖一 朱紅緞緙絲金龍袍

 

二、工作環境與器材配置

 

  1. 拍攝場地

 

  平常史博館的小型器物數位化工作都是直接在庫房進行拍攝,但若是大型器物,則必須利用博物館休館時間(星期一)將文物提借至二樓展場進行拍攝。

 

  

 

圖二 史博館二樓展場

 

  備註1:拍攝過程必須在全黑環境下僅以燈具打光進行,如此可避免因外在光線因素所導致影像色彩失真的情況。另外,自然光線會損害器物的顏色;而光線中的紫外線與紅外線會造成物品脆弱變質,因而應避免器物受到陽光直射(一般拍攝若無專業暗房,可在預備進行拍攝的場地裝置遮光布以阻擋外在光線)。

 

  備註2:關於室內溫度與空氣濕度的調節,以20-24度室溫以及15~18℃濕度和50~65%的相對濕度最適合器物的保護環境。

 

  2. 佈景

 

  器物拍攝的佈景,以黑、灰、白為主。

 

  3. 設備 / 2001年採買,總價約12萬

 

  (1) 相機:機身為120中型相機中最高等級Hasselbland 555 ELD。

 

  (2) 鏡頭:蔡司 Hasselbland CFE 80mm及CFI 120mm。

 

  (3) 光圈:最大分別為F2.8~F22,F4~F32並可搭配makro 1比1 近攝。

 

  (4) 機背:為Kodak Professional DCS Pro back plus 1600萬像素。

 

  【該數位機背隨機搭配三套影像校色軟體:Photo Desk、Camera manerger及Capture Studio,其能在不同光源下產生個別專屬之色彩描述檔(Icc profile)。購買數位機背時會附贈一組序號,透過該序號在網路上登錄才能取得專屬軟體,因而市面上並買不到。目前史博館在校色上是採用專業使用的Capture Studio軟體。】

 

  (5) 燈具:使用BALCAR閃光燈,搭配BALCAR NEXUS 電筒,光量可保持恆定色溫正負50°,並使用BALCAR冷光燈,色溫5500度(接近於一般晴天9:00到16:00的自然光)。

 

  *備註1:關於燈具的選擇,市面上一般傳統攝影燈具器材如:鎢絲燈、石英燈等連續光源攝影燈具,雖可有效控制照明,但照射時所產生的光源熱度過高,會對文物造成傷害,而且照射之亮度、色溫會隨著使用期間增長而有衰弱不定的現象。而採用冷光,則可維持5000-6000度標準色溫(穩定的光源),光線也較為柔和,成本過高則是使用該燈源唯一的缺點。

 

三、文物提借

 

  按照國立歷史博物館之文物持拿規定

 

四、文物拍攝

 

  1. 以水平儀測量相機水平【該水平儀在專業相機店有販售,但價錢較貴。目前B&Q 特力屋有自行研發之水平儀(如圖三所示),有各種不同的種類,十字型為基本型,每個售價39元】

 

  

 

圖三 水平儀

 

  2. 校色:先拍攝一張文物進行電腦校色。

 

  3. 正式拍攝:一般文物僅拍攝一張數位照片,若有特殊紋飾,則進行細部紋飾加拍。

 

  *備註1:為避免拍攝燈源的散射光射入鏡頭,影響成像色彩品質,可在鏡頭前端加上遮光照(如圖四所示)。遮光照的價位從五百到五千不等,但功能性並沒有太大的差異,因而在購買時可多家比較考量。

 

  

 

圖四 遮光照

 

五、儲存檔案:按照史博館檔案命名原則。另外,檔案格式目前以TIFF、JPEG以及MPEG 三種規格為主。

OCR主要廠商介紹

星期二, 五月 27th, 2008

內容發展分項計畫/程婉如

  目前OCR的研究與技術開發,在台灣有力新國際、蒙恬科技、全景軟體,在大陸則以清華文通和北京漢王最著名。以下介紹上述OCR主要廠商之技術與產品現況。

1.力新國際

  原本為力捷電腦(UMAX)的軟體部門,負責開發掃描器驅動程式與搭售軟體,後來於1987年獨立成為「力新國際」公司。目前產品以影像處理(非常好色)、光學文字辨識(丹青)軟體與名片辨識系統為主。其中丹青文件辨識系統技術移轉自工業技術研究院電腦與通訊研究所,是國內最早技術達至成熟的產品,功能包括處理黑白、彩色文件、文件版面分析、表格抽取、印刷多種字體中英數字夾雜的辨識。力新國際也積極以專案方式與各機構單位合作,例如國防部電訊發展室「傳真文件的辨識與分類」、中華電子佛典協會(Chinese Buddhist Electronic Text Association,簡稱CBETA)與日本「大藏出版株式會社」簽約進行的《大正新脩大藏經》數位化,均與該公司合作。其中,力新國際研發部更專為CBETA輸入作業需求而設計,進而發展出「丹青for CBETA版」的OCR辨識軟體。

2.蒙恬科技

  蒙恬科技為獨資企業,成立於1991年,由蔡義泰博士創辦,以手寫輸入系統切入市場,為當時手寫辨識(Handwritten Recognition)技術最先進的中文手寫輸入系統。1994年自工研院電通所前瞻資訊技術中心(Advanced Technology Center,簡稱ATC)移轉OCR辨識核心,並與中央大學資訊工程學系合作,開發OCR相關技術,於1996年推出「認識王」可辨認手寫稿之OCR軟體。並自1997年開始研發語音辨識技術,經由IBM的ViaVoice語音辨識核心的授權,於1998年首推「聽寫王」彙集語音與手寫辨識系統。其它OCR的應用技術則有整合掃描、辨識、翻譯三種介面的「掃譯筆」以及名片辨識與編輯的「名片王」。

3.全景軟體

  全景軟體公司於1998年正式成立,創始人為前國立交通大學校長、交通部長郭南宏博士,公司在創立初期藉由產學合作計畫自交通大學引進了OCR、文件影像分析、彩色影像處理、影像壓縮、音訊處理、檔案加解密等資訊關鍵技術,進行技術商業化及個人用套裝軟體開發,目的在於將實驗室內可商品化的實驗結果帶出,持續研發成為商品。目前的產品領域包括與OCR相關的名片辨識系統、影像剪輯、網路安全、與虛擬實境四類。而藉由企業化經營的過程,公司目前已成功發展出國內產學合作的良好典範。但其OCR部分為專案方式進行整合,並未在市場上發行OCR軟體。

4.清華文通

  北京文通資訊技術有限公司(原北京清華紫光文通資訊技術有限公司)成立於1992年,是在中國科技部(原中國國家科委)與清華大學電子工程系的支援下,為推廣應用國家「863高科技計畫」資訊領域多字體印刷漢字自動識別技術研究成果而形成之企業。TH-OCR是清華大學自1985年即開始研發,TH則是TsingHua(清華)之縮寫,文通資訊以工程院院士吳佑壽為首,在丁曉青教授領導下,長期致力於清華TH-OCR的研究與開發,目前能自動識別多體漢字、漢英混排文字、印刷及手寫體,其產品在大陸市場佔有率達65%以上,其中日、韓文與英文混排文字檔的識別水準甚至超過日本及韓國對其本國文字的識別水準,而亞洲文字(中文簡體、中文繁體、日文、韓文)識別技術也因此獲得微軟高度認可,並在Microsoft Office 2003中全面配裝。

5.北京漢王

  北京漢王科技有限公司成立於1993年,以「中國國家文字識別工程中心」科技研究為基礎,在中國「七五計畫」、「八五計畫」、「九五計畫」、「863高科技計畫」、國家自然科學基金等重點專案支持下,專注於手寫、語音、OCR、生物特徵等識別技術的研究和推廣,相繼推出了語音命令合成技術、OCR掃瞄輸入、名片識別管理系統、指紋識別、身份證識別、車牌號碼識別、銀行票據防偽識別認證等系列產品。

制訂後設資料的三種方案

星期二, 五月 27th, 2008

內容發展分項計畫/江仁傑 2005.08.29

  制訂後設資料,是為了記下某一筆數位化資料的特性。例如我用數位相機拍攝的照片,可以有照片名稱、主題、拍攝者姓名、時間、地點、描述…等等簡單欄位,而這些欄位資訊,就是這張照片的後設資料。

  依照資料庫建置的目的,針對的對象…等不同的考量,資料庫的後設資料,可以制定得很簡單,只註記簡單事項,也可以針對學術、研究用途,制訂出上百個欄位來描述一筆資料。

  國內學界或國際上,針對不同學門,都發展出很多種後設資料的標準,例如,生物界有一種國際間曾被採用的後設資料標準,稱為達爾文核心集(Darwin Core),用來描述某一個生物的數位化物件資料;而檔案學界,有一種國際間使用的後設資料標準,稱為Encoded Archival Description (EAD),用來描述一筆檔案資料。「數位典藏國家型科技計畫-後設資料工作組」,有提供許多不同學門的後設資料標準,讓參與計畫的單位參考,該工作組也接受委託,直接協助各單位制訂後設資料。

  目前參與「數位典藏國家型科技計畫–內容發展分項計畫」的單位,在制訂後設資料時,通常是在以下三種方案中,擇一進行:

一、採用某種國際間流行的後設資料標準。

二、依據自己單位的需求,自行制訂。

三、折衷方案:依照自己單位的需要,參考某種流行的後設資料標準,修改後再使用。

  以上三種方案,各有優缺點:

一、採用國際間流行的後設資料標準:由於許多單位也採用一樣的標準,所以資料庫欄位相同,彼此資料交換時,將更加便利。

二、依據自己單位的需求,自行制訂:較符合該單位自己的需求;而與其他單位的資料庫要進行資料交換時,必須先進行不同欄位之間的對應後,才可以交換,步驟較為繁複。

三、折衷方案:則優缺點介於以上兩者之間。

  要依據哪一種方案,可以參酌優缺點之後決定。

質量均衡 創意加值

星期二, 五月 27th, 2008

內容發展分項計畫/謝筱琳

  前幾天和朋友閒聊,「我覺得你很適合當兵耶!一個口令一個動作」,他突然冒出這句話來,接著又補充道:「你應該是執行力很高,但沒什麼創意的人」。自認新聞媒體出身,還頗有靈機一動的我,當然氣急敗壞地追問他何以有此論斷。然而經他說明解釋,還真有點一針見血,只不過說法必須推翻:我應該是個「有創意,沒執行力」的人。

  他說,每個人都有創意,沒有人是沒有一絲毫創意的;但創意包含「質」與「量」兩個必要條件,這裡的「質」意指創意的發想,「量」則是創意的執行成果。我有過很多點子,每天不斷發想,今天想DIY一本童書繪本,明天想將心愛的收藏品翻拍排版成一獨有型錄,後天又想架設個人網路部落格(BLOG),創意隨時隨處增生,memo爬滿興奮的筆跡,但成品始終難產。空有想法卻無力執行,應該也算一種資源浪費吧!

  「誘發創意,執行推廣」這個概念,讓我聯想起我們數典計畫不也在從事類似文化創意產業的工作。現有的主題計畫,如各種動植物、器物、史料,甚至影音、語言的研究,可被歸為質的部分,是文化創意產業的前製工作,涵括學問、技術、文化等層面;而數位典藏、建置聯合目錄資料庫,則屬量的部分,是文化創意產業的後製作業,讓智識從陰暗的庫房、學術人員塵封的研究論文裡轉檔到網路上,使資源重見天日。

  曾志朗先生在7月23日研討會的記者會上說道:「『擁有』的時代已經過去,現在是『享有』的時代」。擁有與享有無非是「獨樂樂」與「眾樂樂」的區別,然這二者區別,透過網路工具,更擴充為地方與國家,國家與全球的差異。傳統的文化傳承,以中國師徒關係論,幸運保留下的技術,經師傳徒,師留一手,徒又傳徒,徒留一手,一手少一手,訊息如消耗品般,終有一天會消逝殆盡。外界常不解我們數典計畫到底葫蘆裡賣的是什麼藥?我說,我們賣的就是保存文化,使其永續經營的持久劑。透過數位珍藏、網路共享,對內不僅期望縮短國內城鄉差距、消弭文化分配不均問題,將屬於全民的資產捧到他們面前共享;對外,更冀望促進異國文化交流,達成多元文化並存的世界。

  23日研討會上,看見參與同仁付出極大心力投注於數典計畫,期以質量均衡,創意加值的方式推廣我們的歷史文化,身為其中一員,內心滿是感動與感恩。對於執行創意,我已整裝待發。

  • Loading...


    Loading...

    Login






    註冊 | 忘記密碼

    Register





    A password will be mailed to you.
    登入 | 忘記密碼

    Retrieve password





    A confirmation mail will be sent to your e-mail address.
    登入 | Register