1024x768 1280x800   Decrease font size for  - 拓展台灣數位典藏 - 數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫網站 Reset to normal font size for  - 數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫網站 - 拓展台灣數位典藏 Increase font size for  - 拓展台灣數位典藏
 


國立歷史博物館大型器物數位化工作紀要

發表日期: 2008-05-27, 點閱數: 0 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

高鈺茹

 

一、物件選取:朱紅緞緙絲金龍袍-清代(圖一)

 

圖一 朱紅緞緙絲金龍袍

 

二、工作環境與器材配置

 

  1. 拍攝場地

 

  平常史博館的小型器物數位化工作都是直接在庫房進行拍攝,但若是大型器物,則必須利用博物館休館時間(星期一)將文物提借至二樓展場進行拍攝。

 

  

 

圖二 史博館二樓展場

 

  備註1:拍攝過程必須在全黑環境下僅以燈具打光進行,如此可避免因外在光線因素所導致影像色彩失真的情況。另外,自然光線會損害器物的顏色;而光線中的紫外線與紅外線會造成物品脆弱變質,因而應避免器物受到陽光直射(一般拍攝若無專業暗房,可在預備進行拍攝的場地裝置遮光布以阻擋外在光線)。

 

  備註2:關於室內溫度與空氣濕度的調節,以20-24度室溫以及15~18℃濕度和50~65%的相對濕度最適合器物的保護環境。

 

  2. 佈景

 

  器物拍攝的佈景,以黑、灰、白為主。

 

  3. 設備 / 2001年採買,總價約12萬

 

  (1) 相機:機身為120中型相機中最高等級Hasselbland 555 ELD。

 

  (2) 鏡頭:蔡司 Hasselbland CFE 80mm及CFI 120mm。

 

  (3) 光圈:最大分別為F2.8~F22,F4~F32並可搭配makro 1比1 近攝。

 

  (4) 機背:為Kodak Professional DCS Pro back plus 1600萬像素。

 

  【該數位機背隨機搭配三套影像校色軟體:Photo Desk、Camera manerger及Capture Studio,其能在不同光源下產生個別專屬之色彩描述檔(Icc profile)。購買數位機背時會附贈一組序號,透過該序號在網路上登錄才能取得專屬軟體,因而市面上並買不到。目前史博館在校色上是採用專業使用的Capture Studio軟體。】

 

  (5) 燈具:使用BALCAR閃光燈,搭配BALCAR NEXUS 電筒,光量可保持恆定色溫正負50°,並使用BALCAR冷光燈,色溫5500度(接近於一般晴天9:00到16:00的自然光)。

 

  *備註1:關於燈具的選擇,市面上一般傳統攝影燈具器材如:鎢絲燈、石英燈等連續光源攝影燈具,雖可有效控制照明,但照射時所產生的光源熱度過高,會對文物造成傷害,而且照射之亮度、色溫會隨著使用期間增長而有衰弱不定的現象。而採用冷光,則可維持5000-6000度標準色溫(穩定的光源),光線也較為柔和,成本過高則是使用該燈源唯一的缺點。

 

三、文物提借

 

  按照國立歷史博物館之文物持拿規定

 

四、文物拍攝

 

  1. 以水平儀測量相機水平【該水平儀在專業相機店有販售,但價錢較貴。目前B&Q 特力屋有自行研發之水平儀(如圖三所示),有各種不同的種類,十字型為基本型,每個售價39元】

 

  

 

圖三 水平儀

 

  2. 校色:先拍攝一張文物進行電腦校色。

 

  3. 正式拍攝:一般文物僅拍攝一張數位照片,若有特殊紋飾,則進行細部紋飾加拍。

 

  *備註1:為避免拍攝燈源的散射光射入鏡頭,影響成像色彩品質,可在鏡頭前端加上遮光照(如圖四所示)。遮光照的價位從五百到五千不等,但功能性並沒有太大的差異,因而在購買時可多家比較考量。

 

  

 

圖四 遮光照

 

五、儲存檔案:按照史博館檔案命名原則。另外,檔案格式目前以TIFF、JPEG以及MPEG 三種規格為主。

OCR主要廠商介紹

發表日期: 2008-05-27, 點閱數: 0 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

程婉如

 

  目前OCR的研究與技術開發,在台灣有力新國際、蒙恬科技、全景軟體,在大陸則以清華文通和北京漢王最著名。以下介紹上述OCR主要廠商之技術與產品現況。

 

1.力新國際

 

  原本為力捷電腦(UMAX)的軟體部門,負責開發掃描器驅動程式與搭售軟體,後來於1987年獨立成為「力新國際」公司。目前產品以影像處理(非常好色)、光學文字辨識(丹青)軟體與名片辨識系統為主。其中丹青文件辨識系統技術移轉自工業技術研究院電腦與通訊研究所,是國內最早技術達至成熟的產品,功能包括處理黑白、彩色文件、文件版面分析、表格抽取、印刷多種字體中英數字夾雜的辨識。力新國際也積極以專案方式與各機構單位合作,例如國防部電訊發展室「傳真文件的辨識與分類」、中華電子佛典協會(Chinese Buddhist Electronic Text Association,簡稱CBETA)與日本「大藏出版株式會社」簽約進行的《大正新脩大藏經》數位化,均與該公司合作。其中,力新國際研發部更專為CBETA輸入作業需求而設計,進而發展出「丹青for CBETA版」的OCR辨識軟體。

 

2.蒙恬科技

 

  蒙恬科技為獨資企業,成立於1991年,由蔡義泰博士創辦,以手寫輸入系統切入市場,為當時手寫辨識(Handwritten Recognition)技術最先進的中文手寫輸入系統。1994年自工研院電通所前瞻資訊技術中心(Advanced Technology Center,簡稱ATC)移轉OCR辨識核心,並與中央大學資訊工程學系合作,開發OCR相關技術,於1996年推出「認識王」可辨認手寫稿之OCR軟體。並自1997年開始研發語音辨識技術,經由IBM的ViaVoice語音辨識核心的授權,於1998年首推「聽寫王」彙集語音與手寫辨識系統。其它OCR的應用技術則有整合掃描、辨識、翻譯三種介面的「掃譯筆」以及名片辨識與編輯的「名片王」。

 

3.全景軟體

 

  全景軟體公司於1998年正式成立,創始人為前國立交通大學校長、交通部長郭南宏博士,公司在創立初期藉由產學合作計畫自交通大學引進了OCR、文件影像分析、彩色影像處理、影像壓縮、音訊處理、檔案加解密等資訊關鍵技術,進行技術商業化及個人用套裝軟體開發,目的在於將實驗室內可商品化的實驗結果帶出,持續研發成為商品。目前的產品領域包括與OCR相關的名片辨識系統、影像剪輯、網路安全、與虛擬實境四類。而藉由企業化經營的過程,公司目前已成功發展出國內產學合作的良好典範。但其OCR部分為專案方式進行整合,並未在市場上發行OCR軟體。

 

4.清華文通

 

  北京文通資訊技術有限公司(原北京清華紫光文通資訊技術有限公司)成立於1992年,是在中國科技部(原中國國家科委)與清華大學電子工程系的支援下,為推廣應用國家「863高科技計畫」資訊領域多字體印刷漢字自動識別技術研究成果而形成之企業。TH-OCR是清華大學自1985年即開始研發,TH則是TsingHua(清華)之縮寫,文通資訊以工程院院士吳佑壽為首,在丁曉青教授領導下,長期致力於清華TH-OCR的研究與開發,目前能自動識別多體漢字、漢英混排文字、印刷及手寫體,其產品在大陸市場佔有率達65%以上,其中日、韓文與英文混排文字檔的識別水準甚至超過日本及韓國對其本國文字的識別水準,而亞洲文字(中文簡體、中文繁體、日文、韓文)識別技術也因此獲得微軟高度認可,並在Microsoft Office 2003中全面配裝。

 

5.北京漢王

 

  北京漢王科技有限公司成立於1993年,以「中國國家文字識別工程中心」科技研究為基礎,在中國「七五計畫」、「八五計畫」、「九五計畫」、「863高科技計畫」、國家自然科學基金等重點專案支持下,專注於手寫、語音、OCR、生物特徵等識別技術的研究和推廣,相繼推出了語音命令合成技術、OCR掃瞄輸入、名片識別管理系統、指紋識別、身份證識別、車牌號碼識別、銀行票據防偽識別認證等系列產品。

中華電子佛典協會(CBETA)數位化工作流程參訪紀要

發表日期: 2008-05-27, 點閱數: 2 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

[缺圖]

 

  

 

  謝筱琳

 

  CBETA位於北投中華佛學文化館,辦公室佔地約莫內容發展分項辦公室2/3大,以下分為「輸入校對組」、「文字組」、「標記組」、「資訊系統組」,實際在辦公室上班的工作人員不到10位,其餘則為SOHO族或是委外人員。

 

  古早時期,中國於宋代起,也有類似現在資料庫的經文、經錄集結工作,只不過以前多為全手工作業,抄寫一本佛經就需耗費5、6百人力,費時好幾年,不像現在拜電腦與網際網路科技之賜,一台電腦可抵百個人腦,還可以夜以繼日、超時工作,時效性大幅提升。

 

  經文、經錄數位化的技術性工作多集中於「輸入」與「標記」兩部份,此二者正是佛典電子化的成敗關鍵。CBETA研究團隊耗費許多人力與時間在技術研發上面,他們開發許多專屬軟體,例如可以判讀經文的OCR文字辨識軟體,以解決輸校可能面臨的問題。經文和新聞的全文輸入,差別在於經文上有一些讀音標記與日文拼音,還有各種變異古字,這些因素嚴重影響判讀軟體運作。對此,他們的解決方式為「不做線上逐字校對,利用『取出表』快速進行字串取代」,以經驗法則降低錯誤率,目前理想標準錯誤率為1/10000。

 

  CBETA的簡單標記自成一格,以慣用自訂法則標記經文與段落層次,雖不符國際標準,但簡單易學又便利,後匯入國際標準也不成問題,是CBETA希望可推廣至其他單位共享的經驗。

 

  宗教號召力是CBETA數位化工作和其他單位最大不同點。因抄寫經文可以積公德,所以網路上約有900位志工加入輸校行列,每人每天一頁,一天就可完成900頁,這樣的效益是很驚人的;還有許多網路工程師免費、義務幫CBETA設計適合的缺字軟體、判字軟體等,宗教的強大號召讓這個研究團隊有一看不見的向心力, 一來替大眾服務,二來也算自我修煉,這是一般研究團隊所沒有的,並可以引以為鑑的。

 

  以下附上CBETA數位化工作流程圖:

 

  

制訂後設資料的三種方案

發表日期: 2008-05-27, 點閱數: 1 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

 數位典藏聯合目錄系統建置計畫研究助理 江仁傑 2005.08.29

 

  制訂後設資料,是為了記下某一筆數位化資料的特性。例如我用數位相機拍攝的照片,可以有照片名稱、主題、拍攝者姓名、時間、地點、描述…等等簡單欄位,而這些欄位資訊,就是這張照片的後設資料。

 

  依照資料庫建置的目的,針對的對象…等不同的考量,資料庫的後設資料,可以制定得很簡單,只註記簡單事項,也可以針對學術、研究用途,制訂出上百個欄位來描述一筆資料。

 

  國內學界或國際上,針對不同學門,都發展出很多種後設資料的標準,例如,生物界有一種國際間曾被採用的後設資料標準,稱為達爾文核心集(Darwin Core),用來描述某一個生物的數位化物件資料;而檔案學界,有一種國際間使用的後設資料標準,稱為Encoded Archival Description (EAD),用來描述一筆檔案資料。「數位典藏國家型科技計畫-後設資料工作組」,有提供許多不同學門的後設資料標準,讓參與計畫的單位參考,該工作組也接受委託,直接協助各單位制訂後設資料。

 

  目前參與「數位典藏國家型科技計畫–內容發展分項計畫」的單位,在制訂後設資料時,通常是在以下三種方案中,擇一進行:

 

  一、採用某種國際間流行的後設資料標準。

  二、依據自己單位的需求,自行制訂。

  三、折衷方案:依照自己單位的需要,參考某種流行的後設資料標準,修改後再使用。

 

  以上三種方案,各有優缺點:

 

  一、採用國際間流行的後設資料標準:由於許多單位也採用一樣的標準,所以資料庫欄位相同,彼此資料交換時,將更加便利。

  二、依據自己單位的需求,自行制訂:較符合該單位自己的需求;而與其他單位的資料庫要進行資料交換時,必須先進行不同欄位之間的對應後,才可以交換,步驟較為繁複。

  三、折衷方案:則優缺點介於以上兩者之間。

 

  要依據哪一種方案,可以參酌優缺點之後決定。

質量均衡 創意加值

發表日期: 2008-05-27, 點閱數: 1 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

謝筱琳

 

  前幾天和朋友閒聊,「我覺得你很適合當兵耶!一個口令一個動作」,他突然冒出這句話來,接著又補充道:「你應該是執行力很高,但沒什麼創意的人」。自認新聞媒體出身,還頗有靈機一動的我,當然氣急敗壞地追問他何以有此論斷。然而經他說明解釋,還真有點一針見血,只不過說法必須推翻:我應該是個「有創意,沒執行力」的人。

 

  他說,每個人都有創意,沒有人是沒有一絲毫創意的;但創意包含「質」與「量」兩個必要條件,這裡的「質」意指創意的發想,「量」則是創意的執行成果。我有過很多點子,每天不斷發想,今天想DIY一本童書繪本,明天想將心愛的收藏品翻拍排版成一獨有型錄,後天又想架設個人網路部落格(BLOG),創意隨時隨處增生,memo爬滿興奮的筆跡,但成品始終難產。空有想法卻無力執行,應該也算一種資源浪費吧!

 

  「誘發創意,執行推廣」這個概念,讓我聯想起我們數典計畫不也在從事類似文化創意產業的工作。現有的主題計畫,如各種動植物、器物、史料,甚至影音、語言的研究,可被歸為質的部分,是文化創意產業的前製工作,涵括學問、技術、文化等層面;而數位典藏、建置聯合目錄資料庫,則屬量的部分,是文化創意產業的後製作業,讓智識從陰暗的庫房、學術人員塵封的研究論文裡轉檔到網路上,使資源重見天日。

 

  曾志朗先生在7月23日研討會的記者會上說道:「『擁有』的時代已經過去,現在是『享有』的時代」。擁有與享有無非是「獨樂樂」與「眾樂樂」的區別,然這二者區別,透過網路工具,更擴充為地方與國家,國家與全球的差異。傳統的文化傳承,以中國師徒關係論,幸運保留下的技術,經師傳徒,師留一手,徒又傳徒,徒留一手,一手少一手,訊息如消耗品般,終有一天會消逝殆盡。外界常不解我們數典計畫到底葫蘆裡賣的是什麼藥?我說,我們賣的就是保存文化,使其永續經營的持久劑。透過數位珍藏、網路共享,對內不僅期望縮短國內城鄉差距、消弭文化分配不均問題,將屬於全民的資產捧到他們面前共享;對外,更冀望促進異國文化交流,達成多元文化並存的世界。

 

  23日研討會上,看見參與同仁付出極大心力投注於數典計畫,期以質量均衡,創意加值的方式推廣我們的歷史文化,身為其中一員,內心滿是感動與感恩。對於執行創意,我已整裝待發。

模式標本之簡介

發表日期: 2008-05-27, 點閱數: 1 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

梁美珍

 

  在植物標本裡,最重要與珍貴的標本莫過於“模式標本”﹝Types﹞,林試所及台大植物標本館各擁有一千餘份模式標本為本島館藏最大宗,足見其創館歷史悠久。

 

  模式標本經常被提及,對一般民眾而言,模式標本的定義卻是個模糊的概念。本人也是在接觸主題工作同時,嘗試去了解模式標本的意義。陸續參考了一些文獻資料及網路上蒐集所得,下文就對模式標本作一簡單介紹。

 

  當採集到一份標本時,首先核對資料文獻及現有的標本,若該標本屬新的物種時,則需在刊物上公開發表,才能為學界承認。發表時,必須詳細描述該份標本的形態特徵,通常還需附上插圖,並說明標本存放的標本館。該份標本即成為物種發表新名稱時的依據,稱為模式標本。

 

   模式標本是依據《國際植物命名法規》規定,用作發表新種學名的植物標本。在《國際植物命名法規》﹝http://www.bgbm.org/iapt/nomenclature/code/SaintLouis/0000St.Luistitle.htm﹞的規則下,學名和它的模式標本是永遠聯繫在一起的。描述新種的科學文獻通常都會引用模式標本。標本的各項資料,例如採集號、標本號、採集地點及標本收藏處,一般都會在文獻列明。

 

   模式標本又可加以分類,具不同之定義。正模式標本﹝holotype﹞是一種模式標本,但此號標本常常有一份以上之複份標本,這時得指定其中一份為正模式,其他複份稱為複模式﹝isotype﹞或兄弟模式、姐妹模式。即說明模式標本是唯一的。其他之分類則不在此詳述。

 

模式標本的重要性:

 

  • 模式標本是獨一無二的,世界上每個品種祇有一個相應的模式標本(通常是主模式)。
  • 模式標本在任何植物標本館中是最具價值的藏品。當某植物品種在不同作者的描述下存在差異,或在識別未鑑定的標本時,模式標本永遠是澄清問題的參考確據。
  • 模式標本是修訂分類時的重要材料。
  • 模式標本是永久的紀錄,保存於對公眾開放的標本館,以便真正植物學者查考。《國際植物命名法規》強烈建議用作命名的材料,尤其主模式標本,須存於對公眾開放的標本館或公共貯藏機構,並須有措施以便真正植物學者查閱館藏標本,及須妥善保存這些材料。

 

  既然模式標本尤其珍貴,一般民眾是否難以目睹其風采?不然!我們適逢現今科技進步的時代,前輩們用心良苦,為資源得以永久典藏及利用,數典計畫的衍生開創了資源分享的先機,可經由網頁上查詢點選,直接目睹該份標本真實影像及原始發表的全文及圖片,省時省力,學術知識得以迅速傳遞,大公無私的精神正是數典計畫可貴之處。

 

參考資源:

http://www.ndap.org.tw/1_newsletter/content.php?uid=968

http://www.hkherbarium.net/Herbarium/c_tcc.aspx

http://www.hkherbarium.net/Herbarium/c_tcc.aspx

數位典藏聯合目錄的嘗試:跨學科整合

發表日期: 2008-05-27, 點閱數: 3 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

[有表]

 

  

 

  數位典藏聯合目錄系統建置計畫研究助理 江仁傑 2005.07

 

  數位典藏聯合目錄(以下簡稱「數典聯合目錄」)在製作過程中,一方面嘗試整合不同的機構與計畫的後設資料,另一方面也參考許多國內外網站的作法。我們發現,在國內或國外的例子裡,雖然也有許多整合性的資料庫,但如同數典計畫的聯合目錄,整合十五種不同主題的資料,涵蓋動物、植物、地質、人類學、檔案、地圖與遙測影像、金石拓片、善本古籍、考古、器物、書畫、新聞、影音、語言、漢籍全文等領域,則不多見。因此,當「數典聯合目錄」已經進入五年計畫的第四年之時,應可回顧、反省整合上的經驗,提供給國內外相關機構與計畫參考。

 

  整合跨眾多主題的內容,主要有兩個方面的考慮,第一,不同型態資料庫的數位資料,如何整合在一個系統中;第二,在一個系統介面上,不同類型的資料要如何呈現。

 

與各單位聯繫與解釋,是主要工作之一

 

  第一個問題,雖然牽涉到技術上的資料庫匯出匯入問題,但在技術上並沒有不可解決的困難,但主要問題,是必須聯繫各個無上下隸屬關係、各自發展的單位,解釋匯入聯合目錄的工作過程,並排定時程來進行資料庫匯出作業。

 

  而參與數位典藏的機構計畫、公開徵選計畫,總數量有七十多個,而每一個計畫,可能針對不同資料性質,設計出不同的欄位,甚至可能由不同的研究者或助理負責。所以,我們針對技術、版權、管轄情況各不相同的單位與資料庫,一一進行聯繫,必然需要大量的時間來進行聯繫溝通。

 

  第二個問題是,原本各資料庫的系統、欄位等都有差異,那麼在數典聯合目錄上,應當如何顯示各種不同類型的資料?

 

不同資料庫的內容,如何在一個系統、一個介面上呈現?

 

  我們有以下幾種選擇:

 

  第一種,設定所有計畫之間的共通欄位,再將各個不同的資料庫欄位,全部對應成此一共通欄位。例如,將A資料庫的「生態狀況」欄位,與B資料庫的「花紋樣式」欄位,全部對應成「數典聯合目錄」共通欄位之中的「描述」欄位。

 

  第二種,不設定共通欄位,各資料庫在數典聯合目錄的介面上,直接呈現出原本各不相同的欄位資訊,只設定共通的檢索欄位,例如,只設定「題名」、「關鍵字」等為共通檢索欄位。

 

  第三種,設定部分欄位為共通欄位,而各計畫得以在共通欄位之外,再自行發展其他欄位項目。例如,設定各計畫的共通欄位為:「題名」、「關鍵字」、「管理權」三種欄位為共通欄位(並可規定為必填欄位),而各個計畫可以在自己的資料庫之中,再附加符合自己需求的欄位。

 

  以上三種方式,各有優缺點。

 

  第一種方式,所有不同欄位整合為一種共通欄位,優點是在數典聯合目錄上的欄位顯示,較有統一風格,使用者容易熟習欄位架構,閱讀欄位資訊的速度較快;缺點是較為耗時,要將所有不同欄位,對應成同一欄位,各單位並需要在匯出資料時,匯出為數典聯合目錄所需的欄位。

 

  第二種方式,直接呈現出各不相同的欄位,可以保留原資料庫再描述該筆資料的原始特性,欄位名稱較為明確合理,而且,不需要耗費人力進行欄位對應;缺點則是在同一系統上,呈現的風格不一致,使用者較不容易熟習欄位。

 

  第三種方式,設定少數共通欄位,其他欄位由各計畫自訂。這種方式,必須在數典計畫一開始時,就決定共通欄位,否則就要各計畫更改自己資料庫中一部份的欄位,各計畫將耗費額外時間人力,以目前數典計畫的型態,並不合適。

 

  以上三種方式,究竟應採用哪一種?經過民國91年度、92年度兩個不同的工作團隊加以試驗、測試之後,到了計畫的第三年,在93年度的工作團隊手中仍有爭論,最後才明確決定,採用第一種方式。此後,雖然會耗費更多時間進行欄位對應工作,但是在介面上呈現資料時,會比較一致。

 

共通欄位標準:Dublin Core的應用

 

  數典聯合目錄所採用的共通欄位,是國際間正在發展中的欄位標準:Dublin Core(DC),DC是一種簡易的包含15個欄位的標準,它可以在15個簡易欄位之下,再發展更細緻複雜的欄位。但數典聯合目錄的需求,只是要作一目錄性質的簡單資料,讓使用者查出簡易資訊之後,再連結至原始資料庫貨源班為,觀看更詳細的資訊。

 

  因此,數典聯合目錄只採用簡易DC,然後在各欄位之內,加上「先行詞」,以表現不同型態的資料特性。例如,原計畫資料庫與某物件名稱有關的欄位,可能有「主要題名」、「次要題名」或「英文名稱」、「俗名」等等欄位,而在數典聯合目錄DC欄位上,只有「題名」一個欄位與之對應。此時,為了保留這些不同欄位的特性,我們把「主要題名」、「次要題名」或「英文名稱」、「俗名」都放在DC的「題名」,再加上先行詞來修飾:

 

欄位名稱  顯示結果 
題名  主要題名:金鄉祠堂畫象十一
其他題名:朱鮪石室畫象-人事類宴享之屬
其他題名:朱鮪石室畫象(其十一)
其他題名:朱鮪墓祠堂後壁上部 宴飲畫像 

 

  並且,在「題名」的顯示結果上,加上原資料庫顯示該筆資料之頁面的URL,可直接點選,進入原資料庫完整的顯示資訊,或者更清楚的數位化圖檔、影音檔等。在數典聯合目錄,原則上只讓使用者檢視每一筆資料的簡明資訊,以及瀏覽用的圖檔,較詳細資訊與更清晰之圖檔、影音檔,仍保留在各計畫各單位的資料庫中。

 

欄位整合的三個特色

 

  總之,目前欄位整合的方式,可歸納為三點特色:

 

  1. 採用固定的共通欄位標準:簡易Dublin Core,顯示各種不同性質資料庫的簡明資訊。
  2. 簡易Dublin Core內,可使用先行詞,以保留原資料特性。
  3. 每一筆簡明資訊,原則上必須附上原資料庫顯示頁面之URL,使使用者可以看到更詳細的欄位資訊與圖檔或影音檔,或者到原單位的使用介面,獲得進一步的相關資訊。

 

  每一個單位的資料庫,由於狀況不同、考量各異,因此數典聯合目錄在現階段,不一定都能使每一筆資料,都能呈現較完整的資訊。不過,仍能在盡力而為的前提之下,整理經驗,提出問題,讓國科會、總計畫辦公室或其他相關與類似的計畫、機構來參考,共同尋找更好的工作方式。

數位典藏推廣之問題

發表日期: 2008-05-27, 點閱數: 0 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

 林淑惠 94/07

 

  我曾詢問過周遭的朋友,問他們知不知道數位典藏是什麼??幾乎沒有一個人知道什麼是數位典藏,更不用說要他們去了解數位典藏之目的及用途,數位典藏國家型科技計畫成立至今已達3年多之久,經由各單位的努力下典藏成果可說是非常的豐富及多樣化,擁有了這麼多的資源,要如何將這些成果推廣出去變成是一個很重要的課題,因為完成了前置數位化工作後要把這些成果讓更多人知道及運用,才算是數位典藏的最終目的。反之,如果花了這麼多人力及心血只為了保存資料,而不加以做任何更有意義的用途的話,其實是有些浪費的。

 

  接觸數典計畫雖然是很短的時間,但就目前整體看起來計畫對外宣傳的機會似乎有限,目前大多是學術單位與數位典藏有相關聯性才會對計畫有相當程度的了解,所以一般民眾對基本的數位典藏要了解就更困難了,也就是因為這個原因會使計畫在推廣時造成一定的困難度,也許有很多民間單位有許多珍貴的資料,但因不知有數位典藏這個計畫,所以也不知如何典藏,使資料就無意義的閒置在那,對計畫來說也少了一個典藏資料庫的機會。就我的看法其實應該將角色顛倒,不是像現在我們一直在尋求典藏單位的加入,而是要將數位典藏的概念大力的推展出去,讓大家知道有這個計畫存在,使有典藏資料的單位能主動的要求加入,這樣會減少許多尋求的時間,也會擴充典藏資料的豐富性。

 

  要如何將本計畫大力的推廣給全台灣的民眾,甚至是全世界的人,讓資源做更有效的運用,其實是需仰賴做一整體系列的推廣及宣傳,可想而之那將是一項非常浩大也非常重要的工程。最近得知總計畫辦公室建置了一套公共資訊系統,首批要將25個計畫的成果以特展的方式要在網站上展出,並藉由較親切、生動的操作方式增加民眾的使用興趣,這對本計畫來說無疑是一項宣傳的最佳工具,讓民眾透過最便捷的網路,接觸到本計畫的相關資訊並且可以利用簡單的蒐尋方式去找到他們所需要的資料,這是最快,也是最容易的宣傳方式。還有子計畫二也開始進行各主題宣傳影片的拍攝,這也是一項很好的宣傳手法之一,可以在各場合藉由影片的播放達到宣傳的效果。總歸一句話,其實不管用什麼宣傳方式(DM、影片、網路、研討會等)目的就是要讓全民都知道”數位典藏”是什麼,目標或許很大,但我想只要大家一起努力往目標邁進,假以時日要達成這個理想並不是不無可能的。

語言主題小組之【語言典藏計畫】簡介

發表日期: 2008-05-27, 點閱數: 1 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

佳旻 整理

 

前言

 

  「語言典藏」是指以語言為標的的數位典藏,是搶救瀕臨滅絕的最後手段,也是使語言為標的學與語言科技在知識產業時代扮演關鍵角色的基礎工作。大規模與計畫性的語言典藏計畫,近幾年開始在國際間展開,如美國的E-MELD,法國的LACITO,及跨國建立標準的OLAC等等,國內的語言典藏規劃,主要由中研院語言所主導,參與「數位典藏國家型科技計畫」。連同先導計畫,已進行了將近四年。

 

緣起

 

  語言使得人類「雖死而不朽,愈遠而彌存」。但是如何在語者凋零、弱勢語言瀕臨滅亡的危機中保留珍貴文化遺產;如何在數位媒體與資訊科技的不可逆的洪流中,使語言繼續發揮承載知識與文化的人本功能;語言的數位典藏,是關鍵性的基礎工作。

 

  就內容而言,語言是重要的文化典藏對象;就資料詮釋而言,語言與時、空互補,提供典藏基本定位詮釋的座標;就典藏知識的傳播與利用而言,包括內容檢索、知識擷取、及多語環境中之典藏使用,都必須建立在利用語言典藏與知識發展出的語言技術上。「語言典藏」計畫,便是以此為動機,希望以語言為主軸,建立詮釋資料、典藏內容及資訊技術密切合作、相輔相成的典範。

 

計劃介紹

 

  在內容方面,「語言典藏」計畫分為『漢語典藏與典藏架構』及『台灣南島語典藏』二個計畫。其中『漢語典藏與典藏架構』包含了「近代漢語詞彙庫」、「先秦金文簡牘詞彙資料庫」、「二十世紀漢語語料庫與句法結構資料庫」、「新世紀語料庫-多媒體的語言呈現與典藏」、及「閩南語典藏-歷史語言與分布變遷資料庫」等五項子計畫。

 

  而『台灣南島語典藏』包括台灣南島語語料庫、詞彙庫及語法,其最終目標為建立台灣南島語的語音、詞彙、單句和長篇故事語料,並加以中英文翻譯。

 

  資料庫建置目的,主要為蒐集和保存現有語料,進而調查居民用語變化和語言分析,例如「近代漢語詞彙庫」在查詢時,顯示詞項和詞類的同時,顯示例句的出處,便於歷史語法的研究者使用;「二十世紀漢語語料庫與句法結構資料庫」之建立,有利於資訊檢索、擷取、自動問答、摘要等典藏處理應用上的附加價值。

 

參考資料:

 

語言典藏資料庫簡介

語言學研究所簡介

 

相關網站:

 

數位典藏國家型科技計畫http://www.ndap.org.tw/

語言典藏 http://languagearchives.sinica.edu.tw/

台灣南島語數位典藏 http://formosan.sinica.edu.tw/

近代漢語標記語料庫 http://www.sinica.edu.tw/Early_Mandarin/

先秦金文簡牘詞彙資料庫 http://inscription.sinica.edu.tw/

現代漢語平衡語料庫4.0版 http://www.sinica.edu.tw/SinicaCorpus/

現代漢語句法結構資料庫 http://treebank.sinica.edu.tw/

新世紀語料庫-多媒體的語言呈現與典藏 http://MMC.sinica.edu.tw

閩南語典藏 http://SouthernMin.sinica.edu.tw/

殷周金文暨青銅器資料庫 http://db1.sinica.edu.tw/~textdb/rubbing/query.php4 (需授權)

個人內在變項影響個人行為對於標準化工作流程(SOP)執行時的探討

發表日期: 2008-05-27, 點閱數: 0 , 加入收藏櫃

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

高芷彤

 

前言

 

  知識或經驗是以逐漸累積的方式表現,而SOP則是將專家豐富的操作經驗彙編成容易理解的文件,以圖或文字的方式呈現。而此SOP的概念多少存在於個人日常生活中,小至個人處理日常事務行程,如到圖書館借還書、上網購物等,大則到醫療、國家考試、食品、航空等諸多系統,因此所謂的SOP即是對於經常性或重複性工作,例如校對檢驗、操作、作業等,為使程序一致化,將其執行過程與以詳細描述之一種書面文件,其目的是在減少人為錯誤而產生的不良率,達到成本降低與品質製作的均一性。也可以說是將專家長期經的驗加以累積,並以圖或文字的方式以一種書面文件表格呈現,同時對於人員初進入一個新環境能快速適應並了解整個運作的好規範,並且此SOP的精神則是著重在,若是在第一次執行過程中沒有將事情做對而導致要重複操作時所形成的成本浪費,即不合乎SOP的本質。

 

  隨文明的快速擴展,環境不斷的變遷,人類的心智須隨之適應,由於環境快速發展下所帶來的在心智上適應不良稱之為文明病,因此在當下社會人類心理的變化應被獨立出來做分析。在思考到執行檢討SOP的作業流程中,排除科技的日新月異使得機器與技術不斷更新的客觀因素,由於不論在擬定、執行、檢核、到應用擴展的階段,其人為最主要的執行者,以擬定SOP的研究者為例,研究者本身的期望(自我應驗的預言)、觀察的偏差、個人特質等,又如執行者本身對於自己角色的期望、執行時的恐懼、補償性的競爭(過於仔細造成進度的延宕)、怨恨性怠工(過於鬆散造成成本上的重複檢驗)等皆會造成主觀的影響,因此其個人內在因素應為主要被探討的變項。

 

  以下分別以個人內在變項的五大方向來探討對SOP執行時的影響:

 

  1. 精神分析學派:以動力論,強調本能的發洩、本能的壓抑以解釋人的行為。重視人類幼年時經驗對於日後行為影響,了解個人人格早期經驗,有助於解析個人在日後行為發生的方向。
  2. 行為學派:於當時方法過於主觀,而缺乏客觀性,建立強烈的實驗風格,凡事均必須是可客觀測的,並強調刺激與反應的連結。瞭解到刺激的連結問題,藉此解決個人行為偏差問題。
  3. 人本學派:強調人的主動性,以不同階層的自我實現、自我超越解釋人的行為。個人對於自己在工作的價值上頗析,有助於了解在執行sop時工作投入、工作滿足、工作績效的指標。
  4. 認知學派:將人視為訊息處理的主體,著重於訊息處理模式。有助於了解個人在注意力、記憶儲存、知識架構、後設認知等的表現,以預測個人行為。
  5. 生理學派:重在大腦的功能為處理模式的對應上。由專業的大腦偵測儀器可提供精密的證據顯示個人行為上的差異,例如由於性別差異,男女在行為表現上明顯的不同。

 

  以下分別以個人內在變項的五大方向來探討對SOP執行時的影響提出建議:

 

  1. 新進人員施予前測。除了限定新進人員教育程度的限制外,給予新進人員有關機構相關知識測驗、性向測驗等心理測驗,期望新進人員除有齊一性的水平外,在施予員工訓練時也能節省成本。
  2. 新進人員施予後測。在前測執行完後,施予員工訓練,使新進人員了解機構環境並從旁接受虛擬式的SOP執行測驗後,施予後測加以了解新進人員對於環境狀態瞭解的成果。
  3. 正式進入SOP執行。經過前後測的方式可以了解到新進人員對於機構內容與SOP執行流程程度,因此可進入正式SOP的執行,此也為節省成本之辦法,同時也可有效的分配人力。
  4. 結合其他專案執行。使得其他同性質單位之SOP能獲得統一性,避免浪費過多重複的程序。
  5. 確實定期更新SOP流程。由於環境變異,已擬定的流程必須隨時間以及新進技術做調整,淘汰舊時的技術,避免浪費成本。

 

  另外,在其他兩方面也要注意:

 

(1)工作程序的敘述方式:

 

  由於各機構或單位類別在描述工作流程時,所使用的語句以及思考邏輯皆不盡相同,導致在執行上的錯誤。因此在描述工作程序方式上會有所不同,也就是由於各執行人員的認知、教育程度、經歷、選擇、成熟、期望心理作用等的原因,因此在制定SOP的同時必須確保每個人都懂得使用方法,並且將SOP假設在操作人員仍屬生疏的狀況下,即使是新操作人員也可以不經由任何訓練就看懂過程,使用作業流程達成自身能力的超越,因此工作程序的敘述目標應是「無需學習、一看就懂」。

 

(2)檢核各程序間的SOP緊密度:

 

  由於各程序與程序間的SOP若無緊密結合,則會導致品質的不一致,因此若要順利產出符合品質要求的資料或物件,而核對點就必須要設定在風險最高以及關鍵性的程序上,並以下依步驟就是前一步驟的品質把關,如此運作下來,每個人皆扮演執行者與品質管理者的雙重角色。