1024x768 1280x800   Decrease font size for  - 拓展台灣數位典藏 - 數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫網站 Reset to normal font size for  - 數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫網站 - 拓展台灣數位典藏 Increase font size for  - 拓展台灣數位典藏
 


漢籍全文數位化工作流程指南

Tags: none 發表: 2008-01-18, 點閱: 29,630 , 加入收藏櫃 , 列印 列印 , 轉寄 轉寄

想加入的書籤: HemiDemi MyShare Baidu Google Bookmarks Yahoo! My Web Del.icio.us Digg technorati furl 加入此網頁到:YouPush . . 推到twitter 推到plurk 推到FACEBOOK

捌、設備與成本分析
     
         
       數位化本是一項所費不貲的浩大工程,除了有形的、可以計算的設備、軟體費用,隱形的、容易忽略的場地租用、水電費用與設備維修,還有無形的、難以計算的勞務費用如人力訓練費用,以及全文數位化特別需要文史相關研究者標點、標記的所付出之知識成本與時間。
相較於其他物件的數位化工作,在全文數位化過程裡,無形知識的付出占所有工作的大部分,資料有限,經濟成本難以考量,故本書僅就勞務費與設備費,以及部分委外支出,提供選擇方案與可能花費,作為數位化成本之基本參考。
                             
 一、設備選擇考量

此部分,我們針對全文數位化工作所需之相關器材設備,進行選購說明。主要設備包括影像掃描器以及電腦的軟硬體設備。

 

(一)掃描器的選擇

市面上掃描器分有桌上型平台掃描器、桌上型自動進紙式掃描器、桌上型無邊縫掃描器、以及滾筒掃描器。如果欲進行全文數位化的單位想自行掃描,建議使用自動進紙式掃描器,並搭配自動編號存檔之功能,能夠有效節省掃描時間,簡化掃描工作。

 

(二)電腦硬體的選擇
    市面上的電腦可分成兩類,一種是針對商務或一般文書處理的個人電腦(PC),另一種則是為繪圖出版等作業所使用的麥金塔系列(MAC)。由於全文數位化工作大多處理的是輸入、校對以及標記等文書處理的工作,所以選購一般個人電腦即可。
    而在個人電腦的主機選購上,雖然多數工作僅止於文書處理,但由於可能需要同時作業多個視窗,或是瀏覽掃描圖檔,在部分設備的選擇上,還是需要特別挑選,例如:
1.隨機存取記憶體(Random Access Memory,RAM)的容量關係軟體的順暢執行。一般來說,目前的個人電腦至少要有512MB或1GB以上的RAM。
2.顯示卡能夠呈現色彩層次的細膩度,越需要影像處理的工作,其電腦的顯示卡就需挑選效能越高的。目前市售的顯示卡,有附較佳繪圖功能的顯示卡,價格大約都會在3000元以上。若為一般的文書處理,可採買較為低階的顯示卡,或是直接使用主機板內建的顯示卡即可。
3.儲存檔案所使用的硬碟,容量越大越好,並且需配合妥善的儲存規劃。此外,也可購置外接式硬碟,異地備援。

 

(三)電腦軟體的選擇

    電腦軟體方面,由於各項作業所需軟體不一,以下就不同作業流程,分項介紹。
1.數位影像處理:有關色彩校正、色彩管理之工作,可選用Adobe Photoshop系列軟體
 (http://www.adobe.com/tw/products/photoshop/)。
2.繕打輸入:一般來說,只要可以編輯字碼之軟體都可使用,而推薦使用之軟體為國人開發之「漢書」,其好處為記憶體佔用少、作業速度快、可讀取大容量的檔案,能與WORD連結。
3.OCR:欲知OCR光學辨識系統之介紹,可參照數典計畫內容發展分項計畫出版之《報紙期刊全文輸入工作流程指南》,內含多種廠牌之辨識系統比較,其中能夠同時辨識中英日三種語言的「丹青文件辨識系統」,是多數已執行全文數位化之單位建議使用之軟體。
4.標記軟體:標記所使用之軟體,和輸入時使用的軟體大同小異,原因多半是現在的文書處理軟體多可同時處理純文字以及XML標記,故推薦使用之軟體同樣為漢書與UltraEdit。此外,Oxygen XML Editor亦為標記時可使用之軟體,它能夠匯入單位所需之標記基模(schema),快速檢查、追蹤編輯之XML標記是否符合規定。
5.其他:由於全文數位化的主要工作是進行大量繁複的輸入、校對以及標記,所需人力成本極高,為簡化勞務加速工時效率,有些計畫或單位會自行研發有助改善流程之相關系統軟體,例如看圖校對、檔案管理、檔案比對、文書處理、標記轉換……等,這些軟體除可請計畫內資訊部門協助開發,還可以委託外部廠商製作,只不過軟體委外時,最好要求設計師將系統軟體以開放碼處理,以便日後修改有方。
                                  
二、成本分析
    全文數位化工作之成本包括:材料費、勞務費以及經費。材料費為數位化工作所需使用之耗材費用;勞務費為工作人員的薪資;經費則為機器設備與軟體之費用,包含折舊費用,以及場地的修繕、租賃、水電、雜支等費用。計算數位化費用時,應依上述羅列項目,一一統計核算。而有關掃描、繕打之市價行情,長期進行大宗漢籍文書全文數位化的中華電子佛典協會,提供下列參考價格:
 
 
表8、文書掃描與文字繕打市價
作業項目
價格
 

掃描

委外掃成300dpi黑白影像檔,價格為NT1.5元/頁(A4)
輸入
 

台灣:NT50元/1000字

中國大陸:NT25元/1000字
          NT15000元/冊

  (目錄)

    









Download: 漢籍全文數位化工作流程指南  漢籍全文數位化工作流程指南 (2.3 MB, 1,810 hits)



評分:

1 Star2 Stars3 Stars4 Stars5 Stars (No Ratings Yet)
Loading ... Loading ...

回應:


請輸入圖片中的文字
請按圖片取得圖片中文字的錄音檔
Click to hear an audio file of the anti-spam word