期刊報紙全文輸入工作流程
Tags: none 發表: 2007-12-10, 點閱: 30,203 , 加入收藏櫃 , 列印 , 轉寄陸、設備與成本分析
(一)期刊報紙適用之數位化設備
1. 直接掃描期刊報紙原件
(1)桌上型平台式掃描器
(2)桌上型自動進紙式掃描器
(3)桌上型無邊縫書籍掃描器
(4)滾筒掃描器
(5)仰面式書籍掃描器
(6)專業多用途掃描器
2. 原件製作成微縮膠卷
(1)微縮膠卷掃描器(單頁式/捲片式)
3. 原件製作成單張黑白底片
(1)翻拍類
A.數位相機
B.數位機背
(2)掃描器類
A.具備光罩之桌上型掃描器
B.專業多用途掃描器
數位化物件
|
可使用設備
|
---|---|
期刊報紙原件
|
1.桌上型平台式掃描器 4.滾筒掃描器
2.桌上型自動進紙式掃描器 5.仰面式書籍掃描器
3.桌上型無邊縫書籍掃描器 6.專業多用途掃描器
|
微縮膠卷
|
微縮膠卷掃描器(單頁式/捲片式)
|
單張黑白底片
|
《翻拍類》
1.數位相機 2.數位機背
|
《掃描器類》
1.具備光罩之桌上型掃描器 2.專業多用途掃描器
|
(二)各數位化設備功能簡介
1. 掃描器類
(1)桌上型平台式掃描器
此種掃描器為目前市面上最為普遍且單價較低之機型,主要用於一般文件及印刷品等影像掃描,少數含光罩之桌上型平台式掃描器則用來掃描照片或正片,其尺寸最大範圍至A3,若掃描物件大於A3尺寸,則必須進行圖檔影像銜接之後製工作,且書背較厚之物件經掃描後,影像圖檔中書縫間的陰影也必須花更多的時間與技術去克服。且每掃一頁均須重複掀開遮光蓋板,將整本書反轉後依序翻頁以進行掃描動作,而此步驟則需注意掃描物件是否裝訂堅固、紙質狀況良好等。
(2)桌上型自動進紙式掃描器
此種掃描器是將掃描資料放置於自動機械裝置,並由機器依序逐張進行掃描,速度較快,其適宜掃描資料類型包括紙張狀況良好、格式尺寸一致之資料,若為較破舊之古書,則不建議重新拆卸裝訂,以避免花費太多人力、經費及時間,且無法保證書刊是否能恢復原貌。
(3)桌上型無邊縫書籍掃描器
此機型為改良式桌上型掃描器,有一斜邊裝置助於書籍期刊之掃描,可掃描尺寸為A4,但為確保書縫間的影像更為清晰,在掃描過程中難免施予重力以壓平物件,此動作對裝訂老舊之書籍而言,則容易造成書頁脫落的情形。
(4)滾筒掃描器
滾筒掃描器為專業印刷用之掃描器,只針對單頁或單張物件進行掃描,解析度可達4800dpi,但掃描速度較慢,且滾筒捲軸的離心力易對原件造成傷害,因此,目前市面上生產率已不高。
(5)微縮膠卷掃描器
此型掃描器有單頁式或捲片式之機款,是專門為數位化物件為微縮膠卷者所設計,其掃描速度快。
(6)仰面式書籍掃描器
此種掃描器以翻拍的理論設計,將掃描資料面朝上放置,並自機器上方投射光源以攝取掃描物件之影像,掃描尺寸可到A2或A1,進行書籍掃描時,可翻動書頁即可,不至於對原件造成太大傷害,機器並隨附玻璃蓋板,以便將書籍壓平,使書縫間的文字影像更為清晰,掃描速度快。
(7)專業多用途掃描器
此型機器體積較大,兼具翻拍以及傳統掃描之特色,將掃描資料面朝上,並以移動式光源對物件進行掃描,掃描尺寸可到A1,可掃描物件範圍較廣,包含期刊、報紙、書籍、地圖、書畫、紡織品、植物標本、玻璃畫、皮影戲偶、立體物件等,當掃描書籍時,可不需玻璃蓋板而將書縫間的文字影像顯現至清楚可閱讀,掃描速度快。
2. 翻拍類
(1)數位相機
數位相機較適合用來翻拍少量的圖像原件,若物件數量過於龐大時,則並不適宜以此方式進行數位化,因其原始設計並非以大量使用而取勝,若使用頻率過於頻繁,則容易造成相機快門的故障率高。當翻拍較大尺寸之物件時,因焦點聚焦於物件正中心,而四周影像則略為模糊化,此部分的光線處理也較需要專業技術與經驗來控制。
(2)數位機背
數位機背是在傳統的專業單眼相機後方再加掛一個CCD或CMOS感應器,較高階之數位機背可翻拍的尺寸達A1以上,而此款機器也適用於少量翻拍,使用頻率不建議過於頻繁,在光線控制方面也需專業人員操作才能達到較佳數位化品質。
表8、數位化硬體設備樣式
桌上型平台式掃描器 |
具備光罩之桌上型掃描器 |
桌上型自動進紙式掃描器 |
桌上型無邊縫書籍掃描器 |
滾筒掃描器 |
微縮膠卷掃描器 |
仰面式書籍掃描器 |
專業多用途掃描器 |
數位相機 |
數位機背 |
適用性
機型
|
掃描尺寸
|
掃描
速度(A2以上)
|
最高
解析度
|
垂直線是否
變形
|
適合物件
|
大量生產
|
傷害
情形
|
機器
單價
|
---|---|---|---|---|---|---|---|---|
桌上型平台式掃描器
|
A3
|
|
600
|
不會
|
單張
|
可
|
須拆書
、接圖
|
10萬~
20萬
|
桌上型平台式掃描器
|
A4
|
|
600
|
不會
|
單張
|
可
|
須拆書
、接圖
|
3,000~6,000
|
具備光罩之
桌上掃描器
|
A3
|
|
600
|
不會
|
單張
|
可
|
須拆書
、接圖
|
15萬
|
桌上型自動
進紙式掃描器
|
A3
|
|
600
|
不會
|
單張
|
可
|
須拆書
、接圖
|
20萬
|
桌上型無邊縫書籍掃描器
|
A3
|
|
600
|
不會
|
單張
、書籍
|
可
|
書頁容易脫落
|
8~10萬
|
滾筒掃描器
|
A1
|
慢
|
4800
|
不一定
|
單張
|
可
|
離心力
|
100萬
|
微縮膠卷
掃描器
|
|
|
|
不會
|
微縮
膠卷
|
可
|
|
300~
350萬
|
仰面式書籍
掃描器
|
A1
|
一分鐘以內
|
300
|
不會
|
單張
、書籍
|
可
|
光線過熱、紅/紫外線傷書、玻璃壓力
|
450~
600萬
|
專業多用途
掃描器
|
A1
|
一分鐘以內
|
1600
|
不會
|
平面物件、可平放立之體物件
|
可
|
傷害程度較低
|
160~
350萬
|
數位相機
|
視原件大小
|
快
|
|
邊角可能變形
|
不限
|
不可
|
光線過熱、紅/紫外線傷書
|
20~
40萬
|
數位機背
|
視原件大小
|
快
|
|
邊角可能變形
|
不限
|
不可
|
光線過熱、紅/紫外線傷書
|
100~
150萬
|
本文針對全文輸入OCR之需求,特地於數位化設備中加註說明使用OCR軟體等成本考量,下表即為此次研究OCR主要軟體之比較。
軟體型號
|
公司廠牌
|
產出地點
|
軟體價位
|
---|---|---|---|
丹青中英日文文件辨識系統4.5
|
力新國際
|
台灣
|
$6,600
|
蒙恬認識王專業版V3.1
|
蒙恬科技
|
台灣
|
$3,990
|
無發行商業版
|
全景軟體
|
台灣
|
無發行商業版
|
清華TH-OCR2003錄入工廠
|
清華文通
|
大陸
|
$120,000
|
無發行台灣版
|
北京漢王
|
大陸
|
無發行台灣版
|
數位化成本包含設備、人工、維修等,也依照方案不同而有所變動。數位化方案有計畫單位自行數位化及委外廠商進行數位化。本文先以單位自行數位化方案為例說明,因委外方案必須考慮公開招標金額,較前者複雜,故暫不列於此詳述。
(一)數位化成本項目估計
1. 掃描設備成本(租用或採購)
2. 設備操作所需空間及水電:依照租金乘以使用比例
3. 掃描所需人力:所使用人次
=預計掃描總數量/所使用的掃描器每小時可掃描數量/預計完成天數
4. 掃描所需人力時間: 薪資*時間
5. 檢查與重新掃描所需人力:所使用人次
=預計檢查總數量/每小時可檢查數量/預計完成天數
6. 檢查與重新掃描所需時間:薪資*時間
7. 影像相關資訊輸入建檔所需人力:所使用人次
=預計輸入總數量/每小時可輸入數量/預計完成天數
8. 影像相關資訊輸入建檔所需時間:薪資*時間
9. 儲存設備成本估計:總DVD張數或硬碟空間之金額
(一)舉例說明
下列以期刊與報紙為物件進行數位化以計算成本,本文稍略以設備及人工掃描成本為基礎僅供參考,而人員教育訓練時間、評估試掃品質、後製修圖人力及時間、機器故障維修費用等因素,則暫不列入考量。
1. 掃描物件為裝訂式期刊(A4尺寸)
(1)設備成本:桌上型平台式掃描器(A3尺寸)估計為15萬元、電腦設備兩台各3萬元,丹青辨識軟體6,600元,預計攤提時間為三年
(2)人工成本:正職掃描及辨識人員各一人
(一天實際工作六小時,月薪3萬元)
(3)掃描速度:規格為全彩、300dpi;A4尺寸一頁掃描速度為2分鐘(含人工翻頁之時間),則一人一小時可掃描30頁,每月(20個工作天)產出量約為30*6*20=3,600(頁)
(4)平均成本:
設備攤提(150,000+30,000*2+6,600)/3年/12月=6,016元/月
每張成本=(6,016+30,000*2)/3,600=18元/頁
2. 掃描物件為現今發行之報紙(A1尺寸)
(1)設備成本:專業多用途掃描器(A1尺寸)估計為350萬元、電腦設備兩台各3萬元,清華辨識軟體12萬元,預計攤提時間為三年
(2)人工成本:正職掃描及辨識人員各一人
(一天實際工作六小時,月薪3萬元)
(3)掃描速度:規格為全彩、300dpi;報紙A1尺寸(一張2頁)掃描速度為40秒,則一人一小時可掃描3600/40=90張,每月(20個工作天)產出量約為90*6*20=10,800(張)
(4)平均成本:
設備攤提(3500,000+30,000*2+120,000)/3年/12月=102,222
每張成本=(102,222+30,000*2)/10,800=15元/張
每張成本=(102,222+30,000*2)/10,800=15元/張
〈目錄〉
期刊報紙全文輸入工作流程指南 (959.7 KB, 2,374 hits)