本文主要是介紹國家圖書館藏臺灣地區發行期刊、報紙的數位化工作流程。
計畫單位:國家圖書館
計畫名稱:國家圖書館期刊報紙典藏數位化計畫
計畫簡介:
期刊報紙是一般訊息傳遞、研究發展之成果發表最快速的園地,也是記錄當代人文、社會、科技等活動最重要的媒體,讀者使用量極高,但保存不易,使用不便,因此極需數位化予以改善。
國家圖書館(以下簡稱國圖)因根據圖書館法,具有接受國內出版品的法定職責,館藏報刊資料極為豐富。民國七十年起,國圖就已著手規劃中文期刊資訊系統之建置,而「中華民國期刊論文索引及影像系統」自從紙本升級到光碟,以至線上資料庫以來,一直都深受國人的歡迎。
民國九十一年國圖以期刊及報紙館藏參加由國科會主持的國家典藏數位化計畫,預定在五年內進行館藏臺灣地區發行期刊約1,000種、報紙約30種的數位化工作。主要目的在以數位方式保存報刊資料,充實國家圖書館期刊報紙影像資料庫,便利民眾取閱,建立學術文化資產的永久典藏,並期能藉助資訊網路科技的進步,結合數位版權管理以及電子商務機制,提供使用者方便快捷的文獻傳遞服務,達成無牆圖書館的理想。
該計畫九十三年度的工作目標是加強報刊掃描的工作數量,預計進行國圖館藏200種期刊與6種報紙(含微縮片轉製)掃描,共約140萬頁期刊及報紙的全文影像數位化。主要工作項目包括:期刊典藏影像數位化、報紙典藏數位化、期刊篇目後設資料分析建檔等三項作業。<目錄>
該計畫的數位化作業,大致依照下列六項步驟進行,依序分別為:一、數位典藏前置作業;二、後設資料分析與著錄;三、報刊資料數位化,四、數位化資料的儲存與管理;五、智慧財產權管理;六、數位化資料的利用。茲分別介紹如次。
國圖依據圖書館法之規定,典藏國內之出版報刊資料,目前報刊種數已逾一萬餘種,因此館藏藏品在進行數位化作業之前,首先需對預定數位化的藏品內容、範圍、類別、數量、優先順序等作一整體的規劃方案。
有了整體規劃方案之後,再依據當年的經費、人力配備以及儲存設備等條件進行年度計畫的草擬,年度計畫完成後,即可著手進行數位化的前置準備作業,以利工作的順利開展。這些前置作業包括:訂定標準與規範、選擇數位化物件、確定數位化格式、建立工作程序、確立施作方式等。
(一)規劃年度計畫
數位物件為國圖館藏的期刊及報紙,因此在年度計畫規劃中要考慮的因素,除了當年的經費預算及人力配備外,還要對館藏藏品的狀況詳加考量,例如:期刊報紙的館藏數量、保存狀況、破損狀況、紙質、印刷品質、原件尺寸、複本數量、缺期缺頁狀況以及裝訂方式等,另外,部分藏品除原件外,另有微捲形式的藏品,以原件直接進行數位化,或是以微捲進行數位影像轉製,也是必須考量的項目。由於國圖藏品平日仍需提供到館讀者的調閱,因此,如何將藏品分批進行數位化,以減少讀者無法調閱館藏的不便,也是考慮要素之一。
根據上列因素詳加研擬之後的年度計畫,應明確提列年度擬進行的藏品、範圍、項目、方式以及預定數量,如此計畫方能順利執行。
(二)訂定標準與規範
年度計畫確定之後,即可展開各項前置作業。首先,必須訂定嚴謹明確的標準與規範,以便作業過程中有所依據,是絕不可省略的工作。
國圖為進行報刊數位化的相關計畫,特邀請館外圖書資訊界專家,協同館內各組同仁(特藏組、資訊組、參考組、政府出版品部門),成立「文獻分析機讀格式計畫小組」,共同修訂期刊文獻資源建檔之後設資料格式;另外並參與館內之「自動化及網路諮詢委員會」、「中國機讀編目格式計畫小組會議」、「後設資料(Metadata)」格式標準研訂小組會議」、「資料數位化標準研訂小組會議」、「分散檢索標準研訂小組會議」等多項會議,共同訂定數位化作業的相關標準與規範。
至於有關期刊篇目的主題類別與主題詞、關鍵詞等的選用與著錄,則直接採用圖書資訊界向來沿用之「中國圖書分類表」及「中文圖書標題表」等規範工具。
另外,由於報刊係屬連續發行的出版品形式,進行數位化時,出版日期、卷期以及頁碼的編碼方式,也必須明確定訂規則,以免日後連結後設資料時產生問題。因此,國圖同仁特針對期刊以及報紙的卷期特性,訂定編碼原則各一份,作為數位影像檔案編碼的依據。
國圖訂定的標準與規範是本計畫數位化作業人員在執行時所遵循的準繩,可以幫助各項作業有所依據,各項規範包括:
1. 後設資料(Metadata):文獻分析機讀格式(圖一)。
圖一、文獻分析機讀格式
2. 產出規格
(1)掃描影像檔:TIFF檔。
(2)影像製作規格:300dpi、G4壓縮、黑白。在原稿清楚的前提下,影像掃描品質力求清晰,內容完整。部分藝術類雜誌掃描成全彩影像,早期報紙掃描成灰階影像。
(3)微縮捲片:35mm。
3. 作業規範
(1) 資料數位化標準—檔案數位化與命名原則(圖二)。
圖二、國圖訂定的各式數位化規範及標準
(2)國家圖書館期刊影像編碼原則(圖三)。
圖三、國家圖書館期刊影像編碼原則
(3)國家圖書館報紙影像編碼原則(圖四)。
(4)分類規範工具(圖五)。
A.中國圖書分類法 (試用本)(台北市:國立中央圖書館,民68)
B.中國圖書分類法(增訂八版)(台北市:文華圖書館管理資訊公司,民92,第八版)
(5)主題詞規範工具(圖五)。
A.中文圖書標題表(台北市:國立中央圖書館,民84)
B.中文主題詞表。人文社會科學類(台北市:國家圖書館,民92)
圖五、分類及主題詞規範工具
(三)選擇數位化物件
確立檔案格式之後,即可進行選擇數位化物件的作業,由於館藏期刊甚多,數位化之優先次序為:1.收錄於國圖「中華民國期刊論文索引及影像系統」之學術性刊物;2.民國五十年以前發行之台灣地區出版品;3.館藏無複本者;4. 使用量大且破損嚴重;5.絕版而難以購得者。
至於報紙方面,則因使用量極大,且紙質脆弱,應即時進行數位化,是以,自民九十年起,決定將館藏台灣地區發行中英文報紙約30種,全部皆進行數位化,惟近來已有多家國內報社皆已開始發售其報紙光碟,因此,本館數位化的報紙種數則不與業界商品重複為原則,凡能價購者,皆不進行數位掃描,以節省資源。
(四)確立檔案格式
為能提供數位物件的檢索,國圖決定採用「文獻分析機讀格式」(台北市:國家圖書館,民92年)作為期刊篇目文獻的後設資料建檔依據,至於報紙部分,因市面上已有報紙標題資料庫,因此國圖決定不進行報紙的後設資料建檔。
另外,依據媒體資料的不同,所制定的檔案格式亦不同,本計畫的數位物件既是期刊及報紙,屬於文獻類藏品,首要要求為文獻內容的清晰可讀以及永久典藏,因此,國圖依據「資料數位化與命名原則」(台北市:國家圖書館,民92年)之建議規格,決定採用文字檔及影像檔資料永久保存格式進行數位化,至於網路下載以及預覽影像規格,則因限於經費,不擬進行。(參閱表1:數位化檔案格式)
表1、數位化檔案格式
(五)建立工作程序
國圖期刊之數位化採「期刊篇目文獻後設資料之分析與著錄」與「報刊資料的數位化掃描作業」兩部分分別進行,其相關工作流程請參考圖六:
圖六、報刊資料數位化影像掃描流程圖
(六)決定施作方式
在確定當年的數位化計畫後,緊接著則可依據工作內容項目,逐一檢視每一項目的施作方式,確定是自行製作或委外作業。以近幾年狀況而言,若經費足夠,通常會採委外作業招商。當然,若決定採委外招商,則需著手訂定報刊數位化影像掃描作業招標規範(圖七)。
在委外作業的招標規範中,除了需明確提列數位化物件項目、數量、工作地點、工作期間之外,亦需提供明確的數位化作業規範、作業程序、品質檢驗規範等,務使承包廠商確實據以遵行。<目錄>
圖七、國圖數位化作業委外招商合約書
(一)準備資料庫建檔系統
準備一套可以處理期刊文獻後設資料的資料庫系統是一件重要的工作,國圖早年即已著手進行期刊論文索引資料的建檔工作,因此特委託業者開發建置一套後設資料建檔系統,該計畫的期刊篇目文獻後設資料亦在同一資料庫內持續進行。
(二)確定資料庫收錄範圍
1.確認收錄對象及範疇
國圖期刊館藏收藏甚豐,無法負荷將全數刊物篇目予以分析建檔,因此,特從收錄的刊物中,挑選台灣地區出版發行、內容具學術性質者,進行分析著錄,收錄期刊中不包括一般消息報導及活動性質者。中華民國期刊論文索引資料庫內總收錄約有3,000餘種刊物,目前仍持續出版發行者約有1,000餘種。新創刊物之收錄係由國圖期刊選編小組同仁負責(圖八)。
2.挑選收錄之篇目
收錄之新刊物經確定後,為求時效,通常於刊物發行並寄達該館,並登錄處理後,交由期刊論文索引主編同仁進行各卷期收錄篇目之挑選,經收錄後,則需在資料庫系統建立書刊的基本資料,新到卷期登錄註記,若有拖期嚴重者,亦需進行書刊催缺。另外,對於設有網站之刊物,國圖亦予以註記,並作連結,以提供使用者服務(圖九)。
3.後設資料分析、建檔及審校
之後接著進行後設資料建立的步驟。凡經決定收錄的期刊篇章,都依據「文獻分析機讀格式」、「中國圖書分類法」及「中文圖書標題表」等規範工具,針對各篇章進行分析與著錄,著錄項目包含:篇名、著者、刊名、卷期、出版年月、起迄頁次、類別、關鍵詞等(圖十至圖十四)。
建檔工作完成後,需交付國圖同仁進行審核及校正,經總校完畢的後設資料,即可收錄於「中華民國期刊論文索引及影像系統」,並於隔日系統更新索引後,隨即提供使用者線上查詢(圖十五)。
本項工作國圖限於人力,部分作業(如:後設資料之欄位分析、分類、建檔等項目)係採委外招商駐館服務處理,國圖同仁則負責審核及總校正工作。<目錄>
圖八、選編收錄期刊
圖九、選編期刊篇目
圖十、參考類表及標題表
圖十一、訂定期刊篇目分類號與標題
圖十二、期刊篇目之註明標籤
圖十三、期刊篇目之分類註記
圖十四、輸入期刊篇目
圖十五、審核校正後設資料
依照國圖年度數位掃描規劃,分期展開館藏期刊及報紙的數位化作業。本項工作,國圖係採委外招商進行。承包廠商需依照國圖制定之招標規範,逐一完成委託項目。
本項作業依照工作流程順序,包括以下幾個步驟:取件、製作掃描清單、送件、資料整理、進行掃描、品質檢驗、數位成果產出、資料驗收、影像儲存以及索引更新等。玆簡要說明如下:
(一) 取件
1.架上調書
國圖工作人員依據年度計畫中擬定的工作項目,擬製「待掃描期刊清單」,並從國圖期刊書庫書架上直接調出欲進行掃描數位化作業的期刊、報紙或微縮片(圖十六、圖十七)。
2.複本徵集與補缺
取件的同時,應對館藏狀況進行註記,基本上數位化的刊期,以不影響到館讀者調閱為原則,因此,數位化物件盡量以有複本者優先。若發現期刊缺期或沒有複本者,應隨即註記,以便通知館內採訪同仁再作徵補或催缺;若該刊物卷期已絕版或無法取得,則應與他館進行館際合作,盡可能在數位化執行期間取得該件期刊或報紙。
3.核對「已移送/已掃描目錄」
自書架上取件後,接著應核對「已移送/已掃描目錄」,以確認該卷期是否已經數位化,若已經處理則隨即歸架,若確認尚未移送者,即可準備移送數位化,並在書架中加註「XX刊物X卷X期移送掃描中」之標記(圖十八)。
圖十六、年度計畫中的待掃描物件清單
圖十七、依據清單取件
圖十八、在架上註明送交掃描期刊
(二)製作移送掃描清單
準備移送數位化的物件,應建立移送掃描清單,清單中應載明以下各項目:系統識別號、刊名、卷期、出版日期等。為避免錯誤,應再核對「中華民國期刊論文索引資料庫」中之卷期、出版日期、系統識別號等項目。務求紀錄與系統一致,避免日後與後設資料連結時的錯誤。
為不影響到館讀者之借閱,數位化掃描期刊一般分成:批次輪轉式送掃(可送館外處理)、每週平台送掃、每日平台送掃等多種不同週期類別。除批次輪轉式外,平台掃描大都須於館內進行。以平台處理者多為館藏無複本或藏品較為珍貴不宜批次移送館外處理的刊物。
清單項目經核對無誤後,即可依據不同週期類別製作各種「移送掃描清單」(圖十九)。
圖十九、依據掃描週期類別製作移送掃描清單
(三)送件
根據之前完成正確無誤之「移送掃描清單」,由期刊或報紙負責同仁將該清單及物件並同移送委外廠商,準備進行影像掃描數位化作業。
(四)資料整理
委外廠商於接獲移送掃描清單及數位化物件後,應派員赴國圖先進行移送數位掃描期刊資料整理的工作,工作內容包括:核對刊名、卷期、頁數、逐頁檢查有否缺頁、髒污或頁碼異常等,嚴重異常狀況(如嚴重缺頁)應即時通報國圖同仁處理(圖二十)。
報刊資料檢查完畢後,即可分批打包裝箱,準備進行館內或移送館外的數位掃描工作。
另外,若有書冊過厚的報刊,國圖同仁會先行註記「可裁切」或「可拆裝訂」字樣,承包廠商工作人員可以在館內進行書冊裁切或裝訂拆解,以便進行掃描(圖二十一至圖二十三)。
圖二十、依據送交清單檢查期刊並註明頁數
圖二十一、去釘
圖二十二、手動裁切過厚期刊
圖二十三、裁切器裁切過厚部分
(五)進行掃描
此項作業由委外廠商工作人員依照招標規範與契約書之工作項目、作業規範與作業程序在館內或館外進行數位掃描(圖二十四、圖二十五)。
圖二十四、平台式掃描設備
圖二十五、平台式掃描
(六)報紙微縮片轉製
國圖早期報紙因都已拍攝微捲,因此部分報紙的數位化作業,係以微縮捲片直接進行數位影像轉製。此項作業亦採委外招商處理,承包商應依照招標規範與契約書之工作項目、作業規範與作業程序進行掃描數位化(圖二十六)。
微縮片轉製數位影像的工作流程,與一般原件直接掃描相同。
圖二十六、報紙微縮片轉製數位影像
(七)品質檢驗
國圖依據招標規範與契約書要求,進行品質檢驗。委外廠商於影像數位化後,應隨即進行影像檔的品質校正,逐頁檢查掃描後的文件是否有太濃、太淡、黑邊污點、歪斜或是影像內容不清楚等情形發生。若檢驗出品質不佳的數位影像檔,則須進行修改至合乎品質規格要求(圖二十七、圖二十八)。
圖二十七、影像校正(修正前)
圖二十八、影像校正(修正後)
(八)數位成果產出
委外廠商將經過品質檢驗的數位化影像檔案,以數位光碟片(DVD)至少二套,連同各式「掃描清單」,交付國圖申請辦理資料驗收(圖二十九)。
圖二十九、數位成果產出
(九)資料驗收
本項工作由國圖工作人員按月以整批檢驗或抽驗等方式,依據「期刊影像掃描檔案編碼原則」、「報紙影像編碼原則」、「期刊影像掃描暨報紙微縮資料轉製影像規格」、「掃描期刊回復裝訂規格」等,併同廠商交付之各式交付清單及掃描期刊問題整理紀錄單,配合合約之規格以及項目,對委外廠商製作完成之數位成品,進行影像品質之驗收工作。所製作之光碟片與微縮捲片若有品質不佳或編碼錯誤等情形發生,皆依招標規範及契約書處理。
(十)影像儲存
本項作業係由國圖同仁於該館進行。將通過驗收之光碟片等數位成果,逐片轉入影像資料庫。待所有的成果皆完成驗收點交後,光碟片可以準備移交資訊組予以典藏,目前典藏設備為光碟櫃,為便於提供服務,已另行購置影像伺服器儲存數位化成果,並複製一套儲存於和平東路科技大樓國圖資訊圖書館,以達異地備援之目的。
(十一)影像連結查核與索引檔更新
影像資料轉入系統後,經由系統定期自動更新影像索引檔,並與後設資料進行連結註記該篇文獻「 」(已掃描),以上步驟執行完畢後,即可提供使用者線上利用(圖三十)。<目錄>
圖三十一、磁碟陣列
圖三十二、光碟櫃
本項作業係將已完成的數位化成品,進行使用權限的管理,以便提供各種不同的應用。依據著作權法的規定,國圖因是典藏單位,並非期刊文獻的著作權利人,因此,數位化成果,僅能提供典藏之用,若欲提供網路服務的加值與利用,則須獲得著作權利人的授權同意才能進行。
目前該計畫之期刊篇目文獻,凡已獲得授權同意者,將註記於該館的數位版權管理系統,授權許可分有償及無償授權兩種,分別以「無償」及「有償」兩種代號作為提示,凡已取得授權同意者,使用者可以在網路上瀏覽或列印該篇文獻。若尚未取得授權者,則仍無法提供線上服務。目前國圖正積極推動爭取著作權利人授權的相關計畫(圖三十三)。
另有關數位成品的加密保護處理,國圖雖尚未進行,但在提供線上服務時,係以特別設計的瀏覽軟體進行相關保護及管制,目前成效良好。<目錄>
圖三十三、系統呈現授權標示
該計畫之數位成果已全部轉入國圖相關系統中提供服務,其中「中華民國期刊論文索引及影像系統」之營運,係由國圖以委外經營方式,併同館內其他幾項重要資料庫,推出「遠距圖書服務系統」供國人使用。該系統結合電子商務,提供期刊論文索引資料庫以及期刊文獻全文影像,可提供未能到館讀者線上檢索以及文獻傳遞申請服務,甚獲使用者好評(圖三十四至圖三十六)。
目前該計畫數位成果分別呈現於以下三種資料庫,歡迎各界多多利用:<目錄>
(一)期刊影像資料庫檢索與應用:http://readopac.ncl.edu.tw/periodical/hypage.cgi
圖三十四、期刊影像資料庫檢索與應用
(二)報紙影像資料庫檢索與應用:http://192.192.58.101/cgi/ncl9/m_ncl9_news
圖三十五、報紙影像資料庫檢索與應用
(三)遠距圖書服務系統檢索與應用:http://readopac.ncl.edu.tw/
圖三十六、遠距圖書服務系統檢索與應用
※製作單位:數位典藏國家型科技計畫 內容發展分項計畫
國家圖書館期刊報紙典藏數位化計畫
※文字撰寫:國家圖書館期刊報紙典藏數位化計畫 編輯 林淑芬
※圖片拍攝:數位典藏國家型科技計畫 內容發展分項計畫
新聞主題小組助理 汪怡慧、陳美智
※圖文編輯:數位典藏國家型科技計畫 內容發展分項計畫
新聞主題小組助理 汪怡慧、曾欣怡、呂俊毅
致謝:
感謝國家圖書館「期刊報紙典藏數位化計劃」之計畫主持人 俞小明主
任、聯絡人林淑芬編輯撥冗指導及提供實地拍攝與簡介編寫。並感謝國家圖書
評分:
Loading ...