日治時期臺灣農業史料數位典藏計畫–第一期卒業報文數位化工作流程簡介
Tags: Metadata, 影像, 掃描, 數位內容, 數位典藏, 數位化, 數位化工作流程, 數位學習, 檔案, 資料庫, 資訊 發表: 2010-03-01, 點閱: 5,023 , 加入收藏櫃 , 列印 , 轉寄
計畫單位:國立中興大學 圖書資訊學研究所
計畫名稱:日治時期臺灣農業史料數位典藏計畫 - 第一期卒業報文
中興大學成立歷史悠久,在日治時期大正八年(1919),臺灣總督府為開發臺灣農林資源,培養農林人才,設立「農林專門學校」,即為本校前身。昭和三年 (1928)總督府在臺北高等農林學校校址設立「臺北帝國大學」,同時將本校前身併入,改制為「臺北帝國大學附屬農林專門部」。
民國九十四至九十五年配合圖書館新館落成,中興大學圖書館積極執行日治時期農林類資料之整理工作,陸續整理出<卒業報文>、<臺灣農業資料>。其中<卒業報文> 為當時學生所寫畢業論文,主要以臺灣農業主題為研究中心,其主要涵蓋範圍有臺灣植生、土壤、運輸技術、市場調查等,研究領域範圍甚廣,型態為「全手抄本」,這批獨特的珍貴資料,將當時重要研究文獻加以保存,均為研究日治時期農業變遷之重要學術資源,但因資料年代久遠、紙質脆弱,調閱使用易造成損壞,對資料的保存造成極大的影響。
因此,中興大學圖書館希望透過參與國科會「數位典藏國家型科技計畫」,達到文化保存及推廣教育利用目的,第一期擬將<卒業報文>進行數位化影像典藏, 並為資料逐一建立標準化可交換之「後設資料」(Metadata),建置館藏臺灣農業文獻史料資料庫,使該批深具臺灣農業文化特色之資料,能以資訊及網路 化方式即時供大眾查詢使用,支援相關學術之研究,使國家文化資產得以供全民共享。
|
日治時期臺灣農業史料數位典藏計畫 - 第一期卒業報文
數位化工作流程圖
日治時期臺灣農業史料數位典藏計畫 - 第一期卒業報文之數位化工作流程說明:
中興大學圖書館擬完成館藏臺灣農業史料數位化與後設資料建檔工作。過程中首先進行資料清點與整理,再經由影像掃描,以及目次及書目資料後設資料的建置,整合成全文影像資料庫,架設於網路上提供給研究學者線上檢索與瀏覽使用。
第一期計畫除了先將臺灣日治時期卒業報文數位化外,未來將持續增加資料內涵,繼續將館藏其他臺灣農業史料進行數位化與建檔,另亦將積極與國內外臺灣農業文獻的收藏單位進行合作,補徵館藏所缺漏的重要臺灣農業史料與文獻,並進行合作數位化的工作。期許將臺灣之各種農業資料庫與中興大學圖書館臺灣農業史料結合,共同建立一實體與虛擬資源的認識臺灣農業知識地圖。此工作不僅可滿足資料利用者之需要,同時也發揮典藏單位善盡保存、整理及推廣利用的職責,發揮其在學術研究及保存 文化資產之價值,加速臺灣農業歷史之學術研究及推廣應用,促進我國產業、經濟、人文與社會的發展。
日治時期臺灣農業史料數位典藏計畫 - 第一期卒業報文計畫依據資料的重要性與獨特性,優先自臺北帝國大學附屬農林專門部卒業報文673冊中挑選出具農林史料性質102冊進行數位化工作。亦即中興大學圖書館所藏日治時期農學、林學及農藝化學之日文及少數西文之文獻,共計673冊。其完成期間以民國13年(日本大正13年,1924)至民國33年(日本昭和19年,1944)為主。
此批卒業報文(圖一)以手寫本為主,內文涵蓋1,480張圖表、照片627張、地圖3張及契約書9張等珍貴附件。日治時期臺灣農業史料數位典藏計畫 - 第一期卒業報文計畫延攬具備文史學領域之學者專家,針對此批卒業報文評選出對臺灣農林業發展史極具重要性資料共102冊為第一期數位化內容。該批農林史料內容珍貴,不僅能提供日治時期臺灣歷史整體發展見證參考,研究學者更能藉由該批資料,了解當時政治、經濟、社會的變遷,極具研究價值。然資料年代多為五十至百年之久,大多紙質泛黃、污損且脆弱,其中不 乏有蟲蛀之情形,為避免持續劣化,導致珍貴文化史料損毀,透過數位化技術有效保存與維護,實有迫切之需要。
圖一、挑選藏品,準備進行數位化。(示範者:李純芬) |
在計畫進行初期,針對整體作業的程序與規則,擬定工作規範並製作標準流程手冊,以便於工作人員遵行。這些規範包括訂定後設資料格式、製作後設資料建檔說明、 主題標目規範選定、制定檔案命名規範、影像數位化規格與標準作業流程、索引作業規範、檢索系統的設計、檢索欄位設計、全文影像製作規範等。此外對於計畫中 所需的資料與人力支援,先行評估統籌,並規劃工作項目與時程分配。
(一)後設資料規劃建置:
尤其在後設資料的建置上,以Dublin Core為建置標準,訂定符合國際標準之後設資料欄位及說明,並制訂書面的建檔工作規範,詳細說明各個欄位的意義以及填寫方法。為便利使用者瀏覽農業珍貴史料,日治時期臺灣農業史料數位典藏計畫 - 第一期卒業報文計畫更新增農業主題詞表建置工作,邀集圖書資訊界及學界專家學者參與建置主題詞表,並參考各種關鍵詞庫、專科詞典、主題詞表等,包括《中文圖書分類表》2007年版農學類目、《農業科技文獻索引》2006年版及《中文主題詞表》農學主題詞,完整呈現農學領域知識架構,以便研究學者以主題瀏覽方式,一窺臺灣農業史料。
(二)制定掃描作業標準與工作規範:
參酌「數位典藏計畫」參與單位經驗,訂定檔案命名原則、大圖掃描規範、影像掃描及校驗等工作規範與流程說明。制訂影像數位化規格及檔案命名原則,詳細建立各種特殊情形(如浮貼、大圖分區掃瞄、附件等) 的檔案訂定方式,並建立影像掃描的標準化作業流程。
資料在進行數位化工作之前,需針對數位化藏品進行書況檢查、頁碼編寫、統計附件數量及大小(包括照片、地圖、浮貼紙及摺頁圖表等)等前置作業,以便瞭解並確實掌握數位化資料現況,並建立數位化清單,印製詳細掃描清冊,作為影像數位化工作之基礎。
圖二:計畫人員進行頁碼編寫。(示範者:林莉娜)
|
圖三:將藏品狀況、附件數量及大小,填寫於數位化清單紀錄表。(示範者:林莉娜)
|
日治時期臺灣農業史料數位典藏計畫 - 第一期卒業報文計畫參考相關文獻及其它單位數位典藏建置經驗,規劃影像掃描規格及掃描工作規範,自行進行藏品掃描、校驗及數位品質管理。依據所制訂之影像掃描作業流程等規範,進行藏品掃描與後製工作。影像掃描採彩色掃描方式進行數位化,以維持原件的風貌。掃描規格更以全彩、光學解析度300dpi(含)以上,壓縮比 1 : 1 成 TIFF格式影像檔供永久保存,並再轉換成網路瀏覽下載(PDF)及預覽(JPEG) 格式之影像檔案,供不同目的之利用。中興大學圖書館並另設立專屬數位典藏工作室,以大型A1平床式掃描器進行掃描。
圖四:掃描器掃描。(示範者:張依詩)
|
圖五:採用平台式掃描器,使古籍平置於掃描器上。(示範者:張依詩)
|
掃描作業規範:
1. 圖書取用注意事項
(1)飲料應置於工作台,請勿在掃描器前飲食。
(2)翻閱書籍時,小心紙質脆弱,避免撕破、缺角的情形發生。
2. 掃描前準備事項
(1)掃描時必須清除資料原件及襯紙上的非資訊物件如頭髮、碎屑等。並利用擦拭紙及刷具去除玻璃蓋及掃描台雜物。
(2)將硬版白色襯底置於掃描圖書之底層,將書本置於預設之框線內。
(3)請將手錶等首飾先行取下,並帶上手套。
(4)掃描前確認掃描軟體設定,參見掃描軟體設定流程
(5)加強平整襯底以襯紙為第一層。
(6)特殊狀況之資料,與館員討論後再處理。
3. 影像製作規格
(1)使用全彩(24 bits per pixel 或以上)/RGB 光學解析度 400 dpi (含)以上進行掃描,並以 TIFF(Tag Image File Format)無壓縮之標準格式儲存。
(2)以一比一之比例掃描儲存。
(3)尺寸:掃描資料尺寸若大於A1,需分區掃描,參見大圖掃描規範。
(4)解析度:
4-1. 文字資料:以全彩400dpi 為原則
4-2. 照片、手繪圖、大型圖表(大於書本大小)、字跡不清:以全彩600dpi 為原則。
(5)特殊編碼狀況處理
5-1. 浮貼:浮貼文件(指浮貼頁下有文字內容)編碼時需注意,浮貼頁不掀開為第一頁,掀起(多張則全部掀起)為次頁,浮貼紙為摺頁且掀開內含文字時編碼為次頁,依次掃描編碼。
5-2. 空白頁:遇空白頁(整頁空白)略過不掃描直接跳至後面內容。
4. 資料掃描原則
(1)掃描完成之數位化影像歪斜度應小於5 度。
(2)掃描時須掃入書本上下左右邊3 公分(預設框線內)。
(3)掃描頁面須保持端正,不可歪斜;如遇調整無法端正時,適度調整書本角度,請勿重壓書本,以維持圖籍之原貌為原則,不須將歪斜影像,利用軟體矯正。
(4)掃描資料時,原則上書本固定於預設框線,除非原件頁面歪斜,皆應呈現方正之頁面。
(5)資料原件上的縐褶和折角,請在不傷害原件的情況下,儘量攤平後再進行掃描,大於書本之摺頁或不平整處以多張紙張襯底(第一層以牛皮紙為主)。以下情形為例外:
5-1. 攤平後會影響閱讀原件內容時,則不攤開折角維持原狀掃描即可。
5-2. 原件紙質特殊,折角無法完全攤平。
(6)分區掃描之資料,於接縫邊保留10 公分,再接圖。
(7)大尺寸文件:超過A1 大小的文件,須以分區掃描和接圖方式處理。(參見大圖掃描規範)
(8)浮貼
8-1.單張浮貼:需掃2 頁,先掃1 頁有浮貼,再掃1 頁掀開浮貼的影像,依掃描先後編碼。
8-2.多張浮貼:若一頁內有2 份以上的浮貼,先掃1 頁有浮貼,再將所有浮貼翻開掃1 頁沒浮貼的影像檔。
8-3.浮貼為摺頁(超過書本大小):先掃1 頁有浮貼,再將所有浮貼翻開掃1 頁沒浮貼的影像檔,再將摺頁翻開掃描。
(9)內文半透明時(如大型地圖及正文,透明程度會看到下一頁的字),須加襯底再掃描。
(10)大於書本頁面摺頁需以紙版襯底。
大圖掃描規範:
1. 大圖:大於A2(42.1×59.4cm)尺寸的文件
2. 影像規格:
(1)全彩(24 bits per pixel 或以上)
(2)300 或600dpi(見掃校系統的註記)
(3)一比一之比例進行掃描
(4) 以 TIFF(Tag Image File Format)無壓縮之標準格式儲存
3. 掃描方式:視文件大小分數區掃描,各區間重覆之區域至少2 公分,以利後續接圖作業;影像檔經校驗無誤之後,再接成原圖。
4. 分區原則和分區影像檔命名方式如下
(1)長或寬大於A2由上至下或由右至左,分掃成2 頁或數頁,並依序給予分區編號“_t01”、“_t02”…;分區影像檔檔名為原影像檔檔名後加上分區編號。
(2)長或寬兩邊皆超過A2 尺寸依大小分掃成4、6 或9 張,掃描順序為由上至下、由右至左。分區編號依順序給予“t01”、“t02”……,其後依此類推。分區影像檔檔名為原影像檔檔名後加上分區編號。
圖七、大圖掃描中(示範者:張依詩)
|
待影像掃描後,計畫人員依據所制訂之影像校驗工作規範,進行影像檔二校、三校、四校等作業流程,並將影像降階轉檔為75dpi 、150dpi 、300dpi等JPG格式影像檔,以利檢索利用及影像檔上傳磁碟陣列與光碟備份。待全部數位化影像檔確認無誤後,進行DVD光碟備份作業。
影像校驗工作規範:
影像掃描完畢後,需確實校驗,以確保掃描影像品質,其步驟及要求如下:
1. 檔案點收、歸還與紀錄
(1)進行校驗前,無論提調或歸還檔案,皆須填寫「特藏資料調閱工作紀錄表」。
(2)每日掃描作業結束,皆須填寫「校驗執行進度表」、「掃描暨後製作業工作執行表」及「校驗工作紀錄表」。
(3)每週一進行補掃或重掃影像校驗作業。
2. 第一次校驗
(1)影像裁切階段1-1影像裁切以沿頁緣裁切為原則。
1-2照片裁切依照片頁緣裁切為原則(圖說不需裁切)。
1-3地圖裁切以沿頁緣裁切為原則。
(2)頁面歪斜校正階段以上下頁緣為基準線判斷,歪斜度不得超過1 度。
(3)影像裁切與頁面歪斜校正階段需另校驗3-1檢查檔案是否可直接開啟(壞檔)。
3-2檢查是否有重複、(漏頁)、摺頁及皺摺(不平整)。
3-3確認影像的完整性(掃描不全)。
3-4確認是否有雜訊或模糊不清(模糊)。
3-5確認頁面是否歪斜,如原件歪斜則正常(頁面歪斜)。
(4)檔案命名與校驗階段
4-1依檔案命名原則命名。
4-2檢查影像檔案大小、解析度、檔案格式與色彩模式。
4-3以小圖一覽方式查驗,確認影像亮度與色差是否不一致。
3. 第二次校驗影像不符合第一次校驗原則者,即退回重掃或補掃,並於工作紀錄表註記重掃原因。重掃後之影像由原校者重新進行第二次校驗,若再不符合者,再退回重掃,以此類推。
4. 第三次校驗第二次校驗無誤後,再由校驗者針對檔案名稱及全部項目校驗。
圖八:計畫人員進行影像檔裁切、頁面歪斜校正及檔案名稱命名 (示範者:蘇昭樺)
|
圖九:計畫人員進行校驗及將校驗有誤情況,填寫校驗工作紀錄表(示範者:石如君)
|
圖十:計畫人員待全部數位化影像檔確認無誤後,進行DVD光碟備份作業。(示範者:唐子凡)
|
圖十一:燒錄完成的備份光碟,另外進行光碟封面列印,供存放區分。(示範者:唐子凡)
|
將校驗後影像檔,依藏品之目次章節轉製PDF格式,以便影像呈現與瀏覽。轉製PDF格式,需逐一比對目次、章節、頁碼,以呈現最佳化瀏覽模式。使用PDF reader瀏覽模式因具備如下優點,可以提供閱讀者最佳化瀏覽模式:
1. 預先進行PDF檔案中章節及段落編制,即可透過單一檔案呈現整本書籍的完整結構。
2. PDF閱讀器內的瀏覽功能較為完備,可以進行如縮放、調整、無限放大、列印、輔助註解工具等功能。
圖十二:PDF及目次對應表。(示範者:石如君)
|
圖十三:依藏品之目次章節轉製PDF格式。(示範者:石如君)
|
為達到跨機構整合、交換,及未來與國際接軌的目標,日治時期臺灣農業史料數位典藏計畫 - 第一期卒業報文計畫參酌「數位典藏計畫」參與單位經驗,以Dublin Core為建置標準,制訂書面的建檔工作規範,以使建檔人員建立一致性、正確性及標準化的後設資料,促使資料庫透過欄位的設計充分發揮檢索效益。計畫人員依據所制訂之後設資料著錄項目及工作規範,進行藏品內容分析,包括撰擬中文摘要、關鍵字選取、目次建檔及主題詞著錄等,並針對所完成之後設資料進行校正工作。
圖十四:計畫人員進行藏品內容分析。(示範者: 鄭如婷)
|
日治時期臺灣農業史料數位典藏計畫 - 第一期卒業報文計畫資料庫系統乃委外廠商建置,將影像資料與已建置之影像Metadata後設資料庫整合,建構全文影像資料庫。透過無遠弗屆的網站功能,將數位化之成果正確、快速且完整地提供檢索及瀏覽利用。
圖十五:檢索畫面
|
圖十六:全文影像範例(卒業報文)
|
※ 製作單位:數位典藏與數位學習國家型科技計畫
拓展臺灣數位典藏計畫 數位內容建置與整合子計畫
日治時期臺灣農業史料數位典藏計畫 - 第一期卒業報文計畫
※ 文字撰寫:拓展臺灣數位典藏計畫 數位內容建置與整合子計畫
─ 文獻與檔案主題小組助理 陳美智
日治時期臺灣農業史料數位典藏計畫 - 第一期卒業報文計畫
─ 王春香、王欣愉
※ 圖片拍攝:拓展臺灣數位典藏計畫 數位內容建置與整合子計畫
─ 文獻與檔案主題小組助理 陳美智、陳秀華
※ 圖片提供:日治時期臺灣農業史料數位典藏計畫 - 第一期卒業報文計畫
※ 圖文編輯:拓展臺灣數位典藏計畫 數位內容建置與整合子計畫
─ 文獻與檔案主題小組助理 陳美智
致謝:
感謝國立中興大學圖書館 日治時期臺灣農業史料數位典藏計畫 - 第一期卒業報文計畫主持人詹麗萍老師、黃俊升組長、
王春香編審與王欣愉小姐,撥冗指導及提供實地拍攝與簡介編寫。並感謝國立中興大學圖書館其餘相關人員之協助。
全文下載 (1.1 MB, 1,493 hits)