- 拓展台灣數位典藏 - http://content.teldap.tw/index -

Posted By 徐 千禾 On 十月 19, 2009 @ 4:08 pm In 數位化書籍 | No Comments

  

 

壹、 引

 

 

一、緣起

 

綜觀人類文明的演進,人類的生活隨不同環境展現出多元化的改革,將智慧著眼於發展出能增進生活的各種方式。十五世紀德國商人古騰堡(Johannes Gutenberg, 1397-1468)以活字印刷圖書,由於不再由人工抄寫,且能大量印製,將圖書價格降到原本的1/400,也因此當時的一般農民才有看書的機會,同時也造成知識的流通。[9] [1]二十世紀初期公共圖書館的運動,有效的散布公共文學以及文化遺產,因此由Micheal Hart帶領的古騰堡計畫(Project Gutenberg),於1971年由自願者參與將圖書數位化,超過22000種書籍,主要收錄西方傳統文學作品外,食譜、書目、期刊、樂譜等版權過其資源,當時規定作品都是免費的,任何人都可以自由取用與散布,倘若修改其內容或格式,則不可使用古騰堡計畫之名,此為最早數位化計畫的開始。[10] [2]二十一世紀是一個網際網路科技突破的年代,在資訊便利的環境下,知識的取得模式,不僅打破了原有的空間限制,更建構出有利於知識交流的溝通平台。

 

清康熙乾隆四十九年(西元1784年),中國歷史上最大規模的一套圖書集成《四庫全書》編纂完成,總計高達三千六百多位文人學者參與,其中繕寫人員更不計其數,其中收錄眾多中國重要典籍,為後世學者留下一份珍貴的研究紀錄。經過兩百多年後,1998年由香港迪志文化出版有限公司與上海人民出版社、香港中文大學合作,出版[11] 電子版的文淵閣本《四庫全書》,利用光學字元辨識技術 (Optical character recognition ;OCR)將超過四百七十多萬頁的原文圖像(約八億漢字),以掃描方式儲存於光碟中,是當時較大型的數位出版工程,提供包含標題及全文等兩種光碟版的檢索方式,數位化後的《四庫全書》資料庫,輔以資訊科技的檢索技術,提供便利的搜尋檢索功能,進而將知識再轉化,融入生活中。

 

迄網路泡沫化後的2004年夏天,Google開始提供一項名為Google Print的新服務。該工具主要是在Google Print[12] [3](於2005年11月該網頁改稱為Google Book Search)的搜索頁面,由內容出版商提供書本內容之搜索結果,並可購買書本的網頁及內容相關廣告,但隨之而來關於著作權是否侵權的質疑爭議不斷。[13] [4]有鑑於此,Internet Archive、Yahoo及Adobe、HP、MSN於2005年共同推出的環球數位圖書館(Open Content Alliance;OCA[14] [5])開放內容聯盟服務,收錄無版權爭議的資源,鼓勵出版商與作者將公共財產的書籍,及著作權所有人明確准許數位化的內容掃描成數位檔,避免書籍數位化所帶來的版權爭奪問題。此外,美國亞馬遜網站更於2005年末提出分頁銷售計畫(Amazon Pages)及其加值應用的服務(Amazon Upgrade),允許使用者可以單買某一本書的某一頁或某一章節在網路上瀏覽,並運用加值服務例如價格20美元的書只要加1.99美元及可看完整的電子檔,不僅增加實體書籍與虛擬內容之間的互補性,期望讀者能在此獲得精確書籍搜尋,提高讀者購買實體書籍的意願。

 

台灣的古籍數位化先驅自中央研究院1984年7月起開始執行「史籍自動化計畫」(現為「漢籍電子文獻資料庫[15] [6]」),直至迄今的「數位典藏與數位學習國家型科技計畫」(2008年)已累積有24年數位化經驗,其中參與單位從中央研究院、國立台灣大學、國立故宮博物院、國家圖書館、國史館台灣文獻館、檔案管理局等重要的機關單位,並同時以公開方式徵選邀集大學院校共同投入[16] [7],納入民間資料的蒐藏,體現台灣典藏品的完整性。而在這些參與計畫中,與古籍線裝書數位化相關的計畫,包含: 國立故宮博物院、國家圖書館、中央研究院歷史語言研究所傅斯年圖書館,以及台大圖書館參與國家文化資料庫計畫等,結合電腦科技、資訊數位化與古籍相關的「裝訂形式」、「古籍附圖」、「人名權威」、「印記」、「書影」跨古籍的整合,促使「知識」的獲取從被動轉為主動,數位化成果促使古籍不再只是典藏於實體圖書館中。若想要再一窺清代宮中藏書面貌,在國內你可以選擇故宮博物院圖書文獻處所建置的網站,或直接進入到國家圖書館的「認識中國古書[17] [8]」網站更附上精美的圖片,精簡扼要的簡介古籍內涵以及外觀,如同互動式教學一般帶領讀者一同認識古書,若想搜尋與印記、人名權威、書影等詳盡的線裝書資料,不能錯過由中央研究院歷史語言研究所傅斯年圖書館所建置的「人名權威資料庫」、「印記資料庫」、「善本圖籍資料庫」等。此外,中央研究院歷史語言研究所更與大英圖書館「國際敦煌項目」(International Dunhuang Project;IDP[18] [9])簽定合作協議,將館藏敦煌文獻數位資料提供予大英圖書館,經由「國際敦煌項目」可閱覽到各國相關文獻,另由傅斯年圖書館建置敦煌網站,以完整呈現建置此案的始末。如此豐富的中國古籍,如要進行資源分享,除了以數位化保存外,完整的資料庫建置是不可或缺的重要工作。

 

本指南擬整合各館之數位化技術及相關規範,提供擬數位化單位參考。指南為詳實記錄、忠實陳述執行計畫的規劃及方式,藉由指南的制訂及規範,能讓操作人員或新進人員等,從全面性整合的觀點清楚瞭解整體性的工作概況,及自身的工作範圍、工作細項和執行步驟,降低人員在面對新的工作程序及流程上的不安與恐懼,也可作為訓練新進人員的教材。並可幫助管理者找出計畫導入流程後,所產生的變異原因,進而提出改進之道;亦協助後續欲數位化之工作者依循規範產出成果,避免人為錯誤所產生的損失,節省時間成本,以保持良好的數位化成果的產出品質。

 

二、本書特色

 

(一) 本書定位

 

1. 對象:本指南以較不熟悉數位化工作的單位為對象,並提出適用於多數古籍線裝書數位化工作情形的工作流程;內容詳盡陳述數位化工作各領域所需的基本知識與工作流程,並羅列各館不同的時空背景因素,例如:單位規劃、經費、人力、典藏品狀況等,讓各單位在決定「如何數位化」時,能循序漸進地規劃數位化專案,及彈性地逐步調整數位化方式的規劃。

 

2. 主張:以「數位資訊生命週期」來提出數位化專案管理的各面向,並帶出各單位「如何數位化」的背景因素,且詳盡地論述數位化相關流程以及工作規範與標準,又主張以「系統」來管理數位內容,讓產出能有相同的品質,並藉由數位化工作的透明化,更符合數位圖書館之趨勢。

 

3. 領域:古籍數位化工作需要圖書資訊學、資訊科學、語言學、中國文學及歷史學等不同學術社群及機構間的溝通、交流與合作,為跨領域的一門新興學科,因此本指南擬將所涉及之各學科領域於本文中概述,期望能兼顧機構及執行廠商,一方面,提供給前者在執行時注意事項與各項工作規範;另一方面,當委外廠商在執行機構數位化工作時,也能有一概括性的對古籍數位化時所需的認知,雙方皆須避免造成典藏品二次傷害,並可提升機構與廠商之間積極的合作空間。因此本指南可提供給欲數位化之團體,在選擇數位化方式時採用委外或不委外之基本概念,並同時能以系統方式規劃其數位化計畫,除讓繁瑣流程透明化外,自動化的系統串連,更容易控管流程及產出的品質,達到標準化工作流程的精神,並降低數位化之藏與用的衝突。

 

(二) 本書架構

 

本指南將數位化工作流程規劃出三個部份,從數位化背景淵源的「引言」,到如何數位化的「古籍線裝書數位化流程圖」、「前置作業」、「物件數位化程序」、「後設資料與資料庫建置」等,最後以專題討論的方式,規劃出一系列與數位化相關的延伸議題,包含:「數位化設備分析」、「儲存設備分析」、「數位內容保護」及「數位化內容工作之挑戰」,希望能提供給讀者完整的數位典藏觀念及古籍線裝書數位化工作流程之專案規劃藍圖。

 

 

(三) 本書特色

 

本指南擬取代《古籍線裝書數位化工作指南》2004年版。於2004年工作坊後,2004年版電子檔放置於網路提供大眾使用,另於參加太平洋鄰里協會(Pacific Neighborhood Consortium,以下簡稱PNC[19] [10])國際研討會會後,接獲許多改進意見,因此依適切性納入此新版中。主要更新包含:古籍線裝書「數位化方案選擇」、「數位資訊生命週期管理」等架構,以及範例單位之相關數位化工作流程規範與方式,為一本詳實記載並忠實陳述的數位化工作流程指南手冊。

 

 

(四) 物件定義

 

1. 古籍:指古代書籍,原則上指1911年及其以前所書寫或印刷的書籍[20] [11]

 

2. 線裝書:由包背裝演化發展而成。整幅封面為散開的前後封面,連結材料也不再用膠料,而是打眼穿線,比包背裝更加牢固美觀,是明、清以來雕版書籍和抄本的主要裝幀形式。依打眼的數量,又可分為四眼裝、六眼裝、八眼裝等。

 

3. 古籍線裝書:指1911年以前以冊頁線裝形式的書籍,容易因天然災害或過度使用而愈加受損及脆化,因此古籍線裝書之數位化更顯出其重要性。而〈古籍線裝書之數位化工作流程指南〉(以下簡稱〈指南〉),便是依此而制訂,適用於「冊頁線裝形式之書籍」進行數位化工作時之指南(後文所提「書籍」皆概指以冊頁線裝形式之書籍而言)。

 

4. 書籍裝訂形式之流變及特色[21] [12]:書籍由內容(文字)、載體(紙張)以及技術(印刷術)等三元素組成,隨不同朝代或年代的需求,衍生出不同的裝訂形式。《史記.孔子世家》中記載「孔子晚喜易,讀易韋編三絕」,所謂的韋編,是用皮繩將簡或策編聯再一起,並由於當時將文字書寫在竹子或木簡策上,稱之為簡牘時代。後來將文字記載在絲棉上,但由於絲棉的價格不斐,因此在當時書籍相當的昂貴,不僅不普及,在學術研究上也相當不便。直到東漢蔡倫改良造紙的方式,書籍正式形成,並由於閱讀的需求有不同的裝訂方式。所謂有需求有創新,有創新有需求,究竟古籍線裝書中裝訂形式的演變,會對數位典藏在數位化時有哪些要注意的面向呢?以下就各年代不同的衍生需求列出其裝訂形式:

 

表 1-1、古籍線裝書裝訂形式的演變

 

 

資料來源:肖振堂、丁瑜著,《中國古籍裝訂修補技術》,北京:書目文獻出版社,1988.年11月,初版,由拓展台灣數位典藏計畫 彙整。

 

 

由表1-1內容可了解,書籍的裝訂形式是會隨著人類生活的需求,不斷地修正與演進,從方便攜帶卻不容易閱讀的卷軸裝,到逐步改善不易閱讀課題的炫風裝以及經摺裝,但隨著閱讀便利性的提升,相對產生摺頁處容易產生裂開或分裂的問題,因此開始有了以紙釘加以固定的裝訂方式,到了明代中葉的線裝形式,書籍閱讀便利性趨於完善,是目前較為普遍的一種書籍裝訂方式。


 

 [22] <回 到 目 錄>

 

 

[23] [1] 古騰堡,活版印刷的發明人,http://en.wikipedia.org/wiki/Johannes_Gutenberg。

[24] [2] 古騰堡計畫網站:[25] http://www.gutenberg.org/wiki/Main_Page

[26] [3] Google booksearch計畫網站:[27] http://books.google.com/

[28] [4]這個服務與A9.com提供的很類似,而A9.com本身,就是號稱全球最大網路書店amazon.com的分支。參見該公司網頁[29] http://a9.com/

[30] [5] Open Content Alliance聯盟網站:[31] http://www.opencontentalliance.org/

[32] [6] 中央研究院漢籍電子文獻網站:[33] http://www.sinica.edu.tw/ftms-bin/ftmsw3

[34] [7]羅鳳珠,〈臺灣地區中國古籍數位化的現況與展望〉,《書目季刊》,第35卷第1期,2001年6月。

[35] [8] 國家圖書館認識中國古書網站:[36] http://rarebook.ncl.edu.tw/rbook.cgi/frameset2.htm

[37] [9]國際敦煌項目()IDP網站:[38] http://idp.nlc.gov.cn/

 

貳、 古籍線裝書之數位化流程圖

 

 

此流程共分為三個部份,包含:「輸入端」、「處理端」、「輸出端」等三部份,其中在輸入端是以資料管理為主的前置作業,在處理端是以資料創造為主的物件數位化程序,在輸出端則是以資料保存與資料供應的後設資料與資料庫建置。將分別於第参;章「前置作業」、第肆章「物件數位化程序」、與第伍章「後設資料與資料庫建置」提出執行方式。

 

 

圖 2-1、古籍線裝書數位化工作流程圖
資料來源:彙整自中央研究院歷史語言研究所傅斯年圖書館、國家圖書館、國立故宮博物院執行「數位典藏與數位學習國家型科技計畫」所建置的流程圖,由拓展台灣數位典藏計畫 整理繪製

 

一、數位資訊生命週期管理

 

 

(一)數位資訊生命週期

 

生命週期(Life Cycle)是一個應用極廣的概念,如同人類有生老病死等階段,是將原本靜態的技術、產品與市場狀態,賦予了動態與時間概念,讓原本僅針對某一特定時間之論述,有了生命與動的感覺[39] [13]。在產業(Industry)有生命週期、技術(Technology)有生命週期、產品(Product)有生命週期、專案(Project)有生命週期,而製造產品與執行專案的公司(Company)也有生命週期,而數位資訊的生命週期為何?

 

根據世新大學資訊傳播學系蔡順慈教授在一篇《由數位資訊生命週期探討數位典藏工作流程之建立》提到數位資訊生命週期,認為資訊生命週期主要包括資料的創造、管理、保存、及供應:[40] [14]

 

1. 資料創造:資料創造的檔案類型,可以是獲取原生數位資料或是由傳統媒體數位化後的資料。

 

2. 資料管理:資料管理包含的內容,有描述資料 (如Metadata)、分類、索引、格式、定義(Identification)、文件(Documentation)、儲存、使用權限與智慧財產權管理等相關作業的制定與規劃。

 

3. 資料保存:資料保存需考慮儲存的型式與環境,資料儲存涉及到檔案的格式、資料轉換(Migration)、以及資料需要部份或全部、以分散或集中的方式來儲存;其技術方面包括儲存的媒體及平台的選用(陳昭珍,2001)。一般所指的資料「儲存」,通常被認為是資訊生命週期中被動的一個角色,當儲存介質和格式改變後,原有的資料有可能會毀損、或難以讀取 (Hodge, 2000);然而資料「保存」則是強調資料在時空與資訊設備的變更下,都不受到損傷,並且確保資料仍能繼續被取用,也就是「長久性」的保存(Long Term Preservation),此屬於策略性的思考。

 

4. 資料供應:資料的創造、管理與保存都是為了資料的供應,也就是讓需要的人能透過取用機制(Access Mechanisms),適時適地的檢索、分享與傳佈這些資訊,並且從中獲取所需的知識。然而其中最棘手的問題是,這些資料的財產權該如何區分,這是大眾或者資料的提供者,在資料管理的時候,必須注意考慮智慧財產權的問題。

 

古籍線裝書數位化工作與數位資訊生命週期的關係又是如何? 參考《由數位資訊生命週期探討數位典藏工作流程之建立》針對數位典藏工作流程與資訊生命週期之探討,提出古籍線裝書數位化工作之數位資訊生命週期圖如下:

 

 

圖 2-2、 古籍線裝書數位化工作流成生命週期圖

 

資料來源:拓展台灣數位典藏計畫 繪製

 

 

二、數位典藏系統規劃

 

以中央研究院歷史語言研究所傅斯年圖書館所執行的數位典藏計畫為例,其圖書館本身自1988年開始館內便開始進行數位化工作,使用「王安整合影像資訊系統」(200dpi / B&W)來建立「書目與影像連結的資料庫」,八年後,由於系統整合環境的需求,因此將王安系統約五十萬頁掃存12吋光碟轉錄於5.25吋CD-ROM光碟書目資料轉為「全文檢索資料庫」,直到2000年加入數位典藏國家型科技計畫,由於當時需求將原件掃描改以全彩數位化(300dpi)影像儲存。

 

在此背景下,中央研究院歷史語言研究所傅斯年圖書館迄今已因應數位化屬性不同的需求發展出10個系統,分別為:「實體典藏之整理及管理:館藏線上公用目錄、珍藏書庫庫房管理系統」、「實體典藏之數位化:圖籍掃描校驗管理系統」、「虛擬典藏之檢索應用:善本圖籍全文影像系統、人名權威資料系統、空間

 

地理資訊系統、館藏印記資料庫系統、善本古籍附圖影像系統、善本古籍電子全文系統、善本圖籍全文出版系統」。以下分述其系統規劃圖,及針對數位化工作流程控管所建置的「圖籍掃描校驗管理系統」、「數位化典藏工作規劃」等部份。

 

(一)數位典藏系統規劃五程序:[41] [15]

 

1. 確立數位化主題及清單:依據各館之館藏特色加以集結或使用者使用頻繁之珍藏加以數位化,並須事先檢視館藏是否可承受數位化之操作,不宜為數位化而將原始典藏損壞。

 

2. 實體典藏之整理及管理:經由數位化之清單可同步檢視原始典藏並進行修護,珍藏圖籍必須同時考量對外之公用檢索及對內之行政管理機制。

 

3. 實體典藏之數位化:須兼顧典藏及利用二種需求,典藏版的目的是作為典藏之用,以因應原始典藏日益損壞後仍保有其數位化影像(即使虛擬典藏仍無法取代原始典藏),利用版則是考量在網路時代應提供更快速之個人化服務,故另製標誌檔以因應網路傳輸檢索之用。

 

4. 虛擬典藏之檢索應用:實體典藏之數位影像呈現,另依據使用者之各項需求規劃建製其主題屬性之資料庫,並串連各系統之關連性。

 

5. 檢索應用之反饋、調整數位化順序:經由使用者實際檢索利用後同步進行各種系統之使用評估並修正系統設計,並經由使用者之使用反饋調整數位化順序,以取得「藏」與「用」之平衡。

 

 

圖 2-3、數位典藏系統規劃圖

 

資料來源:中央研究院國家典藏數位化計畫 林妙樺,<認識傅斯年圖書館「圖籍掃描校驗管理系統」>,數位典藏國家型科技計畫 電子通訊,檢索:2002年5月,[42] http://www.ndap.org.tw/1_newsletter/content.php?uid=171

 

(二)圖籍掃描校驗管理系統[43] [16]:為中央研究院歷史語言研究所傅斯年圖書館所建置,針對館內進行龐大的數位化工作所建立的管理系統。提供給掃描圖籍相關之組別及工作人員使用,可有效控管圖籍動向及掃描進度,同時兼顧讀者到館閱覽之需求。此系統主要包括二大部份:「應用程式」:用於掃描及校驗、燒錄、光碟標記等模組。「WEB介面」(適用於I.E.瀏覽器):含括從待掃描清單的轉入,到圖籍動向管理、書況確認、掃描確認、修裱管理、品質管理、流通組借閱及系統管理等模組。

 

(三)數位典藏後續工作規劃[44] [17]

 

1. 數位典藏多元媒材之儲存機制:媒材的保存年限及儲存環境,例如:數位媒材改版或昇級等相關問題。

 

2. 數位典藏各種產出之異地儲存:針對各種產出物應規劃異地儲存之機制,並與原始典藏分置兩地(甚至他國)。

 

3. 各種數位典藏產出之開放機制:數位典藏產出之開放機制,除可透過各種安全管理技術外,尚需成立數位產權保護小組及認證中心,方能因應各項可能遭受侵權之法律訴訟。

 

4. 原件數位化亦不得減少其修護:原始典藏之維護和修復費用,因數位化之複製品對於研究者而言,仍無法取代原始典藏

三、長期儲存的規劃

 

(一)目前概況

 

數位典藏的原始物件蘊含了人類重要的知識內容,但數位化後的資訊該如何妥善規劃與保存,是在執行數位典藏專案時所需要注意的重要課題之ㄧ。在歐洲地區的英國、美國、加拿大等,已日漸重視數位資訊長期儲存取用的議題。而圖書館組織和典藏機構為領導者,如:英國大學研究圖書館聯盟數位化檔案庫方案(CEDARS)、澳洲國家圖書館潘朵拉(PANDORA)計畫、加拿大文化遺產資訊網計畫(CHIN)、以荷蘭圖書館為首的歐洲圖書館數位化([45] Networked European Deposit Library;NEDLIB)計畫、美國記憶計畫(American Memory)等,大型圖書館典藏機構藏品數位化計畫,在建置過程中亦逐步摸索長期儲存的輪廓。[46] [18]

 

(二)OAIS開放式檔案資訊系統參考模式(Reference Model for an Open Archival Information System,簡稱OAIS 參考模式)[47] [19]

 

OAI是一個簡單、容易設計程式的協定,主要乃在透過指定的命令集,提供前端向後端儲存器提取所需資訊的協定,OAI元件主要分為OAI Service Provider與Data Provider。[48] [20]是一個目前逐漸受到諸多檔案館或圖書館所重視,由美國國家檔案與文件署(National Archives and Records Administration ;NARA)所主導,美國太空資訊系統諮詢委員會(Consultative Committee for Space Data Systems;CCSDS)負責,主要是為了發展長期保存與資訊取用所需具備的功能,提出一個參考架構及概念,藉此設計出一個可應用於各種類型資源的數位永久保存系統,且於2001年通過ISO標準。主要功能包含六項構成要素,「數位圖文提交(Ingesting)」、「行政(Administration)」、「保存規劃(Preservation Planning)」、「檔案儲存(Archival Storage)」、「資料管理(Data Management)」、「資料存取(Acess)」,其整體架構圖如下:

 

 

圖 2-4 OAIS參考模型之功能模型

 

資料來源: 林素甘、楊美華、柯皓仁等著,〈數位化發展對檔案典藏與保存之影響〉,《臺灣圖書館管理季刊》,第四卷第二期,2008年4月,頁67-88。參考自Brian Lavoie, “Meeting the challenges of Digital preservation: The OAIS reference model,” OCLC Newsletter 243 (January/ February 2000)。

 

 

 

而數位典藏發展迄今,OCLC/RLG、紐西蘭國家圖書館、荷蘭國家圖書館、澳洲國家圖書館、英國里茲(Leeds)與牛津和劍橋等大學合作的CEDARS計畫等,皆是參考OAIS基礎模式所發展自身的數位資源長期保存之儲存計畫。


 

 

[49] <回 到 目 錄>

 

[50] [10] 源起於太平洋周邊國家公立大學校長聯合會,產生太平洋鄰近國家協助計畫。重點工作包括:促成機構間資訊交換標準及資訊相互共用的協定、擴廣電子資訊技術的應用面,如財經資訊、醫療網路、網路教學、圖書館際交換、檔案收藏、及博物館館藏數位化等。

[51] [11] 陳正宏、梁穎 著《古籍印本鑑定蓋說》,上海:上海辭書出版社,2005年10月,初版。

[52] [12] 肖振堂、丁瑜著,《中國古籍裝訂修補技術》,北京:書目文獻出版社,1988.年11月,初版。

[53] [13] David 編撰,<產品生命週期管理(PLM)與其內涵>,科技政策研究與資訊中心(STPI)科技產業資訊室,檢索:2009年2月,[54] http://cdnet.stpi.org.tw/techroom/analysis/pat_A104.htm

[55] [14] 世新大學資訊傳播學系謝易耿 蔡順慈著,<由數位資訊生命週期探討數位典藏工作流程之建立>,拓展台灣數位典藏計畫網站,檢索2009年2月,[56] http://content.teldap.tw/index/?p=766

[57] [15] 陳國棟、林妙樺著,<中研院歷史語言研究所傅斯年圖書館數位典藏系統之整體規劃及發展>,檢索:2009年2月,[58] http://2a3y.sdb.ac.cn/upload/no02_05.ppt

[59] [16]中央研究院國家典藏數位化計畫 林妙樺,<認識傅斯年圖書館「圖籍掃描校驗管理系統」>,數位典藏國家型科技計畫 電子通訊,檢索:2002年5月,[60] http://www.ndap.org.tw/1_newsletter/content.php?uid=171

[61] [17]陳國棟、林妙樺著,<中研院歷史語言研究所傅斯年圖書館數位典藏系統之整體規劃及發展>,檢索:2009年2月,[62] http://2a3y.sdb.ac.cn/upload/no02_05.ppt

 

 

 

參、 前置作業

 

一、數位化方案選擇

 

數位化工作包含:「前置作業」的專案規劃、數位化物件分析、metadata欄位制訂,以及「物件數位化程序」和「後設資料與資料庫建置」等三階段,以「數位典藏與數位學習國家型科技計畫」成果來說,各計畫雖都在執行數位化工作的專案計畫,但不同的典藏品、不同的專案管理人員、不同的政策與經費考量、不同的掃描或拍攝承包商、不同的地點、不同的審查方式、不同的評選人等因素,所完成的的數位化成果將獨一無二,[63] [21]此正是專案交付標的其中一項重要特性,同時也是本指南所考量的重要因素:「如何維持數位化的品質管理」。因此數位典藏專案在考量經費、成本、人力等考量因素,會將部分工作委外徵求廠商進駐館內協助進行典藏品的數位化工作,並隨各館不同的委外專案而彈性調整投入的規模、時間、人力。以下將分別描述數位化方案應考量的各種條件。

 

(一)數位化物件分析

 

為前章節提到的檢視典藏品的現況,分類並評估出哪些古籍線裝書具有價值,並可立即進行數位化者。同時了解目前有哪些館藏已經數位化,提出未來擬數位化典藏品的需求。通常建議物件依性質可分為「一般類別」、「自然生物類別」、「檔案類別」等三類。

 

表 3-1、物件依性質的分類判斷表

 

一般類別

標準

判斷細項

預定數位化的典藏內容應具有重要價值或是具有台灣代表特色

時代意義

1. 具有久遠的歷史年代

2. 特殊或重要時期的典藏內容

學術價值

1. 對台灣重要或特殊事件具有重要證據意義或提供歷史性的理解

2. 與台灣重要人物或事件具有關聯性

3. 對特定內容領域的學術研究具有決定性的影響

審美價值

1. 台灣重要藝術家或工匠的作品或著作

2. 具不平常的技術或藝術技巧

3. 對藝術或美學發展的理解具有重要意義

稀缺性

1. 典藏內容或其副本現存的數量相當稀少

2. 沒有一種相似的數位化副本已經存在別處

重要性

在特定內容領域所具有的知名度,具國家性或國際性的知名度。

代表性

1. 具有特別的物理形式或特徵的典藏內容

2. 代表台灣人文或技術發展的各種形式的重要例子

3. 對特定內容領域具有普遍的典型意義

瀕危狀況

1. 原典藏品保存及毀損狀態已經相當嚴重

2. 瀕臨消失的語言或物種

適當的數位化方法與規格標準

是否有詳訂明確的數位化和後設資料的技術規格?

數位化的技術是否符合原始典藏品的性質或特色?

使用的技術規格是否有助於資源的整合與交換?例如使用國家/國際標準規格

生物多樣性類

物種特質

為台灣或特定縣市特有物種?

為瀕危、稀少或保育類物種?

為外來入侵物種?

為具有毒性的物種?

是否對特定領域的學術研究有決定性影響?

可適用對象

是否適合國小、國中、高中、社會等各級教育推廣?

素材之豐富

性與品質

特定物種是否已具備生態照、標本照、錄音、錄影、解

說等各類媒體素材?

所蒐集特定物種之內容是否豐富、完整?

是否有專家做成之解說?

數位化品質是否良好?

檔案類

時代意義

1. 具有久遠的歷史年代

2. 特殊或重要時期的典藏內容

該資料與該時代資料之連結

同一時代同一相關背景相關資料之參照,或是有無特定資料與那時代之背景連結

相關時代性衍伸閱讀可能性

是否有附屬、相關的衍生資料,可豐富資料的衍生閱讀、研究可能性

其他需求面

符合專題、主題展覽之需求(含實體、數位展覽)

對現代人生具有啟示者,例如某些書法、語彙、語錄可以對現代人產生啟示

 

資料來源:數位典藏與數位學習國家型科技計畫 分項四數位典藏與學習之學術社會應用推廣計畫之最佳可授權品項評選建議標準v1

 

以下提出中央研究院歷史語言研究所傅斯年圖書館、國立故宮博物院、以及國家圖書館等三處,其典藏的古籍線裝書特色與藏書量。

 

1. 中央研究院歷史語言研究所傅斯年圖書館:傅斯年圖書館為國際重要的漢學圖書機構,館內最為珍貴且具特色之典藏,首推三千八百餘部,計四萬四千餘冊的善本書。主要來源是:[64] [22]

 

(1) 民國二十三年院方撥存,購自南京鄧邦述氏『群碧樓』的藏書,共四百三十餘種。

 

(2) 民國三十五年接收日本北平東方研究所之善本書,共一千三百餘種。

 

(3) 購自江安傅增湘「藏園」的部份藏書。

 

(4) 民國五十七年洽購李宗侗(玄伯)散出的善本百餘種。這四萬餘冊的善本書,以罕見的秘籍居多,複本較少。主要為宋、元、明及清初刊本、稿本,名人之批校本、手鈔本、繪寫本等,是國內外研究者所重視的典籍。

 

2. 國立故宮博物院:自《國立故宮博物院善本舊籍總目》挑選出欲數位化的清單,由宋迄清,約有20萬冊。其中承繼自清宮舊藏圖書者,有許多珍本秘笈、珍貴之宋元佛經,及清康熙、乾隆二朝的藏文《甘珠爾經》、《清文全藏經》等。另外,楊守敬於光緒6年(1880)隨何如璋出使日本,在日本收購大量善本舊籍的觀海堂藏書,亦於民國初年售予政府移交本院。民國74年(1985),教育部將北平圖書館館藏精品等書籍。[65] [23]

 

3. 國家圖書館:收藏約一萬二千三百餘部,近十二萬六千冊,其中敦煌寫卷一百五十五卷、宋本一百七十五部、金本六部、元本二百七十二部、明本逾六千部、鈔本近三千部、稿本和批校本各五百部左右。其特色包括:網羅昔日著名藏書家精品;同一名家著述,藏有若干不同版本;複本多,一書相同版本常藏有數部;明代文集和史料豐富,「千頃堂書目」、「四庫全書總目」所未著錄的不在少數。[66] [24]

 

(二)分析並評估整體環境現況

 

由於古籍線裝書常用的紙張皆為植物纖維,植物纖維中的纖維素分子結構決定紙張的強度、耐久性等性能,因此當纖維素中的成份是紙張吸濕的根源,當環境濕度大時,會大量吸收環境中的水分,造成纖維素因水解斷裂產生其他破壞性的化學反應。因可歸納出與紙張相互變動的因素:「紙張吸水」、「光線」、「溫濕度」、「空氣中酸性物質」。

 

1. 紙張因吸水受潮後讓空氣容易侵入,因此有害物質破壞原有的結構,在紙張受潮後,該環境有利於害蟲的生長,因此產生霉變和蟲蛀的問題

 

2. 當紙張受潮後遇到光線的照射,加速紙張的光氧化反映,加速紙張變黃、脆化等質變。因此溫度維持在20-24%較為適宜[67] [25],避免因為溫度的變化過大,容易造成並加速紙張纖維的熱脹冷縮產生質變劣化。

 

3. 另外,有鑒於國立故宮博物院科技室主任嚴素芬於2006年6月所發表的一篇《圖書蛀蟲、防蟲處理》一文中提到,由於圖書館人員對於蛀蟲的不熟悉,特此摘錄常見的文物蟲害之特性,以供參考。[68] [26]圖書蟲害通常以蛀食紙質類的昆蟲為主,除了紙質外,書籍的函套可能是織品,收藏書籍的箱、盒或櫃、架可能是木質,而周邊材質也可能有蟲害。

 

表 3-2、 常見的文物蟲害之特性

 

 

(三)成本管理

成本則涉及一系列有關規

 

劃、估算、編列預算以及控制成本,使專案能在核准的預算內完成流程,本指南在成本估算的地方只列入設備攤提的部分,暫不將人事等其他隱藏成本列入估算。

 

1. 成本構成要素:藉由掃描進行數位化所需成本,其要素主要由下列三方面構成-材料費、勞務費及經費:

 

表 3-3、 成本管理之構成要素表

 

 

資料來源:拓展台灣數位典藏計畫 彙整

 

2. 成本估算方式:本指南之成本分析,僅依據材料費、勞務費、直接費用及間接費用之系統空間建置、維護費用,對古籍線裝書影像掃描成本略作估算。依設備攤提方式大致上可分為「使用年限」、「數位化總產出」兩種方式。

 

 

表 3-4 、使用年限

 

資料來源:拓展台灣數位典藏計畫 彙整

 

 

表 3-5 、數位化總產出

 

資料來源:拓展台灣數位典藏計畫 彙整

 

 

由於設備選用的不同,其每頁的成本也不同。上述可知基本成本估算包含:電腦設備、軟硬體之掃描器設備及相關產品、系統開發建置費用、人力、檔案大小及設備使用年限等,將在附錄中,分別以不同掃描平台來估算所需成本,針對不同設備選用的不同成本估算方式,來呈現其差異性。本指南所列成本計算僅為初步評估,主要考量僅限於設備及人力資源,但仍可依此簡易公式約略考量各單位成本控制之重要因素,以下加以說明:

 

 

表3-6、 成本控制之影響因素

 

 

資料來源:拓展台灣數位典藏計畫 彙整

 

(四)影像規格制訂

 

 

數位化方案選擇影響因素有主觀條件的實體物件狀況,以及客觀因素的單位計畫預算、人力配置、數位化目的、影像格式、物件考量及設備規格等,以下將針對客觀因素提出說明與建議方案。

 

1. 數位化目的:數位化方案的選擇需考慮到影像,或文字數位化之目的,究竟是為了永久典藏、印刷出版?或是方便網路使用公共資訊級。以下根據古籍線裝書數位化之使用目的、影像品質的呈現、影像檔案大小及瀏覽器支援問題等,以下列出國內針對數位化成果基於永久典藏、一般性的應用等目的,所需儲存的格式:

 

表3-7、數位典藏與數位學習國家型科技計畫檔案規格

 

資料來源:拓展台灣數位典藏計畫 彙整

 

 

表3-8、國家文化資料庫檔案規格[69] [27]

 

資料來源:行政院文化建設委員會國家文化資料庫數位化製作規格,2004[70] [28]

 

2. 物件數位化之影像格式制訂:以下提出數位掃描常用圖檔格式,並匯整成表格說明。另外提供影像製作規格參考規範標準,可參考本書最後所彙整之影像製作規格參考規範標準,並於附錄中詳列大陸地區、台灣地區、美國地區等三大地區所擬訂的影像製作規格相關規範指南,提供給讀者參考。

 

表 3-9、 數位掃描常用圖檔規格

 

資料來源:拓展台灣數位典藏計畫 彙整

 

 

表 3-10、影像格式比較表

 

 

資料來源: 徐明景著,《數位攝影的技術:數位影像製作技巧在攝影上的應用》,台北:田園城市,2001年10月,頁51。

 

 

(五)設備挑選

 

由國立台灣大學特藏組洪淑芬小姐所撰寫的《文獻數位化前置作業》一文中提到,書籍數位化所使用的設備考量需兼顧掃描速度以及資料保護。其下列歸納出掃描器適用的書籍:[71] [29]

 

表格 3-11、物件數位化設備挑選原則

 

 

資料來源:洪淑芬 著,《文獻典藏數位化的實務與技術》2004年2月,初版,頁35-37。

 

 

在設備選擇需考量到主觀因素的實體物件狀況,以及客觀因素的單位計畫預算等兩因素,以下將分別說明。

 

 

表 3-12、設備選擇需考量到主觀因素的實體物件狀況

 

 

資料來源:拓展台灣數位典藏計畫 彙整

 

 

 

表 3-13、設備介紹及其特點說明

 

 

資料來源:拓展台灣數位典藏計畫 彙整

 

 

在選擇數位化方式時主要為掃描,掃描又分「直接掃描」及「間接掃描」。「直接掃描」指直接透過掃描器對古籍線裝書進行掃描,如平台式掃描器或平床式(平台光學)掃描器等。「間接掃描」則是先將古籍線裝書進行縮影微捲,再將微捲進行數位化。本書僅以「直接掃描」進行描述。

 

 

由於古籍線裝書屬於古代書籍,為平面物件,適宜掃描進行數位化工作。又以線裝形式存在的物件年代大多在明代中葉,多會發生書籍中縫過緊、紙張脆化、書塊、蟲蛀等狀況,故建議可先以平床式(平台光學)掃描器為主,又當書況極為不佳時,則可使用平台輔以數位拍攝的方式進行,如下圖由中央研究院歷史語言研究所傅斯年圖書館所自行開發的古籍拍攝平台。

 

 

 

 

 

 

(六)品質管理系統建置及校驗標準

 

 

1. 數位典藏品質管理系統架構:數位化流程主要分為輸入、處理、輸出到反饋等四階段,因此品質的管理和數位化設備息息相關,包含從輸入、處理到輸出的色彩管理,及數位化後檔案該如何長期儲存的規劃等議題。以中央研究院歷史語言研究所傅斯年圖書館為例,說明其輸入到反饋端的相關設備。

 

 

表 3-14、 品質管理系統建置相關所需設備

 

 

資料來源:林妙樺著,「2008年數位典藏專業培訓:數位內容織品質管理」,2008年11月。

 

 

 

圖 3-5、 善本古籍數位化流程導入品質控管概念圖

 資料來源:林妙樺著,「2008年數位典藏專業培訓:數位內容織品質管理」,2008年11月。

 

 

2. 數位典藏品質校驗標準:依各館不同的數位化工作規範有所不同,綜合目前三館的數位化工作規範,大致上可歸納出共通的檢驗項目:「資料的正確性」、「資料產出的品質」、「資料產出的數量」等內容。在資料正確性部分主要是逐筆依照該檔的檔案名稱校對與原件在頁碼、內容上是否正確,其次在資料產出的品質上,針對「歪斜」、「中縫問題」、「字跡」、「兩頁間距」、「透背頁問題」、「木屑或毛髮」、「蛀洞或破洞」、「沾黏書頁的紙條」、「摺痕或凹凸不平」、「色差」、「圖檔清晰度」等項目逐一進行確認。最後依照每日校驗數量成果,彈性調整規劃,以避免由於日後發生檔案錯誤,而要再次重新製作圖檔的問題產生。

 

(七)委外製作

 

委外服務,是指某一機構將所提供之產品或服務,以簽訂合約的方式,轉授於外部機構提供。[72] [30]另外也有人將委外定義為:「在約定的時段之內,以雙方同意﹝且附有但書﹞的價格,將某項或某部分企業內部的管理功能,連同相關資產,交由外界的供應商或服務提供廠商負責處理。」

 

 

委外類型分為兩類:「全面委外處理」﹝full or total outsourcing﹞及「部分委外處理」﹝part or selective outsourcing﹞,前者意指某個管理功能領域中,百分之九十以上的作業、員工及資產等,都轉移至委外供應商的外包模式;後者意指被選定的委外處理的管理功能中,大部分還是留在組織內部自行運作。[73] [31]在國科會數位典藏國家型科技計畫的各單位委外經驗中,牽涉的委外執行種類大致上包含文字輸入、物件修復、物件掃描及物件攝影後製,基本上均為部分委外的類型。前面所提及之單位,包含台灣文獻館的掃瞄委外、台中國立美術館的館藏數位化委外及台博館所進行的各式委外作業,均屬於部分委外的範疇,指定部分工作內容委任於承包商執行,而管理及監督之權責仍掌握於委外單位的手中。而委外的程序大致上可分為:

 

圖3-6、委外的作業流程圖

 

委外最重要的關鍵就是規格需求書,也就是擬定計畫書的階段,包含如何規劃、執行、監控和結束等內容。其次則是專案的範疇及工作分解結構的範疇,建立一個詳細的專案範疇,做為將來在決策時的基礎,而工作分組則是將專案交付標的及專案工作細分為更小與容易管理的組件。接下來則是針對專案的各流程,進行排序及資源與時程的評估,進而估算成本及編列預算,大致底定後,開始針對內容進行品質的控管,包含物件數位化的規格、工作規範、校驗標準、人力配置等。最後進行風險的評估,哪些數位化工作需要委外,委外的需求評估及設備的採購等完成後形成一份委外需求書,方可進行招標的工作。

 

 

最後,關於委外廠商評選與規範書方面,依據行政院公共工程委員會所頒佈的「機關委託資訊服務廠商評選及計費辦法」辦理,以公開客觀評選方式委託廠商,建議採序位法來評定優勝者,並將價格納入評比,以總分第一者為優勝者。並成立評選委員會,其中專家學者人數不得少於三分之ㄧ,會議實際出席人數應達二分之一。評選辦法包含書面審查、簡報答詢,針對廠商提出的建議書內容要項及專案承作能力之參考,由評選委員會評分後,選出平均積分高於70(含)之廠商,若全部廠商低於70分,則以廢標辦理。而「建議評分作業要點」及「相關規範說明」擬以中央研究院歷史語言研究所傅斯年圖書館為範例說明之:

 

表 3-15、建議書評分要點說明

 

 

資料來源:中央研究院歷史語言研究所傅斯年圖書館,林妙樺提供

 

 

 

表 3-16、相關規範項目說明(以中央研究院歷史語言研究所傅斯年圖書館為例)

 

 

資料來源:參考中央研究院歷史語言研究所傅斯年圖書館,林妙樺提供「傅斯年圖書館委外招標建議書」增刪而成。

 

 

二、工作規劃

 

(一)數位化工作方案:數位化工作規劃應包含:「數位化之目的」、「典藏品特色及價值」、「人員編制及素養」、「經費支援及編列」、「擬訂計畫及管理」、「評估成效及調整」等方面,以下簡述各面向,並進而提出建議:

 

1. 數位化目的:本典藏物件大多為紙質的珍藏資料,故應妥善保護,但為免影響其使用,以現今數位化技術將其加以虛擬化,可使典藏物件得以永久保存,亦可提供虛擬物件配合經常性的使用,解決傳統紙本資料收藏與流通利用的衝突,建議數位化目的可分為「典藏」或「利用」等兩大方面來進行規劃。另外,目前軟硬體變化快,在舊版資料轉換時,不常用的資料常被忽略,造成日後無法閱讀之遺憾,因此隨著科技的更新,適宜的軟硬體配合也需要注意。另外也需納入計畫或單位的發展重點,決定館藏數位化清單及順序。

 

2. 典藏品特性與價值:各機構單位典藏物件類型及特色皆不盡相同,需先考量「典藏品特性與價值」,作為物件數位掃描設備及數位化之先後順序的準則。

 

(1) 以國家圖書館為例,考量古籍版本珍貴性、坊間流傳多寡及書籍本身書貌,來決定數位化投入比例,其所典藏書籍書況較好,因此選用平床式(平台光學)掃描器為主。

 

(2) 以國立故宮博物院為例,所典藏書籍多為宮廷本,書況良好,因此同樣以平床式(平台光學)掃描器為主,而中央研究院歷史語言研究所傅斯年圖書館之典藏書籍書況不一,因此規劃以平台式掃描器及數位拍攝平台設備來進行數位化。

 

3. 人員編制及素養:數位化工作是圖書資訊學、資訊科學、語言學、中國文學及歷史學等跨領域的人才與資源的整合計畫,從前置作業、實際執行數位掃描工作,到後設資料與資料庫建置等三大工作,需要各學科的整合才能完成上述工作。

 

4. 經費支援及編列:必須考量可投入經費的規模與如何編列預算。國立成功大學圖書館館長楊明宗在館刊之《現代圖書資訊之服務與管理》一文中提到,雖然科技推倒圖書館間的圍牆,但經濟問題似乎又成為另一道更堅實的鴻溝。計畫預算該如何編列,需仔細考量典藏品物件狀況、整體環境等相關因素。[74] [32]

 

5. 擬定計畫及管理:依上述面向擬訂計畫書,配合作業流程擬定相關作業標準。

 

6. 評估成效及調整:評估計畫執行成效並檢視修正,調整原有計畫書內容再執行下一階段工作。

 

工作流程圖:在考量申請單位所提出的徵求條件下,依照自身單位條件或資源,規劃出專案的範疇,也就是數位化加值應用面的廣度,例如資料庫的建立、電子書的製作或圖檔商業應用等方向,訂定出數位影像檔的規格及數位化的設備,並同時在數位化產量以及資料庫建置的部分,評估是採自行製作還是委外製作的議題。最後, Metadata規劃建議可參考「數位典藏與數位學習國家型科技計畫」與參與計畫所制訂的欄位,再依典藏目的與需求彈性調整,進而規劃出較事宜的方案。以下為數位典藏專案管理所涉及的各項議題。

 

 

 

 

圖 3-7、 古籍線裝書專案管理之工作流程圖
資料來源:拓展台灣數位典藏計畫 彙整

 

 

 



[75] [33]

 

(一)編製目錄、擬定清單:在〈第三次兩岸古籍整理研究學術研討會〉[76] [34]論文中曾提到關於古典文獻的考訂及研究工作,此工作必須必先了解其文章,通曉其辭句,明白作者的旨意與撰述的內容,古籍線裝書由於涉及考據訓詁、版本目錄,因此古典文獻的考訂及研究是門很深的學問,通常是由相關研究人員及計畫主持人共同研擬及挑選欲數位化古籍。在編製目錄時,需注意下列事項:

 

1. 訪查蒐集,比對校勘:訪查、蒐集以求齊全,要整理古籍線裝書一定要蒐集該書的一切版本,做比對校勘的工作,故網羅佚籍、對域外漢籍的調查蒐集就顯得格外重要。

 

2. 考訂研究,編製目錄:編製完整的古籍目錄,「目錄之學,學中第一緊要事,必從此用途,方能得其門而入」,古籍線裝書目錄的編製是古籍線裝書開發與利用的基礎,不僅要編製藏書目錄、聯合目錄,更應根據古籍線裝書整理研究的需要,編製各類古籍線裝書的專題目錄,俾便對古籍線裝書進行專題研究。

 

此編製目錄對於典藏品的本身為編製藏書目錄,對於典藏品數位化後的影像檔則有利於編製文物數位化的標準;而編製目錄之基礎則為metadata後設資料欄位之擬定。如何擬定可見附錄五「善本古籍核心元素需求規格書」。

 

(二)物件挑選、規劃順序:由機構或單位主管選定欲數位化物件後,擬定清單並依照該館之主要目標,例如:研究取向、館際合作等排定數位化之先後順序。以中央研究院歷史語言研究所傅斯年圖書館以及國立故宮博物院為例,當數位化資料龐大、且書況不佳時,會有不易排定數位化先後順序的狀況產生,因此建議分批建立數位化清單,較容易掌握整體數位化順序,並依物件數位化結果,彈性調整清單建立的數量。以下說明三館的在此階段的作業方式:

 

1. 中央研究院歷史語言研究所傅斯年圖書館:每年制訂欲數位化的範圍,依書籍版本、主題等,擬定待數位化清單;並視書況及修裱進度,排定物件數位化順序。

 

2. 國家圖書館:每年制訂欲數位化的範圍,自國家圖書館自動化系統書目資料中挑選出欲數位化的物件,並清查該批物件若已有出版品或其他計畫已有數位化檔案的成果,則暫不排入該批清單中,待確認數位化的物件後,檢視書況以排定清單中物件數位化的順序;並視每日數位化進度彈性調整物件數位化的數量。

 

3. 國立故宮博物院:自《國立故宮博物院善本舊籍總目》中挑選善本古籍,以EXCEL建立數位化清單,並同時建置於善本古籍總目資料庫中,每月進行清單的建置工作,以分批的方式較容易掌握整體典藏品數位化的順序。

 

 

 

 

圖3-8、國立故宮博物院善本古籍數位典藏掃描清單(92年)

資料來源:內容發展分項計畫善本古籍主題小組討論會議之會議文件,[77] http://readopac.ncl.edu.tw/ndap/rar/ndap-rar-doc-00.htm

 

 

 

(三)館藏目錄、檔案命名

 

1. 館藏目錄系統與檔案命名

 

(1) 中央研究院歷史語言研究所傅斯年圖書館:由於清單建立來自於其館藏目錄系統,因此檔案命名方式皆是以原館藏目錄系統之「登錄號」為原則。而其圖檔編碼原則也依循登錄號,以傅斯年圖書館為例,命名以「登錄號」另建立資料夾,各頁則以附加檔名作為區分,並儲存該登錄號之資料夾中,以登錄號123456圖籍共100頁為例,應有123456資料夾,期內共有123456.001~123456.100(共100個圖檔)。另再降階轉出JPEG影像。

 

(2) 而國家圖書館:最初的清單建立是由館藏清單中挑出選定欲數位化的清單,其命名方式採重新擬定。例如史的編碼原則是以整部書(同一書號,非冊號)為製作單位,其影像檔案目錄分為「書號」、「卷次」、「頁次」來區分檔名,檔名中英文字母皆為小寫。

 

例如:虫賓衣生蜀草十二卷,閩草六卷,養草二卷,留草二卷。/12956-00000/0a00001/0001.tif

 

 

(3) 國立故宮博物院:因數位典藏計畫專案而建置的善本古籍附圖資料庫,其清單是由《國立故宮博物院善本圖籍總目》叢書中挑選建置而成,檔案命名是依照故宮博物院之「文物統一編號」表所制定,詳見附錄六「工作流程圖及數位化工作規範」。

 

 

圖3-9、國立故宮博物院檔案命名方式

 

資料來源:國立故宮博物院圖書文獻處提供

 

 

2. 在檔案命名方面,陳昭珍教授在一篇《數位化檔案命名原則》提出編碼原則應具唯一性,以便同步作為數位化檔案之名稱,以中央研究院歷史語言研究傅斯年圖書館為例,依此清單作為庫房管理模組之基本表單,並逐步建立其提件及修復紀錄。以下簡單摘要陳教授提出的重要概念:[78] [35]

 

(1) 系統中每一數位資源皆須具有唯一之檔名。

 

(2) 可由檔名辨識為唯一單位所提供。

 

(3) 命名方式可支援同一物件之多種格式及其使用目的。

 

(4) 需與[79] metadata結合。

 

(5) 符合國際各種網路資源之命名原則。

 

(6) 使用[80] ASCIICode命名。

 

(7) 檔案名稱的英文字母大小寫不作區分。

 

(8) 不使用%、/、?、#、*、-字元。


 

 

[81] <回 到 目 錄>

 

[82] [18] 林彥宏、李姿穎 著,<數位典藏資源的長期保存與品質管理>,2008年7月。

[83] [19] 林素甘、楊美華、柯皓仁等著,〈數位化發展對檔案典藏與保存之影響〉,《臺灣圖書館管理季刊》,第四卷第二期,2008年4月,頁67-88。

[84] [20]陳昭珍 著,<數位典藏計畫異質系統互通機制:以OAI建立聯合目錄的理論與實作>,國家圖書館館刊,2002年6月,頁1-17。

[85] [21] PMI國際專案管理學會(Project Management Institute),《A Guide to the Project Management Body of Knowledge, Third Edition;專案管理知識體指南繁體中文版(PMBOK Guide 3th)》,台北:博鴻國際專案管理顧問股份有限公司,2006年6月,頁5。

[86] [22] 中央研究院歷史語言研究所傅斯年圖書館,網站[87] http://lib.ihp.sinica.edu.tw/

[88] [23]故宮文物數位典藏系統之研製 陳暐仁著,<「故宮善本古籍數位典藏子計畫」計畫簡介>,數位典藏國家型科技計畫 電子報,檢索2009年2月,[89] http://www2.ndap.org.tw/newsletter06/news/read_news.php?nid=538

[90] [24] 國家圖書館數位典藏,計畫網站[91] http://readopac.ncl.edu.tw/ndap/rar/ndap-rar-int-00.htm

[92] [25] 悉三彩、莊興業、何遠鴻著,<紙質文物的修護與保護>,檢索:2009年2月[93] http://ethesys.yuntech.edu.tw/ETD-db/ETD-search/getfile?URN=etd-0806103-160927&filename=etd-0806103-160927.pdf

[94] [26] 嚴素芬著,<圖書蛀蟲、防蟲處理>,檔案管理局,檢索:2009年2月,[95] http://www.gaya.org.tw/journal/m43/43-main3.pdf

[96] [27] 國家文化資料庫計畫執行期間為民國91年到96年。[97] http://km.cca.gov.tw/

[98] [28] 〈行政院文化建設委員會國家文化資料庫數位化製作規格〉,檢索:2009年2月。[99] http://km.cca.gov.tw/download/rule/93_do_scale.doc

[100] [29]洪淑芬 著,《文獻典藏數位化的實務與技術》,台北:數位典藏國家型科技計畫 訓練推廣分項計畫,2004年2月,初版,頁35-37。

[101] [30] 陳君屏,〈公共圖書館委外服務研究〉,《台灣圖書館管理季刊》,2006年4月,第二卷第二期,頁97。

[102] [31] J. Brian Heywood (余峻瑜 譯),《企業外包制勝—高績效低成本的委外經營模式》,台灣培生教育出版,2003年5月,頁54。

[103] [32] 楊明宗 著,《現代圖書資訊之服務與管理》,成功大學圖書館館刊,第五期,2000年4月,[104] http://www.lib.ncku.edu.tw/journal/5/4.htm

[105] [33]古籍整編,即是整理古籍,進行書籍編目。以國家圖書館為例,執行數位化計畫迄今已邁入第二季,累積了豐富的數位化資源,為能將館藏資源整合,目前正在進行編目整檔的工作,提出「整編古籍,編撰善本書志,重編所有善本與普通本線裝書目,並採行善本書編目自動化作業,編製中文古籍聯合目錄」。又在由陽明大學廖又生教授撰寫一篇《圖書館生產與作業管理初探》提到圖書館的生產型態中專案生產型態:「專案生產係指唯一產品製造時間較長、所耗資源較多者而言,例如古籍整編、善本圖書校勘等,通常是圖書館特定目的下所進行的生產型態。」

[106] [34] 錢月蓮著,<第三次兩岸古籍整理研究學術研討會論文綜述>,漢學研究中心,檢索:2009年2月,[107] http://ccs.ncl.edu.tw/Newsletter_79/p091_097.pdf

 

 

肆、 物件數位化程序

 

一、色彩管理系統規劃

 

每個人對於色彩的感知不同,對顏色的解釋與理解也是不盡相同,例如:紅色,可能被解釋為蘋果紅、玫瑰紅…等;而藍色可能就會產生天空藍、靛藍…等各式不同的「色差」,因此在不同的認知之下,即使是同樣的顏色,最後出現的結果卻可能是大異其趣。相對於色彩裝置,類似的狀況也會產生,從整個數位化工作流程中,包含輸入端、處理端以及輸出端等各家生產的色彩裝置都說著自己的語言,但是溝通時卻缺乏共同的語言認知,以致於色彩重製之後產生顏色偏離的現象,這時色彩描述檔就扮演了重要的角色與媒介,它可以讓裝置與裝置間說共同的語言,因此同樣的顏色可以從一而終,避免分歧,色彩管理即是針對這樣的情形衍生出的一門學問。

 

而數位化工作是將文物真實地典藏,因此對於色彩的需求度相對提高,如何擬定色彩管理規劃及做好品質控管,以下說明色彩管理與數位化工作之關係。[108] [36]

 

 

圖 4-1 、色彩管理系統與數位化流程關係圖 

資料來源: 徐明景著,《數位攝影的技術:數位影像製作技巧在攝影上的應用》,台北:田園城市,2001年10月,頁62-63,

 

(一)色彩管理模式

 

1. CMYK與RGB色彩模式:

 

CMYK:又稱色料三原色,理論上只用CMY三種顏色相加就可以形成黑色,但實際印刷時三種顏色的相加只能形成一種深灰色或深褐色(因為油墨里含有雜質的緣故);另外三層顏色也不容易立即乾燥,所以不利於快速印刷;再來三層印刷需要非常精確的套印;用黑色替代三層顏色也可以大大節省成本,所以採取四種顏色的配色方法。RGB:又稱色彩三原色,由紅綠藍組成,此三原色光模式是用三種原色的光以不同的比例加和到一起,形成各種顏色的光。

 

又色彩深度會影響色彩的層次能力與檔案大小,而色彩模式決定影像呈現色彩型式,在數位影像範疇中,由於使用狀況的考量,有可能常需要在不同的色彩模式中轉換,因此了解色彩模式差異與色彩深度,並加上對影像實體結構的了解,才能正確控制數位影像的呈現品質。以下列出色彩模式與色彩深度表:

 

表4-1 色彩模式與色彩深度一覽表

色彩模式

英文簡稱

色彩深度

註解

全彩

RGB True Color(Millions Color)

24bits

常見電腦顯色模式

四色印刷

CMYK

32 bits

印刷分色四色版

索引色

Index Color

8 bits

網路色彩壓縮模式之一

雙色調

Duotone

8 bits

黑白染色的表現

單色調(灰色調)

Grayscale

8 bits

一般黑白的表現

雙階調(高反差)

Bilevel

1 bit

單純全黑或全白高反差的模式

視覺空間模式

LAB

24 bits

數學座標室的視覺空間

 

資料來源:徐明景 著,《數位攝影的技術》,台北:田園城市文化事業有限公司,2001年10月,頁27。

 

2. 色彩管理變動因素:也就是造成色彩不一致的原因,包含:軟硬體間本身品質的落差、色系不同RGB/CMYK、以及其他,例如輸出紙張、印表機油墨等印刷材料特性、數位化時的環境因素(例如:其他光源、天氣等)、人眼判別不同等因素。

 

3. 變動因素如何控制:透過數值在不同的色彩空間內,每個顏色都有其絕對位置。但在影像擷取至輸出的過程中,經過許多的人員、設備、環境光源等各種因素,雖不會改變原本影像的資訊,卻由於不同的顯色方式,影響了其中顏色的轉換與對應的精準性。因此,為了解決色彩管理相關問題,1993年國際色彩協會(International Color Consortium,簡稱ICC)與知名廠商Adobe Systems Incopration、Agfa-Gevaert N.V.、Apple Computer、Eastman Kodak Company、Microsoft Corporation、Silicon Graphics Inc等共同建立一個跨平台的色彩管理系統,主要是製訂出ICC規範,也就是所謂的「符合標準色彩描述檔的 ICC Profile」,利用各種不同的設備,按照標準硬體與軟體所製作出屬於設備本身的特性化描述文件,供色彩軟體進行色域轉換,以做到色彩還原。

 

(二)色彩管理流程圖[109] [37]

 

為了讓各家廠商所用的色彩系統可以有轉換依據,國際色彩協會(ICC)建立了一套可以共同遵循的標準,而 CIE Lab色彩模型具備了此一要素。其色域可以涵蓋各種色彩空間,所以各種色彩空間的各種顏色可以在CIE Lab色彩模型裏找到對應的顏色,而記錄對應關係的東西就是所謂的色彩描述檔(ICC Profile)。但有色彩描述檔(ICC Profile)無法立即解決所有問題,當A色彩空間裏的顏色在B色彩空間找不到時,就只能找一個最相近的顏色來代替,這就是色彩轉換。任何一種的轉換方式都不是絕對完美,只要色彩轉換一次,顏色的資訊就可能會產生損失,在數位檔完成後,需要進行校色的動作,使數位檔的顏色在電腦螢幕、掃描器與輸出設備上盡量一致,以使原件在掃描時的狀況,充分加以保留當時的原件保存狀況。[110] [38]

 

1. 輸入端:掃描器校正,產出ICC Profile

 

圖 4-2 色彩管理輸入端流程圖

資料來源: 吉順隆數位影像科技股份有限公司 王遠華先生提供

 

2. 處理端: 螢幕顯示器校正以及一般影像校正軟體

 

圖 4-3、色彩管理輸入端流程圖

 

 

資料來源: 吉順隆數位影像科技股份有限公司 王遠華先生提供

 

3. 輸出端:印表機校正,產出ICC Profile,RIP的設定是關鍵。一般的噴墨式或雷射印表機均為RGB模式,所以目的端的ICC Profile是RGB色域模式,而RIP所控制的印表機大多為CMYK,因此須了解所使用的印表機為何種。

 

(三)色彩管理範例:國立故宮博物院以Xrite校色儀、MONACO optix pro進行螢幕色彩校正為螢幕瀏覽基礎,其次以GretagMacbeth ColorChecker 搭配 MONACO DC COLOR產生 ICC profile。最後在掃描時全程以KODAK公司Q13色卡為貫穿全程。

 

(四)色彩管理的限制:由張錫本提出三點色彩管理的限制,包含:「設備的顯色能力」、「色彩管理軟體」、「量測儀器」,以下分別說明之。[111] [39]

 

1. 設備的顯色能力:顯示器的背光模組、色彩濾色片、控制晶片等,又或是印表機的墨水系統、材質以及解析度等。

 

2. 色彩管理軟體:引算法則、轉換引擎、對應方式皆不同。

 

3. 量測儀器:精確性、重複性、以及定期校準等因素。

 

(五)色彩管理實作建議:影像輸入端的設定及維護色彩管理系統。掃描器使用色彩管理ICC Proflie流程管理效益在於:掃描流程標準化、色彩準確性高且品質穩定、不需專業人員也能控制色彩,減少人員修改色彩次數。由吉順隆數位影像科技王遠華先生於本計畫辦理之色彩管理工作坊提出兩點建議:[112] [40]

 

1. 單位對典藏文物數位檔保存格式需視需求而定

 

2. 色彩管理僅能減少圖檔與原物件之色差,若要求與原作近乎相似,則要與原作比對,而單位也需架設色溫標準環境。

 



二、古籍線裝書數位化規範

 

(一)原件拿取基本原則,以中央研究院歷史語言研究所傅斯年圖書館,所擬定的數位化工作規範為例:

 

1. 原件拿取原則時注意平衡,以手掌托拿為原則,並在翻動原件時,請帶上手套,以保護原件。

 

2. 移動原件時,盡量以整套為原則,例如原件的附屬物品如紙片、木夾、函套等,應隨原件移動,以免散失。

 

3. 使用修裱專用軟毛刷子,刷去原件上的髒污,例如在逐頁檢查書況,注意是否有紙屑、毛髮、灰塵,使用軟毛刷子刷去。

 

4. 若需要註記,只可使用鉛筆註記,並以夾紙條的方式置於原件中,不得使用其他筆具或便利貼等。

 

5. 飲料與食物應與原件保持安全距離。且原件不可放置於電腦螢幕、主機或其他會有熱源產生之處

 

6. 在翻閱原件時小心紙質脆弱,避免撕破、缺角的情形發生。若有剝落字情況,必須即刻送交裱褙室人員進行修復。又或紙質焦脆的原件,摺角不宜翻動,以維護原件完整。

 

 

(二)全彩影像掃描原則[113] [41],以下匯整自中央研究院歷史語言研究所傅斯年圖書館、國立故宮博物院、國家圖書館等執行機構所分別擬定的數位化工作規範,供參考:

 

1. 每日進行掃描工作前,執行掃描器校正程式。每兩周必須執行螢幕色彩校,掃描時,目視螢幕不得有炫光、色偏、歪斜等情況。

 

2. 每頁影像檔拍攝時須放置色卡、灰階、尺規。尺規色表採IT8標準色彩導表,掃描時將尺規起始值平行置放接近於原件端,並使尺規色表與原件之間距為0.1~1CM。

 

3. 原稿不清楚或文字線條太細、文字太小或館內其他要求時,在國家圖書館則會提升掃描密度到600dpi儲存,避免影像流失。

 

4. 單頁即達A4大小者,以單頁分別掃描,並須分別重疊左右頁各二到四行,以便於日後接圖之用,一般原件仍採雙幅全掃。例如在國家圖書館善本古籍全書掃描畫面為「彩色全頁」,卷端彩色掃描則以「A4」尺寸為主。在故宮博物院則是所有影像檔古籍封面獨立一頁拍攝,書籍版面左右半頁合為一頁影像檔拍攝;遇特殊情況,視書籍大小而定,得半頁單獨拍攝。又或若原件超出A3(含)尺寸,無法一次全版面拍攝,須採取左右單頁掃描或拍攝時,如有需要,廠商必須提供影像檔接圖作業,以維持完整版面。

 

5. 欲破損之原件(或人為因素)需修補者,仍請館員處理。情況特殊之原件(如無頁碼原件),掃描後交由館員處理。必須以維持原件之原貌為原則,且力求降低原件之傷害,故依原書方式掃描為主,若原件不適宜數位化操作則暫緩數位化,不得因數位化而損害原件。若有特殊情況,則需由本館表被室人員協助處理。全套原件掃描時,第一冊掃描完成後必須先交由館員優先校驗,無誤後方可執行全套逐頁批次掃描。

 

6. 若可明確辨識原件之缺頁情況,則於原件旁加註缺頁條,其位置皆為下緣齊頁,原件之影像版面必須固定。

 

7. 襯紙標準與方法:是用於原件透背葉,卻不能攤開掃描者。因書籍紙質較薄,產生本頁可透視前頁文字的情況時,國家圖書館會再掃描前加襯白紙。在國立故宮博物院則會以小於原書頁的大小,加襯棉紙。

 

8. 在數位掃描設備方面,以故宮博物院為例,會要求委外廠商須能提供平床式拍攝或掃描設備,書籍以書頁朝上方式置於平床拍攝或掃描,若書籍上方設計以平面玻璃壓置,則下方須有防護設計,或可調整玻璃與平床間距,使書籍不受壓折傷害。

 

9. 關於影像檔尺寸方面:在故宮博物院將A3(含)尺寸以下之古籍原件,以1:1比率數位掃描或拍攝,以全彩300dpi規格儲存。而國家圖書館則分為兩種,善本古籍為B4至A3尺寸,全書掃描畫面為彩色雙頁形式,檔案格式為典藏及印刷用300dpi TIFF不壓縮檔、網路傳輸用A4尺寸大小/72dpi壓縮比85%之JPEG檔二種;善本古籍卷端彩色掃描原則上分為典藏與印刷用A4尺寸大小/300dpi/TIFF不壓縮檔、網路傳輸用A4尺寸大小/300dpi/JPEG不壓縮檔二種。

 

10. 為避免損傷文物,拍攝時須採用冷光源燈光設備,不得使用閃光燈系統。

 

 

(三)全彩影像掃描校驗相關標準,以下匯整自中央研究院歷史語言研究所傅斯年圖書館、國立故宮博物院、國家圖書館等執行機構所分別擬定的數位化工作規範,供參考:

 

1.以不影響版框內字跡及閱讀為基準。

 

2.頁面之平整美觀與否亦需要考量。

 

3.書頁掃描之中縫,注意陰影、字跡、字形扭曲、兩頁間距。

 

4.透背頁字跡/襯紙。

 

5.木屑與毛髮/遮字/邊角捲翹/摺角/蛀洞或破洞。

 

6.沾黏書頁上之紙條,需要掃存。

 

7.原件頁面凹凸不平/摺痕/壞檔/錯頁/漏頁/檔名與檔案順號/頁面完整/版面歪斜。

 

8.色差/字跡或圖像清晰度。

 



三、古籍線裝書數位化步驟

 

數位化物件應以「珍貴性」、「代表性」、「數量多寡」作為評估的準則,並依照各館的政策,調整數位化物件的先後順序。為考量計畫成果之後續研究、教育、文化或商業應用,在擬定清單前,須作一次典藏的盤點工作,清查數位典藏國家科技型計畫成果之智慧財產權的狀態,詳參照數位典藏與學習之學術與社會應用推廣分項計畫[114] [42]。當擬定清單後,歸納書籍的尺寸、大小及書況,來作為選擇適合的數位化方式的依據。

 

表 4-2、 各館數位化方式清單

 

 

資料來源:拓展台灣數位典藏計畫 彙整

 

由於中央研究院歷史語言研究所傅斯年圖書館、國立故宮博物院、國家圖書館等三處在物件數物化階段,皆採行委外廠商到館內進行數位化工作,以下流程,將帶入廠商製作的部分,以供參考:

 

(一)提調書籍:由單位或機構人員每日進行,在提調書籍時檢查是否有蟲蛀、脆化、破損、裝訂鬆脫等狀況,若書況不佳則送修裱室,暫不進行數位化工作,並同時在核對書籍情況、冊數是否與原書目系統中登錄情況相符。

 

1.各館在提調書籍時,建議由館內人員進行提調動作,例如:國立故宮博物院是由單位主管以及助理共三名一同進行檢查。除提調時的書況檢查外,中央研究院歷史語言研究所傅斯年圖書館之館藏,需先經由流通組提調出來後,交由數位典藏組人員進行數位化,因此在提調時會由兩組人馬共同進行檢查。

 

2.若當天未數位化完的書籍是否會放回書庫中,各館有不同的作法:

 

(1) 必放回書庫:國立故宮博物院及國家圖書館皆以中午時段作為彈性調整數位化數量的緩衝點,首先在中午時會將書一併歸回庫房中,待下午時段,視上午掃描速度調整下午的書量。

 

(2) 暫放於防潮櫃中:中央研究院歷史語言研究所傅斯年圖書館,並於數位化管理系統中可查檢書籍的動向。

 

3.相關設備:防潮櫃、工作手套、書車。

 

 

(二)書況檢查:開始正式進行數位掃描工作前,各館多是由數位典藏人員再次進行檢視,逐頁與逐冊的檢閱,判定焦脆或剝落等書況是否需要進行修裱,判定其原件掃描方式,再選擇平床式或平台式掃描器進行之。

1. 每日依據掃描進度,以「逐頁逐冊」方式檢視書況,同時協調人力。

2. 此步驟的書況檢查要點,在於確認該書籍是否適合進行數位化,若有「蟲蛀」、「紙質脆化」、「裝訂鬆脫」等問題時,會先送修裱室進行修復工作。

3. 逐頁檢視,將有助於瞭解資料現況,並可同時於表單註記後轉予修裱人員。此外,為避免資料受損,操作時需格外小心,此階段較為費時。

4. 相關設備:PC、工作手套、軟毛刷、紙籤。

 

(三)儀器校色:由委外廠商使用色彩校正軟體替儀器進行校色工作,此階段雖費時,但能保持數位化影像檔之色彩正確性。

 

1.每日正式數位化作業前進行儀器校色工作。

 

2.以國立故宮博物院為例,除每日要求廠商進行儀器校色外,更換不同部書掃描時,由於在尺寸及書況等因素皆會有所調整時,會要求廠商需重新進行色彩管理的動作。

 

3.目前古籍線裝書數位化工作流程的色彩管理階段,各館除要求廠商進行儀器校色外,在數位化的同時多會全程使用色卡進行色彩管理。

 

4.相關設備:PC、掃描器、色彩導表、色彩校正儀器、色彩校正軟體。

 

 

(四)圖籍試掃或試拍:由委外廠商以及數位典藏人員共同進行,為數位化前置作業。國立故宮博物院採每部書取首冊第一頁進行試拍,檢驗其呈像擺設位置以及色彩正確度,為每日正式數位化前作業。中央研究院歷史語言研究所傅斯年圖書館,並以數位化管理系統進行一校圖籍校驗管理。

 

1.費時,但可降書籍受損,增加數位化影像之穩定度。

 

2.中央研究院歷史語言研究所傅斯年圖書館針對數位化物件,若雙方洽談並無爭議之圖檔,則毋須試掃或列印,更為環保。

 

3.相關設備:PC、掃描器、工作手套、無酸紙、書況與試掃紀錄表、口罩。

 

 

表 4-3 書況與試掃記錄表

 

題名

登錄號

書況需試掃註記

記錄者

試掃日期

試掃者

試掃結果

             
             

資料來源:

中央研究院歷史語言研究所傅斯年圖書館 2004/07/14修

 

(五)全彩影像掃描

 

1. 依照館藏所擬訂的圖檔規格進行掃描,在此階段多數單位會「委外製作」,協請廠商進館駐點進行典藏品數位化工作。需特別注意以下幾點:

 

(1) 每年得標廠商以「價格標」作為最後決標的關鍵,也就是價格取勝,雖可使預算達到最高產出,仍須特別注意廠商的「經歷」及「能力」,廠商在先前是否已接過數位典藏的案子,或在專案規劃的進度掌控上是否能如期完工。此外,雖在招標過程中會要求廠商試作,但由於試作的成果有時看不出來廠商在專案規劃及進度管理的能力,因此館內人員需經常性的了解委外廠商的情報資訊,並和其他數位典藏執行單位交換意見,避免後續招標完後發生無法結案或毀約的情況產生。

 

(2) 無論廠商是否曾經執行過數位典藏專案,都得由館藏單位進行後續的「圖籍數位化基本教育訓練」,平均約一個月的時間,委外廠商才能確實掌握掃描工作。

 

(3) 因此「減少圖籍的損害」,是委外廠商本身需要格外注意的課題。另外,招標時間的行政作業程序過長,常造成無法配合規劃執行的進度,也是需要格外留意的課題。

 

2.檔案規格:在先前可行性分析章節中曾提過,可將影像檔依目的性區分為「典藏級」、「商務級」、「公用資訊級」。以下列出各館目前使用的影像檔規格標準:

 

表 4-4、 各館數位化檔案規格清單

 

單位

典藏級

商務級

公用資訊級

中央研究院歷史語言研究所傅斯年圖書館

文字300DPI

古籍附圖300-600DPI

TIFF

150DPI

JPEG

72DPI

JPEG

國立故宮博物院

圖檔300DPI

TIFF

國家圖書館

圖檔300DPI

文字300DPI

套印或彩色圖級600DPI

TIFF

             

 

資料來源:本計畫彙整

 

 

3.作業方式:依照各館擬定的數位化規範進行,此外每頁影像檔均放置色卡、尺規。以下列出各館數位化現況:

 

(1) 在數位化過程中,廠商同時會協助進行書況檢查,以國家圖書館為例,會要求廠商若遇到書況不佳時,應於表單中註記,累積一定數量,請求館內人員重新進行書況的判別,最常遇到的是「中縫過緊」問題。

 

(2) 其掃描作業規範大致上會依照各館藏書的尺寸為主,目前大多以A1為限,下列出各館不同的作業方式:

 

A. 國立故宮博物院和國家圖書館,若尺寸超過A1時,以不掃描為主。檔案格式為典藏及印刷用300dpi TIFF不壓縮檔、網路傳輸用A4尺寸大小/72dpi/壓縮比85%之JPEG檔二種。掃描原書須以1:1之比例掃描。在原稿清楚的前提下,影像掃描品質必須清晰,不可太濃、太淡、歪斜,掃描內容必須完整,在原稿不清楚或者文字線條太細、文字太小等情況下,需提升掃描密度至600dpi(彩色原書)避免影像流失。

 

B. 中央研究院歷史語言研究所傅斯年圖書館,由於考量館內典藏物件如:古籍線裝書、金石拓片等物件尺寸與性質,與廠商共同開發古籍拍攝平台,以數位拍攝的方式將書況不佳、超過A1尺寸的典藏物件加以數位化。

 

(3) 另外在國立故宮博物院,所有檔案封面獨立一頁,內容兩幅為一頁掃描,或一幅為一頁,視大小使用平床式掃描器而定。

 

(4) 針對掃描後影像需進行品質校正,在國家圖書館的做法,以去除黑邊與影像外產生之污點,以中心線為基準,左右影像歪斜度不超過五度。

 

4.相關設備:PC、平床式(平台光學)掃描器(國立故宮博物院:60秒/頁)/平台式掃描器、口罩、作業手套、網路卡。目前國立故宮博物院與國家圖書館所使用的掃描設備相同,包含相機Mamiya645pro TL(120相機)、數位機背Imacon、鏡頭mamiya 55mm/80mm定焦鏡頭 f2.8-22、翻拍平台的平床式(平台光學)掃描器。中央研究院歷史語言研究所傅斯年圖書館所使用的設備則包含: EIZO ColorEdge CG211螢幕、PC主機、Mac G4(含以上)、磁碟陣列、數位機背、相機+鏡頭+相機座架、冷光燈組、古籍拍攝平台、水平儀、IT8色彩導表、測光錶。

 

(六)影像校驗:每頁影像檔數位化後,製作備份列印清單,開始進行一校,針對有問題的單頁進行修正後,會進行二校以及三校的動作。另外,由於影像校驗標準涉及主觀認知,雖有明確且詳細的校驗標準,但由於人員本身在校驗上有不同的理解,而容易造成與委外廠商之間衝突,因此需培養團隊默契以避免困擾。另外人員流動率高也會造成重複問題出現,同時影響校驗品質的差異。

 

1.校驗標準:參見上述第二章「古籍線裝書數位化工作規範」。

 

2.在影像校驗的流程中,各館均以原書來逐頁校對數位影像檔,並以三次校驗為基準。而在校驗的過程中最常遇到「缺頁」、「歪斜」、「炫光」、「影像模糊」、「雜屑」等問題。

 

3.相關設備:PC、顯示器(需完成校色程序)、磁碟陣列、網路設備、工作手套。

 

(七)影像光碟儲存:若影像掃描是委由廠商進行數位化,在此階段多會同時請廠商進行影像儲存的動作。

 

1. 目前三館進行的方式多委請廠商進行光碟製作的工作。

 

2. 由於燒錄時間較費時,且DVD規格目前並無主流,中央研究院歷史語言研究所傅斯年圖書館採用多媒材儲存,包含DVD、磁帶、磁碟陣列。而國立故宮博物院在影像儲存的同時會委請廠商以300DPI規格以TIFF無壓縮儲存,並燒錄兩份DVD備份及磁碟陣列,與國家圖書館所採用的儲存媒材相同。

 

3. 光碟的命名多以檔案命名方式為主,若當一部書較為龐大時,會產生較多的影像檔,因此多以多片光碟儲存之,因此在光碟外殼上會註記是哪一部書的影像檔的編號數量。以國家圖書館為例,則是會在光碟外殼上製作標籤,並標示書號、書名、影像檔編號起訖、影像檔規格。以網路瀏覽級的DVD光碟外殼為例:一般來說會標示「DVD編號:網路24/書號*******/檔案儲存72dpi jpeg」:

 

 

DVD編號:典藏1411/書號:055101/1a0006-1a00010(卷數)真雨山讀書記。

 

4. 在影像儲存時,以中央研究院歷史語言研究所傅斯年圖書館及國立故宮博物院二館為例,相鄰文頁之數位化影像檔應燒錄在同一張或相鄰之光碟片上。為確保光碟使用品質,所用以備份之DVD-R光碟片容量為4.7GB/單面,尺寸為12公分,適用所有DVD-ROM Drives(PC)。燒錄後的DVD光碟片以及保護外殼上使用不易脫落的色筆標註,並要求廠商提供每片光碟片檔案清單以及各檔頁數與總頁數。

 

5.注意事項:檔案命名、儲存媒材的壽命。

 

6.相關設備:PC(要有DVD ROM)、燒錄機(為DVD-RW)、DVD空白片。

 

(八)光碟校驗:由於此階段在委外製作階段視為結案的關鍵,因此除在影像檔建立後需校驗外,在光碟燒製完成後,也須進行校驗工作,校驗影像是否能正常開啟,確認光碟是否燒錄成功。此外校驗光碟外殼上的標示是否和光碟內容相符合,避免有缺交或漏存檔案的問題產生。

 

(九)影像上傳到全文影像資料庫:影像製作完成後,多數以DVD光碟儲存,因此在此階段多數單位會委請自己的資訊組協助進行批次上傳置資料庫。

 

1.在此階段雖多已協請館內資訊室人員進行上傳動作,由於數位化是逐年進行的龐大工程,且在數位化過程中產生相當多的數位檔案,建議仍需定期針對已上傳的影像檔進行抽驗的動作,確認影像是否連結正確,影像是否能正常顯示等問題,避免造成使用者的不便。同時在此階段視之為影像管理及影像創造的前端,以國家圖書館為例,在下一年度數位化清單的建立時,會先同時確認與清查影像檔是否已經數位化。

 

2.注意事項:檔案命名、儲存媒材的壽命。

 

3.相關設備:PC(需要有DVD ROM)、網路設備、單位主機。


 

 

[115] <回 到 目 錄>

 

[116] [35] 陳昭珍,陳立原,張文熙,《數位化檔案命名原則》,國家圖書館館訊,2001年3月。

[117] [36] Widows網站,<色彩管理設定:常見問題集>,檢索:2009年2月,[118] http://windowshelp.microsoft.com/Windows/zh-TW/help/76f61616-6d12-46ec-bac2-49969d130c791028.mspx#E5

[119] [37] 王遠華,<掃描器色彩管理流程實務>,色彩管理實務工作坊,2007年10月。

[120] [38] 蔡耀廣,〈從實務上談數位檔案的基本知識–結構, 製作, 色彩, 保存〉,檢索時間2009年1月,[121] http://proj1.sinica.edu.tw/~ndaplib/channels/dlm_paper/digi_arch.pdf

[122] [39] 張錫本,<符合標準規範的色彩管理流程設計>,色彩管理實務工作坊,2007年10月。

[123] [40]王遠華,<掃描器色彩管理流程實務>,色彩管理實務工作坊,2007年10月。

 

伍、 後設資料與資料庫建置

 

[124] [43]

 

(一)後設資料生命週期模式:為有效促使數位典藏計畫有效發展其後設資料,並達到後設資料的品質保證、作業一致性與計畫管理等多重目的,數位典藏與數位學習國家型科技計畫後設資料小組參酌電腦科學之系統分析與人文社會科學的內涵分析等方法,建立後設資料生命週期作業模式(Metadata Life cycle Model, MLM),提出後設資料生命週期分析法,對資料的深層後設資料加以分析,主要包括了內涵分析、系統分析、結果測試與成效評估四大層面。

 

(二)生命週期作業程序:以數位典藏與數位學習國家型科技計畫後設資料小組協助善本古籍小組主題研擬核心欄位為例,分為四個階段十個程序,包含:1.「需求評估與內涵分析」:需求訪談、計畫相關標準與個案觀察、深入分析後設資料需求、確認後設資料策略暨標準間的互通性。2.「後設資料需求功能書」研製後設資料功能需求書、評估後設資料系統。3.「後設資料系統」:研製參考規範、開發後設資料系統。4.「服務與評估」:後設資料服務、後設資料作業評估。以下將分別說明各步驟的內容。

 

 

圖5-1 、生命週期作業程序

 

資料來源:數位典藏與數位學習國家型科技計畫 後設資料小組

 

1. 需求訪談:後設資料分析人員訪談主題計畫之內容專家或提供者,以了解計畫屬性與其後設資料需求。除了獲取計畫背景資訊、協調聯絡方式外,並與主題計畫確認計畫的目的、目標及預期效益。

 

2. 計畫相關標準與個案觀察:分析相關的後設資料標準及其應用個案,評估應用標準實作的可能性。在標準觀察方面,應用「後設資料標準評選模式」從社群、資料、學科、功能四個層面分析主題計畫的屬性,歸納適用的後設資料類型。在個案分析方面,則蒐集國際上相關的數位圖書館計畫,了解其後設資料的應用趨勢和議題,以作為未來實施與發展的參考。此階段分析的成果,將有助於主題計畫了解與其他同質或相似計畫間的差異,藉以修正計畫規劃的方向。

 

3. 深入分析後設資料需求:評估後設資料系統發展的可能性,以利主題計畫決定採用同質或相似計畫的系統,或自行發展,或採取與其他組織團體(如大學或業界)合作等方式發展其系統。針對中央研究院傅斯年圖書館、國家圖書館兩單位所提之善本需求元素,與MICI-DC、Dublin Core、MARC21、CMARC 四標準所做之評估分析[125] [44]

 

表 5-1、 後設資料標準評估分析

種類

滿足率

無法對應之元素數

優點

缺點

MARC21

77%

20

A. 善本古籍之書目描述需求滿足率最高B. 易與國際圖書館社群進行交換C. 易與圖書館目錄系統結合

善本古籍內容小組會議 數位典藏國家型科技計畫後設資料工作組分析報告A. 缺乏專為善本古籍類型資料之描述欄位B. 古籍善本特殊描述項目(如:牌記、手書題記等)只能著錄於500General Note。

CMARC

67%

29

A. 有善本古籍之特殊描述欄位(140、141)B. 較能配合依中國編目規則描述之善本記錄C. 易與圖書館目錄系統結合

A. 部分善本古籍特殊描述項目(如:牌記、手書題記等)只能著錄於300一般註

MICI-DC

62%

33

A. 是為善本古籍類資料所設計之後設資料格式,對於善本古籍特殊描述項目(如:牌記、手書題記等)皆有描述欄位可滿足

A. 偏於博物館社群之善本古籍描述格式,對部分以圖書館社群切入之善本古籍描述需求無法滿足(如:出版、印刷)B. 缺乏對與善本古籍其他形式電子資源連結之描述

Dublin Core

95%

4

A. 使用彈性大B. 易與其他學科領域或社群進行交換

A. Dublin Core 元素只有15 個,較適於簡要資料之描述B. 多數善本古籍需求元素皆對照一個 Dublin Core 元素,Dublin Core元素過少,無法具體描述善本專業描述需求C. 交換時恐造成資料遺失。

資料來源:數位典藏與數位學習國家型科技計畫後設資料小組

 

4. 確認後設資料策略與標準間的互通性:利用之前的研究發現,建議主題計畫採用的後設資料策略,如採用單一或複合的後設資料標準;或以既有的後設資料標準為基礎,發展適用的後設資料格式。例如國家圖書館在執行數位化工作,為能探討國內外 Metadata 發展現況、積極加入國內外 Metadata 研究組織及相關計畫(如DC會議及CORC計畫)。發展各主題領域或資料類型之metadata、研究 MARC 與 Metadata 轉換之語法、語意等相關標準,以及發展 Metadata 管理系統等需求,成立metadata小組。[126] [45]

 

(1) 善本古籍需求元素與標準對照一覽表:以數位典藏與數位學習國家型科技計畫善本古籍主題小組為例,分析包括:「台灣地區善本古籍需求元素與相關標準對照一覽表」、「善本古籍後設資料核心元素分析」、「後設資料標準評估分析」等。後續並將就善本古籍的範圍、數位典藏計畫,以及後設資料標準應用方式,提出觀察與分析報告,最後並提出善本古籍「後設資料核心元素」與數位典藏與數位學習國家型科技計畫的「聯合目錄」之建議方案,詳見附錄五「善本古籍核心元素需求書」。

 

(2) 核心元素分析:各核心元素的定義與範例,係參考數位典藏與數位學習國家型科技計畫善本古籍主題小組「中研院史語所傅斯年圖書館善本古籍元素」、「國家圖書館善本古籍元素」、「國立故宮博物院」所提供的定義以及中國編目規則相關規範、彙整所得。

 

表 5-2、 善本古籍主題小組核心元素表

 

描述性後設資料元素

(共12元素)

類型

 

識別號

登錄號、排架號、索書號

題名

正題名、其他題名、拼音題名

著者

姓名、朝代年號或國別、著作方式

其他貢獻者

姓名、朝代年號或國別、著作方式

出版資訊

責任者、地點、時間、責任方式

數量

 

簡述

版本、裝訂、裝潢、圖像、行格、避諱等

主題

主題、關鍵詞

語文

 

關連

叢書、子目、合刊、原件複製品、影像檔

現藏者

 

紀錄管理性後設資料元素(共1元素)

建檔紀錄

建檔人員、建檔時間、修改人員、修改時間

資料來源:內容發展分項計畫之善本古籍小組所提供的核心欄位

5. 研擬後設資料功能需求書:後設資料功能需求書的目的,即作為主題計畫、後設資料分析、系統開發三方面溝通的橋樑,促使不同專業領域達成共識。其內容包括:需求書的版本與管理資訊、計畫背景、參與人員、系統目標與範圍、採用的標準、後設資料元素與結構、後設資料元素屬性(如名稱、長度、資料型態、系統主鍵等)、輸出範本、相關標準的比對、系統範圍關係圖、系統功能需求(如中文、日文字型的輸入與顯示)、控制詞彙或代碼清單、XML DTD等。以數位典藏與數位學習國家型科技計畫 善本古籍主題小組為例,是以元素需求為導向,並參考各核心元素對照至Dublin Core 與MARC21 &#12695;所屬之元素段。

 

6. 後設資料系統評估:評估後設資料系統發展的可能性,以利主題計畫決定採用同質或相似計畫的系統,或自行發展,或採取與其他組織團體(如大學或業界)合作等方式發展其系統。

 

7. 研擬參考規範:評估後設資料參考規範的目的:包括後設資料元素應用指引,或提供計畫應用標準的檢核表與參考資料,或控制後設資料記錄品質的手冊等。參考規範內容應包括後設資料元素定義、著錄原則、系統建議、著錄範例,及其他相關後設資料標準的對照項目等。系統發展的可能性,以利主題計畫決定採用同質或相似計畫的系統,或自行發展,或採取與其他組織團體(如大學或業界)合作等方式發展其系統。

 

8. 發展後設資料系統:至此階段,已完成後設資料發展任務,進入系統開發程序。系統開發任務在於開發符合需求書的後設資料系統與工具。開發期間,為促使有效的系統設計,主題計畫、後設資料及系統發展者之間的參與成員,應持續交流與討論意見。待系統雛型完成後,主題計畫與後設資料分析人員雙方,亦應回覆系統測試與評估的結果,提供系統人員修正的參考。

 

9. 著錄後設資料:如何存放端看各機構如何規劃整個數位化工作,委外的部分有哪些?資料庫是以誰為核心?圖檔資料及其文字metadata篇目文字該如何對應,都是此部分應該要仔細考慮?

 

10. 後設資料服務與作業評估:為控制後設資料機制的品質,後設資料工作小組依服務模式涉入的角色、關係與服務項目,規劃「後設資料服務模式」,並依據主題計畫的需求,檢視後設資料整體實施程序和效益。

 



二、關聯式資料庫

 

數位化工作從起始階段開始,一直到資料庫儲存的結案階段,所涉及的九大知識領域比重不同。而目前數位化的目的為了要能有效的保存典藏品及有利於資訊分享,因此如何達到此目的,將是數位典藏工作的核心目標。而建立資料庫是多數人在管理資料時所採用的方式,所謂的資料庫廣義來說,為一個具有相關隱含意義的資料集合,通常為了特殊目的而建置,因此會有預定的使用族群,而資料庫可大可小、可簡單亦可複雜。一般對於資料量需求不大、關係簡單之資料,是可以採用Word、Excel等文件格式記錄,這也算是廣義資料庫的一種;但若資料彼此間關係稍微複雜,就會有不少維護困難與著錄限制,[127] [46]因此目前各執行計畫多採用關聯式資料庫。

(一) 關聯式資料庫:是1969年E. F. Codd博士在IBM公司的研究成果,不同於其它資料庫模型,關聯式資料庫模型是以數學集合論為理論基礎建立的資料庫模型。簡單來說,就是將資料看成一些彼此有相關的表格,允許資料庫檔案之間存在著關係(relation),使得使用者修改其中一份檔案,另外幾份相關檔案也會跟著修改。利用各關係檔案之中的關鍵欄位來互相建立關聯模組,串起整個相關資料。

(二) 數位內容品質管理:數位化工作是一個具規模或持續性的工作,並對於影像檔有一定的品質要求,由於具有一定的規模因此需要有效地進行工作進度的掌控。數位化工作一直以來的困擾:「人員的流動」、「委外廠商的能力評估」,應以系統來管理數位化流程,建立一個透明化的工作平台。中央研究院歷史語言研究所傅斯年圖書館林妙樺館員在「2008年數位典藏專業培訓課程」中[128] [47],針對數位化系統規劃提出以下五點:

1. 發掘數位化需求,並擬定規劃策略:檢視典藏品的現況,分類並評估出哪些古籍線裝書可立即並具有價值可進行數位化,並了解目前有哪些館藏已經數位化的部分,並提出未來欲數位化典藏品的需求,進而擬定數位化清單

2. 分析、評估整體環境與現況:主要探討的部分為「原件」、「人員」、「系統」、「數位化操作及儲存環境」、「現有設備」。

(1) 從數位化清單中了解欲數位化物件之原件現況,是否能立即進行數位化,或需先進行修復工作。同時決定該原件可數位化的方式,例如使用平床式(平台光學)掃描器或平台式掃描器。

(2) 專案的人員組織包含參與數位化之相關人員、原始典藏之維護管理人員、資訊技術人員等,由內容及技術兩部份組成數位典藏團隊。

(3) 在系統的部分,評估原有館藏或單位的舊系統是否適用於數位化系統規劃,是否能整合或取代之,若需進行整合,則應了解新舊系統之間的整合方式,是否皆能移轉或仍要進行程式改寫等步驟。

(4) 古籍線裝書藏品需要在恆濕恆溫的環境中保存,因此空調的設備、數位化操作空間及光源、防潮箱、機房等環境都需加以評估。

3. 系統規劃之目標及預期效益:系統規劃數位化流程需達到下列的三個成效。

(1) 避免原始典藏因數位化而損傷:有鑒於原始典藏品不易保存且流通不易,再加上典藏空間的不足,因此將原始典藏品數位化以另一種型式典藏,數位化的過程中要極力避免藏品的二次傷害。

(2) 可有效控管數位化流程:數位化流程是由許多流程串連而成,且由於數位化涉及多元領域,因此多數機構會將專業的部分委由廠商協助進行,因此參與數位化的人員將不限定於館藏人員,因此藉由系統來加以有效的控管流程,讓流程透明化,達到一定的品質產出。

(3) 結合不同典藏團隊:數位化工作涉及文史學科及技術的資訊科技等專業性,對於古籍線裝書在選定數位化物件、擬定數位化清單、排定數位化順序、metadata欄位分析與著錄及資料庫檢索需求等內容,有賴文史學科專業背景的人協助。而在技術方面,有賴於資訊科技背景的專業人士協助評估系統整合的可行性、資料庫系統的建置、及考慮成本而採用委外廠商進行掃描工作內容。

4. 規劃符合需求之系統架構及方案:首先須擬定專案工作流程以及製作的數位化工作流程之各種規化流程圖,其次決定系統架構是要以集中式或分散式系統建置,及作業系統的選定,同時並提交相關系統開發需求書及規格書,最後評估核定經費及人力,決定流程中哪些要自行製作開發及委外製作開發。

5. 訂定數位化系統發展計畫等內容:若決定採用系統來有效將資源整合,需納入「系統測試」、「教育訓練」、「系統驗收」、「系統維護與保固」、「系統評鑑」等部分,雖耗時,但若能嚴謹且妥善的進行,相信將有效的節省數位化流程中反覆校驗成果的時間,並有效產出相同的數位化品質。

(三) 各館資料庫分析:以下列出各館資料庫與檢索系統,及資料庫建置方式。

 

表5-3、各館資料庫與檢索系統分析

中央研究院歷史語言研究所傅斯年圖書館

http://lib.ihp.sinica.edu.tw/pages/03-rare/DAP/index.php

典藏館特性

圖書館

書目系統

傅斯年圖書館善本圖籍書目資料庫

http://www.ihp.sinica.edu.tw/ttscgi/fsndb2/ttsweb?@0:0:1:fsndb::/ttsweb/fsn/main.htm@@0.9961351775402316

文字metadata建置

新增欄位於書目資料庫中

影像資料庫系統

匯入書目清單的文字metadata與上傳影像檔至傅圖善本圖籍典藏系統。

檢索系統

http://ndweb.iis.sinica.edu.tw/rarebook/Search/index.jsp

數位典藏系統入口網

http://lib.ihp.sinica.edu.tw/pages/03-rare/system/index.htm

國立故宮博物院

http://tech2.npm.gov.tw/da/ch-htm/about02_5.html

典藏館特性

博物院

書目系統

新建善本古籍總目資料庫。「善本古籍資料庫後設資料檢索目錄」:為配合「善本古籍及其附圖」影像檔的建置以及方便讀者能在短時間內檢索所需之資料,因而建置「善本古籍及其附圖」目錄檢索資料庫。

文字metadata建置

建置於善本古籍總目資料庫

影像資料庫系統

將影像上傳善本古籍總目資料庫中,完成全文影像資料庫。「善本古籍影像檔資料庫」:本計畫一方面以裱褙修補古籍的方式增強其保存性,一方面以高品質數位掃描(或數位攝影)建檔,以減低對古籍本身的損耗,同時影像檔分別以300dpi 無壓縮Tiff圖檔及200dpi JPG壓縮之Tiff的圖檔儲存格式儲存,以便能兼及優良圖檔的保存及網路應用傳輸下載的便利性。

檢索系統

《國立故宮博物院圖書文獻處善本古籍資料庫》:http://npmhost.npm.gov.tw/tts/npmmeta/RB/RB.html

數位典藏系統入口網

http://www.npm.gov.tw/digitization/overview.htm

國家圖書館

http://readopac.ncl.edu.tw/ndap/rar/ndap-rar-int-00.htm

典藏館特性

圖書館

書目系統

開發建置「善本古籍Metadata書目資料庫」,http://rarebook.ncl.edu.tw/rbook.cgi/store/frameset.htm

文字metadata建置

將館藏善本的相關書目訊息以詮釋資料(Metadata)格式提供查詢,方便利用,使用者無論從善本書的書名、著者、版本,乃至於序跋者、刻工、版式行款、…等各個角度檢索,都可以查到所需的古籍資訊;此外還可以點選該書的卷次及篇目,以便在網路上閱覽到整部古籍的影像。

影像資料庫系統

查詢結果「條列式」顯示畫面出現圖案者,代表該書有全文影像,並於特定區域內直接瀏覽全書影像。大部分書目於「詳目式」頁面右上方,有「卷端書影」縮圖,點選後可放大瀏覽。【缺字處理】以 Unicode 為內碼,缺字則以圖片方式呈現,並參考CNS11643中文全字庫網站的字碼查詢提供本系統已處理之缺字的查詢。

檢索系統

「善本古籍Metadata書目資料庫」與上傳影像檔至古籍影像檢索系統作連結。[129] http://rarebook.ncl.edu.tw/rbook.cgi/store/frameset.htm,並無單獨建置數位典藏系統入口網

資料來源:拓展台灣數位典藏計畫 彙整

 

三、全文影像資料庫

 

(一)建置metadata 資料

 

metadata欄位擬定後,評估其現有資料庫功能以及規劃,了解是否可直接新增欄位建立資料,以資料庫整合方式進行。若否,則須擬定資料庫系統需求書,建立新的資料庫系統。完成資料庫規劃後,可開始逐筆建置圖籍影像的文字metadata篇目資料。在進行書目建檔時,依照書籍後設資料的metadata資料庫欄位表單依序著錄。例如中央研究院歷史語言研究所傅斯年圖書館會將線上公用目錄已有書目資料者,以人工鍵入metadata資料庫中,再進行更細部的影像描述及展現工作。若系統已建立控管物件數位化等流程,在進行影像數位化的同時,列印出當天或當月份已數位化的清單,可掌握數位化圖檔的產出進度。依物件數位化的數量而定,目前評估每天大約需要2-3名工作人員進行於此工作。

 

1. 依循標準:metadata資料庫欄位表單、著錄規範

 

2. 注意事項:在此步驟有些單位會與物件數位化一起進行,最後在一起上傳到資料庫中,再加以校對。而有些單位則會先建立圖檔後,在資料庫中進行細部的描述。此關鍵在於數位典藏資料庫是要整合進入原有書目館藏的資料庫中、或將原有的書目館藏資料轉入新建立的數位典藏資料庫中、又或是直接建立新的資料庫,因此該步驟會如何安插在整個數位化流程中,端看該單位是如何進行數位化工作,並且是否有委外請廠商共同進行,也需要一並考量,如何能讓流程透明化、流暢是本指南終旨。

 

3. 相關設備:總目資料庫、PC(需有DVD ROM)

 

(二)全文影像資料庫建置

 

1. 影像上傳或連結:在影像數位化完後,批次將DVD光碟上傳到影像資料庫中,並與Metadata書目資料庫連結整合,完成全文影像資料庫建置工作。文字metadata資料的規劃與各機構的數位化工作流程有關,委外的部分有哪些,資料庫是以誰為核心,圖檔資料及其文字metadata篇目該如何對應,都是此部分應該要仔細考慮。

 

2. 資料庫開放應用:目前「數位典藏與數位學習國家型科技計畫」執行迄今已邁入第二期的階段,機構已累積相當成熟的數位化方式及規範,各機構所進行的資料庫開放程度,在遠端均可檢索影像,但若需要複製或列印,則皆須到各館進行申請。

 



四、全文資料標誌語言

 

所謂全文資料標誌語言是指可用來標誌各種不同常見文件特徵,已達到文件轉錄的最大效益,並促進平台系統之間的文件交換,例如最常於佛學數位化研究中提及的TEI(Text Encoding for Interchange),是一個國際性、跨學科性的標準,利用標準通用的標誌語言(SGML)展現電子形式的文本,可不受軟硬體、平台的限制達到再利用、資料交換的目的。其主要用於協助圖書館、博物館、出版者和個別學者以電子文本形式呈現各種文獻和(語言學)文本,達到線上教學與利用[130] [48]

 

 

「數位典藏與數位學習國家型科技計畫」對於全文資料之標誌語言之應用,有用在「新聞數資料庫」、「漢籍資料庫」、「史籍資料庫」等。全文資料庫建立後有利於關聯式資料庫的處理,以中央研究院為例,1985年10月開始試做的「漢代墓葬綜合研究資料庫」,1986年2月的「台灣土著語言資料庫」,1986年4月的「台灣日據時代戶籍資料庫」,1987年1月的「清代竹塹地區土地申告書資料庫」,以及1989年計算中心所做的「說文解字和玉篇資料庫」等等。也有利用影像處理技術所做的古籍資料庫,如傅斯年圖書館發展的「善本書全文影像資料庫」,目前已完成該館近半數善本書的典藏,並已開放使用。這些資料庫雖非本文報告的重點,然而在語文處理技術上和全文資料庫是相輔相成的[131] [49]。詳細全文資料庫建置方式請參見:中央研究院資訊科學研究所之「文獻處理實驗室」《中央研究院古籍全文資料庫的發展概要》一文。[132] http://www.sinica.edu.tw/~cdp/paper/1997/19970301_5.htm


 

 

[133] <回 到 目 錄>

 

[134] [41]數位典藏與數位學習國家型科技計畫計畫辦工是 彙編,《數位典藏技術彙編2007年版》,台北:數位典藏與數位學習國家型科技計畫,2007年12月,http://www2.ndap.org.tw/eBook08/showContent.php?PK=162

[135] [42] 數位典藏與數位學習之學術與社會應用推廣分項計畫,計畫網站[136] http://aspa.teldap.tw/

[137] [43]數位典藏與數位學習國家型科技計畫 後設資料工作組,<後設資料生命週期作業模式(Metadata Lifecycle Model, MLM)>,檢索:2009年2月,[138] http://metadata.teldap.tw/design/lifecycle_new2.htm

[139] [44] 數位典藏與數位學習國家型科技計畫 後設資料工作組,<善本古籍內容小組核心元素分析報告(一)>,檢索:2009年2月,[140] http://pl11.sinica.edu.tw:8080/dspace/bitstream/1868/1857/1/N1-BC0800001.pdf

[141] [45]國家圖書館中文編目標準規範 metadata小組[142] http://catweb.ncl.edu.tw/2-1-12.htm

[143] [46]黃國倫著,<資料庫初體驗(I)>,數位島嶼電子報第24期,檢索:2009年2月,[144] http://content.teldap.tw/main/epaper_detail.php?doc_id=1177&epaper_id=44

[145] [47]林妙樺 著,<數位內容之品質管理>,台北:數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫:品質管理研討會,2008年,[146] http://dlm.ntu.edu.tw/01_1.htm

 

 

陸、 延伸議題

 

除了上述數位化所涉及的議題,另有其他議題值得注意,包含:「數位化設備」、「儲存設備」、「數位內容保護」、「數位內容之工作挑戰」等議題,以下將分別簡述之。

 

一、數位化設備分析

設備與成本分析主要說明掃描工作所需之空間規劃、設備(硬體設備與軟體設備)以及所需成本的粗略估算,作為規劃數位化工作之參考依據。

 

[147] [50]

 

1. 地點:地點應位於建築物中央,並遠離建築物外牆、機房、管線、水閘和光照等會影響之地點,建議靠近書庫或圖書館、載貨用升降梯、古籍線裝書修裱室等,如此作業動線之規劃,較有利於流程便利性。

 

2. 空間:需預留數位化工作人員之工作空間及管理上之安全空間,以便有效進行古籍線裝書掃描工作。工作桌除放置電腦設備及掃描器設備外,建議可規劃工作桌所需空間為預掃描之物件大小的7倍,以確保有足夠的空間來放置尚未數位化及數位化後之原件。

 

3. 暫存空間溫濕度控制:暫存空間溫度和相對溼度標準為:溫度18-21℃,相對溼度47%-55%。掃描工作需要有足夠的冷卻和空氣對流裝置,以減輕各項設備所造成的高溫。若無中央控制系統,可以冷氣機之冷卻系統濾除空氣中的雜質。

 

4. 照明:對照明的要求也相對的提高,除了適當的亮度之外,更要求舒適愉快的氣氛。因此,在考慮良好的照明時,必須先瞭解色溫、演色性、經濟效率。以紫外線為例,由於其亮度或光度及光源性質和波長等因素,會傷害古籍線裝書或其他藏品,因此須避免太陽光直接照射書籍,可關上窗戶並加上可遮蔽陽光之黑窗簾。由於掃描作業地點多以燈管及燈泡為主要光源(例如:日光燈管或鎢絲鹵素燈泡),建議可套上能吸收紫外線的材料。避免使用白燈泡,此類燈泡會產生熱能,導致局部溫溼度波動,影響溫度控制。

 

5. 其他要求:為防止蟲類侵入造成古籍線裝書二次傷害,需要絕對禁止在工作場所攜帶食物及飲料進入,以維持環境清潔。避免古籍線裝書被推落、摔壞的危險或被水災侵襲等自然傷害,因此禁止將古籍線裝書放置地板上。另外,可將古籍線裝書放置於防潮櫃中;若放置於開放式書架上,則須離地18公分,由於18公分以下容易將藏品暴露在水災、灰塵、泥砂等可能的侵襲下,亦可避免打掃人員將書籍移置不適當處放置。

 

(二)主要數位化相關設備

 

1. 選購條件:

(1) 不得為滾筒式或饋紙式掃描機

(2) 掃描範圍:A4以上(最大至A1)

(3) 掃描方式:以單頁式掃描

(4) 光源種類:使用 Cold light fluorescent tube

(5) 光源周邊溫度:室溫為20+1(20-1)度時,資料面測得溫度不得高於攝氏30度

(6) 曝光:全自動曝光控制

(7) 掃描速度:於上述基準情況下掃描,平均每部機器各影幅之掃描時間須少於10秒鐘。(依計畫年限及欲數位化物件數量作調整)

 

2. 掃描設備:古籍線裝書數位掃描方式大致以「平台式掃描器」及「平床式(平台光學)掃描器」兩種掃描器來數位化。

(1) 平台式掃描器:掃描方式是將書籍面朝下,建議古籍線裝書數位化不蓋下遮光板。而每掃一頁均需要重複操作掃描等動作,也就是需要將整本書翻動一次,因此若古籍線裝書書況不佳時,則不適合用平台式掃描器,此種掃描器較適合用於資料尺寸一致、書況良好的書籍。

(2) 平床式(平台光學)掃描器:掃描方式是將書籍面朝上來掃描,因此不需要翻動整本書籍,只需翻動書頁即可。藉高處投射光源,而機器自上方擷取影像進行掃描動作。但仍須顧及古籍線裝書之書背裝訂處,避免此處因機械操作不當而損傷書籍。

 

表格 6-1、數位掃描設備比較分析

資料來源:拓展台灣數位典藏計畫 彙整

 

(三)平床式(平台光學)掃描器比較分析

 

回顧以往多數以數位化產出為首要考量基礎的設備或技術,因在數位化過程中較少將重心放置於文物的保護上,導致原件因設備(如掃描機器離心力過大或燈光過熱等)、存放空間(如過於陰暗潮濕)或人為因素(如無使用適宜手套翻閱掃描)而造成毀損或破壞。目前則因有專門適合古籍線裝書進行數位化之機器設備(如書籍掃描器、專業用途掃描器等),使得文物能兼顧數位化產出及保持現狀之需求,以降低數位化過程中原件受傷害程度。

 

1. 設備類型:目前市面上掃描器已能支援在不破壞原件的情形下,進行古籍線裝書之數位化,其過程不需接觸文物或拆卸裝訂,原理則是運用不同角度的書籍支架來支撐物件左右兩邊重量之平衡。

 

2. 掃描方式:由於目前古籍影像篇幅之取捨以跨頁為一影幅的方式,解決線裝古籍之左右頁對稱問題為主。目前以180度書籍支架為主,而使用率最高者為德國Zeutschel廠牌,由於書籍本身裝訂處會有過於緊靠文字的問題,而此款設備是以玻璃代替手來使書籍平坦,因此數位化後的影像極為清晰,但古籍線裝書最為脆弱也就是在書背裝訂之處,若以玻璃物質平壓書籍,則可能會導致加速原件損壞,因此須視原件書況來決定可操作的設備。

 

3. 平床式掃描器之平台比較:以下將國內常用於掃描書籍之平床式掃描器設備比較其內部性能。

 

表 6-2、 數位掃描平台功能比較分析表

 

 

古籍拍攝平台

德國Zeutschel賽數

DigiBook專業多用途

比較型號

國內自行研發

OMNISCAN 6000 COLOR

2000LC

圖片

價格

30萬左右

450-600萬(含軟體)

160-350萬

襯底顏色

黑色絨布(避免反光)

白色

綠色

可移動式面板

上下可移動之磁性面板

上下移動

上下移動

微調方式

步進馬達(微調)

電動微調

手動微調

固定原件

掀蓋式玻璃

固定式玻璃

書籍定位與玻璃距離

書籍可不接觸

緊密

手壓

最大可拍攝範圍

(以1:1比率)

86㎝×105㎝

(A0以上)

A1尺寸

A1尺寸

平台中縫寬度

>5㎝

<5㎝

<5㎝

中縫移動

較彈性

標準

標準

拍攝物件

古籍、器物、立體雕塑藏品、期刊報紙、檔案

古籍、期刊報紙、檔案

古籍、期刊報紙、檔案、地圖

評價

半自動

全自動

半自動

備註

需另外購買燈光以及數位機背等相關設備,價格約150萬左右。

無需另外購買

無需另外購買

 

資料來源:拓展台灣數位典藏計畫 彙整

 

(四)書況與設備選擇方案:除考慮機構單位計畫經費外,仍需針對主觀因素的書籍狀況來作為設備選擇的考量因素,將針對中央研究院歷史語言研究所傅斯年圖書館、國立故宮博物院、國家圖書館等三處在進行數位化工作時,對於「書籍狀況」、「書籍尺寸(可掃範圍)」的不同考量,提出以下四種選擇方案:

 

 

表6-3 、書況與設備選用關係表

 

方案

書籍狀況

書籍尺寸

可掃範圍

數位化設備

考量因素

範例

優點

缺點

方案一

良好

尺寸一致

≦A3

平台式掃描器

價格較為低廉、體型小,可同時購買多台使用,且掃描品質良好。

容易產生歪斜問題。
書籍與設備較多接觸。

中研院史語所與中研院近史所等單位皆有使用此種掃描器進行數位化。

>A3

平床式掃描器

減少書籍的碰觸、歪斜的發生。

但是價格較為昂貴,鮮少有單位自行採購,多是委由廠商進行。

台灣大學圖書館已完成的淡新檔案及國家圖書館和國立故宮博物院等單位所進行數位化工作。

方案二

尺寸不一致

平台式掃描器/平床式掃描器

方案三

破損

尺寸一致

≦A1

平床式掃描器

減少書籍的碰觸、歪斜的發生。

但是價格較為昂貴,鮮少有單位自行採購,多是委由廠商進行。

台灣大學圖書館已完成的淡新檔案及國家圖書館和國立故宮博物院等單位所進行數位化工作。

>A1

古籍拍攝平台

可以將書籍的碰觸減至最低,且擴充平台對於尺寸不一的物件彈性大,亦能減少歪斜的發生。

此設備需另外採購數位機背及燈光等設備。

中央研究院歷史語言研究所傅斯年圖書館自行與廠商研發平台。

方案四

尺寸不一致

平床式掃描器/古籍拍攝平台

 

資料來源:拓展台灣數位典藏計畫 彙整

 

 



二、儲存設備分析

 

數位化儲存媒體主要分為二部分來論述,包含:「硬體儲存設備種類」、「儲存媒體容量與保存年限」。

 

(一) 硬體儲存設備種類:儲存媒體除可依先前論述過依存取特性可分成三種方式:線上即時備援On-Line Backup),以硬碟作為儲存媒介,讀寫速度快,強調在資料保全的磁碟陣列,但費用是最高的;近線備援(near online Backup),以光碟櫃(Jukebox)為儲存設備,可隨時存取、方便查詢且資料保固度高,保存年限較長,費用也比較便宜一些;離線備援(Off Line Backup),以磁帶(tape)儲存,是最經濟但存取速度慢,且安全性較低的儲存方式。以下簡要主要各館所選用的儲存媒材,並以表格說明相關儲存媒材的優缺點。

 

1. 磁帶備份[148] [51]:磁帶本身是以循序的方式來儲存資料,且由於是以捲動方式將磁帶轉到所需的資料上才可存取,因此存取檔案較花時間。不過由於磁帶適用於整體備份或傳輸大量的資料,而非存取某一小塊,因此大型資料的備份無須旁人照料就可完成。[149] [52]其缺點在於所有磁帶為磁性媒體,也就是說其易受電力磁場的影響。包含手機及其它環境因素,如陽光及濕氣會對磁帶產生不良的後果。因此磁帶上的資料安全端視單位如何處理磁帶而定,建議將磁帶放在黑暗、乾燥以及涼爽的環境中,並且避免有灰塵進入磁帶機、磁帶。

 

2. 光碟備份[150] [53]:分為CD(Compact Disk) 及DVD(Digital Video Disk)兩種,以下節錄微軟官方網站中針對光碟片的說明內容:[151] [54]

 

表 6-4 、光碟片容量與相容性一覽表

 

光碟

一般資訊

容量

相容性

光碟機

稱為「唯讀」光碟,通常用來儲存商業程式及資料。您無法在 CD-ROM 上新增或刪除資訊。

650 MB

可與大部份電腦及裝置高度相容。

CD-R

您可以多次將檔案燒錄至 CD-R (每次都稱為一個「工作階段」),但是無法從光碟中刪除檔案。每次的燒錄都是永久的。

650 MB 和 700 MB

您必須關閉工作階段,才能在其他電腦中讀取此光碟。可與大部份電腦及裝置高度相容。

CD-RW

您可以多次將檔案燒錄至 CD-RW。您也可以刪除光碟上不想要的檔案,收回空間然後新增其他檔案。CD-RW 可以多次燒錄及清除。

650 MB

可與許多電腦及裝置相容。

DVD-ROM

稱為「唯讀」光碟,通常用來儲存商業程式及資料。您無法在 DVD-ROM 上新增或刪除資訊。

4.7 GB

可與大部份電腦及裝置高度相容。

DVD-R

您可以多次將檔案燒錄至 DVD-R (每次都稱為一個「工作階段」),但是無法從光碟中刪除檔案。每次的燒錄都是永久的。

4.7 GB

您必須關閉工作階段,才能在其他電腦讀取此片光碟。可與大部份電腦及裝置高度相容。

DVD+R

您可以多次將檔案燒錄至 DVD+R (每次都稱為一個「工作階段」),但是無法從光碟中刪除檔案。每次的燒錄都是永久的。

4.7 GB

您必須關閉工作階段,才能在其他電腦讀取此片光碟。可與許多電腦及裝置相容。

DVD-RW

您可以多次將檔案燒錄至 DVD-RW (每次都稱為一個「工作階段」)。您也可以刪除光碟上不想要的檔案,收回空間然後新增其他檔案。DVD-RW 可以多次燒錄及清除。

4.7 GB

您不需要關閉工作階段,以在其他電腦讀取此片光碟。可與許多電腦及裝置相容。

DVD+RW

您可以多次將檔案燒錄至 DVD+RW (每次都稱為一個「工作階段」)。您也可以刪除光碟上不想要的檔案,收回空間然後新增其他檔案。DVD+RW 可以多次燒錄及清除。

4.7 GB

您不需要關閉工作階段,以在其他電腦讀取此片光碟。可與許多電腦及裝置相容。

DVD-RAM

您可以多次將檔案燒錄至 DVD-RAM。您也可以刪除光碟上不想要的檔案,收回空間然後新增其他檔案。DVD-RAM 可以多次燒錄及清除。

2.6 GB

DVD-RAM 光碟通常僅可用於 DVD-RAM 磁碟機,而且不能使用 DVD 播放器和其他裝置來讀取。

4.7 GB

5.2 GB

9.4 GB

 

資料來源:微軟WINDOWS網站,<說明與使用方法>:http://windowshelp.microsoft.com/Windows/zh-TW/help/2af64e60-60aa-4d79-ab6c-3a5db5806cbe1028.mspx

 

3. 磁碟陣列(Redundant Array of Independent Disks;RAID,獨立磁碟冗餘陣列;在台灣稱為:磁碟陣列):RAID把多個硬碟組合成為一個邏輯磁區,因此,作業系統只會把它當作一個硬碟。RAID常被用在伺服器電腦上,並且常使用完全相同的硬碟作為組合。[152] [55]建議在挑選硬碟時有兩點要注意:磁碟空間與轉速。最後,磁碟進入備份流程的目的是彌補磁帶還原速度過慢的缺點,讓磁碟和磁帶各自發揮其長處。[153] [56]

 

(二) 儲存媒體容量與保存年限

 

1. 容量與傳輸速度:資料儲存容量多以 Byte (即8-bit)為單位計算,1,024Bytes = 1M bytes,1,024M bytes = 1G bytes,1,024G bytes = 1T bytes。傳輸速度:儲存設備的資料傳輸速度皆以「每秒」傳送的資料量為單位,常見的速度表示如 80MB/Sec.,即是「每秒可傳送80MByte」的資料,一般標示上的規格皆為介面的最高傳輸速度,而非實際傳輸速度。例如標示為ATA-100的硬碟機,即是指其使用100MB/Sec的傳輸介面,但一般真正的讀寫速度約為50MB/Sec左右。要完全使用界面所提供的頻寬,則需以多部磁碟串接於同一通道。

 

2. 儲存設備是電腦用來存放、讀取大量檔案、程式、資料的地方,其容量、存取速率、存取方法、功能、使用年限各有不同以下提供《國家檔案數位化影像品質》研究報告文中,提供常見數位檔案儲存媒體比較表。[154] [57]

 

 

表 6-5 、常見數位檔案儲存媒體比較表

 

 

 

資料來源:檔案管理局編,《國家檔案數位化影像品質之研究》,台北:檔案管理局,2008年1月初版二刷。頁163-164。

 



三、數位內容保護

 

隨著網際網路普及化,資訊共享所帶來的便利卻相對嚴重衝擊智財權,如何在共享的概念下,提出有效的數位內容保護機制,藉由保護數位內容創作者,避免非法散佈者或未經授權的使用者侵犯其權益。目前數位內容保護包含:文字、聲音、影像等,在逐步數位化後,電子印刷品、數位音樂、數位圖片與數位圖像等都是需要保護之標的物。其機制仍在發展中,包含:加密技術、條件存取機制、數位浮水印、數位指紋及數位版權管理機制等技術,由於技術皆有範疇及限制,須整合才能達到穩定的成效。

 

(一) 數位版權管理(Digital rights management ;DRM)[155] [58]:DRM技術是一種控制電子檔案使用權的技術,主要是在一個電子檔案上加入有關版權的限制,例如該檔案能播放的次數、是否可拷貝到另一台電腦、檔案過期日等,藉以保護電子檔案的安全性。當播放器要解開這個檔案時,便會根據檔案上所記錄的版權限制來決定是否可以播放。該技術並適用於電腦上的音樂、影像、電子書等檔案。Internet Data Center[156] [59]對DRM定義為:用於整合軟硬體的存取與管控機制,不論其使用與複製途徑,可持續追蹤與管理數位內容之使用狀況,並提供完善保護數位資訊與權限之管理技術。也就是利用加密來作保護,當使用者取得解密金鑰時才可開啟檔案或進行儲存、列印、複製、轉寄等基本功能。系統的管理工具可分為「合法工具」、「技術工具」兩系統,前者由合法系統提供用來保護合法權利的一系列工具,後者為執行DRM的工具。

 

1. 標準化權利描述語言[157] [60]

 

(1) Xrml版權描述語言[158] [61]:由ContentGuard公司提出一種版權描述語言,專門用來描述數位內容版權及版權使用限制的XML語言。為目前使用最多的數位版權描述語法標準,主要目的在於提供一個國際通用的方式,&#63789;達到指定版權、使用條件與保護內容的目的。是一種有專利,但可免費使用的規格書。

 

(2) ODRL(Open Digital Rights Language )數位版權(權利)管理技術:國際數據資訊中心IDC(Internet Data Center)為數位版權(權利)管理技術下定義為:「結合硬體與軟體的存取機制,將數位內容設定存取權限,並與儲存媒體連結,使得數位內容在其生命週期內,從產生到消失,都會受到保護。不管在其使用過程中是否有複製行為發生,仍然可以持續追蹤與管理數位內容之使用狀況。簡而言之,在數位內容生命週期內,能提供完善保護數位內容、權利之管理技術,則稱為數位版權(權利)管理技術。」

 

(3) MPEG-21(MPEG-21 Rights Expression Language):是一種以XML為基礎的語言,為MPEG組織所訂的標準,是MPEG家族中的一員,在整個標準的第五個部份和第六個部份和數位版權有很密切的關係;MPEG -21 REL也有RDD關鍵詞彙字典。

 

表 6-6、 標準化權力描述語言比較表

 

 

ODRL

XrML

MPEG-21

核心概念

party、asset、right/constraint、rights/permission、agreement

principal、resource、condition、right、license

principal、resource、condition 、 right、license

資料字典

ˇ

×

ˇ

應用現況

行動商務、教育領域,採用者:OMA、W3C

電子書、音樂,採用者:OeBF、MPEG 、Adobe、sony、HP、Xerox

多媒體,採用者:ContentGuard 、 Microsoft

專利擁有者

開放

ContentGuard

ISO

 

資料來源: 邱亦秀等著,<XrML:版權描述語言>。

 

2. 信任機制:權利語言需連結到信任機制才能完成交易認證,尤其以付費方面的DRM服務:E-learning、On line movie、MP3 download等,需搭費PKI機制與信任的基本架構才能完成。目前已有許多廠商投入開發DRM系統,如:微軟、Apple、RealPlayer、Glassbook、Softlock、InterTrust、ContentGuard..等。

 

(二) 數位浮水印[159] [62]:一種可以保護智慧財產權的技術,將著作權資訊植入數位媒體的方式,能發生在非法使用時證明合法的持有者是誰,如創作者為自己的作品落款或用印一般,目前Adobe就開發類似印章概念的數位印章機制。此技術通常是將具有代表性的圖騰(註冊商標、個人肖像)加到欲保護內容中,包含數位化的文字檔、動靜態影像、聲頻信號等。數位浮水印一般具有下列幾項特性:

 

1. 廣義:數位/類比簽章,以便和原來資料作區別。

 

2. 主要用於版權控制(使用者、買賣方、專利/著作權)和身份確認。

 

3. 版權擁有者加入浮水印,並能夠從資料中偵測並解出浮水印,用來作為版權控制,而浮水印便是版權所有的證明。只有加上浮水印的版權擁有者,有解出浮水印的方法。而從植入數位浮水印外觀分為以下兩類:

 

表 6-7、 浮水印比較表

 

分類

意義

優點

缺點

可視

顧名思義,可直接在標的物上看見浮水印。

有直接防止隨意非法使用數位內容的效果。

浮水印破壞原有物件的品質

不可視

無法直接以肉眼察覺是否有植入浮水印

具備浮水印保護機制且不會破壞原有品質

使用者無法以肉眼察覺,需在具信用的第三端,使用特殊解碼演算法將數位浮水印的資訊萃取出來進行驗證

資料來源:拓展台灣數位典藏計畫 彙整

 

4. 另外,在選擇浮水印技術的同時,須符合下列兩項基本要求:

 

(1) 在浮水印外觀上:對於可視浮水印,除非經過所有允許,否則自行除去將嚴重破壞媒體上信號的效果,反之對於不可視浮水印須達到無法移除和修改等特性

 

(2) 防衛機制:浮水印須具在任何攻擊或額外處理下應變的機制,通常包含有A/D或D/A轉換、過濾處理、壓縮、修剪和旋轉等等。也就是數位浮水印須具備強韌性,當數位媒體被竄改後,仍能正確的將浮水印機制擷取出來,以確保內容擁有者的權益。

 

5. 浮水印的分析

 

(1) 中央研究院歷史語言研究所傅斯年圖書館:由中央研究院資訊科學研究所研發。目前浮水印最主要的功能是有所有者識別/確認、內容辨偽和版本控制等。其所研發的浮水印系統已與ODAE系統整合,應用於數位典藏計畫中。詳參見「後設資料工作組[160] [63]」之數位典藏相關支援。

 

(2) 國立故宮博物院:是將隱藏資訊加在數位圖片中,採用雙層加密的方式,可減緩攻擊者以任何形式對影像檔所作的破壞攻擊。詳參見國立故宮博物院數位典藏計畫網站[161] [64]

 



四、數位化內容工作挑戰

 

(一)罕見字問題:在篇目建檔時,由於許多文字已非現今生活中經常使用之文字,因此會出現有罕見字的問題。關於罕見字的處理,目前數位典藏國家型科技計畫技術研發分項計畫研發出「中文缺字技術」。採用中研院資訊所文獻實驗室之構字式作為交換碼,其架構遵循漢字構形原理,將漢字拆解為最小單位之基礎部件,再由部件拼湊而成,利用有限的部件來表達數以萬計的漢字,不會再有交換碼不足之問題,而且目前已提供小篆、楷書、異體字之對應。

 

(二)影像檔案產出時效:在校對圖檔時,由於需要校對的檔案繁多,須特別留意,建議每日完成當日所建置的影像檔,以避免累積過多的數量。

 

(三)人員流動率高:由於數位化工作會雇用工讀生處理掃描的工作,但工讀生流動率高,為確保工作品質,館內應給予適當的教育訓練。其中應包括數位化工作之目的、原件整理及數位化工作掃描時應注意的事項、螢幕校正的方法、品質檢核的原則和流程。利用短期密集的訓練讓新進工作人員能夠瞭解其工作的重要性,並且快速進入狀況。此外,當改變工作流程或數位化設備時,也應注意人員工作上安全的管制與檢查。藉由上課講解和實際操作的練習,確認每一個步驟的一致規範。因為人員流動率高,建議應有專職人員統籌負責教育訓練事宜,並且將古籍線裝書數位化工作列為例行性的工作。

 

(四)規範修正即時性:無論訂定工作流程與規範前的思考,是多麼周密與嚴謹,或,皆可能因種種因素而與現實不符,必須定期檢討與協調,以瞭解品檢狀況並掌握進度。

 

(五)計畫管理的執行:制度化的工作流程,有助於提升數位化工作的效率及數位影像的品質。事前的準備規劃工作需要仔細的考量,並且進行小量測試,以確保良好的數位化工作品質。

 

(六)數位化設備:數位化工作流程由於檔案原件的尺寸大小、保存狀況或有不同等因素,使用的數位化設備因而有異,各種不同的數位化設備所需注意的項目亦有不同,數位化工作流程上會有些微的差異。

 

(七)品質校驗:數位影像品質檢核流程除需進行初步校驗外,各單位應有專人進行數位影像的二校,並再以程式確認數位影像是否可被正常開啟使用。而為了確保數位影像之品質,一校與二校應逐筆與原件對照校驗,以免有疏漏。且須在確認數位影像無誤後,方進行燒錄的工作,以免造成人力和物力的浪費。

 

(八)工作場所內規範:其他工作規範除了數位化工作和數位影像品質檢核時的注意事項外,工作場所內的規範與原件使用規範亦影響工作效率及檔案原件的保護。

 

(九)電腦化系統控管數位化流程:電腦化的流程控管,目前許多單位仍以紙本表單的方式進行各項工作流程的控管。本計畫研究發現,將掃描/數位攝影、品質檢核與光碟/磁帶製作等工作流程,以電腦系統控管使數位化流程的管控更加清楚,並且可進行統計分析,以利資源有效配置,可參考中央研究院歷史語言研究所傅斯年圖書館數位化管理系統。

 

(十)相關技術的掌握:由於科技日新月異,數位化相關掃描與資料儲存設備汰換率高,除了注意設備保存年限外,也應瞭解目前科技發展現況,以便充分掌控設備間的相容性。

 

(十一) 委外製作:雖在委外招標時可進行廠商「試作」的測試,但由於試作的其他因素影響,如:試作的時間相較於實際執行時間較容易規劃、試作的人員與實際執行人員不同、廠商對於書況無法掌握等因素,仍可能無法避免「品質不良」的困擾,因此建議在委外的同時,應多與相關單位蒐集數位化廠商的資訊,或在招標書中要求廠商提供以往的成果,作為日後的品質保證。

 

(十二) 數位化智財權議題及資料安全問題

 

1. 不可視浮水印面臨的困境

 

(1) 無法在黑白的數位影像中加入,或勉強加入了,一經轉檔就不見。

 

(2) 部分不可視浮水印無法處理TIFF檔。

 

(3) 檔案過大亦無法加入。

 

(4) 於原始的數位影像中加入不可視浮水印,會破壞原本的圖像,現已發現有產生波紋的情況。

 

2. 資料竄改:為避免數位影像遭到被竄改,可以在典藏用的數位檔案中加入一個時間,或將原始的數位影像製作兩份光碟,一份為永久保存不供外借,另一份才是供轉檔等後續處理使用。若以此方式,有一不外借的對照的版本,亦可作為數位影像內容有疑義時比對之用。

 

3. 智慧財產權議題:智慧財產權在進行數位化工作前,除了要確定該影像檔是否處於開放狀態,另要注意其是否含有智慧財產權,如照片、圖片等。即使是歷史資料,仍然有許多智慧財產權、著作權、隱私權等問題要處理。

 


 [162] <回 到 目 錄>

 

[163] [48] 林妙樺 著,<數位內容之品質管理>,發表於數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫之「品質管理」研討會中。

 

[164] [49] 文獻處理實驗室著,<中央研究院古籍全文資料庫的發展概要>,檢索:2009年2月,[165] http://www.sinica.edu.tw/~cdp/paper/1997/19970301_2.htm

 

[166] [50] Konstanze Bachmann,《藏品維護手冊》,劉藍玉譯,台北:五觀藝術管理,2001年,初版。頁60~67。

 

[167] [51] Tomshardware,<使用磁帶機備份:防護措施最重要! : 價位合理的備份方案>,檢索:2009年2月, [168] http://www.tomshardware.tw/742,review-742.html

 

[169] [52] Tomshardware,<備份大師: 容量10、50以及100 GB的磁帶備份方案 : 簡介>,檢索:2009年2月,[170] http://www.tomshardware.tw/702,review-702.html

 

[171] [53] Tomshardware,<DVD燒錄機評比:7倍容量-目前容量>,檢索:2009年2月,[172] http://www.tomshardware.tw/745,review-745-2.html

 

[173] [54] 微軟WINDOWS網站,<說明與使用方法>:http://windowshelp.microsoft.com/Windows/zh-TW/help/2af64e60-60aa-4d79-ab6c-3a5db5806cbe1028.mspx

 

[174] [55] 維基百科,<RAID>,檢索:2009年2月,[175] http://zh.wikipedia[176] .org/wiki/RAID

 

[177] [56] 曠文溱編,<廠商:磁帶備份無法被取代>,檢索:2009年2月,[178] http://www.zdnet.com.tw/news/hardware/0,2000085676,20099266,00.htm

 

[179] [57]檔案管理局編,《國家檔案數位化影像品質之研究》,台北:檔案管理局,2008年1月初版二刷。頁163-164。

 

[180] [58] 維基百科,<Digital rights management>,檢索:2009年2月,[181] http://en.wikipedia.org/wiki/Digital_rights_management

 

[182] [59] IDC英文全名為Internet Data Center,指的是結合網路服務供應商所提供的硬體設備,包含空間隔間、機櫃機架、電力、頻寬、保全等配置,並結合應用軟體的支援,提供企業一個可靠穩定安全極高品質的作業環境,幫助企業掌握e時代的經營優勢。

 

[183] [60]陳映后國立臺灣師範大學碩士論文,<數位版權描述語言-ODRL、XrML、MPEG-21 REL之比較研究>2004年。

 

[184] [61] CONTENTGUARD,<XrML 2.0 Technical Overview>,檢索:2009年2月,[185] http://www.xrml.org/Reference/XrMLTechnicalOverviewV1.pdf

 

[186] [62]蕭人豪,林欣慧,林金龍,蕭麗虹等著,<數位浮水印技術發展現況:以數位典藏計畫為例>,檢索:2009年2月,[187] http://daal.iis.sinica.edu.tw/document/DRM.pdf

 

[188] [63] 數位典藏國家型科技計畫後設資料工作組,網站([189] http://metadata.teldap.tw/tool/tool_2-das_chi.htm

 

[190] [64] 國立故宮博物院數位典藏計畫,網站:http://www.npm.gov.tw/digitization/exchanges.htm?pageno=3。

 

[191] [65]肖瓏 馮英著,<基於古文獻特藏的數位圖書館系統的設計與實現>,檢索:2009年2月,[192] http://www.nlc.gov.cn/service/wjls/pdf/08/08_02_a5b17.pdf

 

[193] [66]故宮博物院圖書文獻處 著〈國立故宮博物院圖書文獻處93年善本古籍數位化影像製作 規格書〉,出自國立故宮博物院圖書文獻處,2004年修訂版。

 

[194] [67]中央研究院歷史語言研究所 著〈中央研究院歷史語言研究所 傅斯年圖書館善本圖籍數位化影像製作 規格書〉,出自中央研究院歷史語言研究所,2005年4月修訂版。

 

[195] [68] 翁維瓏 著,數位典藏異地備份計畫,《數位典藏異地備份儲存資源網路建置計畫簡介》,檢索2009年2月,[196] http://newsletter.teldap.tw/news/read_news.php?nid=1736

 

[197] [69]黃彥棻 採訪,<文物數位化,故宮從A走向A+>,ithome,2005年8月http://www.ithome.com.tw/itadm/article.php?c=32667。

參考文獻

 

專書

 

陳正宏、梁穎 著《古籍印本鑑定蓋說》,上海:上海辭書出版社,2005年10月,初版。

 

肖振堂、丁瑜著,《中國古籍裝訂修補技術》,北京:書目文獻出版社,1988.年11月,初版。

 

PMI專案管理學會,《專案管理知識體指南:PMBOK?guide》,台北:國際專案管理學會台灣分會,2004年5月,第三版。

 

美國品質協會,《美國品質協會手冊(ASQ Handbook)》,美國:品質協會,1999年,頁13-14。

 

檔案管理局 編,《國家檔案數位化影像品質之研究》,台北:檔案管理局,2008年1月初版二刷。頁163-164。

 

內容發展分項計畫 編,《數位化工作流程-善本古籍主題小組》,台北:內容發展分項計畫,2005年1月初版。

 

內容發展分項計畫 編,《數位典藏作業規劃與品質管理研討會論文集》,台北:內容發展分項計畫,2004年12月。

 

內容發展分項計畫 編,《博物館典藏數位再造理論研討會 人與自然研討會手冊》,台北:內容發展分項計畫,2002年11月。

 

數位典藏國家型科技計畫計畫辦公室 彙編,《數位典藏技術彙編2004年版》,台北:數位典藏國家型科技計畫,2004年12月。

 

拓展台灣數位典藏計畫 編,《數位典藏品質管理研討會論文集》,台北:拓展台灣數位典藏計畫,2007年11月。

 

數位典藏國家型科技計畫 編,《數位典藏專業培訓課程講議彙編》,台北:訓練推廣分項計畫,2007年3月。

 

珍藏歷史文物數位典藏計畫 編,《珍藏數位工作研討會會議論文集》,台北:珍藏歷史文物數位典藏計畫,2005年7月。

 

拓展台灣數位典藏計畫 編,《2003年古籍數位典藏研討會論文集》,台北:拓展台灣數位典藏計畫,2003年9月。

 

拓展台灣數位典藏計畫 編,《色彩管理實務工作坊議程手冊》,台北:拓展台灣數位典藏計畫,2007年10月。

 

洪淑芬 著,《文獻典藏數位化的實務與技術》,台北:數位典藏國家型科技計畫 訓練推廣分項計畫,2004年2月,初版。

 

蔣傳明、苑克儷 譯,《21世紀國會圖書館數字戰略》,中國:北京圖書館,2004年2月,初版。

 

Konstanze Bachmann著,《藏品維護手冊》,劉藍玉譯,台北:五觀藝術管理,2001年,初版。

 

徐明景 著,《數位攝影的技術》,台北:田園城市文化事業有限公司,2001年10月。

 

期刊論文

 

羅鳳珠 著,〈臺灣地區中國古籍數位化的現況與展望〉,《書目季刊》,第35卷第1期, 2001年6月。

 

陳昭珍、陳立原、張文熙 著,<數位化檔案命名原則>,國家圖書館館訊,2001年8月,頁1-5。

 

陳昭珍、葉建華 著,<數位資源命名管理系統>,檔案季刊,2002年9月,頁94-106。

 

陳昭珍 著,<國家典藏數位化及應有的技術規範>,中華民國圖書館年鑑,2004年5月,頁5-27。

 

陳昭珍 著,<電子資源的長久保存>,佛教圖書館館刊,2001年6月,頁36-44。

 

陳昭珍 著,<數位典藏計畫異質系統互通機制:以OAI建立聯合目錄的理論與實作>,國家圖書館館刊,2002年6月,頁1-17。

 

謝易耿 蔡順慈 著,<由數位資訊生命週期探討數位典藏工作流程之建立>,拓展台灣數位典藏計畫網站,檢索2009年2月,[198] http://content.teldap.tw/index/?p=766

 

林素甘、楊美華、柯皓仁等 著,〈數位化發展對檔案典藏與保存之影響〉,《臺灣圖書館管理季刊》,第四卷第二期,2008年4月,頁67-88。

 

錢月蓮 著,<第三次兩岸古籍整理研究學術研討會論文綜述>,漢學研究中心,檢索:2009年2月,[199] http://ccs.ncl.edu.tw/Newsletter_79/p091_097.pdf

 

悉三彩、莊興業、何遠鴻 著,<紙質文物的修護與保護>,檢索:2009年2月[200] http://ethesys.yuntech.edu.tw/ETD-db/ETD-search/getfile?URN=etd-0806103-160927&filename=etd-0806103-160927.pdf

 

嚴素芬 著,<圖書蛀蟲、防蟲處理>,檔案管理局,檢索:2009年2月,[201] http://www.gaya.org.tw/journal/m43/43-main3.pdf

 

陳映后 著,<數位版權描述語言-ODRL、XrML、MPEG-21 REL之比較研究>,2004年。

 

蕭人豪, 林欣慧, 林金龍,蕭麗虹等 著,<數位浮水印技術發展現況:以數位典藏計畫為例>,檢索:2009年2月,[202] http://daal.iis.sinica.edu.tw/document/DRM.pdf

 

顧力仁 著,<數位圖書館與古籍整理之探討>,頁1-11,http://www.lis.ntu.edu.tw/joomla/images/journal/o14-6.pdf。

 

楊曉雯 著,<美國圖書館數位化技術之應用上>,《國立中央圖書館台灣分館館刊》,第六卷第四期,2005年5月,頁58-67。

 

楊曉雯 著,<美國圖書館數位化技術之應用下>,《國立中央圖書館台灣分館館刊》,第六卷第五期,2005年5月,頁40-56。

 

羅鳳珠 著,<台灣地區中國古籍文獻資料數位化的過程與未來發展方向>,2000年。

 

羅鳳珠 著,<臺灣文學文學數位化的回顧與前瞻>,收錄於《2004年漢學研究國際學術研討會論文集》,2004年10月。

 

羅鳳珠 著,<台灣地區國家古籍數位化的現況與展望>,收錄於《第三屆兩岸古籍整理研究學術研討會論文集》,2001年4月。

 

網路資源

 

David 編撰,<產品生命週期管理(PLM)與其內涵>,科技政策研究與資訊中心(STPI)科技產業資訊室,檢索:2009年2月,[203] http://cdnet.stpi.org.tw/techroom/analysis/pat_A104.htm

 

David 編撰,<專案管理與專案生命週期>,科技政策研究與資訊中心(STPI)科技產業資訊室,檢索:2009年2月,[204] http://cdnet.stpi.org.tw/techroom/analysis/pat_A088.htm

 

Amber編纂,<PDCA環與回饋控制系統>,科技產業資訊室,檢索:2009年2月,[205] http://cdnet.stpi.org.tw/techroom/analysis/pat_A027.htm

 

林妙樺 著,<認識傅斯年圖書館「圖籍掃描校驗管理系統」>,數位典藏國家型科技計畫 電子通訊,檢索:2002年5月,[206] http://www.ndap.org.tw/1_newsletter/content.php?uid=171

 

國家檔案局檔案徵集組,<電子檔案之管&#63972;及發展趨勢─ICA工作手冊介紹>,檔案管理局,檢索:2009年2月,[207] http://www.archives.gov.tw/Publish.aspx?cnid=950&p=646

 

黃彥棻 著,<重裝備打造國家檔案銅牆鐵壁>,iThome Online,檢索:2009年2月,[208] http://www.ithome.com.tw/itadm/article.php?c=34045

 

陳暐仁著,<「故宮善本古籍數位典藏子計畫」計畫簡介>,數位典藏國家型科技計畫 電子報,檢索2009年2月,[209] http://www2.ndap.org.tw/newsletter06/news/read_news.php?nid=538

 

Amber 編撰,<SWOT、PEST與五力分析>,科技產業資訊室,檢索:2009年2月[210] http://cdnet.stpi.org.tw/techroom/analysis/pat_A025.htm

 

黃彥棻 撰,<台灣it委外:從降低成本轉向效益導向>,iThome Online,檢索:2009年2月,[211] http://www.ithome.com.tw/itadm/article.php?c=35693

 

Windows網站,<色彩管理設定:常見問題集>,檢索:2009年2月,[212] http://windowshelp.microsoft.com/Windows/zh-TW/help/76f61616-6d12-46ec-bac2-49969d130c791028.mspx#E5

 

陳國棟、林妙樺著,<中研院歷史語言研究所傅斯年圖書館數位典藏系統之整體規劃及發展>,檢索:2009年2月,http://2a3y.sdb.ac.cn/upload/no02_05.ppt。

 

數位典藏與數位學習國家型科技計畫 後設資料工作組,<後設資料生命週期作業模式(Metadata Lifecycle Model, MLM)>,檢索:2009年2月,[213] http://metadata.teldap.tw/design/lifecycle_new2.htm

 

數位典藏與數位學習國家型科技計畫計畫辦公室 彙編,《數位典藏技術彙編2007年版》,台北:數位典藏國家型科技計畫,2007年12月,http://www2.ndap.org.tw/eBook08/showContent.php?PK=162。

 

黃國倫著,<資料庫初體驗(I)>,數位島嶼電子報第24期,檢索:2009年2月,[214] http://content.teldap.tw/main/epaper_detail.php?doc_id=1177&epaper_id=44

 

文獻處理實驗室著,<中央研究院古籍全文資料庫的發展概要>,檢索:2009年2月,[215] http://www.sinica.edu.tw/~cdp/paper/1997/19970301_2.htm

 

Tomshardware,<使用磁帶機備份:防護措施最重要! : 價位合理的備份方案>,檢索:2009年2月, [216] http://www.tomshardware.tw/742,review-742.html

 

Tomshardware,<備份大師: 容量10、50以及100 GB的磁帶備份方案 : 簡介>,檢索:2009年2月,[217] http://www.tomshardware.tw/702,review-702.html

 

Tomshardware,<DVD燒錄機評比:7倍容量-目前容量>,檢索:2009年2月,[218] http://www.tomshardware.tw/745,review-745-2.html

 

Tomshardware,<DVD燒錄機評比:7倍容量-結論>,檢索:2009年2月,[219] http://www.tomshardware.tw/745,review-745-11.html

 

維基百科,<RAID>,檢索:2009年2月,[220] http://zh.wikipedia.org[221] /wiki/RAID

 

曠文溱編,<廠商:磁帶備份無法被取代>,檢索:2009年2月,[222] http://www.zdnet.com.tw/news/hardware/0,2000085676,20099266,00.htm

 

CONTENTGUARD,<XrML 2.0 Technical Overview>,檢索:2009年2月,[223] http://www.xrml.org/Reference/XrMLTechnicalOverviewV1.pdf

 

維基百科,<Digital rights management>,檢索:2009年2月,[224] http://en.wikipedia.org/wiki/Digital_rights_management

 

肖瓏 馮英著,<基於古文獻特藏的數位圖書館系統的設計與實現>,檢索:2009年2月,[225] http://www.nlc.gov.cn/service/wjls/pdf/08/08_02_a5b17.pdf

 

何沙崙、林秋燕、陳瑩芳 著,<考察澳洲、紐西蘭政府出版品與檔案管理作業>,發表於2000年3月,[226] http://open.nat.gov.tw/OpenFront/report/show_file.jsp?sysId=C08901810&fileNo=001

 

古騰堡,活版印刷的發明人,檢索:2009年2月,http://en.wikipedia.org/wiki/Johannes_Gutenberg。

 

古騰堡計畫網站,檢索:2009年2月http://www.gutenberg.org/wiki/Main_Page。

 

Google booksearch計畫網站,檢索:2009年2月http://books.google.com/。

 

中央研究院漢籍電子文獻網站,檢索:2009年2月http://www.sinica.edu.tw/ftms-bin/ftmsw3。

 

國家圖書館認識中國古書網站,檢索:2009年2月http://rarebook.ncl.edu.tw/rbook.cgi/frameset2.htm。

 

國際敦煌項目()IDP網站,檢索:2009年2月http://idp.nlc.gov.cn/。

 

Open Content Alliance聯盟網站,檢索:2009年2月http://www.opencontentalliance.org/。

 

其他

 

張錫本,<符合標準規範的色彩管理流程設計>,色彩管理實務工作坊,2007年10月。

 

王遠華,<掃描器色彩管理流程實務>,色彩管理實務工作坊,2007年10月

 

數位典藏國家型科技計畫 後設資料工作組,<善本古籍內容小組核心元素分析報告(一)>,檢索:2009年2月,[227] http://pl11.sinica.edu.tw:8080/dspace/bitstream/1868/1857/1/N1-BC0800001.pdf

 

邱亦秀等著,<XrML:版權描述語言>,[228] http://www.asiaa.sinica.edu.tw/~ccchiang/GILIS/IO/112XrML.ppt

 

林妙樺 著,<數位內容之品質管理>,發表於數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫之「品質管理」研討會中。

 

故宮博物院圖書文獻處 著〈國立故宮博物院圖書文獻處93年善本古籍數位化影像製作 規格書〉,出自國立故宮博物院圖書文獻處,2004年修訂版。

 

中央研究院歷史語言研究所 著〈中央研究院歷史語言研究所 傅斯年圖書館善本圖籍數位化影像製作 規格書〉,出自中央研究院歷史語言研究所,2005年4月修訂版。

 

數位典藏與數位學習國家型科技計畫總入口網站[229] http://teldap.tw/

 

數位典藏與數位學習國家型科技計畫分項一:拓展台灣數位典藏計畫[230] http://content.teldap..org.tw

 

數位典藏與數位學習國家型科技計畫分項二:數位技術研發與整合計畫[231] http://tech.teldap.tw/

 

數位典藏與數位學習國家型科技計畫分項三:數位核心平台計畫[232] http://core.teldap.tw

 

數位典藏與數位學習國家型科技計畫分項四:數位典藏與學習之學術社會應用推廣計畫[233] http://aspa.teldap.tw/

 

數位典藏與數位學習國家型科技計畫分項五:數位典藏與學習之產業發展與推動計畫[234] http://idp.teldap.tw/

 

數位典藏與數位學習國家型科技計畫分項六:數位教育與網路學習計畫[235] http://learning.teldap.tw

 

數位典藏與數位學習國家型科技計畫分項七:語文數位教學計畫[236] http://elcl.teldap.tw/

 

數位典藏與數位學習國家型科技計畫分項八:數位典藏與學習之海外推展暨國際合作計畫[237] http://collab.teldap.tw/

 

數位典藏國家型科技計畫後設資料工作組 [238] http://metadata.teldap.tw/tool/tool_2-das_chi.htm

 

中央研究院歷史語言研究所傅斯年圖書館 [239] http://lib.ihp.sinica.edu.tw/

 

中央研究院歷史語言研究所傅斯年圖書館數位典藏http://lib.ihp.sinica.edu.tw/pages/03-rare/DAP/index.php。

 

國家圖書館數位典藏計畫[240] http://readopac.ncl.edu.tw/ndap/

 

國家圖書館中文編目標準規範 metadata小組http://catweb.ncl.edu.tw/2-1-12.htm。

 

古籍文獻典藏數位化計畫http://readopac.ncl.edu.tw/ndap/rar/ndap-rar-int-00.htm。

 

古籍影像檢索系統http://rarebook.ncl.edu.tw/rbook.cgi/store/frameset.htm。

 

國立故宮博物院國家型數位典藏計畫[241] http://www.npm.gov.tw/digitization/overview.htm

 

故宮文物數位典藏網站[242] http://tech2.npm.gov.tw/da/

 

善本古籍資料庫http://npmhost.npm.gov.tw/tts/npmmeta/RB/RB.html。

 

檔案管理局下載專區[243] http://www.archives.gov.tw/Chinese_archival/Download/Default.aspx?cnid=288

 


 

[244] <回 到 目 錄>

 

 

[245] 附錄一、影像製作規格參考規範標準

 

[246] 附錄二、各單位目前異地備援比較分析

 

[247] 附錄三、數位化成本估算實例

 

[248] 附錄四、善本古籍核心元素需求規格書

 

[249] 附錄五、工作流程圖與數位化規範


 

 

附錄一、影像製作規格參考規範標準

 

 

一、大陸地區:北京圖書館,參考來自宵王疣 馮英著,<基於古籍文獻特藏的數字圖書館系統的設計與實現>[250] [65]。在此份文件中對於每種資源數位化級別、色彩要求、保存格式、解析度均作詳細的規定,並以善本之數位化標準為例。

 

表 附1-1 、北京圖書館數位化相關規格標準

 

種類

珍善本

類別

原書

用途

珍藏、精密印刷、網上瀏覽

色彩要求

24位元彩色

級別

A(典藏)

P(複製)

L(瀏覽-

有限制)

M(瀏覽-

無限制)

S(縮圖)

格式

TIFF

JPEG

JPEG

JPEG

GIF

最低解析度

600DPI

600DPI

300DPI

150DPI

72DPI

備註

頁面向上掃描,也就是以平床式(平台光學)掃描器為主。如需做OCR則參照對於普通古籍之要求。

 

資料來源: 宵王疣 馮英著,<基於古籍文獻特藏的數字圖書館系統的設計與實現>,頁5。

 

二、台灣地區

 

(一) 數位典藏與數位學習國家型科技計畫:以實地訪查的方式調查各機構規格。

 

表 附 1-2 、數位典藏與數位學習國家型科技計畫 相關執行計畫數位化規格標準

 

數位典藏與數位學習國家型科技計畫

數位化目的

典藏級

商務級

瀏覽級

比例

1:1

檔案格式

TIFF

JPEG

JPEG

色彩模式

RGB(24bit/piexl)

RGB(24bit/piexl)

RGB(24bit/piexl)

解析度及尺寸

原尺寸300dpi以上

原尺寸300dpi

72 dpi

       

故宮博物院圖書文獻處[251] [66]

實體物件狀況

物件<A3大小

物件>A3(含A3)

比例

1:1

影幅取捨

封面獨立一頁,左右半頁合為一頁

封面獨立一頁,接圖(左右單頁拍攝)

檔案格式

TIFF

TIFF

色彩模式

RGB(24bit/piexl)

RGB(24bit/piexl)

解析度及尺寸

原尺寸300dpi

原尺寸300dpi

資料備份

DVD光碟、DAT磁帶

中央研究院歷史語言研究所傅斯年圖書館[252] [67]

實體物件狀況

內文為圖像

內文為文字

比例

1:1

影幅取捨

封面獨立一頁,其餘左右半頁合為一頁

檔案格式

TIFF

TIFF

色彩模式

RGB(24bit/piexl)

RGB(24bit/piexl)

解析度及尺寸

原尺寸600dpi

原尺寸300dpi以上

壓縮檔

檔案格式

JPEG

JTIF

JPEG

JTIF

色彩模式

RGB(24bit/piexl)

RGB(24bit/piexl)

解析度及尺寸

144 dpi

300 dpi

72 dpi

150 dpi、200 dpi

資料備份

DVD光碟

DVD光碟

國家圖書館

實體物件狀況

若文字線條過細、文字太小、其他特殊要求

古籍原書

B4-A3尺寸

普通線裝書

B4-A3尺寸

比例

1:1

影幅取捨

封面獨立一頁,其餘左右半頁合為一頁

檔案格式

TIFF

TIFF

TIFF

色彩模式

RGB(24bit/piexl)

RGB(24bit/piexl)

黑白

解析度及尺寸

原尺寸600dpi以上

原尺寸300dpi以上

原尺寸300dpi 以上

壓縮檔

檔案格式

 

JPEG

TIFF

色彩模式

RGB(24bit/piexl)

黑白

解析度及尺寸

原尺寸A4大小

72dpi(85%)

72dpi(G4)

資料備份

DVD光碟

                       

 

資料來源:拓展台灣數位典藏計畫 彙整

 

(二) 國家文化資料庫檔案:在國家文化資料庫知識管理系統中了解該計畫所採用的檔案規格標準。

 

表 附 1-3、 國家文化資料庫相關數位化規格標準

 

國家文化資料庫檔案

數位化目的

永久保存檔

網路瀏覽格式

檔案格式

TIFF

JPEG

色彩模式

RGB

RGB

色彩深度

彩色 24bit/piexl

彩色 24bit/piexl

解析度及尺寸

600dpi以上

300dpi

500 ×400至1000× 700pixels

壓縮品質

不壓縮

75%

台灣大學圖書館

數位化目的

典藏級

電子商務級

公共資訊級

(顯示、列印)

公共資訊級

(顯示)

檔案格式

TIFF

JPEG

JPEG

JPEG

色彩模式

RGB

色彩深度

彩色 24bit/piexl

解析度及尺寸

300dpi

300dpi

150dpi

75dpi

資料備份

DVD光碟、磁碟陣列

 

資料來源:國家文化資料庫知識管理系統,http://km.cca.gov.tw/download/rule/93_do_scale.doc。

 

(三) 古漢籍善本數位化資料庫國際合作建置計畫,成員包含:美國國會圖書館亞洲部、哈佛大學哈佛燕京圖書館、普林斯頓大學東亞圖書館及中央研究院歷史語言研究所傅斯年圖書館。

 

表 附 1-4 、古漢籍善本數位化資料庫國際合作建置計畫數位化相關規格標準

 

古漢籍善本數位化資料庫國際合作建置計畫

實體物件狀況

內文為圖像、文字

比例

1:1

影幅取捨

封面獨立一頁,其餘左右半頁合為一頁

檔案格式

TIFF

色彩模式

RGB(24bit/piexl)

解析度及尺寸

原尺寸300dpi以上

壓縮檔

JPEG

JPEG

JTIF

RGB(24bit/piexl)

RGB(24bit/piexl)

72 dpi

72 dpi

300 dpi

資料備份

DVD光碟




 

附錄二、各單位目前異地備援比較分析

 

一、 中央研究院

 

(一)儲存設備每個節點為以 10TB 的磁碟陣列為基本單元(Storage Brick)構成的儲存系統,儲存最近一年所產生的資料,及必須提供線上即時存取服務的數位化資料為主。所有資料都在該網路上儲存二份(一份在所屬的本地端儲存資源節點,另一份則在該網路上的另一節點中,達成院內之異地備份機制),計算中心並另製作一份備份存於磁帶中長久保存。一年以上的資料則以磁帶備份方式存於計算中心大量資料儲存系統。

 

(二)異地備援:各儲存節點須協助提供相關設備之置放空間與環境,所有設備均置於一座標準19吋機櫃中(寬x深x高約為 60×100x206 cm,機櫃正面及背面與其他設備或壁面間至少應保留 100cm,以便散熱通風及工作維護),機櫃中包含下列設備,並保留了未來擴充之空間。[253] [68]

 

1. Unix server 一部

 

2. Gigabit Ethernet Network

 

3. 一部容量 5TB Disk Array, Disk 採用 250GB SATA Disk(或以上)

 

4. 不斷電系統 UPS 容量 3000 VA

 

(三)架構圖

 

圖 附 2-1、儲存資源網路架構圖

資料來源:中央研究院計算中心

 

 

 

 

圖 附 2-2 、 Deployment of DataGrid for Digital Archives in Academia Sinica

資料來源:中央研究院計算中心

 

(四)數位典藏異地備份儲存資源網路:有鑒於Middleware- Storage Resource Broker (SRB)美國聖地牙哥超級計算中心的儲存資源仲介軟體(SRB)的建置,目前數位典藏與數位學習國家型科技計畫規劃給相關計畫單位異地備援之計畫,主要希望能提供儲存設備管理與數位資訊管理整合之儲存資源管理。

 

1. 目的:建立穩定、安全、存續性高的儲存管理系統 (persistent repository system) ,提供資料安全、自動的複製、分散存放與快速存取,並逐年擴展為以邏輯保存(logical preservation) 與實體保存 (physical preservation) 並重、具備自動轉製 (transformation) 與轉錄 (migration) 能力,以建立存續性高、可達長久保存目的之儲存系統基礎架構。

 

2. 系統架構

  

圖附2-3 數位典藏異地備份儲存資源網路規劃

資料來源:數位典藏與數位學習國家型科技計畫 技術核心平台分項計畫

 

 

二、 國立故宮博物院[254] [69]

 

國立故宮博物院研究員兼資訊中心主任林國平表示,故宮目前已經完成NAS(網路附加儲存)以及SAN(儲存區域網路)的建置,在磁碟陣列的容量上面,先前已完成4TB光纖通道硬碟的採購,以作為線上儲存(On-line Storage)之用;在今年陸續增購6TB的SATA硬碟採購,作為近線儲存(Near-line Storage)之用。NAS主要是採用微軟的WSS 2003架構,支援開放系統,並做為外部檔案分享之用。而SAN的建立,讓使用者便於整合複雜的儲存環境,並透過使用者的策略與設定,達到儲存設備自動化管理的境界。林主任指出,在數位檔案的傳輸時,以光纖專線進行傳輸,不妨礙日常系統的頻寬,也達到傳輸的安全性。目前儲存架構上,採用SAN與NAS並存。在主機、伺服器部分,則採用叢集(cluster)電腦架構,達到系統的高可用度,且作為備援之用,組成兩套伺服器和作業系統,在當其中一套數位典藏系統無預警停機時,另一臺備援系統可即時接手。

 

(一)儲存設備:由於數位典藏的過程完成不易,為了讓每一個數位檔案都能夠詳細完整的保留下來,定期備份、多元方式儲存,則是故宮數位典藏的特色。國立故宮博物院研究員兼資訊中心主任林國平說,最早的備份方式是先把資料存到磁碟,再把資料從磁碟分別備份到磁帶以及光碟。而作光碟儲存,主要是為了業務上的傳遞之用,但目前很多圖檔輕易超過4.7GB,有考慮改以磁帶作為業務部門中的檔案傳遞之用。

 

(二) 異地備援:每個數位檔案在數位化達一定程度時,都必須進行備份。最早,故宮的備份是以光碟備份為主,陸續增加了LTO-1的磁帶機,搭配400GB的磁碟陣列(RAID);邇後再升級成LTO-2磁帶機,加上2TB的磁碟陣列,然後再將磁碟陣列擴充到4TB。主機早期以IBM的R6為主,後來則陸續升級成E450、E650及V880;也有一些搭配微軟作業系統的電腦伺服器以及Tivoli、Veritas軟體的輔助。這些軟、硬體設備,確保了數位文物的備份安全。 數位典藏從數位攝影開始,到保留RAW檔、進行檔案分離、轉檔成TIFF檔,並進行命名管理,將數位檔案存放到磁碟陣列上,然後再利用光碟櫃進行光碟燒錄,或是以LTO-2磁帶進行備份。由於資料的搬動是一大困擾,因此故宮的數位檔案在上傳到固定磁區後,直接進行光碟燒錄或磁帶備份。

 

 

三、 國家圖書館

 

(一) 儲存設備:在數位典藏計畫之前,國家圖書館以微捲為儲存媒材,直到2001年加入數位典藏國家型科技計畫改以數位掃描方式,以DVD-R為儲存媒材。

 

(二) 異地備援:目前數位化的成果都做兩套備份,但存放在國圖不同樓層,本館將考量其中一份儲存於資訊圖書館或再另覓儲存地。


 附錄三、數位化成本估算實例

 

 

一、 平台式掃描器

 

(一) 基本設定:安排工作人員三名,其中兩名分別負責掃描、整理及校驗,另一名為系統開發建置以及維護。使用設備為電腦兩部及一台平台式掃描器。

 

 

分類

說明

數量

價格

1

掃描設備

硬體

電腦設備

2台

60,000元

平台式掃描器

1台

130,000元

軟體

Adobe photoshop

1套

20,000元

2

系統開發建置軟硬體

數位化管理系統建置費用

1套

600,000元

3

人力

薪資

3人

90,000元/月

4

檔案大小

A3全彩300dpi每張掃描

1個

費時約90秒

6

產出

每月(20工作天)數位產出

3000-4000頁

 

7

使用年限

設備年限(硬體+軟體)

4年

 

8

光碟耗材

DVD±R

1片

10元

表 附3-1、 平台式掃描器成本

估算表

 

資料來源:拓展台灣數位典藏計畫 彙整

 

 

(二) 計算實例:依使用年限設定之設備攤提費用計算。

 

表 附 3-2、 平台式掃描器成本估算實例

 

 

掃描成本估算(平台式掃描器)

定義

材料費

DVD±R(4.7GB=4700MB),但建議只燒錄4500MB

勞務費

人員薪資

設備攤提費用

(掃描設備軟硬體+系統建置軟硬體)/使用年限

公式

(材料費(元)/數位產出數量(張))+(勞務費(元)+設備攤提費用(元)/數位產出數量(頁))=每張成本(元/頁)

計算實例

材料費

掃描頁數

4500/50(MB)=90(頁)

每頁DVD成本價

10/90=0.111元/頁

需求量×2套

0.111×2=0.22元/頁

勞務費用

30,000*3=90,000元

設備攤提費用

(60,000+130,000+20,000)/4=52,500元/年,換算成每月則為1,375元/月

每頁成本(3000頁)

(90,000+1,375)/3,000=30.46元/頁,0.22元/頁+30.46元/頁=30.68元/頁

每頁成本(4000頁)

(90,000+1,375)/4,000=22.8元/頁,0.22元/頁+22.8元/頁=23.02元/頁

資料來源:拓展台灣數位典藏計畫 彙整

 

         

 

 

二、 平床式(平台光學)掃描器:德國賽數

 

(一)基本設定:安排工作人員三名,其中兩名分別負責掃描、整理及校驗,另一名為系統開發建置以及維護。使用設備為電腦兩部以及一台平台式掃描器。

 

表 附 3-3 、平床式(平台光學)掃描器成本估算表 (平床式(平台光學)掃描器)

 

 

分類

說明

數量

價格

1

掃描設備

硬體

電腦設備

2台

60,000元

平床式(平台光學)掃描器

1台

4,500,000元

軟體

Adobe photoshop

1套

20,000元

2

系統開發建置軟硬體

數位化管理系統建置費用

1套

600,000元

3

人力

薪資

3人

90,000元/月

4

檔案大小

A3全彩300dpi每張掃描

1個

費時約90秒

6

產出

每月(20工作天)數位產出

3000-4000頁

 

7

使用年限

設備年限(硬體+軟體)

4年

 

8

光碟耗材

DVD±R

1片

10元

 

資料來源:拓展台灣數位典藏計畫 彙整

 

(二)計算實例:依使用年限設定之設備攤提費用計算。

 

表 附 3-4 、平床式(平台光學)掃描器 成本估算實例 (平床式(平台光學)掃描器)

 

掃描成本估算(平床式(平台光學)掃描器)

定義

材料費

DVD±R(4.7GB=4700MB)光碟片,但建議只燒錄4500MB

勞務費

人員薪資

設備攤提費用

(掃描設備軟硬體+系統建置軟硬體)/使用年限

公式

(材料費(元)/數位產出數量(張))+(勞務費(元)+設備攤提費用(元)/數位產出數量(頁))=每張成本(元/頁)

計算實例

材料費

掃描頁數

4500/50(MB)=90(頁)

每頁DVD成本價

10/90=0.111元/頁

需求量×2套

0.111×2=0.22元/頁

勞務費用

30,000*3=90,000元

設備攤提費用

(60,000+6,000,000+20,000)/4=1145,000元/年,換算成每月則為95,417元/月

每頁成本(3000頁)

(90,000+95,417)/3,000=61.81元/頁,0.22元/頁+61.81元/頁=61.81元/頁

每頁成本(4000頁)

(90,000+95,417)/4,000=46.35元/頁,0.22元/頁+46.135元/頁=46.57元/頁

 

資料來源:拓展台灣數位典藏計畫 彙整

 



三、 古籍拍攝平台掃描器(需燈光設備及數位機背)

 

 

(一)基本設定:安排工作人員三名,其中兩名分別負責掃描、整理及校驗,另一名為系統開發建置以及維護。使用設備為電腦兩部以及一台平台式掃描器。

 

表 附 3-5、 平床式(平台光學)掃描器 成本估算表 (古籍拍攝平台)

 

 

分類

說明

數量

價格

1

掃描設備

硬體

電腦設備

2台

60,000元

古籍拍攝平台

1台

350,000元

燈光設備

1,00,000

數位機背

1400,000

軟體

Adobe photoshop

1套

20,000元

2

系統開發建置軟硬體

數位化管理系統建置費用

1套

600,000元

3

人力

薪資

3人

90,000元/月

4

檔案大小

A3全彩300dpi每張掃描

1個

費時約90秒

6

產出

每月(20工作天)數位產出

3000-4000頁

 

7

使用年限

設備年限(硬體+軟體)

4年

 

8

光碟耗材

DVD±R

1片

10元

 

資料來源:拓展台灣數位典藏計畫 彙整

 

 

(二)計算實例:依使用年限設定之設備攤提費用計算。

 

表 附 3-6、 平床式(平台光學)掃描器 成本估算實例 (古籍拍攝平台)

 

掃描成本估算(古籍拍攝平台)

定義

材料費

DVD±R(4.7GB=4700MB)光碟片,但建議只燒錄4500MB

勞務費

人員薪資

設備攤提費用

(掃描設備軟硬體+系統建置軟硬體)/使用年限

公式

(材料費(元)/數位產出數量(張))+(勞務費(元)+設備攤提費用(元)/數位產出數量(頁))=每張成本(元/頁)

計算實例

材料費

掃描頁數

4500/50(MB)=90(頁)

每頁DVD成本價

10/90=0.111元/頁

需求量×2套

0.111×2=0.22元/頁

勞務費用

30,000*3=90,000元

設備攤提費用

(60,000+1,850,000+20,000)/4=482,500元/年,換算成每月則為40,208元/月

每頁成本(3000頁)

(90,000+40,208)/3,000=33.40元/頁,0.22元/頁+33.40元/頁=33.62元/頁

每頁成本(4000頁)

(90,000+40,208)/4,000=32.55元/頁,0.22元/頁+32.55元/頁=32.77元/頁

資料來源:拓展台灣數位典藏計畫 彙整



 

附錄四、善本古籍核心元素需求規格書

 

 

善本古籍主題小組

 

善本古籍核心元素後設資料需求規格書

 

version 0.2

 

數位典藏國家型科技計畫後設資料工作組製

 

中華民國九十一年十月二十一日

 

 

目錄

 

一、計畫簡介與說明_______________________________________________ 3

二、計畫之著錄對象範_____________________________________________ 3

三、計畫參與人員________________________________________________ 3

四、善本古籍核心後設資料元素欄位架構 ______________________________ 3

五、善本古籍核心元素後設資料需求規格書架構說明 _____________________ 4

第一部份:善本古籍核心元素欄位定義 ________________________ 4

第二部份:善本古籍核心元素欄位屬性 ________________________ 5

第三部份:善本古籍核心元素著錄規範與限制___________________ 7

六、善本古籍核心元素著錄範例 _____________________________________ 10

七、善本古籍核心元素後設資料標準比對 ___________________________ 13

八、需求規格書確認表單___________________________________________ 15


 

一、計畫簡介與說明

 

本計畫的建置主要在於能分享善本古籍檔案及古籍影像數位化作業的經驗,推展相關數位化技術的開發、整合與實作測試,並研擬相關之作業規範與標準,以促進計畫的順利執行。計畫主要進行的工作項目如下:

1. metadata與內容分析相關需求的整合。

2. 資訊技術需求的提出與引介。

3. 研擬相關標準與規範。

4. 研討善本古籍數位典藏作業相關問題。

 

二、計畫之著錄對象範圍

所謂古籍,原則上是指1911年及其以前書寫或印刷,具有古典裝訂形式之中文書籍,但各古籍收藏機構可根據本身情況,予以適當調整。

 

三、計畫參與人員

l 國家圖書館特藏組:

盧錦堂主任、顧力仁編輯、宋慧芹小姐

l 中研院史語所傅斯年圖書館:

陳國棟先生、湯蔓媛小姐、林妙樺小姐、呂純怡小姐、周惠蓮小姐

l 數位典藏國家型科技計畫後設資料工作組:

陳亞寧先生、陳淑君小姐、張怡婷小姐、粘芸蓁小姐、沈漢聰先生(本份需求規格書撰寫者)

l 故宮博物院圖書文獻處

 

四、善本古籍核心後設資料元素欄位架構

善本古籍核心後設資料元素依據其所具有的功能性概分為兩大類:描述性後設資料元素與紀錄管理性後設資料元素,茲分述如下:

描述性後設資料元素(共12元素)

n 類型

n 識別號(登錄號、排架號、索書號)

n 題名(正題名、其他題名、拼音題名)

n 著者(姓名、朝代年號或國別、著作方式)

n 其他貢獻者(姓名、朝代年號或國別、著作方式)

n 出版資訊(責任者、地點、時間、責任方式)

n 數量

n 簡述(版本、裝訂、裝潢、圖像、行格、避諱……等)

n 主題(主題、關鍵詞)

n 語文

n 關連(叢書、子目、合刊、原件複製品、影像檔)

n 現藏者

紀錄管理性後設資料元素(共1元素)

n 建檔紀錄(建檔人員、建檔時間、修改人員、修改時間)


 

五、善本古籍核心元素後設資料需求規格書架構說明

本份「善本古籍核心元素後設資料需求規格書」係以三大部份呈現中研院史語所傅斯年圖書館、國家圖書館特藏組與故宮博物院文獻處對善本古籍元素的共同需求,分別為第一部份:善本古籍核心元素欄位定義、第二部份:善本古籍核心元素欄位屬性與第三部份:善本古籍核心元素著錄規範與限制。其中,第一部份主要描述上述三個主題計畫所需共同著錄的善本古籍元素欄位,並對每個所需著錄的欄位給予定義,以確保大家都著錄相同性質的欄位資訊。而第二部份主要是協助系統建置人員,在實際系統建置上,設定所需要著錄欄位的種種屬性,如必填欄位在資料建檔時系統會要求建檔人員務必填寫必填欄位的資料。第三部份係定義善本核心元素欄位的著錄規範與限制,以確保不同的建檔人員會以相同的格式建檔。

第一部份:善本古籍核心元素欄位定義

項目說明:

n 元素中文名稱:主題計畫所需著錄項目之中文名稱。

n 元素英文名稱:元素中文名稱對應之英文名稱。

n 元素定義:元素欄位的定義說明。

 

元素中文名稱

元素英文名稱

元素定義

類型

Type

藏品的類型或性質。

識別號

登錄號

Identifier

Accession Number

記載該書之館藏登錄號。

索書號

Call Number

著錄館藏之排架位置。

排架號

 

Shelving Control Number

館藏索書號。

題名

正題名

Title

Title

古籍之名稱,包含卷數。(正題名一般以正文首卷卷端題名為準)

其他題名

Alternative title

異於正題名者,包括:其他卷端題名,內封題名、版心題名、書衣題名、其他題名等。

拼音題名

Ping-Yin title

將原書題名翻譯為拼音題名。

著者

姓名

Creator

Name

主要創作者之姓名。

朝代年號或國別

Dynasty

主要創作者之朝代或國別。

著作方式

Role

藏品之主要創作方式,包括:撰、纂、修、注、編、輯、譯、書、繪、序、跋、批、校、其他。

其他貢獻者

姓名

Contributor

Name

除主要創作者外,對於某古籍內容之創作有貢獻者。

朝代年號或國別

Dynasty

其他貢獻者之朝代或國別。

著作方式

Role

其他貢獻的方式,包括:纂、修、注、編、輯、譯、書、繪、序、跋、批、校、其他。

出版資訊

責任者

 

Publisher

使某古籍行世者的相關資料。

地點

Published place

有關責任發生之地點。

時間

Published date

有關責任發生之時間,包括朝代、年號、中曆紀年,並在圓括號內加註西元紀年。

責任方式

 

包括:刊刻、印刷、抄寫、修補、遞刊等。

數量

Quantity

古籍藏品之冊數或幅數等。

簡述

版本

Description

Edition

版本說明,依序顯示朝代、元號、紀年、出版地、出版者及版本類型。

型態結構

裝訂

Binding

包括:卷軸裝、葉子、經摺裝、蝴蝶裝、包背裝、線裝、毛裝等。

裝潢

Mount

包括:函套、夾板、木匣、紙匣、帙等。

圖像

Decoration

包括:位置、名稱等。

行格

Lines per page

以正文之半葉為準;半葉若干行,每行若干字;小字或單行或雙行,行若干字。行之上端,如有空白不頂格者,應以頂格之字數為準。各行字數,多寡不齊同者,註「行若干字至若干字不等」。

避諱

Tabooed word

歷代避免直接稱呼君主、尊長等名字之作法。

刊記/牌記

Public notice

包括:位置、形式、全文等。

收藏印記

Seal

1印面文字。
2.形狀。
3.刻法(陽、陰)。

題記

Colophon

位置、題記者姓名、題記者朝代。

保存現況

Conditions

書葉殘破及修復等之說明。

附註

Notes

上述欄位之補充說明。

主題

主題

Subject

Subject

主題之描述。

關鍵詞

Keywords

語文

Language

作品內容所採用之語文。

關連

叢書

Relation

 

若為子目,在此著錄所在叢書名。

子目

 

若為叢書,在此著錄子目。

合刊

 

合刊或有單獨檢索意義之附錄,包括:題名、著者、著者朝代、貢獻方式。(合函、合裝等亦然)

原件複製品

Duplicates

著錄原件產出的幻燈片、微縮及數位化媒材。

影像檔

檔名

File Format

File

古籍數位化之檔案名稱。

說明

Note

說明影像使用性質。

現藏者

Owner

古籍藏品之現藏及權限管理者。

建檔紀錄

建檔人員

Record

Person

該筆紀錄之首次建檔人員代碼。

建檔時間

Date

修改人員

Revised Person

修改時間

Revised Data

               

 

第二部份:善本古籍核心元素欄位屬性

項目說明:

n 元素中文名稱:主題計畫所需著錄項目之中文名稱。

n 必填欄位:標示“*”者表示必填欄位,建檔時需填寫該欄位之值,不能空白。

n 多值欄位:標示“◎”者表示多值欄位,該組欄位資料可重覆著錄。

n 檢索欄位:標示“⊙”者表示檢索欄位,表示該欄位資料可提供使用者檢索。

n 備註:對元素欄位屬性的其他說明。

 

元素中文名稱

必填欄位

多值欄位

檢索欄位

備註

類型

 

 

 

識別號

登錄號

 

 

 

 

排架號

 

 

 

 

索書號

 

 

 

 

 

 

題名

正題名

 

 

 

 

 

其他題名

 

 

可使用下拉功能表,並允許著錄建檔人員再增加。

拼音題名

 

 

各種題名可自動產生羅馬拼音。

著者

姓名

 

 

 

 

可自動產生拼音。考慮建置人名權威檔。

朝代年號或國別

 

 

 

 

 

著作方式

 

 

 

 

可使用下拉功能表,並允許著錄建檔人員再增加。

其他貢獻者

姓名

 

 

 

 

 

朝代年號或國別

 

 

 

 

著作方式

 

 

 

拉功能表,並允許著錄建檔人員再增加。

出版資訊

責任者

 

 

 

 

 

地點

 

 

可設古今地名對照表:原地名(今名)。對GIS輸出資料。

時間

 

 

對GIS輸出資料。

責任方式

 

 

 

可使用下拉功能表,並允許著錄建檔人員再增加。

數量

 

 

 

 

簡述

版本

 

 

 

 

 

 

型態結構

裝訂

 

 

 

 

可使用下拉功能表,並允許著錄建檔人員再增加。

裝潢

 

 

 

圖像

 

 

 

行格

 

 

避諱

 

 

刊記/牌記

 

 

收藏印記

 

 

題記

 

 

保存現況

 

 

 

 

附註

 

 

 

主題

主題

 

 

 

 

關鍵詞

 

 

語文

 

 

 

 

關連

叢書

 

 

 

 

 

 

子目

 

 

合刊

 

 

原件複製品

 

 

 

影像檔

檔名

 

 

 

 

 

 

說明

 

 

 

 

現藏者

 

 

 

 

建檔紀錄

建檔人員

 

 

 

 

 

 

 

建檔時間

 

 

 

 

修改人員

 

 

 

 

修改時間

 

 

 

 
                           


 

第三部份:善本古籍核心元素著錄規範與限制

項目說明:

n 元素中文名稱:主題計畫所需著錄項目之中文名稱。

n 著錄規範:定義元素在建檔時需統一遵循的國際或自訂規格、形式、或規則。

n 限定資料:該元素欄位限定著錄的資料值。

 

元素中文名稱

著錄規範

限定資料

類型

善本圖籍的物件類型主要為「善本」(Rare Books)、「古籍」(the Chinese Ancient Books)、「類善本」等。

善本、古籍、類善本

識別號

登錄號

原則上依館藏冊數決定登錄號之多寡(如:五冊書則會有五組登錄號);但仍不強制設定。

 

排架號

善本及類善本著錄排架號;古籍為索書號。

 

索書號

善本及類善本亦提供索書號之檢索。

 

題名

正題名

1. 正題名含名稱及卷數,並以逗號(,)區隔。

2. 正題名一般依正文首卷卷端所題著錄。正題名非得自主要著錄來源,需註明於附註項。

3. 若正文首卷卷端無題名,或所題不宜,得依次以正文其他各卷卷端題名、各卷卷末題名、內封題名、版心題名、書衣題名、其他題名為準。

4. 正文其他各卷卷端、各卷卷末、內封、版心、書衣、書中其他部份之題名,兼及其他資料,若有與正文首卷卷端之題名不同者,亦應在適當處予以著錄,並均能提供檢索。

5. 凡書中各處均不載題名時,而由其他資料查考得出,須依查考得出之題名著錄,並用方括號,又在附註中註明。

6. 凡於書中及其他資料俱不能取得相當題名時,得以己意著錄,並用方括號,又在附註中註明。

7. 題名之冠有「欽定」、「御批」、「增廣」、「增補」、「詳註」、「箋註」、「重修」、「校訂」、「選本」、「足本」、「繡像」、「繪圖」等字樣者,依原題字樣著錄;但略去此類字眼,亦可提供檢索。

8. 凡題名有「皇朝」或「國朝」等字樣者,依原題字樣著錄,並在附註中註明所指朝代。

9. 在適當處得著錄拼音題名;若採取不同之拼音題名,應以能互通為原則。

10. 卷數著錄以現有為準,若為殘卷,則於卷數前加一「存」字,又在附註中註明原有卷數及現存卷次。卷數及卷次均用中國數字;千、百、十等須標明。

11. 卷次用上、下、詩韻、干支等標誌者,均換算為數字著錄。如:上、中、下卷,著錄為「三卷」。一卷中再分若干子卷者,仍按一卷著錄。

12. 卷首、卷末、補遺、附錄、目錄等連同其卷數均著錄於正文卷數之後。

13. 原書分集(編)再分卷,應據實著錄。

14. 原書分回,應依所題著錄。

15. 拼音題名以「漢語拼音系統」為準。

16. 其他題名指異於題名者。

 

其他題名

 

拼音題名

 

著者

姓名

1. 著者連結人名權威檔,其他貢獻者亦連結人名權威檔。

2.著者一般依正文首卷卷端所題著錄,即依作品之主要著錄來源著錄,著作方式記於著者名稱之後,著者敘述非得自主要著錄來源者,加方括弧。

3.正文首卷卷端所題著者灼知其難憑信者,而真正著者又無從查考,則省略著者,而於附註中註明「題某某撰」。

4.正文首卷卷端所題灼知其難憑信者,而查出真正著者,則予以著錄,並用方括號,而於附註中註明「題某某撰,今從……」。即主要著錄來源所署著者不足憑信或有疑問,仍照樣著錄,而以考證所得記於附註項。

5.正文首卷卷端所題不能代表全書或末題著者,應從書中其他部份選擇適當者著錄,並在附註中註明。

6.書中不著著者,而由其他資料查考得出,須依查考得出之著者著錄,並用方括號,又在附註中註明。

7.帝王及后之著作,以廟號或謚號著錄,而於附註中註明其真實姓名,並均能提供檢索。

8.凡僧尼之著作,法名前冠「釋」或「尼」字,如其俗家姓氏甚著名,或出家後又還俗,則於附註中加以註明,並均能提供檢索。

9.凡女子之著作,如其姓名前冠以夫家姓氏者,只著錄本人姓名。

10. 凡二人合著之書,稱「某某、某某同撰」,其次序如書中所列。

11. 凡二人以上合著之書,以書中所列第一人為正著者,稱「某某同撰」,其餘人名如有必要時得於附註中註明,並均能提供檢索。

12. 著者年代一般以卒年為準,但凡著者跨越兩個年代者,可參考其生平事蹟,寫作時代及習慣題法等著錄。

13. 著者年代一般可依下列朝代名稱著錄:周、秦、漢、魏、蜀、吳、晉、劉宋、南齊、梁、陳、北魏、東魏、西魏、北齊、北周、隋、唐、五代、宋、遼、西夏、金、元、明、清。

14. 凡竊據之偽朝代名,應依照當時正式之朝代名稱著錄,但原題朝代,須在附註中註明。

15. 外國著者以相應現代國名之簡稱著錄。

16. 著作方式一般依原題著錄;未題時,可參照下列方式著錄

撰:著述。

編:整理編排。

輯:收集他人著述匯集為一書。

修、纂:主要用於官修書。主持其事為「修」,實際編寫為「纂」。

注:解釋。

譯:將一種語文譯成另一種語文。

繪:圖畫創作。

書:書法創作。

篆刻:印章圖文創作。

其他

 

朝代年號或國別

 

著作方式

撰、纂、修、注、編、輯、譯、書

、繪、序、跋、批、校、其他

其他貢獻者

姓名

 

朝代年號或國別

 

著作方式

纂、修、注、編、輯、譯、書、繪

、序、跋、批、校、其他

出版資訊

責任者

1. 出版項各項資料若已著錄於版本項,則本項省略不記。

2. 出版責任者連結出版者權威檔。

3. 地點連結地名權威檔。

4. 出版時間中西曆用中西曆對照表。

5. 出版資訊之著錄,包括刊刻(鈔、寫)年(順序為朝代、元號、中曆紀年、西曆紀年)刊刻(鈔、寫)地、刊刻(鈔、寫)者。
若遇印刷、增刊、補刊、配補、遞修等情況,亦應仿此一併著錄。

6. 若書中紀年以干支、太歲等計算者,須併著錄中曆紀年、西曆紀年。中曆紀年用中國數字;西曆紀年用阿拉伯數字。

7. 紀年無從查考時,以朝代、元號著錄。

8. 若僅知朝代大致時期,可著錄作「某代初葉」、「某代中葉」、「某代末葉」。

9. 藏版著非刻書者時,則在適當處予以著錄,並能提供檢索。

 

地點

 

時間

 

責任方式

刊刻、印刷、抄寫、補刊、遞刊

數量

1. 以面(葉)數、冊數或其他單位為單位。

2. 冊裝古籍著錄實有冊數;卷軸裝古籍著錄實有卷數;單幅圖籍著錄幅數。

3. 冊裝古籍若分函,得著錄實有函數,並用圓括號。以上均以阿拉伯數字著錄。

 

簡述

版本

1. 版本之著錄,首朝代、元號、紀年,次處所,最後為版本之類別。本書未載之項目,闕之(考證所得者, 記於附註項)。僅記國朝或元號者。可依元號紀年記朝代名稱於前。其以干支或其代字紀年者,應查明年代記註於後。

2. 版本類別大抵可分為稿本、寫本、鈔本、刊本、活字本、套印本、朱印本、藍印本、石印本、影印本、鉛印本、鈐印本、繪本、寫繪本等。其中或可細分,如刊本有原刊、重刊、初印、後印等;活字本有泥活字、木活字、銅活字等;套印本有朱墨套印、四色套印等,或又有其他類別,均視情況做適當表達。

3. 書籍之附有插圖者,以「圖」著錄之,至於插圖應否詳為著錄,視其在書中之重要性而定。有插圖之書,必要時應記其位置;圖像連結古籍附圖資料庫。插圖之種類須按下列順序詳記之:地圖、設計圖、圖表、影抄、 譜系表、表格、樂譜等。其他一般圖概以「圖」著錄。

4. 彩色插圖冠以「彩」或「彩色」等字樣著錄之,如「彩圖」或「彩色地圖」。若未全部著色,則另冠以「部份」於「彩」或「彩色」之前,如「部份彩圖」或「部份彩色地圖」。

5. 圖之大於書頁而摺疊於書中者,冠以「摺」字,如「摺圖」。

6. 重要之插圖,得據圖上號數、目錄所標示或合計所得定其數量。

7. 行格以半葉為準;半葉若干行(大、小)若干字。

8. 版框大小、行格、版式、刊記、避諱、刻工等細節,視需要詳細著錄。

9. 版框,著錄其高闊,高在前,闊在後,用阿拉伯數字,長度以公分為計算單位。版框高度一般以正文首葉版框上邊(靠內)至下邊(靠內)之距離為準;其無邊欄者,於高則量其全幅,於廣則量其半葉。凡卷軸裝,於高量其全幅,於闊量其全卷之長。凡經摺裝,於高量其版框,於闊量其摺疊後之闊度。

10. 行格之記載,應就書之正文,數其半葉若干行,每行若干字;小字或單行或雙行,行若干字。行之上端,如有空白不頂格者,應以頂格之字數為準。各行字數,多寡不齊同者,註「行若干字至若干字不等」。

11. 避諱方式有:缺筆、空字、改字等,如可查考則予以著錄。並連結人名權威檔。

12. 古籍裝訂形式大抵可分如卷子、卷軸裝、葉子、經摺裝、蝴蝶裝、包背裝、線裝、毛裝等形式,應予以記載;至若針眼、金鑲玉襯、包角等情況,可在適當處註明。襯裝之書亦應予以記載。

13. 經摺裝、蝴蝶裝、包背裝、線裝等著錄其實有冊數;卷軸裝著錄其實有卷數;單張者著錄其實有幅數。

14. 古籍之有函套、木匣、紙匣、木夾板、帙等附屬品及其他裝潢情形可視需要予以著錄。

15. 凡書在流傳過程中,出現題記、收藏印記等,應予以著錄。

16. 題記之位置、題記者朝代及姓名應加以註明;至若題記全文,則可視需要照錄。又,題記之屬過錄者,則連過錄者朝代及姓名亦一併註明。

17. 收藏印記可全部或則要予以著錄;著錄包括印面文字、刻法(如「朱文」、「白文」)及印面形狀。

18. 序文或目錄之末,或各卷末之空白處,往往有刊刻者之牌記, 或校刊人督刊人等之題記,以及刊印工價等,應舉其處所,述其形狀,錄其記語。

19. 鈐有收藏家之印記者,應擇要記載。記載之順序,應依印記之時代先後。記載之內容,除錄其全文外,應依印鑑形狀記明「方形」、「圓形」、「長方形」、「橢圓形」,或「聯珠印」等。并據其刻鑄之陰陽,記明「白文」或「朱文」。並連結印記資料庫。

20. 題記要提供全文檢索。

21. 保存現況若遇書葉破損或變質,視需要著錄歷次修裱過程的紀錄;並連結庫房管理系統。

22. 附註為解說題名、著者、版本、出版、稽核、集叢各項未詳盡之處,得於附註項說明之並應加記:批校題跋、殘缺卷葉、印記、板式行款、紙墨裝釘、考證校勘。

23. 有關上述各項,若有未詳盡之處,可作附註補充說明。

 

型態結構

裝訂

線裝、包背裝、經摺裝、蝴蝶裝、卷子、葉子等。

裝潢

函套、夾板、冊頁、書盒等。

圖像

 

行格

 

避諱

 

刊記/牌記

 

收藏印記

 

題記

 

保存現況

 

附註

 

主題

主題

主題連結標題權威檔。

 

關鍵詞

關鍵字連結標題權威檔。

 

語文

主要為漢文、滿文、滿漢合刻、蒙文、藏文等。

漢文、滿文、滿漢合刻、蒙文、藏文、其他(勾選此項可輸入文字)。

關連

叢書

1. 說明主要包括:公用典藏、印刷出版、國家典藏、所方計畫等。

2. 叢書子目各分別著錄,各子目並應在適當處著錄所在之叢書名。

3. 叢書,視情況全部或擇要著錄其子目。

4. 合刊(鈔),應在第一書適當處著錄與其合刊(鈔)之書名、著者,並均能提供檢索。合函、合裝等亦然。

5. 若有微縮品、幻燈片及數位化媒材之複製,應予以著錄。

 

子目

 

合刊

 

原件複製品

 

影像檔

檔名

影像檔之檔名以每冊書之登錄號為檔名,附加檔名為頁次。

 

說明

   

現藏者

   

建檔紀錄

建檔人員

建檔紀錄由系統自動產生及更新。

 

建檔時間

 

修改人員

 

修改時間

 

 

六、善本古籍核心元素著錄範例

 

善本古籍核心元素著錄範例主要係讓主題計畫參與同仁確認建檔時所需著錄之後設資料欄位與欄位的先後排序,並供日後系統設計人員參考使用。

 

元素中文名稱

著錄範例

範例一

範例二

類型

l古籍

l古籍/善本

l善本書

識別號

登錄號

 

l(表示多值)

180702

180703

180704

180705

180706

180707

180708

180709

180710

180711

180712

180713

排架號/索書號

 

l槍木櫃77-4

題名

正題名

l重訂李義山詩集箋註三卷外詩箋註一卷

l南豐先生元豐類稿存四十卷附錄一卷

l新刊標題孔子家語句解六卷

l高皇帝御製文集,二十卷

其他題名

l版心題名:李義山詩集箋註
內封題名:李義山詩集箋註

l版心題名:南豐集
書衣題名:宋少師曾文定公全集
其他題名(跋):重刊元豐類稿

l版心題名:家語
其他題名(目錄):新刊標題句解孔子家語

 

拼音題名

 

l Gao huang di
yu zhi wen ji

著者

姓名

l李商隱

l釋義淨

l明太祖

朝代年號或國別

l唐

l1328-1398

著作方式

l撰

l譯

l撰

其他貢獻者

姓名

l朱鶴齡

l何焯

l謝正蒙

朝代年號或國別

l清

l清

l明

著作方式

l注

l批校

l仝訂

出版資訊

責任者

l劉氏慎獨齋

l南京國子監

 

地點

l建陽

l南京

 

時間

l明正德十一年

(1516)

l明正德十五年(1520)

l明1368-1644

責任方式

l刊刻

l修補

 

數量

l8冊

l12冊

簡述

版本

l清乾隆九年(1744)東柯草堂刊本

l宋嘉泰四年(1204)壽州呂氏刊明成化間修補本

l清蕭山王氏十萬卷樓鈔本配補光緒三十二年(1906)虞山周氏鴿峰草堂鈔本

l明崇禎十四年(1641)原刊清康熙元年(1662)印本

l明萬曆間西安縣丞朱朝貞嶺南張萱遞刊本

l明刊本

型態結構

裝訂

l卷軸裝

l葉子

l經摺裝

l蝴蝶裝

l包背裝

l線裝

l毛裝等

l線裝

裝潢

l肖楠木夾板2片

 

圖像

l位置:「普回向真言」後。

l名稱:無聞老和尚註經處產靈芝圖

 

行格

l 每半葉10行,行21字;註文小字雙行,字數同。

 

避諱

l避宋諱,玄、弘、殷、恆、貞、桓、媾、慎、敦、槨等字缺末筆。

 

刊記

l首冊內封右欄題
「江都程夢星午橋 刪補」,中間大字題「李義山詩/集箋註」,左欄下方題「東 柯草堂校刊」。

l目錄尾題後有「眉山程舍人宅刊行/已申上司不許覆板」兩行 四周雙邊刊記。

 

收藏印記

l書中依序鈐有「國之中央圖/書館收藏」朱文長方印。「六龍」朱穴橢圓印。「白仲/之印」白文方印。「伊南/逸史」朱文方印等。

l天放樓、心師竹齋圖書字畫家藏、陽湖趙烈文字惠父號能靜僑於海虞築天放樓收庋文翰之記、群碧樓、明刻本。

題記

l位置:第二冊扉葉

l手書題記者:錢良
擇(方湘衡朱筆過錄)

l朝代:清

 

保存現況

l完整

l蛀蝕嚴重,已修復

l完整

附註

l全書原四十卷,此本僅存卷一至卷三,卷九至卷十四。

l舊題晉陶潛撰, 誤;據四庫全書總目提要,為後人依託。

l原題:巡按直隸監察御史臣謝正蒙,整飭揚州兵備副使臣熊尚文仝訂。

主題

主題

 

l明太祖(1328-

1398) — 文集

關鍵詞

 

l明刊本

語文

l漢文

l滿漢對照

l漢文

關連

叢書

   

子目

   

合刊

l題名:詩話一卷
著者:程夢星
著者朝代:清
貢獻方式:撰

l題名:貧士傳二卷(附)
著者:黃姬水
著者朝代:明
貢獻方式:撰

 

原件複製品

l有微捲

 

影像檔

檔名

 

l180702\180702.001-180702.999

l180703\180703.001-180703.999

說明

 

l公用典藏

現藏者

l國家圖書館善本 書庫

l中華民國

l傅斯年圖書館

建檔紀錄

建檔人員

   

建檔時間

修改人員

修改時間


 

七、善本古籍核心元素後設資料標準比對

 

後設資料標準比對是作為本計畫後設資料欄位與國際後設資料的接軌,以及與國際間其他主題計畫作XML資料交換的關鍵機制。以下係善本核心元素後設資料欄位與Dublin Cone、MARC 21、CMARC的比對:

 

元素中文名稱

Dublin Core

MARC 21

CMARC

類型

Type

500 GENERAL NOTE

$a General note

200 題名及著者敘述項

$b資料類型標示(紀錄所屬資料型態-圖書、連續出版品、地圖、拓片等)

識別號

登錄號

Identifier

852 LOCATION

$z Public note

805 館藏記錄

$c登錄號

排架號

Identifier

852 LOCATION

$j Shelving control number

 

索書號

Identifier

852 LOCATION

$j Shelving control number

852 LOCATION

$k Call number prefix

805 館藏記錄

$d分類號

805 館藏記錄

$e書號

題名

正題名

Title

245 TITLE STATEMENT

$a Title

200 題名及著者敘述項

$a正題名

$p卷數

其他題名

Title-Alternative

246 VARYING FORM OF TITLE

$a Title proper/short title

517 其他題名

$a其他題名

拼音題名

Title-Alternative

242 TRANSLATION OF TITLE BY CATALOGING AGENCY

$a Title

200 $r 題名之羅馬拼音

著者

姓名

Creator

100 MAIN ENTRY–PERSONAL NAME

$a Personal name

700 人名-主要著者

$a標目主題(姓)

$b副標目(名)

朝代年號或國別

Creator

100 MAIN ENTRY–PERSONAL NAME

$d Dates associated with a name

700 人名-主要著者

$s朝代

著作方式

Creator

100 MAIN ENTRY–PERSONAL NAME

$e Relator term

700 人名-主要著者

$4著作方式

其他貢獻者

姓名

Contributor

700 ADDED ENTRY–PERSONAL NAME

$a Personal name

702 人名-其他著者

$a標目主題(姓)

$b副標目(名)

朝代年號或國別

Contributor

700 ADDED ENTRY–PERSONAL NAME $d Dates associated with a name

702 人名-其他著者

$s朝代

著作方式

Contributor

700 ADDED ENTRY–PERSONAL NAME $e Relator term

702 人名-其他著者

$4著作方式

出版資訊

責任者

Publisher

260 PUBLICATION, DISTRIBUTION, ETC. (IMPRINT)

$b Name of publisher, distributor, etc.

210 出版項

$c 出版者,經銷者等名稱

地點

Publisher

260 PUBLICATION, DISTRIBUTION, ETC. (IMPRINT)

$a Place of publication, distribution, etc.

210 出版項

$a 出版地,經銷地等

時間

Date-Issued

260 PUBLICATION, DISTRIBUTION, ETC. (IMPRINT)

$c Date of publication, distribution, etc.

210 出版項

$d 出版,經銷等日期

責任方式

Publisher

260 PUBLICATION, DISTRIBUTION, ETC. (IMPRINT)

$3 Materials specified

210 出版項

$c 出版者,經銷者等名稱

數量

Format-Extent

300 PHYSICAL DESCRIPTION

$a Extent

215 稽核項

$a數量(面數、冊數或其他)

簡述

版本

Description

250 EDITION STATEMENT

$a Edition statement

780 輔助檢索項(古籍)–羅馬拼音

$a 版本類型

裝訂

Description

500 GENERAL NOTE

$a General note

141 古籍-特性

3 裝訂形式代碼

裝潢

Description

500 GENERAL NOTE

$a General note

300 一般註

$a附註

圖像

Description

300 PHYSICAL DESCRIPTION

$b Other physical details

215 稽核項

$c插圖及其他稽核細節

行格

Description

500 GENERAL NOTE

$a General note

300 一般註

$a附註

避諱

Description

500 GENERAL NOTE

$a General note

300 一般註

$a附註

刊記/牌記

Description

500 GENERAL NOTE

$a General note

300 一般註

$a附註

收藏印記

Description

500 GENERAL NOTE

$a General note

300 一般註

$a附註

題記

Description

500 GENERAL NOTE

$a General note

300 一般註

$a附註

保存現況

Description

583 ACTION NOTE

$l Status

141 古籍-特性

6-7保存情況代碼-主體

附註

Description

500 GENERAL NOTE

$a General note

300 一般註

$a附註

主題

主題

Subject

650 SUBJECT ADDED ENTRY–TOPICAL TERM

1 $a Topical term or geographic name as entry element

606 主題標題

1 $a標目主題

關鍵詞

Subject

650 SUBJECT ADDED ENTRY –TOPICAL TERM

$a Topical term or geographic name as entry element

606 主題標題

$a標目主題

語文

Language

546 LANGUAGE NOTE

$a Language note

101 作品語文

$a正文語文

關連

叢書

Relation-hasPart

760 MAIN SERIES ENTRY
$a main entry heading

225 集叢項
$a 集叢名

子目

Relation-IsPartOf

762 SUBSERIES ENTRY
$a main entry heading

225 集叢項
$i 編次名稱

合刊

Relation-hasFormat

777 ISSUED WITH ENTRY
$a Main entry heading

523 合刊、合訂
$a合刊題名

原件複製品

Relation-Has Format

533 REPODUCTION NOTE

$a Type of reproduction

300 一般註

$a附註

影像檔

檔名

Relation-Has Format

530 ADDITIONAL PHYSICAL FORM AVAILABLE NOTE

$a Additional physical form available note

300 一般註

$a附註

說明

Relation-Has Format

530 ADDITIONAL PHYSICAL FORM AVAILABLE NOTE

$3 Materials specified

300 一般註

$a附註

現藏者

Rights

852 LOCATION

$a location

805 館藏記錄

$a 單位簡稱/代碼

$b次單位簡稱/代碼

建檔紀錄

建檔人員

Description

500 GENERAL NOTE

$a General note

805 館藏記錄
$f 編目者、審核者

建檔時間

Description

500 GENERAL NOTE

$a General note

805 館藏記錄
$y 日期(年、月)、冊次號、年代號

修改人員

Description

500 GENERAL NOTE

$a General note

805 館藏記錄
$f 編目者、審核者

修改時間

Description

500 GENERAL NOTE

$a General note

805 館藏記錄
$y 日期(年、月)、冊次號、年代號

             

 

八、需求規格書確認表單

 

此後設資料需求規格書是否符合貴單位之需求?

是□ 否□

若不符合貴單位的需求,請說明原因,謝謝。

原因:

   
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 


簽名:

日期:民國 年 月 日

 

附錄五、工作流程圖與數位化規範

 

 

一、 國立故宮博物院

 

(一) 流程圖

 

 

(二) 檔案命名

 

 

 

(三) 相關規格及作業規範

1. 將A3(含)尺寸以下之古籍原件,以1:1比率數位掃描或拍攝,以全彩300dpi規格儲存。

2. 以DVD+R光碟片備份。(容量4.7GB/單面、尺寸12公分、適用所有DVD-ROMDrives(PC) 之DVD+R碟片。)

3. 使用全彩(24bits per pixel),光學解析度300dpi數位掃描或拍攝,並以TIFF無壓縮之標準格式儲存(廠商應提供二份DVD碟片備份及一份DAT磁帶備份);另轉成200dpi JPEG壓縮之TIFF格式影像做壓縮儲存(廠商應提供一份DVD碟片備份)。

4. 所有影像檔古籍封面獨立一頁拍攝,書籍版面左右半頁合為一頁影像檔拍攝;遇特殊情況,視書籍大小而定,得半頁單獨拍攝。

5. 若原件超出A3(含)尺寸,無法一次全版面拍攝,須採取左右單頁掃描或拍攝時,如有需要,廠商必須提供影像檔接圖作業,以維持完整版面。

6. 每頁影像檔拍攝時須放置色卡、灰階、尺規。

7. 廠商須能提供平床式拍攝或掃描設備,書籍以書頁朝上方式置於平床拍攝或掃描,若書籍上方設計以平面玻璃壓置,則下方須有防護設計,或可調整玻璃與平床間距,使書籍不受壓折傷害。

8. 拍攝儀器,廠商當提供中片幅型相機套裝數位機背,或其他能支援高像素之同等級光學攝影或掃描設備。

9. 為避免損傷文物,拍攝時須採用冷光源燈光設備,不得使用閃光燈系統。

 

 

(四) 執行方法與過程

1. 建立數位化清單

2. 從《國立故宮博物院善本舊籍總目》分批挑選善本古籍列入數位化清單,以便掌控整體善本古籍數位化之順序及數量

3. 書況檢查

4. 進入書庫提調善本書籍,檢查有無嚴重蠹蝕、紙質脆化、裝訂鬆脫等情形。若書籍狀況不佳,則送裱修室修復,暫不列入數位化清單,並核對書籍冊數與善本古籍總目資料庫登錄資料是否相符。

5. 文字後設資料目錄建置

6. 現存善本古籍總目資料庫欄位表單(後設資料metadata資料庫)內建置完整詳細部、冊、圖資料之細目。

7. 校色

8. 每日正式數位化掃描作業前,依顏色校正軟體之標準,雖然此舉較費時,但能保持數位化影像檔顏色之正確。

9. 試拍

10. 數位化校正顏色後,將每部書取首冊第一頁,試拍其成像位置、色彩正確度。此舉可降低善本書籍之不當受損,並增進數位化影像之穩定度。

11. 製作影像圖檔

12. 使用全彩(24bits per pixel),解析度300dpi數位掃描,以無壓縮TIFF格式儲存;另轉成200dpi JPEG壓縮之TIFF新影像。每頁資料影像須放置色表、尺規。

13. 影像檢查。

14. 每單筆數位影像檔應含現場一校,數位化完成後,製作備份,列印清單,連同影像檔硬碟交付研究助理執行二校。針對有問題的頁次重新數位化,再進行三校作業。

15. 影像儲存。

16. 數位化資料待全部無誤後,委外廠商製作DVD光碟備份,送出最終校正後清單並對光碟備份進行查驗四校。

17. 光學解析度300dpi影像,以TIFF無壓縮之標準格式儲存(廠商應提供二份DVD碟片備份及一份DAT磁帶備份);另轉成200dpi JPEG壓縮之TIFF新影像(廠商應提供一份DVD碟片備份)。

18. 建立網站資料。

19. 由資料庫系統委外廠商,將影像資料與已建置之影像metadata後設資料庫結合,建構全文影像資料庫。

20. 開放利用。

21. 依照國家數位典藏計畫,逐步開放資料庫供外界利用。

 

 

數位典藏與數位學習國家型科技計畫 拓展臺灣數位典藏計畫

 

數位典藏工作流程調查表

 

單位: 國立故宮博物院        數位化物件名稱:   善本古籍       

子計畫名稱: 故宮圖書文獻數位典藏子計畫 分項計畫名稱:   善本主題小組分項計畫   

主持人(負責人)(E-mail、Tel): 李研究員兼處長天鳴(02)28812021-2279 聯絡人(E-mail、Tel):陳暐仁 28812021轉2347、2544

程序

工作內容

操作人員(數量、專業能力之要求)

硬體(名稱、版本、價格)

軟體(名稱、版本、價格等)

依循標準(技術規範、成品規格、品質要求…等)

耗時

總結(困難、缺失、特色…等)

成本估算

備註

1

建立數位化清單

計畫主持人

   

從《國立故宮博物院善本舊藉總目》挑選善本古籍列入數位化清單。

每月建立清單

分批建立數位化清單,較易掌握整體善本古籍數位化順序。

   

2

書況檢查

計畫主持人、協同主持人、計畫專任研究助理3員

   

1、 提調書籍,檢查有無嚴重蠹蝕、紙質脆化、裝訂鬆脫情形。若書籍情況不佳,則送裱修室修復,暫不列入數位化清單。

2、 核對書籍情形、冊數與善本古藉總目資料庫登錄資料是否相符。

每日作業

     

3

文字後設資料目錄建置

計畫專任研究助理3員

PC

善本古藉總目資料庫(http://www.npm.gov.tw/tts/

npmmeta/dblist.htm)

善本書籍後設資料metadata資料庫欄位表單

每日作業

在現存之善本古藉總目資料庫內,建置更完整詳細部冊資料之細目。

   

4

校色

委外廠商數位化人員

PC、平床式掃描機(平台式掃描機)、色彩校正儀器

色彩校正軟體

依該色彩校正儀器之標準校對流程

每日正式數位化作業前

較費時,但能保持數位化影像檔之色彩正確。

   

5

試拍

委外廠商數位化人員、專任研究助理1員

PC、平床式掃描機(平台式掃描機)、口罩、作業手套

 

數位化前置作業。每部書取首冊第一頁,試拍後檢驗其成像擺設位置、色彩正確度。

每日正式數位化作業前

較費時,但可降低善本書籍之受損,與增進數位化影像之穩定度。

   

6

製作影像圖檔

委外廠商數位化人員、專任研究助理1員

PC、平床式掃描機(平台式掃描機)、口罩、作業手套

 

使用全彩(24bits per pixel),解析度300dpi數位掃描成TIFF格式儲存。每頁影像檔須放置色卡、尺規。

每日作業。掃描:60秒/頁

招標時間過長,較無法配合執行進度。

   

7

影像校對

計畫專任研究助理3員、工讀生2員

PC、顯示器(需完成校色程序)

 

每頁影像檔數位化後,製作備份,列印清單,連同影像檔硬碟交付研究助理與工讀生進行一校,針對有問題的單頁修正後,再進行二校至三校。

每日作業。校對:60秒/頁

     

8

影像儲存

委外廠商

   

1.數位化影像檔待全部校對無誤後,由廠商製作DVD光碟備份,送出最終校正後清單。對光碟備份進行查驗四校。

2. 光學解析度300dpi影像檔,以TIFF無壓縮之格式儲存(廠商應提供二份DVD碟片備份及一份硬碟備份。

       

9

建立網站資料

委外廠商

PC

善本古藉總目資料庫(http://www.npm.gov.tw/tts/

npmmeta/dblist.htm)

由資料庫系統委外廠商,將影像檔縮圖與已建置之影像metadata後設資料庫結合,建構全文影像資料庫。

       

10

開放利用

 

PC

善本古藉總目資料庫(http://www.npm.gov.tw/tts/

npmmeta/dblist.htm)

依照國家數位典藏計畫,逐步開放資料庫供外界利用。

       

註:若程序多於七個,請複製本表使用

調查人:陳暐仁 調查地點: 國立故宮博物院 調查日期: 97年11月



 

 

二、 國家圖書館

 

 

n 原件數位化作業流程

 



 

 

 

 

附件A:國家圖書館善本古籍、敦煌卷子、拓片、年畫及普通本線裝書掃描影像規格

 

掃描作業規範:

 

1.本館提供善本古籍為B4至A3尺寸,善本古籍全書掃描畫面為彩色雙頁形式,檔案格式為典藏及印刷用300dpi TIFF不壓縮檔、網路傳輸用A4尺寸大小/72dpi壓縮比85%之JPEG檔二種;善本古籍卷端彩色掃描原則上分為典藏與印刷用A4尺寸大小/300dpi/TIFF不壓縮檔、網路傳輸用A4尺寸大小/300dpi/JPEG不壓縮檔二種(若網路傳輸用A4尺寸大小/300dpi/JPEG不壓縮檔案有字跡無法辨識的狀況,廠商有義務通知本館,由本館決定是否將解析度調高至600dpi,若由本館驗收時發現文字辨識困難,本館將退回該檔案,請廠商無條件重新轉檔為600dpi之檔案)。如有特殊需要,本館得提出要求,改為掃描600dpi /TIFF不壓縮檔,計價標準為/300dpi/TIFF不壓縮檔之2倍。敦煌卷子掃描規格比照善本古籍,尺寸為A4大小(橫向),可分段掃描,但需依固定掃描順序完成工作。拓片及年畫掃描規格亦比照善本古籍,但尺寸較不固定,原則上不大於A1 60cm×80cm,需以1:1比例完整掃描,不可分段掃描。普通本線裝書為B4尺寸,掃描畫面為黑白雙頁形式,檔案格式為典藏及印刷用300 dpi TIFF不壓縮檔、網路傳輸用72dpi的G4壓縮TIFF檔。

 

2.善本古籍、普通本線裝書若有因紙質較薄,而產生本頁可透視前頁文字的情況時,掃描前需加襯白紙。

 

3.掃描善本古籍(全書及卷端)、敦煌卷子、拓片、年畫及普通本線裝書均須以1:1之比例掃描。

 

4.在古籍清楚完整的前提下,影像掃描品質必須清晰,每日掃描前需校對螢幕顏色,掃描時目視螢幕不可有色偏、炫光、歪斜等情形。掃描內容必須完整,在原稿不清楚或者文字線條太細、文字太小、或本館有特殊要求等情況下,需提升掃描密度至600dpi儲存以避免影像流失。(提升掃描密度為600dpi TIFF影像,每頁以300dpi兩頁之價格計算,請另附掃描清單。)

 

5.影像覆校通過後,寫入並複製之DVD-R光碟片需為IMATION、TDK或SONY等同等級之4.7GB DVD-R。為保持文件之完整性,同一書號需燒錄於同一片DVD-R內,不可分散燒錄(同一書號的影像超過4.6G以上,以致無法燒錄至同一片DVD-R內之情況除外)。篇目資料覆校通過後,寫入並複製之CD-R光碟片需為KODAK、PHILIPHS、RICHO或同等級之金片。每次結報驗收另附「DVD/書名/書號對照表」 excel表格(附件H)之電子檔案給本館備存。

 

6.善本古籍(全書及卷端)、敦煌卷子、拓片、年畫及普通本線裝書之影像檔案必須分開燒錄於不同的光碟片中,不可混合燒錄;篇目資料檔案亦同。

 

7.本館將提供《商君書》影本供廠商(1)試編圖檔資料及(2)試作文字著錄檔案編寫。

 

(1)試編圖檔資料:請廠商將全部內容依資料層次分為書號、卷次及頁碼三層,將圖檔編碼資料列印為紙本交本館審核。圖檔編碼範例詳見附件B。

 

(2)試作文字著錄檔案編寫:廠商需依照範例,將書號書目基本資料、篇目與插圖、頁次等著錄檔列印為紙本交本館審核。著錄檔案範例見附件C。

 

8.廠商完成上述第7項之試作後,需將兩份試作資料列印為紙本,註明公司名稱、文件內容(《商君書》試作資料)交本館審核(試作題目共2題,每一題各50分,總分為100分,每錯一處扣1分,得分為80分(含)以上才算符合資格),始得參加價格標作業,相關資料見附件I「試作說明」。

 

附件B:國家圖書館善本古籍、敦煌卷子、拓片、年畫及普通本線裝書掃描影像檔案編碼原則

 

國家圖書館特藏組 民國96年1月16日修訂

 

本編碼原則適用於善本古籍、敦煌卷子、拓片、年畫及普通本線裝書掃描影像檔之編碼處理。

 

B-1善本古籍部分:

 

一、古籍全書

 

1.善本古籍以整部書(同一書號,非冊數)為製作單位。

 

2.其影像檔案目錄分為三層,包括:書號、卷次、及頁次區分檔名,檔名中的英文字母、符

號皆為半形皆為小寫。

 

例1:蠙衣生蜀草十二卷,閩草六卷,養草二卷,留草二卷

 

/12956-00000/0a00001/00001.tif

 

3.1書號

 

檔名長度為11 bytes(包含短橫-),由《國立中央圖書館善本書目》或「古籍影像檢

 

索系統」(http://rarebook.ncl.edu.tw/rbook.cgi/hypage.cgi?HYPAGE=home/rbook_home.htm )查出書號。

 

例1:蠙衣生蜀草

 

→書號→12596-00000

 

例2:葉臺全集→12763-00000

 

蒼霞草 →12763-00001(子目)

 

蒼霞續草 →12763-00002(子目)

 

蒼霞餘草 →12763-00003(子目)

 

綸扉奏草 →12763-00004(子目)

 

續綸扉奏草 →12763-00005(子目)

 

後綸扉尺牘 →12763-00006(子目)

 

蘧編 →12763-00007(子目)

 

例3:穀庵集選 →11437-00000

 

附 可閒先生逸稿 →11437-00001(合刊)

 

觀頤摘稿 →11437-00002(合刊)

 

東齋稿略 →11437-00003(合刊)

 

3.2 卷次

 

檔名長度為7 bytes,第一碼為阿拉伯數字(凡屬於正文前的以0表示,凡屬於正文

的,包括卷前在內,以1表示;不分卷的書也以1表示),第二碼為英文字(基本上只

用a、b、c…z 來代表正文內不同性質的部分,如詩集、奏疏、尺牘…外編、年譜、

附錄…詩集、文集、續集…山中集、憑几集、[憑几集]續集、息園存稿詩、文…),後五

碼為阿拉伯數字(依次以00001、00002、00003…來表示卷次)。

 

例1:蠙衣生留草二卷→1d00002

(註:書名: 1a蠙衣生蜀草十二卷,1b閩草六卷,1c養草二卷,1d留草二卷)

例2:蠙衣生蜀草正文前的序、凡例及目次等→0a00000

(註:書名: a蠙衣生蜀草十二卷,b閩草六卷c養草二卷,d留草二卷,0a蠙衣

生蜀草正文前的序、凡例及目次)

例3:玄扈樓集(不分卷)→1a00000

例4:玄扈樓集(不分卷)續集(不分卷)→分別為:1a00000及1b00000

 

3.3 頁次

檔名長度共5 bytes,古書右、左版面單位各為一頁。

例:第一頁→00001.tif

 

二、古籍卷端

1.善本古籍以整部書(同一書號,非冊數)為製作單位。

2.其影像檔案編碼以書號為主。

2.1書號

檔名長度為5~11 bytes(包含短橫-),由《國立中央圖書館善本書目》或「古籍影像檢索

系統」(http://rarebook.ncl.edu.tw/rbook.cgi/hypage.cgi?HYPAGE=home/rbook_home.htm )查出書號。

例1:蠙衣生蜀草

→書號→12596 (非叢書子目書號)

例2:叢書子目:

蒼霞草 →12763-00001(子目)

蒼霞續草 →12763-00002(子目)

蒼霞餘草 →12763-00003(子目)

綸扉奏草 →12763-00004(子目)

續綸扉奏草 →12763-00005(子目)

後綸扉尺牘 →12763-00006(子目)

蘧編 →12763-00007(子目)

 

附件C:國家圖書館善本古籍、敦煌卷子、拓片、年畫及普通本線裝文字書著錄檔案編寫原則

國家圖書館特藏組 民國95年11月6日修訂

C-1善本古籍部分:

 

一、至國家圖書館古籍影像檢索系統(http://rarebook.ncl.edu.tw/rbook.cgi/hypage.cgi?HYPAGE=home/rbook_home.htm)剪貼書目

基本資料,完成第一層metadata書目資料之著錄。

例:查詢書號03829,進入該書號內容「蓮華峰古蹟考略」後,複製該筆資料之書號、

題名、卷數、創作者、版本、附註等,貼至word檔中,成為以下格式。

書號:03829

題名:蓮華峰古蹟考略

卷數:三卷

創作者:(清) 三寶 (編) ;(清) 王亶望 (編)

版本:清乾隆間(1736-1795)朱格精寫袖珍本

附註:缺卷二、卷三

 

二、開啟掃描完成之電子檔案,對照其中含篇目之部分,依圖檔編碼原則於第三層內建置篇目

檔並著錄頁碼,如下列所示範。

$000不分卷$b0a00000

篇目:目錄+1-4

序文+5-8

蓮華峰+9-18

法鏡寺+19-66

翻經臺+67-74

夢謝亭+75-80

舍利塔+81-88

(圖)三生石+89-110

七葉堂+111-112

月桂亭+113-126

西嶺草堂+127-128

(圖)曲水亭+129-130

(圖)+131-132

瓔珞泉+133-134

連雲棧+135-138

下天竺後山各題名+139-150…………………

 

 

 

數位典藏與數位學習國家型科技計畫 拓展臺灣數位典藏計畫

 

數位典藏工作流程調查表

單位: 國家圖書館特藏組  數位化物件名稱: 古籍文獻

子計畫名稱: 臺灣研究核心資源數位化計畫 分支計畫名稱: 臺灣重要圖書文獻數位化

主持人(負責人)(E-mail、Tel): 顧力仁 [255] klj@ncl.edu.tw (02)2361-9132*401

聯絡人(E-mail、Tel): 張圍東 [256] wdc@ncl.edu.tw (02)2361-9132*404

 

 

 

 



三、中央研究院歷史語言研究所傅斯年圖書館

 



 

 



 

數位拍攝作業流程

 

 

 工作規範

 

(一)原件拿取基本原則

1. 是否有既定的館藏標準?

2. 原件拿取原則時注意平衡,以手掌托拿為原則

3. 移動原件時,盡量以整套為原則,以免散失的狀況發生

4. 原件的附屬物品如紙片、木夾、函套等,應隨原件移動,以免散失

5. 翻動原件時請帶上手套,以保護原件

6. 使用修裱專用軟毛刷子,刷去原件上的髒污

7. 若需要註記,只可使用鉛筆註記,並以夾紙條的方式置於原件中,不得使用其他筆具或便利貼等。

8. 飲料與食物應與原件保持安全距離

9. 原件不可放置於電腦螢幕、主機或其他會有熱源產生之處

10. 原件取用後必須置於防潮箱中,不得置於開放式空間,並隨時上鎖。

11. 翻閱時請帶上手套

12. 逐頁檢查書況,注意是否有紙屑、毛髮、灰塵,使用軟毛刷子刷去

13. 翻閱原件時,應小心紙質脆弱,避免撕破、缺角的情形發生。若有剝落字情況,必須即刻送交裱褙室人員進行修復。

14. 紙質焦脆的原件,摺角不宜翻動,以維護原件完整。

15. 拆線、拆釘的原件,翻閱後應將前後頁次放置整齊,維持原件之原樣。

 

 

(二)全彩影像掃描原則

1. 每日進行掃描工作前,執行掃描器校正程式

2. 每兩周必須執行螢幕色彩調校

3. 拆線掃描的原件,任何時候都務必摺疊整齊,因紙質薄脆且邊緣容易破碎,請注意是否有重要紙屑因未黏妥而掉落。

4. 欲破損之原件(或人為因素)需修補者,仍請館員處理。

5. 情況特殊之原件(如無頁碼原件),掃描後交由館員處理

6. 全套原件掃描時,第一冊掃描完成後必須先交由館員優先校驗,無誤後方可執行全套逐頁批次掃描。

7. 配合各項原則執行掃描。

8. 上傳至PC電腦之磁碟陣列影像檔校驗無誤後,燒錄DVD影像。

9. 必須以維持原件之原貌為原則,且力求降低原件之傷害,故依原書方式掃描為主,若原件不適宜數位化操作則暫緩數位化,不得因數位化而損害原件。若有特殊情況,則需由本館裱褙室人員協助處理。

10. 尺規色表採IT8標準色彩導表

11. 掃描時,將尺規起始值平行置放接近於原件端,並使尺規色表與原件之間距為0.1~1CM

12. 單頁即達A4大小者,以單頁分別掃描,並須分別重疊左右頁各二到四行,以便於日後接圖之用,一般原件仍採雙幅全掃。

13. 若可明確辨識原件之缺頁情況,則於原件旁加註缺頁條,其位置皆為下緣齊頁,原件之影像版面必須固定。

14. 拆線標準:中縫太緊,以致夾縫兩旁字跡產生陰影或扭曲

15. 拆紙釘標準:中縫太緊或原件太厚,拆線後仍不能解決問題,且原件必須是沒有包角者。

16. 兩頁併掃標準:試用於原件線釘全拆後,不能或不需攤開掃描。例如「原件沒有透背葉情況」、「原件因書口之版心開裂,不能攤開掃描」、「原件破損易碎」、「原件因沾黏無法離開」。

17. 襯紙&#20482;掃標準:原件透背頁,但因版心沾黏,且面積上無法攤開或因書口之版心開裂過多不及修補者,則須襯指兩頁併掃。

18. 攤開標準:適用於原件透背葉、原件紙釘全拆、圖文相連者,但先決條件必須為書況良好,能攤開且不影響原件原貌。

19. 襯紙標準與方法:是用於原件透背葉,卻不能攤開掃描者。

20. 拆線後紙釘斷裂:補做紙釘或分段做釘

21. 套書掃存方式宜採相同方式:併掃或攤開。

 

 

(三)全彩影像掃描校驗相關標準

1.以不影響版框內字跡及閱讀為基準

2.頁面之平整美觀與否亦需要考量

3.書頁掃描之中縫,注意陰影、字跡、字形扭曲、兩頁間距

4.透背頁字跡

5.襯紙

6.木屑與毛髮

7.遮字

8.邊角捲翹/摺角

9.蛀洞或破洞

10. 沾黏書頁上之紙條,需要掃存

11. 原件頁面凹凸不平/摺痕

12. 壞檔/錯頁/漏頁

13. 檔名與檔案順號

14. 頁面完整

15. 版面歪斜

16. 色差

17. 字跡或圖像清晰度



 

 

數位典藏與數位學習國家型科技計畫 拓展臺灣數位典藏計畫

 

數位典藏工作流程調查表

 

單位: 中研院史語所  數位化物件名稱: 善本古籍

子計畫名稱:史語所數位知識總體經營計畫-拓展臺灣數位典藏計畫 分支計畫名稱:傅斯年圖書館善本古籍國際學術知識網絡建置計畫

主持人(負責人)(E-mail、Tel):陳鴻森hschen@mail.ihp.sinica.edu.tw 26523118

聯絡人(E-mail、Tel): 林妙樺 [257] miaohua@mail.ihp.sinica.edu.tw 2782-9555*646

 

 


Article printed from 拓展台灣數位典藏: http://content.teldap.tw/index

URL to article: http://content.teldap.tw/index/?p=1006

URLs in this post:
[1] 壹、 引言: http://content.teldap.tw/index/?p=1006&page=2
[2] 貳、 古籍線裝書之作流程圖: http://content.teldap.tw/index/?p=1006&page=3
[3] 參、 前置作業: http://content.teldap.tw/index/?p=1006&page=4
[4] 肆、 物件數位化程序: http://content.teldap.tw/index/?p=1006&page=5
[5] 後設資料與資料庫建置: http://content.teldap.tw/index/?p=1006&page=6
[6] 陸、 延伸議題: http://content.teldap.tw/index/?p=1006&page=7
[7] 參考文獻: http://content.teldap.tw/index/?p=1006&page=8
[8] 附錄: http://content.teldap.tw/index/?p=1006&page=9
[9] [1]: #_ftn1
[10] [2]: #_ftn2
[11] 電子版的文淵閣本《四庫全書》: http://www.sikuquanshu.com/main.aspx
[12] [3]: #_ftn3
[13] [4]: #_ftn4
[14] [5]: #_ftn5
[15] [6]: #_ftn6
[16] [7]: #_ftn7
[17] [8]: #_ftn8
[18] [9]: #_ftn9
[19] [10]: #_ftn10
[20] [11]: #_ftn11
[21] [12]: #_ftn12
[22] <回 到 目 錄>: http://content.teldap.tw/index/?p=1006
[23] [1]: #_ftnref1
[24] [2]: #_ftnref2
[25] http://www.gutenberg.org/wiki/Main_Page: http://www.gutenberg.org/wiki/Main_Page
[26] [3]: #_ftnref3
[27] http://books.google.com/: http://books.google.com/
[28] [4]: #_ftnref4
[29] http://a9.com/: http://a9.com/
[30] [5]: #_ftnref5
[31] http://www.opencontentalliance.org/: http://www.opencontentalliance.org/
[32] [6]: #_ftnref6
[33] http://www.sinica.edu.tw/ftms-bin/ftmsw3: http://www.sinica.edu.tw/ftms-bin/ftmsw3
[34] [7]: #_ftnref7
[35] [8]: #_ftnref8
[36] http://rarebook.ncl.edu.tw/rbook.cgi/frameset2.htm: http://rarebook.ncl.edu.tw/rbook.cgi/frameset2.htm
[37] [9]: #_ftnref9
[38] http://idp.nlc.gov.cn/: http://idp.nlc.gov.cn/
[39] [13]: #_ftn13
[40] [14]: #_ftn14
[41] [15]: #_ftn15
[42] http://www.ndap.org.tw/1_newsletter/content.php?uid=171: http://www.ndap.org.tw/1_newsletter/content.php?uid=171
[43] [16]: #_ftn16
[44] [17]: #_ftn17
[45] Networked European Deposit Library: http://nedlib.kb.nl/
[46] [18]: #_ftn18
[47] [19]: #_ftn19
[48] [20]: #_ftn20
[49] <回 到 目 錄>: http://content.teldap.tw/index/?p=1006
[50] [10]: #_ftnref10
[51] [11]: #_ftnref11
[52] [12]: #_ftnref12
[53] [13]: #_ftnref13
[54] http://cdnet.stpi.org.tw/techroom/analysis/pat_A104.htm: http://cdnet.stpi.org.tw/techroom/analysis/pat_A104.htm
[55] [14]: #_ftnref14
[56] http://content.teldap.tw/index/?p=766: http://content.teldap.tw/index/?p=766
[57] [15]: #_ftnref15
[58] http://2a3y.sdb.ac.cn/upload/no02_05.ppt: http://2a3y.sdb.ac.cn/upload/no02_05.ppt
[59] [16]: #_ftnref16
[60] http://www.ndap.org.tw/1_newsletter/content.php?uid=171: http://www.ndap.org.tw/1_newsletter/content.php?uid=171
[61] [17]: #_ftnref17
[62] http://2a3y.sdb.ac.cn/upload/no02_05.ppt: http://2a3y.sdb.ac.cn/upload/no02_05.ppt
[63] [21]: #_ftn21
[64] [22]: #_ftn22
[65] [23]: #_ftn23
[66] [24]: #_ftn24
[67] [25]: #_ftn25
[68] [26]: #_ftn26
[69] [27]: #_ftn27
[70] [28]: #_ftn28
[71] [29]: #_ftn29
[72] [30]: #_ftn30
[73] [31]: #_ftn31
[74] [32]: #_ftn32
[75] [33]: #_ftn33
[76] [34]: #_ftn34
[77] http://readopac.ncl.edu.tw/ndap/rar/ndap-rar-doc-00.htm: http://readopac.ncl.edu.tw/ndap/rar/ndap-rar-doc-00.htm
[78] [35]: #_ftn35
[79] metadata: http://en.wikipedia.org/wiki/Metadata
[80] ASCIICode: http://www.ascii.cl/
[81] <回 到 目 錄>: http://content.teldap.tw/index/?p=1006
[82] [18]: #_ftnref18
[83] [19]: #_ftnref19
[84] [20]: #_ftnref20
[85] [21]: #_ftnref21
[86] [22]: #_ftnref22
[87] http://lib.ihp.sinica.edu.tw/: http://lib.ihp.sinica.edu.tw/
[88] [23]: #_ftnref23
[89] http://www2.ndap.org.tw/newsletter06/news/read_news.php?nid=538: http://www2.ndap.org.tw/newsletter06/news/read_news.php?nid=538
[90] [24]: #_ftnref24
[91] http://readopac.ncl.edu.tw/ndap/rar/ndap-rar-int-00.htm: http://readopac.ncl.edu.tw/ndap/rar/ndap-rar-int-00.htm
[92] [25]: #_ftnref25
[93] http://ethesys.yuntech.edu.tw/ETD-db/ETD-search/getfile?URN=etd-0806103-160927&filename=etd-0806103-160927.pdf: http://ethesys.yuntech.edu.tw/ETD-db/ETD-search/getfile?URN=etd-0806103-160927&filename=etd-0806
103-160927.pdf

[94] [26]: #_ftnref26
[95] http://www.gaya.org.tw/journal/m43/43-main3.pdf: http://www.gaya.org.tw/journal/m43/43-main3.pdf
[96] [27]: #_ftnref27
[97] http://km.cca.gov.tw/: http://km.cca.gov.tw/
[98] [28]: #_ftnref28
[99] http://km.cca.gov.tw/download/rule/93_do_scale.doc: http://km.cca.gov.tw/download/rule/93_do_scale.doc
[100] [29]: #_ftnref29
[101] [30]: #_ftnref30
[102] [31]: #_ftnref31
[103] [32]: #_ftnref32
[104] http://www.lib.ncku.edu.tw/journal/5/4.htm: http://www.lib.ncku.edu.tw/journal/5/4.htm
[105] [33]: #_ftnref33
[106] [34]: #_ftnref34
[107] http://ccs.ncl.edu.tw/Newsletter_79/p091_097.pdf: http://ccs.ncl.edu.tw/Newsletter_79/p091_097.pdf
[108] [36]: #_ftn36
[109] [37]: #_ftn37
[110] [38]: #_ftn38
[111] [39]: #_ftn39
[112] [40]: #_ftn40
[113] [41]: #_ftn41
[114] [42]: #_ftn42
[115] <回 到 目 錄>: http://content.teldap.tw/index/?p=1006
[116] [35]: #_ftnref35
[117] [36]: #_ftnref36
[118] http://windowshelp.microsoft.com/Windows/zh-TW/help/76f61616-6d12-46ec-bac2-49969d130c791028.mspx#E5: http://windowshelp.microsoft.com/Windows/zh-TW/help/76f61616-6d12-46ec-bac2-49969d130c791028.mspx#E5
[119] [37]: #_ftnref37
[120] [38]: #_ftnref38
[121] http://proj1.sinica.edu.tw/~ndaplib/channels/dlm_paper/digi_arch.pdf: http://proj1.sinica.edu.tw/~ndaplib/channels/dlm_paper/digi_arch.pdf
[122] [39]: #_ftnref39
[123] [40]: #_ftnref40
[124] [43]: #_ftn43
[125] [44]: #_ftn44
[126] [45]: #_ftn45
[127] [46]: #_ftn46
[128] [47]: #_ftn47
[129] http://rarebook.ncl.edu.tw/rbook.cgi/store/frameset.htm: http://rarebook.ncl.edu.tw/rbook.cgi/store/frameset.htm
[130] [48]: #_ftn48
[131] [49]: #_ftn49
[132] http://www.sinica.edu.tw/~cdp/paper/1997/19970301_5.htm: http://www.sinica.edu.tw/~cdp/paper/1997/19970301_5.htm
[133] <回 到 目 錄>: http://content.teldap.tw/index/?p=1006
[134] [41]數位典藏與數位學習國家型科技計畫計畫辦工是 彙編,《數位典藏技術彙編2007年版》,台北:數位典藏與數位學習國家型科技計畫,2007年12月,http://www2.ndap.org.tw/eBook08/showContent.php?PK=162: #_ftnref41
[135] [42]: #_ftnref42
[136] http://aspa.teldap.tw/: http://aspa.teldap.tw/
[137] [43]: #_ftnref43
[138] http://metadata.teldap.tw/design/lifecycle_new2.htm: http://metadata.teldap.tw/design/lifecycle_new2.htm
[139] [44]: #_ftnref44
[140] http://pl11.sinica.edu.tw:8080/dspace/bitstream/1868/1857/1/N1-BC0800001.pdf: http://pl11.sinica.edu.tw:8080/dspace/bitstream/1868/1857/1/N1-BC0800001.pdf
[141] [45]: #_ftnref45
[142] http://catweb.ncl.edu.tw/2-1-12.htm: http://catweb.ncl.edu.tw/2-1-12.htm
[143] [46]: #_ftnref46
[144] http://content.teldap.tw/main/epaper_detail.php?doc_id=1177&epaper_id=44: http://content.teldap.tw/main/epaper_detail.php?doc_id=1177&epaper_id=44
[145] [47]: #_ftnref47
[146] http://dlm.ntu.edu.tw/01_1.htm: http://dlm.ntu.edu.tw/01_1.htm
[147] [50]: #_ftn50
[148] [51]: #_ftn51
[149] [52]: #_ftn52
[150] [53]: #_ftn53
[151] [54]: #_ftn54
[152] [55]: #_ftn55
[153] [56]: #_ftn56
[154] [57]: #_ftn57
[155] [58]: #_ftn58
[156] [59]: #_ftn59
[157] [60]: #_ftn60
[158] [61]: #_ftn61
[159] [62]: #_ftn62
[160] [63]: #_ftn63
[161] [64]: #_ftn64
[162] <回 到 目 錄>: http://content.teldap.tw/index/?p=1006
[163] [48]: #_ftnref48
[164] [49]: #_ftnref49
[165] http://www.sinica.edu.tw/~cdp/paper/1997/19970301_2.htm: http://www.sinica.edu.tw/~cdp/paper/1997/19970301_2.htm
[166] [50]: #_ftnref50
[167] [51]: #_ftnref51
[168] http://www.tomshardware.tw/742,review-742.html: http://www.tomshardware.tw/742,review-742.html
[169] [52]: #_ftnref52
[170] http://www.tomshardware.tw/702,review-702.html: http://www.tomshardware.tw/702,review-702.html
[171] [53]: #_ftnref53
[172] http://www.tomshardware.tw/745,review-745-2.html: http://www.tomshardware.tw/745,review-745-2.html
[173] [54]: #_ftnref54
[174] [55]: #_ftnref55
[175] http://zh.wikipedia: http://zh.wikipedia.org/wiki/RAID
[176] .org/wiki/RAID: http://zh.wikipedia.org/wiki/RAID
[177] [56]: #_ftnref56
[178] http://www.zdnet.com.tw/news/hardware/0,2000085676,20099266,00.htm: http://www.zdnet.com.tw/news/hardware/0,2000085676,20099266,00.htm
[179] [57]: #_ftnref57
[180] [58]: #_ftnref58
[181] http://en.wikipedia.org/wiki/Digital_rights_management: http://en.wikipedia.org/wiki/Digital_rights_management
[182] [59]: #_ftnref59
[183] [60]: #_ftnref60
[184] [61]: #_ftnref61
[185] http://www.xrml.org/Reference/XrMLTechnicalOverviewV1.pdf: http://www.xrml.org/Reference/XrMLTechnicalOverviewV1.pdf
[186] [62]: #_ftnref62
[187] http://daal.iis.sinica.edu.tw/document/DRM.pdf: http://daal.iis.sinica.edu.tw/document/DRM.pdf
[188] [63]: #_ftnref63
[189] http://metadata.teldap.tw/tool/tool_2-das_chi.htm: http://metadata.teldap.tw/tool/tool_2-das_chi.htm
[190] [64]: #_ftnref64
[191] [65]: #_ftnref65
[192] http://www.nlc.gov.cn/service/wjls/pdf/08/08_02_a5b17.pdf: http://www.nlc.gov.cn/service/wjls/pdf/08/08_02_a5b17.pdf
[193] [66]: #_ftnref66
[194] [67]: #_ftnref67
[195] [68]: #_ftnref68
[196] http://newsletter.teldap.tw/news/read_news.php?nid=1736: http://newsletter.teldap.tw/news/read_news.php?nid=1736
[197] [69]: #_ftnref69
[198] http://content.teldap.tw/index/?p=766: http://content.teldap.tw/index/?p=766
[199] http://ccs.ncl.edu.tw/Newsletter_79/p091_097.pdf: http://ccs.ncl.edu.tw/Newsletter_79/p091_097.pdf
[200] http://ethesys.yuntech.edu.tw/ETD-db/ETD-search/getfile?URN=etd-0806103-160927&filename=etd-0806103-160927.pdf: http://ethesys.yuntech.edu.tw/ETD-db/ETD-search/getfile?URN=etd-0806103-160927&filename=etd-0806
103-160927.pdf

[201] http://www.gaya.org.tw/journal/m43/43-main3.pdf: http://www.gaya.org.tw/journal/m43/43-main3.pdf
[202] http://daal.iis.sinica.edu.tw/document/DRM.pdf: http://daal.iis.sinica.edu.tw/document/DRM.pdf
[203] http://cdnet.stpi.org.tw/techroom/analysis/pat_A104.htm: http://cdnet.stpi.org.tw/techroom/analysis/pat_A104.htm
[204] http://cdnet.stpi.org.tw/techroom/analysis/pat_A088.htm: http://cdnet.stpi.org.tw/techroom/analysis/pat_A088.htm
[205] http://cdnet.stpi.org.tw/techroom/analysis/pat_A027.htm: http://cdnet.stpi.org.tw/techroom/analysis/pat_A027.htm
[206] http://www.ndap.org.tw/1_newsletter/content.php?uid=171: http://www.ndap.org.tw/1_newsletter/content.php?uid=171
[207] http://www.archives.gov.tw/Publish.aspx?cnid=950&p=646: http://www.archives.gov.tw/Publish.aspx?cnid=950&p=646
[208] http://www.ithome.com.tw/itadm/article.php?c=34045: http://www.ithome.com.tw/itadm/article.php?c=34045
[209] http://www2.ndap.org.tw/newsletter06/news/read_news.php?nid=538: http://www2.ndap.org.tw/newsletter06/news/read_news.php?nid=538
[210] http://cdnet.stpi.org.tw/techroom/analysis/pat_A025.htm: http://cdnet.stpi.org.tw/techroom/analysis/pat_A025.htm
[211] http://www.ithome.com.tw/itadm/article.php?c=35693: http://www.ithome.com.tw/itadm/article.php?c=35693
[212] http://windowshelp.microsoft.com/Windows/zh-TW/help/76f61616-6d12-46ec-bac2-49969d130c791028.mspx#E5: http://windowshelp.microsoft.com/Windows/zh-TW/help/76f61616-6d12-46ec-bac2-49969d130c791028.mspx#E5
[213] http://metadata.teldap.tw/design/lifecycle_new2.htm: http://metadata.teldap.tw/design/lifecycle_new2.htm
[214] http://content.teldap.tw/main/epaper_detail.php?doc_id=1177&epaper_id=44: http://content.teldap.tw/main/epaper_detail.php?doc_id=1177&epaper_id=44
[215] http://www.sinica.edu.tw/~cdp/paper/1997/19970301_2.htm: http://www.sinica.edu.tw/~cdp/paper/1997/19970301_2.htm
[216] http://www.tomshardware.tw/742,review-742.html: http://www.tomshardware.tw/742,review-742.html
[217] http://www.tomshardware.tw/702,review-702.html: http://www.tomshardware.tw/702,review-702.html
[218] http://www.tomshardware.tw/745,review-745-2.html: http://www.tomshardware.tw/745,review-745-2.html
[219] http://www.tomshardware.tw/745,review-745-11.html: http://www.tomshardware.tw/745,review-745-11.html
[220] http://zh.wikipedia.org: http://zh.wikipedia.org/wiki/RAID
[221] /wiki/RAID: http://zh.wikipedia.org/wiki/RAID
[222] http://www.zdnet.com.tw/news/hardware/0,2000085676,20099266,00.htm: http://www.zdnet.com.tw/news/hardware/0,2000085676,20099266,00.htm
[223] http://www.xrml.org/Reference/XrMLTechnicalOverviewV1.pdf: http://www.xrml.org/Reference/XrMLTechnicalOverviewV1.pdf
[224] http://en.wikipedia.org/wiki/Digital_rights_management: http://en.wikipedia.org/wiki/Digital_rights_management
[225] http://www.nlc.gov.cn/service/wjls/pdf/08/08_02_a5b17.pdf: http://www.nlc.gov.cn/service/wjls/pdf/08/08_02_a5b17.pdf
[226] http://open.nat.gov.tw/OpenFront/report/show_file.jsp?sysId=C08901810&fileNo=001: http://open.nat.gov.tw/OpenFront/report/show_file.jsp?sysId=C08901810&fileNo=001
[227] http://pl11.sinica.edu.tw:8080/dspace/bitstream/1868/1857/1/N1-BC0800001.pdf: http://pl11.sinica.edu.tw:8080/dspace/bitstream/1868/1857/1/N1-BC0800001.pdf
[228] http://www.asiaa.sinica.edu.tw/~ccchiang/GILIS/IO/112XrML.ppt: http://www.asiaa.sinica.edu.tw/~ccchiang/GILIS/IO/112XrML.ppt
[229] http://teldap.tw/: http://teldap.tw/
[230] http://content.teldap..org.tw: http://content.teldap..org.tw
[231] http://tech.teldap.tw/: http://tech.teldap.tw/
[232] http://core.teldap.tw: http://core.teldap.tw/
[233] http://aspa.teldap.tw/: http://aspa.teldap.tw/
[234] http://idp.teldap.tw/: http://idp.teldap.tw/
[235] http://learning.teldap.tw: http://learning.teldap.tw/
[236] http://elcl.teldap.tw/: http://elcl.teldap.tw/
[237] http://collab.teldap.tw/: http://collab.teldap.tw/
[238] http://metadata.teldap.tw/tool/tool_2-das_chi.htm: http://metadata.teldap.tw/tool/tool_2-das_chi.htm
[239] http://lib.ihp.sinica.edu.tw/: http://lib.ihp.sinica.edu.tw/
[240] http://readopac.ncl.edu.tw/ndap/: http://readopac.ncl.edu.tw/ndap/
[241] http://www.npm.gov.tw/digitization/overview.htm: http://www.npm.gov.tw/digitization/overview.htm
[242] http://tech2.npm.gov.tw/da/: http://tech2.npm.gov.tw/da/
[243] http://www.archives.gov.tw/Chinese_archival/Download/Default.aspx?cnid=288: http://www.archives.gov.tw/Chinese_archival/Download/Default.aspx?cnid=288
[244] <回 到 目 錄>: http://content.teldap.tw/index/?p=1006
[245] 附錄一、影像製作規格參考規範標準: #_Toc226776911
[246] 附錄二、各單位目前異地備援比較分析: #_Toc226776912
[247] 附錄三、數位化成本估算實例: #_Toc226776913
[248] 附錄四、善本古籍核心元素需求規格書: #_Toc226776914
[249] 附錄五、工作流程圖與數位化規範 : #_Toc226776915
[250] [65]: #_ftn65
[251] [66]: #_ftn66
[252] [67]: #_ftn67
[253] [68]: #_ftn68
[254] [69]: #_ftn69
[255] klj@ncl.edu.tw: mailto:klj@ncl.edu.tw
[256] wdc@ncl.edu.tw: mailto:wdc@ncl.edu.tw
[257] miaohua@mail.ihp.sinica.edu.tw: mailto:miaohua@mail.ihp.sinica.edu.tw