臺南大學日治時代日文珍本數位典藏計畫–日治時代日文舊籍珍本 數位化工作流程簡介
Tags: Metadata, 圖書館, 影像, 掃描, 數位化工作流程, 文書, 檔案, 資料庫 發表: 2009-11-16, 點閱: 20,783 , 加入收藏櫃 , 列印 , 轉寄
計畫單位:國立臺南大學數位學習科技學系
計畫名稱:臺南大學日治時代日文珍本數位典藏計畫
國立臺南大學[1]前身為台南師範學校,創立於西元 1899 年(明治 32 年)。當時臺灣總督府為培育公學校 (以中央或地方經費所開辦的兒童義務教育學校) 之師資,成立台北、台中、臺南等三所師範學校[2]。109年來,臺南大學歷經台南師範學校、台灣總督府國語學校台南分校、台灣總督府臺南師範學校、台灣省立臺南師範學校、台灣省立臺南師範學院、國立臺南師範學院等校名,於 2004 年 8 月 1 日起,正式更名為「國立臺南大學」(以下簡稱臺南大學)。
臺南大學創立時即設置圖書館,雖然不如今日之規模,但其典藏日治時代(1895-1945 年,含明治、大正、昭和等時代)之圖書、地圖、辭典等出版品非常豐富,內容涵蓋培育師資所應具有之知識,包括地理、歷史、化學、物理、文學、音樂、兒歌、美術、宗教、風俗民情等。此外,日本政府統治台灣初期,爲了解台灣風俗與天然資源,於 1900 年後陸續進行大規模的「舊慣調查」,包括土地、人口、司法、行政法、以及經濟產業狀況等,皆納入調查的範圍,為日本政府經營台灣提供翔實的參考,本校亦珍藏當時對台灣各項調查的統計資料。這些日治時代的重要史料(含出版品與調查統計資料)多以日文寫成,也有部分漢文和西文之文獻,學術界通稱為「日文舊籍」。
隨著日治時代結束、民國光復,國民小學教育由日語轉變為國語,原存於臺南大學圖書館的日文舊籍逐漸轉為特藏書籍,存於特藏書庫。因爲內部修整與空間不足而丟棄某些舊籍,部分遺留下的日文舊籍也因紙張損毀、頁面脫落,曾經重新裝訂為藍皮之精裝本。時至今日,臺南大學圖書館仍珍藏日文舊籍 6000 餘冊,內容皆爲蒐集先人之歷史、文化、政治、經濟等各方面的著述,揭露不同時代台灣人民的生活面貌。爲使重要史料得以永久保存,且能配合經常性的使用,解決傳統紙本資料收藏與流通利用的衝突,本計畫希望將這些資料加以整理且數位化,透過電腦網路提供學術研究或教育推廣之用,並能永續典藏與運用。
本計畫將整理與數位化這批日文舊籍,且擷取書中珍貴的圖表、相片、分佈圖、地圖等影像,建置日文舊籍之「電子書資料庫」及「圖表相片資料庫」,提供網路瀏覽與檢索等功能,透過電腦網路跨越時空、無遠弗屆的特性,提供教學研究推廣加值用途,並永久典藏與運用。本計畫目標如下所示:
1、將臺南大學圖書館所藏具有代表性的日文舊籍珍本,逐一進行全本數位化(掃描)。
2、針對掃描之全文影像,建置電子書資料庫及圖表相片資料庫。
3、提供網路瀏覽與檢索等功能,提供學術研究與運用。
本計畫提供日據時代翔實的參考資料,讓研究台灣文史學者藉由當時的統計資料與風俗民情之調查,了解台灣於日治時代的面貌,鑑古知今,亦期能藉由網際網路將珍藏的資料傳播於世界各地,讓世人充分瞭解台灣的人文與歷史風貌。
[2]維基百科網站http://zh.wikipedia.org/。
日治時代日文舊籍珍本之數位化工作流程簡介
本計畫參照「數位典藏國家型科技計畫」出版之工作流程參考標準[3],以及國立台中圖書館[4]、國立中央圖書館台灣分館[5]、台灣大學圖書館[6]、中央研究院台灣史研究所[7]等機構數位化日文舊籍之經驗,規劃(1)前置工作、(2)數位化物件、(3)後設資料 (metadata)、(4) 建置資料庫及網站等四階段工作之內容及流程,計畫的工作流程如上頁所示。在「前置作業」步驟,本計畫的任務為規劃工作流程、購置數位化設備、日文珍本鑑定、數位檔案之命名、數位檔案之格式(包含永久典藏、網路預覽、小圖瀏覽)等工作;在「物件數位化工作」步驟,本計畫首先建立色彩管理模式,接著制定掃描工作流程、進行日文珍本掃描、圖檔校對、影像儲存、選擇書中珍貴圖片及翻譯等
任務;在「後設資料」步驟,本計畫參照「中國編目規則」[8]及「中國機讀編目格式」(CMARC) 設定後設資料之欄位;最後在「建置資料庫及網站」步驟,進行網站與資料庫之開發與建置。
一、購置數位化設備
數位化所需之設備包含:個人電腦主機、低速A3 規格、低速A4 規格平台式掃描器及高速度 USB 2.0 規格高階掃描器、外接式硬碟、電子防潮櫃等,詳細規格請參見表一。本計畫為重現日文珍本資料,考量盡量不破壞書的原貌,以不拆書冊為原則進行數位化掃描,若書面大小超過A4者,使用A3 規格平台式掃描器。
表一、數位化設備之清單
品 名 |
廠牌型號 |
規 格 |
數量 |
備 註 |
平台式掃描器 |
MICROTEK ScanMaker i800 |
6低速A4規格高階掃描器 |
1 |
掃描A4以下書籍內容 |
平台式掃描器 |
MICROTEK ScanMaker 9800XL |
12低速A3規格高階掃描器 |
1 |
掃描A3以上書籍內容 |
平台式掃描器 |
MICROTEK ScanMaker 6000 |
高速度 USB 2.0 (USB 1.1相容) 規格高階掃描器 |
3 |
掃描A4以下書籍內容 |
平台式掃描器 |
MICROTEK ScanMaker 5950 |
高速度USB (USB 2.0) 規格高階掃描器 |
1 |
掃描A4以下書籍內容 |
DVD燒錄器 |
SONY DRX-810UL |
DVD±R/RW雙模式寫入與覆寫燒錄器(外接式) |
1 |
數位典藏資料備份 |
電子防潮櫃 |
防潮家D-306E |
W: 880mm, 365L |
1 |
放置器材與資料 |
個人電腦主機 |
主機:ASUS AS-D670 主機板:ASUS P5LD2-VM/BTO |
CPU:Pentium D 3.4GHz RAM:3GB 硬碟:160GB |
1 |
文書處理、網頁設計、影像處理 |
22”液晶顯示器 |
CHIMEI CMV 221D |
解析度:1,680×1,050 對比度:800:1 |
1 |
同上 |
影像處理軟體 |
Adobe Photoshop CS2 中文版 |
2 |
影像處理 |
|
外接式硬碟 |
WD |
320G 7200轉sataII |
3 |
儲存影像 |
伺服器 |
IBM eServer X3650 |
2U / Intel Xeon Dual Core 2.0GHz / 1GB RAM / Gigabit LAN*2 |
1 |
架設網站及資料備份 |
二、建立書目清單
在日文舊籍進入數位化工作前,首要前置作業即為建立書目清單。建立書目清單有助於了解藏品的數量及協助文件之提調,亦為後設資料之依據,後設資料可基於書目資料建立更為複雜的描述性資料。因日文舊籍之媒體類型為印刷圖書資料,本計畫依據「中國編目規則」及日文舊籍之特性訂定清單之欄位,包含書名、作者、編譯者、出版者、出版地、出版年、頁面數、高廣尺寸、叢書名、是否有圖像、國家圖書館聯合目錄是否有館藏、它館是否數位化、保存現況、收藏印記、備註等16個欄位,著錄方式依原書照錄,著錄來源為其版權頁,若版權頁遺失則參照書名頁,目前已建置 4225 筆書目資料。
圖七、日文舊籍之清單。
三、鑑定與查核日文舊籍珍本
日文舊籍珍本評估標準包含:於坊間流傳的多寡、內容對於台灣史研究之貢獻、及日文舊籍本身之書況。本計畫邀請臺南大學台灣文化研究所戴文鋒教授、國家台灣文學館林佩蓉研究員、成功大學台灣文學系博士候選人陳淑容進行珍本鑑定,並以國家圖書館之圖書聯合目錄[9] 查詢他館藏是否典藏相同之日文舊籍,以了解其獨特性。本計畫並依照上述三位專家所提供的建議資料,安排日文珍本數位化的優先順序,且因目前有部分機構刻正進行日治時代臺灣資料之數位化,為避免重複數位化造成資源上的浪費,故鑑定為珍本者再次查詢台中圖書館、中央研究院台灣史研究所是否已進行全文數位化,他館未進行數位化之珍本為第一優先進行數位化者;他館完成數位化之珍本,因為未來呈現方式,及加值或推廣方式不同,且日文舊籍的所屬單位也不同,為將留在最後才進行數位化。
四、制定數位化檔案格式
本計畫參照「數位典藏國家型科技計畫」所制定之標準[10],以及日文珍本之特性與作業需求,並考慮匯入聯合目錄之規格,制定永久典藏、網路預覽、小圖瀏覽等三種數位化檔案規格,如表二所示,內容包含檔案格式、解析度等參數設定,而不論是純文字、套印本、或是彩色圖籍,計畫皆採用無失真 600dpi 彩色 TIFF 格式掃描。就檔案量而言,由於 TIFF格式之檔案量較高,為便於人員之訓練及增加作業速度,網頁上之可視圖檔皆轉為 JPEG 格式。
表二、數位影像檔之格式
使用目的 |
說明 |
檔案規格 |
|
永久典藏 |
將資料數位化且典藏,保持原有風貌 |
檔案格式 |
TIFF |
解析度 |
600 dpi |
||
色調深度 |
RGB (24 bits) |
||
電子書 |
使用者可網路上觀看全文影像 |
檔案格式 |
PDF / JPEG |
解析度 / 影像大小 |
150 dpi / 600×600 pixels |
||
色調深度 |
RGB (24 bits) |
||
圖表相片 |
讀者閱讀清晰的圖表相片 |
檔案格式 |
JPEG |
解析度 / 影像大小 |
72 dpi / 980×980 pixels |
||
色調深度 |
RGB (24 bits) |
||
網路預覽 |
提供使用者網路預覽 |
檔案格式 |
JPEG |
解析度 / 影像大小 |
72 dpi / 390×390 pixels |
||
色調深度 |
RGB (24 bits) |
||
小圖瀏覽 |
提供使用者瀏覽及選擇欄位用 |
檔案格式 |
JPEG |
影像大小 |
100×100 pixels |
||
色調深度 |
RGB (24 bits) |
||
浮水印 |
供安全機制作業之用 |
檔案格式 |
JPEG |
解析度/影像大小 |
書籍大小的1/3 網路預覽檔為133×133 pixels |
||
色調深度 |
灰階 |
五、制定數位化檔案命名原則
本計畫參照「文建會國家文化資料庫」[11] 數位化檔案命名原則,並依據日文珍本及圖表相片使用之目的、典藏所在處等元素,制定符合所需之命名原則,如下所述:
1. 檔案命名原則
(1) 可由檔名辨識典藏所在處。
(2) 藉由檔名可了解同一物件有多種檔案格式與使用目的。
(3) 每一數位資源皆有唯一之檔名。
(4) 檔案名稱與Metadata結合。
(5) 符合下列規格:
a. 使用ASCII code命名
b. 命名一律使用半形英文小寫字母與數字,不可使用中文或全形
c. 檔名不可包含下列字元 / \ : * ? “ < > | ! @ # $ % ^ & ( ) + = { } [ ] , .
2. 檔名結構與內容說明
檔名結構及其內容說明如表三所示,包含:單位代碼、物件類別、物件代碼、多部分之序號、使用目的,此五種皆必備,且各段間以 ”-” (dash) 作為分隔,例如臺南大學圖書館第一冊日文舊籍掃描3頁為永久保存之用,其檔案編號為:
nutn-bk-jblib001-0001-u.tif
nutn-bk-jblib001-0002-u.tif
nutn-bk-jblib001-0003-u.tif
例如第一冊日文舊籍內有3張照片擷取為永久典藏之用,其檔案編號為:
nutn-ph-jblib001-0001-u.tif
nutn-ph-jblib001-0002-u.tif
nutn-ph-jblib001-0003-u.tif
表三、日文珍本數位化檔案命名原則
一、提調日文舊籍
計畫提件時的維護原則如下:
1、翻動原件時,必須戴上手套,以保護原件。
2、若需註記,只可使用鉛筆註記,並以夾紙條的方式置於原件中,不得使用其他筆具或便利貼。
3、飲料與食物等應與原件保持安全距離。
4、原件不可放置於電腦螢幕、主機或其他會有熱源產生之處。
翻閱原則:
1、原件翻閱與掃描時,須戴手套。
2、逐頁檢查書況時,須注意是否有紙屑、毛髮、灰塵。
3、翻閱原件時,須小心紙質脆弱,避免撕破、缺角的情形發生。
4、若頁面相黏,為避免因強制分離頁面造成撕破的情況,則應跳過相黏的頁面。
二、 色彩管理模式
本計畫於每次正式數位化掃描作業前,皆依照顏色校正軟體之標準校對顏色。雖然此舉較為費時,但可確保數位化影像顏色的正確性。故於掃描器啟用前,使用ICC軟體與Kodak Q-60R1色彩校色片製作色彩描述檔,以便進行掃描器色彩之校準。
三、 制定掃描工作流程
本計畫為維持物件數位化之品質且便於管理,使不同人員進行掃描時皆能操作一致的作業流程,確保影像品質,制定掃描工作之標準流程,如圖十所示。爲避免灰塵、手上的污漬造成日文珍本的汙染,於掃描前需進行清潔環境且穿戴手套;為避免檔案有污點(非本身文件所有的)於掃描前,需擦拭掃描器的鏡面;爲避免影像歪斜造成後置工作之不便及確認掃描的範圍,於正式掃描前需進行預覽以確保影像之品質(此增加掃描工作的時間),最後進行正式掃描。於全書掃描完畢後,進行校對與儲存工作。
圖十一、掃描工作流程。
四、 數位化(掃描)日文珍本
一般而言,數位化必須以維持圖書原貌、減低對圖籍之傷害為原則,故依原書不拆裝、不蓋上掃描器面板的方式進行正式掃描,若圖書不適宜進行數位化操作則暫緩數位化,不使圖書因數位化而受損。
因書冊大小而有雙頁掃描(兩頁合計小於A4者)、單頁掃描(單頁小於A3者)、與分區掃描(單頁大於A3者)等不同的掃描方式,如書中附有大地圖則採分區掃描後,再使用Photoshop軟體進行拼圖工作,以維持圖像的品質。
由於臺南大學日文舊籍多已重新裝訂,使內頁有歪斜的情況,因掃描時以不拆書為原則,常造成內文圖檔歪斜。為保持檔案瀏覽時的舒適感及檔案品質,工作人員於正式掃描前,先預覽檢查影像是否歪斜,若發現歪斜5度以上,則使用Photoshop軟體對書籍做人工微調,以保持影像方正,此舉亦增加掃描工作之時間。
為兼顧影像品質與掃描之效率,本計畫將掃描作業分為兩階段:第一階段針對珍本之封面、書名頁、序言、目次、圖、照片、凡例、圖例、版權頁、封底、廣告等部份進行掃描,使讀者對於各書有初步的了解;第二階段為內文之數位化。
五、校對與檢查圖檔
掃描完畢後必須進行校驗。數位影像檔校驗的原則包含:文字及圖表的清晰度,以不影響字跡及閱讀為基準;頁面之平整美觀;閱讀之舒適度。校驗內容則有:影像是否有嚴重色偏、歪斜、黑邊、模糊、不當裁切、檔案之流水號跳號、圖檔與原書內容不相符、圖檔格式非600dpi等情況,若有上述情況發生則進行重掃,並記錄於EXCEL檔。
圖十七、掃描完後,由工作人員逐一檢查圖檔。 (示範者:辜雅婷) |
六、儲存作業
經校驗確認同一檔案之流水號無跳號、圖檔與原書內容相符、圖檔格式為 600dpi無誤及字跡與圖像無失真或模糊的情況後,燒錄於光碟中,且於光碟上註明檔名、檔案內容與燒錄日期,並每週將圖檔存入外接式硬碟。多處備份可確保資料不會因人為或環境因素而遺失。為避免備份完畢之資料,受環境潮濕、光線、及熱源之影響,皆保存於電子防潮箱。
七、轉檔與後置作業
(一)轉為網路預覽檔及小圖瀏覽檔
為使讀者初步瞭解書籍與圖表相片之內容與種類,本計畫利用Photoshop影像處理軟體進行轉檔,以降低檔案量,供讀者於網路上瀏覽與選擇之用。轉換為網路預覽檔及小圖瀏覽檔之方法是利用Photoshop批次調整圖片格式、解析度、大小,網路預覽檔為390×390,小圖瀏覽檔為100×100。
圖二十一、掃描並校驗完成後的圖檔,由工作人員進行批次轉檔作業。(示範者:陳俊豪) |
圖二十二、轉檔方法:錄製轉換過程鄔顜憒董B理中選取錄製項目銃}啟圖片資料夾?選取「忽 略動作的開啟指令」避免批次處理過程需要手動控制鉯翵x存資料夾鉯翵u忽略動作的開啟指令」。
(二)製作電子書
為減少等待檔案下載的時間,電子書以每書各章節為單位(故一書有多個電子書檔),檔案量限制在10M以下,以提升下載速度。為保持閱覽之清晰度,使影像在放大150%後文字仍清晰可見,經幾次嘗試,將電子書數位檔案訂為150dpi,圖片大小為600×600之格式。考量使用的方便性,使讀者不需下載其他瀏覽軟體,便可閱覽電子書,故採用目前較為普遍的Adobe Acrobat製作電子書(PDF檔),電子書製作步驟如下所示:
步驟一:利用Photoshop加上浮水印。
步驟二:利用Adobe Acrobat建立電子書、調整解析度。
圖二十三、將圖檔批次加入浮水印。 |
圖二十四、製作電子書之步驟二:由「檔案」進入「建立」鉯嚝隉u從多個檔案」鉯翵珨搨n的檔案鄑髡邦q子書鉯擗J檔案名稱進行儲存鄏A進行解析度調整。
(三)擷取圖表相片
為吸引讀者閱讀、提升資料使用率,本計畫擬建置「圖表相片資料庫」,其內容由珍本中擷取出與台灣文史生活相關者為首選,再來為其餘圖片。考量檔案下載速度及閱讀清晰度,以Photoshop影像處理軟體將600dpi之. .tif 檔批次轉換成72dpi、圖檔大小為980×980之 .jpg 檔。
(四)建置數位影像之安全機制
為防止數位影像遭非法人士之不法使用,本計畫針對電子書、圖表相片及網路預覽檔之防護措施如下:
1、鎖住滑鼠右鍵,防止檔案儲存於他人電腦之中。
2、增加可視浮水印於圖表相片及電子書中央。
3、取消PDF電子書存檔、列印、郵寄、標籤、頁面之功能。
(五)校驗電子書與圖表相片之影像檔
為確保影像品質,數位影像檔校驗原則包含:文字及圖表的清晰度,如電子書放大150%後文字仍需清晰可見;頁面之平整美觀;閱讀之舒適度。校驗內容則有:圖檔連結是否正確、影像是否有嚴重色偏、歪斜、黑邊、模糊、不當裁切等情況,若有上述情況發生則重新製作。
一、制訂日文珍本後設資料欄位
本計畫參照「數位典藏國家型科技計畫」後設資料工作組善本古籍主題小組訂定的善本古籍核心後設資料元素[12] 與中國編目規則及「中國機讀編目格式」(CMARC),且考量metadata須達成三項目標:
1. 描述日文舊籍之內涵與特色。
2. 使用者易於檢索。
3. 與其他資料庫互通、交換資料。
據此訂定日文舊籍描述性之後設資料,包含館藏類型、中日文題名、作者或編譯者、版本項、出版項、語文、稽核項、保存現況、內容分析、及權利範圍等29個欄位,著錄規則如表四所示。欄位建置完畢後,將由一至二位的碩士及兼任助理,熟悉欄位定義與著錄規則後,再輸入欄位資料。
二、圖表相片之後設資料
本計畫參照中央研究院臺灣史研究所建置之日治時期台灣研究古籍資料庫及圖表相片之特性,制訂圖表相片後設資料之欄位,其包含:圖片檔案編號、出處(書名及頁數)、出版年、中日文標題、中日文圖片描述、檔案解析度等10個欄位。
為消除語言隔閡,使讀者能進一步瞭解資料之內容概況,在中文標題、圖片描述、中文書名、序言中文摘要、作者中文譯名和摘要的部分,請瞭解日文之人士進行翻譯,而翻譯時注意之事項如下:
1、 日文漢字與中文用詞意義相似者,採用兩者中較為簡潔的字詞為主:
如日文珍本「老莊の思想と道教」,老莊中文可翻為老子與莊子,但也可合併為老莊(與日文漢字用詞相同),故中文譯為「老莊思想與道教」,而非「老子和莊子的思想與道教」。
2、 地名、人名、職稱等專有名詞,若能查證今日沿革之地名或職稱,則於日文漢字後括號註明,若無法查證則照錄日文漢字:
如:日文「入江侍從」,侍從即為今日本天皇之侍衛官,故翻譯為「入江侍從(侍從為天皇之侍衛官)」。
3、 標點符號使用全形。
4、 全形字與半形字間空一格,即國字與英文字母、阿拉伯數字中間空一格,但標點符號與英文字母、阿拉伯數字間無須空格。
5、 中文標題中的數字,10之前皆使用國字,10之後則使用阿拉伯數字例如:昭和10年酮L和十年。中文描述中之時間與日期使用阿拉伯數字例如:明治33年2月1日。
圖二十五、圖片後設資料範例檔。 |
三、比對欄位元素與Dublin Core、MARC21、CMARC
為使計畫後設資料欄位與國際間其他主題計畫作XML資料交換,且便於匯入數位典藏聯合目錄,故比對日文舊籍後設資料欄位與Dublin Core、MARC21、CMARC,結果如表五所示。
四、校驗後設資料
書籍與圖表相片之後設資料輸入資料庫後,再由專任助理、計畫主持人校對無誤後,最後於網路上公開瀏覽。勘驗內容包含:是否有錯字、亂碼、翻譯與原文是否相符、圖檔連結是否正確,及格式的一致性,如標點符號是否為全形、全形與半形間是否有空一格、標題中的數字10之前皆使用國字,以確保描述資料的精確性。
表四、日文舊籍後設資料之欄位
欄位名稱 |
欄位說明 |
|||
類型 Type |
藏品的類型或性質。例:日文舊籍指民國38年前日治時代出版之印刷品;圖表相片指擷取日文舊籍書中之圖像、相片、分佈圖、地圖。 |
|||
題名 Title |
日文題名 Main Title |
主要著錄來源為書名頁,若無書名頁,則參考版權頁、封面、書背、卷端、簡略書名頁及逐頁書名等,以載有最完備之著錄資料者替代之,並將來源記於附註項。 1.題名之遣詞用字、符號、標點、數字、國語注音符號、羅馬拼音,或其他拼音符號及夾用外文者,均依原作品所載著錄。 2.題名之冠有「欽定」、「增廣」、「增補」、「詳註」、「重修」、「校訂」、「選本」、「繪圖」、「最新」等字樣者,依原題字樣著錄。 3.書籍之分卷者,應將卷數記於正題名之後,空一格以國字書寫。若所題卷數與原書不符時,須於附註說明之,例:欽定四庫全書總目 二百卷,卷首一卷。 4.若一作品為另一作品之一部份或續編、補編等,則將其部份題名(含編次、編次名稱)著錄於正題名之後,以圓點及空格相隔,例:1.圖解觀賞用魚類大觀.卷二,金魚篇。 |
||
並列題名 Varying form of title |
與正題名不同語文之其他題名或符號(如羅馬拼音、國語注音等),視為並列題名。依主要著錄來源所載之順序著錄,並列題名前冠以等號(﹦)。 例:中華民國經濟年鑑 = Economic yearbook of the Republic of China。 |
|||
副題名 Remainder of title |
加冒號置於所屬正題名或並列題名之後,例:健康的第一步:認識你的身體。 |
|||
中文題名 Chinese of title |
由日文題名翻譯成中文題名。 |
|||
著者 Author |
作者 Writer |
1超過三人(團體)者,僅記首列之著者,並加「等」字,其餘全部省略。 2.著者之頭銜、學位、職位等均不必著錄。 |
||
編譯者 Translator and Editor |
外國著者原名或僅載中文譯名者,均依原題著錄;若同時載有著者外文原名及其中文譯名者,則原名著錄於中文譯名後,並加圓括弧。 例:1.兒童肖像大全/John Norton 原著;胡哲編譯。 2.機械準確性的基礎/Wayne R. Moore 原著;孫葆銓,孫樂南編譯。 3.禪門公案秘傳:隻手之聲/霍甫曼著;徐進夫譯。 4.天堂暗影/雷馬克(Erich M. Remarque)著;張時譯。 |
|||
版本項 Edition Description |
版次 |
依作品中所載版次敘述著錄。 |
||
版本 |
版本名稱如原刊本、補刊本、初刊本…等,均照原書所載著錄之。 |
|||
出版項 Publication |
出版地 Published Place |
作品之出版、經銷、印製、發行等之地名。 若作品載有二個以上之出版地,擇其排列最前者著錄之。 如無法推測,應以其國名、省名等著錄。著錄之國名、省名若有疑問,亦加問號於其後。若國名、省名亦無法查悉,則以「出版地不詳」著錄之。 例:1.〔臺北市〕。 2.〔浙江省〕。 3.〔出版地不詳〕。 未正式出版之作品,不必著錄其出版地;亦不得著錄為「出版地不詳」。 |
||
出版者 Publisher |
作品之出版、經銷、印製、發行等之名稱。 若作品載有二個以上之出版者,及經銷地、經銷者,擇其排列最前者著錄之。 出版者或經銷者名稱以最簡明字樣著錄之,但以不妨礙辨識為原則。 出版者或經銷者不詳,得以「出版者不詳」著錄之。 |
|||
出版年 Date |
作品之出版、經銷、印製、發行等之年代。 出版年之記載,以阿拉伯數字著錄之,例:1.1955;2.昭和27年。 作品含有數冊(捲、幅等)而其出版年不同時,須註明其最初及最後出版年。 |
|||
語文 Language |
日文舊籍書中之語文。 |
|||
稽核項 Physical Description |
頁數 Extent |
1.書中含較優紙張精印且未列入正文頁碼之圖版,記「圖版xx面(葉)於面(葉)數之後,隔以逗點。面(葉)數、冊數或其他單位均以阿拉伯數字著錄之。 例:我們正在寫歷史:方勵之自選集/方勵之著。32,366面,圖版8面。 2.依書中之次序(正文前、正文、正文後)著錄,隔以逗點。倘正文前後之面(葉)數不止一組,則各合計其面(葉)數,加方括弧。惟廣告等未涉及本文內容者不予計入。 例:刑事政策 /佐藤昌彥撰;李德義譯。[9],219,[40]面。 3.由某一書或多冊書中提出相連續之若干面(葉)單獨著錄者,應著錄其起訖面(葉)數。 |
||
插圖 Illustration |
1.插圖之種類須按下列順序詳記之:圖像、地圖、設計圖、圖表、影抄、譜系表、表格、樂譜等。 2.其他一般圖概以「圖」著錄。彩色插圖冠以「彩」或「彩色」等字樣著錄之,如「彩圖」或「彩色地圖」。若未全部著色,則另冠以「部份」於「彩」或「彩色」之前,如「部份彩圖」或「部份彩色地圖」。圖之大於書頁而摺疊於書中者,冠以「摺」字,如「摺圖」。 3.重要之插圖,可據圖上號數、目錄所標示或合計所得定其數量。例:3幅地圖。 |
|||
高廣尺寸 Dimension |
1.一書之高廣應以其封面之長寬為準,按公分量度而記載之,其零數作一公分計。高在前,廣次之,中間置「x」號,以阿拉伯數字表示。 2.合訂書籍記其裝訂後之高廣。 |
|||
裝訂形式 Binding |
書籍裝訂之方式,如精裝、平裝、重新裝訂。 |
|||
保存現狀 Conditions |
紀錄書籍中缺少的葉面及現況。 |
|||
收藏印記 Seal |
有收藏家之印記者,應擇要記載。記載之順序,應依印記之時代先後。 |
|||
集叢項 Series |
叢書名 Series Title |
叢書題名 |
||
集叢號 Volume Number |
依作品之編次著錄,力求簡明,不必要之文字得予省略,數碼以阿拉伯數字記之。 例:1.(生態研究.75年;第10號)。 2.(大眾心理學全集;12)。 3.(IBM PC小品;第17集)。 4.(國學基本叢書四百種;004-009冊)。 |
|||
附屬集叢 Name of Part |
1.附屬集叢,不論其名稱是否具有獨立性,均著錄於主要集叢之後,用圓點及空格相間。 例:1.(家庭圖書館. 營養與健康系列)。 2.(滄海叢刊. 社會)。 2.附屬集叢名若僅由編次組成,照錄之。若包括編次與編次名稱,則依次著錄,兩者以逗點(,)相隔。 例:1.搜神秘覽 三卷/(宋)章炳文撰(筆記小說大觀. 四十二編;第2冊)。 2.漢語詞法句法論集/湯廷池著(現代語言學論叢. 甲類;12)。 3.雲南邊境風物志/李霖燦著(國立北京大學中國民俗學叢書專號.2, 民族篇;第65-66輯)。 4.金石文字集拓/(清)莫繩孫編(石刻史料新編. 第三輯,一般類;第1冊)。 |
|||
附屬集叢號Number of Part |
依作品之編次著錄,力求簡明,不必要之文字得予省略,數碼以阿拉伯數字記之。 |
|||
附註項 Notes |
題名、著者、版本、出版、稽核、集叢各項未詳盡之處,得於附註項說明之。參考書目、索引、附錄之附註。 例:1.註云:參考書目:面98-100 2.註云:含參考書目。 3.註云:含參考書目及索引 4.註云:含索引。 5.註云:附錄:中西名詞對照表。 |
|||
內容分析 Content |
摘要及說明 Abstract |
由日文序言或描述摘要且翻譯成中文摘要或說明。 |
||
目次 table of contents |
照錄日文舊籍中之目次。 |
|||
權限範圍 Rights |
典藏單位國家 Owner Country |
著錄原件典藏單位國家之名稱,如:臺灣。 |
||
典藏單位 Owner |
著錄原件典藏單位或機構之名稱,如:國家電影資料館。 |
|||
使用限制 Restriction |
網際網路公開展示與檢索或非營利、教育及研究使用。 |
|||
表五、欄位元素與Dublin Core、MARC21、CMARC之比對
欄位名稱 |
Dublin Core |
MARC21 |
CMARC |
|
館藏類型 Collection Type |
Type |
655 INDEX TERM–GENRE/FORM $a Genre/form data or focus term |
||
題名 Title |
日文題名 Main Title |
Title |
245 TITLE STATEMENT $a Title |
200 題名及著者敘述項 $a 正題名 $p 卷數 |
並列題名 Varying form of title |
Title-Alternative |
246 VARYING FORM OF TITLE $a Title proper/short title |
||
副題名 Remainder of title |
Title-Alternative |
245 TITLE STATEMENT $b Remainder of title |
||
中文題名 Chinese of title |
Title-Alternative |
246 VARYING FORM OF TITLE $a Title proper/short title |
||
著者 Author |
作者 Writer |
Author |
100 MAIN ENTRY–PERSONAL NAME $a Personal name |
700 人名-主要著者 $a 標目主題(姓) $b 副標目(名) |
編譯者 Translator and Editor |
Author |
|||
版本項 Edition Description |
版次 |
Description |
250 EDITION STATEMENT |
780 輔助檢索項 $a 版本類型 |
版本 |
Description |
|||
出版項 Publication |
出版地 Published Place |
Publisher |
260 PUBLICATION, DISTRIBUTION, ETC.(IMPRINT) $a Place of publication, distribution, etc. |
210 出版項 $a 出版地,經銷地等 |
出版者 Publisher |
Publisher |
260 PUBLICATION, DISTRIBUTION, ETC.(IMPRINT) $b Name of publisher, distributor, etc |
210 出版項 $a 出版地,經銷地等 |
|
出版年 Date |
Date-Issued |
260 PUBLICATION, DISTRIBUTION, ETC.(IMPRINT) $c Date of publication, distribution, etc. |
210 出版項 $a 出版地,經銷地等 |
|
語文 Language |
Language |
546 LANGUAGE NOTE $a Language note |
101 作品語文 $a 正文語文 |
|
稽核項 Physical Description |
頁數 Extent |
Format-Extent |
300 PHYSICAL DESCRIPTION $a Extent |
215 稽核項 $a 數量(面數、冊數或其他) |
插圖 Illustration |
Description |
300 PHYSICAL DESCRIPTION $b Other physical details |
215 稽核項 $c 插圖及其他稽核細節 |
|
高廣尺寸 Dimension |
Format-Extent |
300 PHYSICAL DESCRIPTION $c Dimensions |
215 稽核項 $d 高廣、尺寸 |
|
裝訂形式 Binding |
Description |
563 BINDING INFORMATION $a Binding note |
||
保存現狀 Conditions |
Description |
583 ACTION NOTE $l Status |
||
收藏印記 Seal |
Description |
500 GENERAL NOTE $a General note |
300 一般註 $a 附註 |
|
集叢項 Series |
叢書名 Series Title |
Relation- Is Part Of |
440 SERIES STATEMENT/ADDED ENTRY—TITLE $a Title |
225 集叢項 $a 集叢名 |
集叢號 Volume Number |
Relation- Is Part Of |
440 SERIES STATEMENT/ADDED ENTRY—TITLE $v Volume number/sequential designation |
||
附屬集叢 Name of Part |
Relation- Is Part Of |
440 SERIES STATEMENT/ADDED ENTRY—TITLE $n Number of part/section of a work |
||
附屬集叢號 Number of Part |
Relation- Is Part Of |
440 SERIES STATEMENT/ADDED ENTRY—TITLE $n Number of part/section of a work |
||
附註項 Notes |
Description |
|||
內容分析 Content |
摘要及說明 Abstract |
Description |
520 SUMMARY, ETC. $a Summary, etc. note |
300 一般註 $a 附註 |
目次 table of contents |
Description |
|||
權限範圍 Rights |
典藏單位 Owner |
Right |
852 LOCATION $a Location |
|
典藏單位國家 Owner Country |
Right |
852 LOCATION $n Country code |
||
使用限制 Restriction |
Right |
540 TERMS GOVERNING USE AND REPRODUCTION NOTE $a Terms governing use and reproduction |
[12].沈漢聰等著(2006)。數位典藏技術彙編。臺北市:數位典藏國家型科技計畫。
一、架設系統平台及資料庫
計畫使用的系統硬體設備如有:(1)IBM eServer X3650 (2U / Intel Xeon Dual Core 2.0GHz / 1GB RAM / Gigabit LAN*2):(2)Compaq Evo W6000 (Desktop / Intel Xeon 2.4GHz / 512MB RAM)。資料庫與網站架設於Windows 2003 Server (IBM) / Windows XP (Compaq) 作業系統中,且採用Apache Web Server、My-SQL、PHP 4.0 Script架設資料庫。
二、設計檢索系統
日文舊籍的查詢檢索分為兩部份:(1)臺南大學圖書館自動化系統中目前已有5000多筆資料可供讀者線上檢索,但目前只有書名、作者、分類號可供查詢,如圖二十六,但此系統未提供電子全文及影像瀏覽之功能;(2) 架設網頁展示(如圖二十七)已完成數位化之電子全文及圖表影像,讀者可以在網頁上直接點選閱讀全文影像及其後設資料。
|
|
三、上傳資料
Apache Web Server平台架設完畢後,可利用FTP上傳圖檔資料(如圖二十八),而日文珍本及圖表相片之Metadata,由兼任助理逐筆輸入後設資料庫中,如圖二十九所示,然後由專任助理及計畫主持人核對是否有誤,確認無誤之資料即可於網路上公開,並於每季提供資料給數位典藏聯合目錄小組轉成XML,以匯入聯合目錄。
圖二十八、圖檔影像上傳。
圖二十九、Metadata輸入資料庫。
四、設計網頁介面
參照中央研究院臺灣史研究所日治時期臺灣研究古籍資料庫及國立台中圖書館日文舊籍資料庫,考量介面使用的方便性,且吸引讀者閱讀之興趣,網頁之架構層次,如圖三十所示,網頁以 1024×768 呈現,風格以人文為主,提供最新消息、計畫簡介、電子書資料庫、圖表相片資料庫、珍本導讀、影像精選、相關網站、工作人員等功能,供各界人士瀏覽。
圖三十、網頁架構圖。
※ 製作單位:數位典藏與數位學習國家型科技計畫
拓展臺灣數位典藏計畫 數位內容建置與整合子計畫
國立臺南大學數位學習科技學系 日治時代日文珍本數位典藏計畫
※ 文字撰寫:國立臺南大學數位學習科技學系
日治時代日文珍本數位典藏計畫 張鳳吟、辜雅婷
拓展臺灣數位典藏計畫 數位內容建置與整合子計畫
─ 文獻與檔案主題小組助理 陳美智
※ 圖片拍攝:國立臺南大學數位學習科技學系
日治時代日文珍本數位典藏計畫 張鳳吟、辜雅婷
拓展臺灣數位典藏計畫 數位內容建置與整合子計畫
─ 文獻與檔案主題小組助理 陳美智
※ 圖片提供:國立臺南大學數位學習科技學系
日治時代日文珍本數位典藏計畫 張鳳吟、辜雅婷
※ 圖文編輯:國立臺南大學數位學習科技學系
日治時代日文珍本數位典藏計畫 張鳳吟、辜雅婷
拓展臺灣數位典藏計畫 數位內容建置與整合子計畫
─ 文獻與檔案主題小組助理 陳美智
致謝:
感謝「日治時代日文珍本數位典藏計畫」計畫主持人林信志老師、張鳳吟小姐、辜雅婷小姐、及陳俊豪先生,撥冗指導及提供實地拍攝與簡介修訂。並感謝國立臺南大學數位學習科技學系其餘相關人員之協助。
數位典藏國家型科技計畫內容發展分項計畫數位典藏工作流程調查表
單位: 國立臺南大學數位學習科技學系
數位化物件名稱: 日治時代日文舊籍珍本
子計畫名稱: 臺南大學日治時代日文珍本數位典藏計畫
分項計畫名稱: 數位內容公開徵選計畫
主持人(E-mail、Tel):林信志 hclin@mail.nutn.edu.tw 06-2133111轉945
聯絡人(E-mail、Tel):張鳳吟 feng-ying@mail.nutn.edu.tw 06-2133111轉294
程序 |
工作內容 |
操作人員(數量、專業能力之要求) |
硬體(名稱、版本、價格) |
軟體(名稱、版本、價格等) |
依循標準(技術規範、成品規格、品質要求…等) |
耗時 |
總結(困難、缺失、特色…等) |
成本估算 |
備註 |
1 |
研擬書目欄位 |
1人/具圖書資訊學背景知識之能力 |
Microsoft Excel |
中國編目規則 中國機讀編目格式(CMARC) 機讀編目格式(MARC) |
2個星期 |
||||
2 |
建立書目清單 |
2人/具備基本日文能力 |
Microsoft Excel |
品質要求:符合欄位規範及格式 |
1000筆/月 |
||||
3 |
鑑定日文舊籍 |
2人/臺灣文史相關領域之專家學者 |
Microsoft Excel |
評估基準:獨特性、內容對於台灣史研究之貢獻、舊籍之書況 |
|||||
4 |
制訂數位化檔案格式 |
1人/具影像處理能力 |
Microsoft Word |
數位典藏各種檔案規格建議 |
1個星期 |
||||
5 |
制訂檔案命名原則 |
1人/熟悉書籍狀況 |
Microsoft Word |
「文建會國家文化資料庫」數位化檔案命名原則 |
1個星期 |
||||
6 |
掃描日文珍本 |
4人/具使用掃描器、及影像處理軟體之能力 |
Scan maker 6000掃描器(2,788元/台) |
ACDSee 5.0 Photoshop 7.0 |
檔案規格:600dpi TIF檔RGB 品質要求:影像端正無傾斜、清晰、無跳頁掃描、無不當裁切 |
100頁/日 |
|||
7 |
校對影像檔 |
1人/具使用影像處理軟體之能力、謹慎、仔細 |
ACDSee 5.0 Photoshop 7.0 Microsoft Excel |
校驗原則:影像是否有色偏、歪斜、黑邊、模糊、不當裁切、流水號跳號、與原書內容不相符之情況 |
|||||
8 |
儲存影像檔 |
1人/具使用儲存設備之能力 |
WD 320G 7200轉sataII 外接式硬碟(4,300元/台) |
檔案規格:600dpi TIF檔RGB |
每兩週進行備份 |
需容量更大及更穩定的儲存設備,以進行備份避免資料遺失 |
|||
9 |
擷取圖表相片 |
1人/具使用影像處理軟體之能力 |
Photoshop 7.0 |
檔案規格:600dpi TIF檔RGB |
40筆/週 |
||||
10 |
建立圖表相片之後設資料 |
1人/具備基本日文能力 |
Microsoft Excel |
欄位包含:出處、標題、圖片描述之說明 |
40筆/週 |
||||
11 |
翻譯書名、標題、描述及摘要 |
1人/具備日文能力及文史相關知識背景 |
Microsoft Excel |
品質要求:內容相符、用詞簡潔 |
40筆/週 |
||||
12 |
製作電子書 |
2人/具使用Adobe Acrobat及影像處理軟體之能力 |
Adobe Acrobat 7.0 Photoshop 7.0 |
品質要求:影像放大150%仍清晰 |
|||||
13 |
後製影像檔 |
2人/具使用影像處理軟體之能力 |
ACDSee 5.0 Photoshop 7.0 |
檔案規格: 網路預覽檔:72dpi JPEG檔 小圖瀏覽檔:100×100 pixels JPEG檔 |
|||||
14 |
建置後設資料資料庫 |
2人/具批次匯入、My-SQL及PHP語言操作能力 |
IBM eServer X3650 |
Apache Web Server、My-SQL、PHP 4.0 Script |
具管理者介面,可供編輯、修改之用 |
3個月 |
|||
15 |
勘誤後設資料及檢驗影像檔 |
2人/具文史相關背景 |
資料庫管理者介面 |
品質要求:無錯字、亂碼,內容正確,格式統一,圖檔可連結,影像清晰 |
50筆/週 |
缺乏台灣文史相關領域之專家協助檢驗內容之準確性 |
|||
16 |
架設及維護網站 |
1人/具網頁設計及PHP語言操作能力 |
IBM eServer X3650 |
Dreamweaver 8.0 PHP 4.0 Script Photoshop 7.0 |
成品要求:具人文風格、便於使用者操作與瀏覽 |
3個月 |
填表人:張鳳吟 調查地點:臺南大學數位學習科技學系 調查日期:2007年12月27日
全文下載 (2.4 MB, 2,222 hits)