中研院史語所傅斯年圖書館(初稿)
內容發展分項計畫/高芷彤
前言
目前指南是規劃由秀華與芷彤共同撰寫,在計劃管理(工作規劃)、後設資料與資校庫建置兩部份是採合寫,另外,擬章節分別撰寫則分別為:以物件區分,秀華負責印章而芷彤負責印記;以數位化方式區分,秀華負責攝影芷彤負責掃描部分;而設備與成本分析雖分別擬定,但最後以整體觀點呈現。其次,在委外製作,則視各機構單位的不同分別屬實報導,包含決策、如何規劃進行、以及撰寫規格書等。
欄位已9.0為主。
紀錄:
故宮印章的狀況:
鼎本身有文字,因此METADATA的建置釋放在同一性質的藏品中。可能在類別中在區分,但沒有看到代碼錶也無法了解該如何整合印章印記。
印記本身的疑問:
為何要抽出印記來做
在善本古籍中描述也可以啊,因為METADATA建置時,可避免重複的資訊,也就是說資料庫中包容萬象,但卻無法做深度描述,以東巴京為例,瞄文怡雯等不同語文,當需要做不同主題特殊需求時,想要針對不同對象時則較無法區分。
一、考証源流
因原始藏品,當此印記為真時,項元變在善本書與書畫有其印記,表示其書或書畫是向元變所收藏的,以及藏品價值在宋代就存在了,此為其印記的價值所在。並且在印記的數量中,也可以了解其書或化的流動狀態,是動態的資訊。另外,其加值作用,因為有篆刻,也有書法之美的意涵在裡面。
假使今天印記是假的,真偽該如何認定。
若向原辯原始印章是我所收藏,則我就可以知道此印記之真假。以傅圖為例,當初只以史料收藏為主,非博物館因此並沒有收藏印章,因此紀錄印記後,真偽委請學者專家鑑定,因此紀錄印記希望留下線索提供給學者專家去鑑定。
印記的層次較善本(例子目一二三等)分類來的簡單,因此METADATA的建置較善本早,當初與故宮合作也是有此考量大家可以減少重覆並且能相互比對使的資料庫更完善。
沒有引章印記的何來真偽,引章資料庫沒有建置,印記資料庫之建置有何意義。由於各館的考量不同,因此在館際合作上有其難處。以每計畫或單位較為具有特色的會先做,例如故宮會先執行器物,但並非印記資料庫建置沒有意義,而是平行分別建置,並無期偏重之問題。而站在傅圖的立場上,印記資料庫的建置是希望能輔助善本古籍考證。
在印章現藏(p5)的欄位中,未來建議可以網址連結到原印章典藏處,此是當初在建置metadata有考量到整合資料庫的欄位。
在史博館的metadata建置欄位可看出,是就現有典藏為考量,未來若有新增物件,那原始的資料庫勢必會有變動的成本增加。在傅圖的印記資料庫中,系統設計應以使用者使用為主,當從善本古籍進入查出,考看到印文,印記就可連到印記資料庫,人名就會連到人名權威檔中,因此任何角度皆可查到相同的資料(資料庫的緊密度/關係),但此印記、人名以及善本皆為儲存在不同的資料庫中。
系統重新修改的例子,若新計畫要做印記,但就目前史博館目前的印章metadata欄位尚看不出印記可連結處,因此需要新增欄位連到印記,且程式設計師修改則會改到系統結構,並新增連結,會增加成本。因此建議在metadata的建置時要有完好的規劃,例如五年計畫,91年開始就先構想五年的資料庫建置,有多少東西要做,不以單一藏品為考量,可避免系統一再的修改。以metadata到系統節到考論規格書、建置、轉檔花了三年的時間,雖耗時久,但建置到目前為止,此資料庫仍能維持在91年的模組,而不需要在每一年因新計畫而將資料庫有所更動。
陳鴻森主任站在研究者立場而言,覺得用印記資料庫以及人名權威檔建置,由於有版本真偽的冒險性,但在館員立場,是希望能建置後提供線索給學者。例如前印處是讓使用者了解其印記典藏處,且能避免重複性,例如所裡的章接會出現在所收近來的書中,因此重複出現機率高,以拓片在執行數位化時就有此問題,出現許多相同重複的圖檔在資料庫中,相同印章所蓋出來的印記未何要儲存如此多的印記,目的是要知道此時本書所蓋的章是同一個,因此建議可取較為好的印記來作為代表,並未留下考證資料,留下可連結到十本書所鈐印處,資料庫除建累積,其資料的可信度也逐漸上升,書籍或印記的考證脈絡也因累積資料而清晰。(提供研究基礎,不一定完全正確但有經過比對的資料線索-蛛絲馬跡)
以傅圖陳主任出國前,為搜尋資料才能找到所要找的資料,為何不使用電腦,由於資料庫尚未建置完全。以研究人員為利,提供給使用者資料庫的特色:系統好查好用-要有單一入口(依屬性需求不同有不同的入口頁面)-資料庫分別儲存但metadata可相互連結。
一、 物件選擇
問:當初以印記為數位化物件的考量因素為何?有沒有特殊考量或注意事項?
答:因為可以考証源流,篆刻之美
二、 計畫管理
問:印記數位化判別工作是如何進行?如何挑選數位化物件?是否有遇到困難?
答:因為要把每頁影像看過才知道有沒有印記,例如傅圖的做法則是將先前91年產出影像在excel中記錄下來,因此過程是相當的繁瑣。並且印記的作法是先將書籍掃描完成後,提取印記在來做資料庫的建置。就學者而言,書籍應是所典藏的重點,印記是其書籍的加分作用,因此並不可能先做印記,且判讀也是一個問題(篆刻家年歷、印記是否相同、尺寸),因此事先作藏品完後再去看哪處有印記,因需要地毯式搜索。但畫則較書容易,因書籍不能夠準確猜測印記在哪一頁出現。但仍有例外,例如有些學者有些癖好會在某特定頁數蓋上印記,例如每午頁蓋印記,因此在資料庫建置時,會要求把頁數一同建置處,這個線索是很特殊的,建議未來要做數位化的機構可以注意。
問:印記數位化之主要流程為何?
答:如上
問:貴館在執行印記數位化過程中是否有委外製作的部份?
答:沒有,因為沒有效率。沒有好壞分別純粹是能不能判別。
有委外開發取圖系統,目的是節省取圖的時間。之前有做過實驗,將三個出處取出較為好的印記,但若此三個印記接蓋在字上或者是只找到一個印記,那光修圖並補上朱宏,一天下來只能完成一至兩個印記,若依天八百玩,一刻印記則為四百玩。因此能否批次節省時間,才委外請廠商言發此系統。
系統可節省取圖時間,但仍需要人工加上朱紅,但至省能提升一半的效能。
系統是「印記取圖模組」
並沒有花太多成本,算是一個類似於影像處理系統
且向小畫家一般,可攀別此印記原先的朱紅顏色,因此還可看出有些印記的朱紅色分布是不平均的,因此此系統會建議使用哪一種朱紅色來補足此印記。
問:印記的的影像解析度及色彩模式與書籍數位化要求有不同嗎?
答:一個相同印記蓋在拓片以及書籍上,取圖的解析度就會不同。因拓片過大,因此印記就顯的很小,取印記的解析度就不同,若想要在資料庫中放大查看,則會解析度會放大模糊。
在數位化時需要看元藏品的尺寸,因此在拓片中有插入印記另拍的流程。因拓片過大但希望輸出是相同尺寸,且有接圖問題。當初就資料庫能查看作為考量,較大的藏品流程為:先拍1:1尺吋供網站上瀏覽、拍重複的供往後可接圖使用、單拍印記。若在此之前以往上未遵循此流程則將拿回重新拍攝。
問:印記在數位化時,有些單位使用拍攝,而傅圖使用的是掃描,請問在設備選擇的決策因素為何?
答:印記取用哪種數位化方式則就現有典藏品數位化而有區別。旦印章就只能使用拍攝而無法使用掃描。書畫可只掃一小塊,但建議依循主流成的不同而插入「印記另拍」需求。
三、 數位化流程
問: 在掃描印記的同時,遇到尺寸不一的印記是如何進行數位化?
答:是人工裁大小嗎?此系統可點在對角線即可取此印記,可自動取圖並且能解須此朱紅,後再去背。
問:印記在校驗時,有針對哪些部分,例如摺痕、汙漬等項目?
答:有一加工過的代表性影像。但仍會呈現原鈐印處的可供考證的原印記。
問:是否可簡述一方印記從實體到虛擬的流程,包含路徑、人力、設備?
答:如上。
四、 後設資料建置
問:在後設資料規劃與資料庫建置時,由於印記與善本、書畫、器物、金石拓片主題相關,當初在擬定欄位時,有何考量?
答:鈐印處,大家鈐同一個印記只需在鈐印處注入即可避免重複建置的問題(可避免重複、可相互連結、著入)。當初在建置此資料庫就區別印章與印記是不同的資料庫,因此是相輔相成並無誰主誰副的關係存在。例如族譜,有脈絡但個體仍有其存在性的必要,其印記的存在是對於此藏品的加分作用。
問:對於整合印記相關主題,並建置整合性資料庫之構想有何建議?
答:如上
問:目前印記資料庫是與資訊所一同開發,可否針對一旦委外停辦、資訊人員撤離,資訊系統將很難善後議題,分享您的經驗與建議?
答:這與系統規劃的好壞有關,例如生產線的建置,其重點在後續的加值才會改變,否則只有開發成本。除非有新需求產生則會有需要到原系統開發人員,否則不會更動元系統。
系統務必要備分,因此目前印記資料庫沒有太大的問題。
但若系統都是委外,將擔心廠商是否會倒,因此數典系統都是委外請數典系統開發,其有責任且若資訊所不維護,計中不維護那勢必傅圖需有人可以承接。
公開徵選委外請廠商該如何善後?
因此當初財會建議需要建置優良廠商名冊。例如掃校系統建置後,台史所等單位皆有購買,其可以省重覆開發的成本,且與廠商在商談價格時也較容易。另外若站在廠商的立場,當有十個機構均有負維護的費用,廠商會惡性倒閉的可能性較低。因此良性的互動是很重要的。例如當初未何要等資訊所開發依年至兩年的時間,而非委外請廠商能快速的開發。廠商會一不同單位而有不同價格導致多數成本的重覆浪費,當此系統有其效益可共享的價值時,也是當初委請資訊中心開發的原因。當初委外掃校系統時三個月就要完成,由於很急且資訊中心也無法在短暫的時間完成,因此才考慮委外。委外建議要有評選機制,避免典藏品二次傷害,建議可在合約擬定時納入:收到問題要多久回覆、回覆時要怎樣、處理時要如何、如果沒有達到約定要有哪些罰則,當然這些都與要花多少委外成本有關。建議每一個機構單位都要有資訊人員,避免維護人員還在維護的同時,計畫已經結束或人員已經離職的問題。因此常態性機構較少此類問題產生。例如某一位法施的紀念館要建置資料庫,當初是為了要宣揚法師的理念,會有許多加值品例如光碟網頁等,其目的在弘法,因此當目的不同時,系統的需求以及數位化的需求也相對不同,網站的建置較為簡單。當初藏品數量固定,其也無需建立系統,若只有五百件藏品,也建議可委外執行。在數位化中要強調共通性時,數位化的流程可制定,但仍需要考慮其藏品的數量以及計畫本身的規劃來擬定期該館的數位化流程。以國家檔案局而言,國家檔案法制定後,由於檔案包含許多典藏品,早期基層人員認定檔案就是公文時,公文要變為檔案時並非全數移轉,需要判別其價值性,例如中秋節請所有公務人員不苦收受廠商賄賂,每一人都有,此藏品有其收藏價值嗎?就算公文本身會是史料,建議是原發文單位做典藏,而發文單位只需要作一次典藏,而非每一收文單位重複典藏。
在執行典藏時,需要有文件鑑定,尤其是人事資料有其永久保存的價值,因此在典藏之前需要有判別工作,鑑定其價值性。又或是例如戶籍資料之公文搬遷、小孩子出生資料珍貴性在哪?之其在38年以前,其價值性可代表人口移動,永和地區是往何處搬移,遷徙活動呼之欲出,因此派別工作委請專家有其必要性。
鑑定原則:
一、 完整性
戶籍資料是戶政單位的命脈,其是完整的。
二、 時間性
是在哪個時間點的戶籍資料,此就為判別的重要依據。
可就最完整的先數位化,或最早期的數位化。但建議當要讓廠商測試或自己剛開始執行數位化時,建議先就目前較為近期公文來測試與實驗,之後才開始執行較有歷史價值的典藏品來做。
典藏品毀損是不可逆的,是並非金錢能衡量的。
五、 設備與成本
問:印記數位化與善本古籍數位化在設備上有何不同?
答:依循主流成來變動
六、 委外製作
問:請廠商協助開發影像裁切系統「印記取圖模組」時,是如何撰寫規格書?有哪些是需要特別注意?
答:當初沒有撰寫規格書,小畫家等影像系統。
此系統是委請掃校系統的同一個廠商開發,有其信心。建議委外廠商可考量:
一、 在評選時設計概念與其貴館的吻合度
二、 以往成品是否有技術門檻
三、 是否便於商談價格
四、 互動良好的廠商
問:決定此部分委外的因素為何?
答:同上
七、 內容保護
問:關於印記的內容保護方面,目前有進行哪些機制?
答:較於開放,目前只有圖檔沒有開放。只有權限控管,而沒有作浮水印的建置。權限是由該不同管所管制,因此當你有印記資料庫的權限,不太表你有人名權威檔的權限。
當初沒有考慮浮水印是因為主要想要呈現好的印記。
目前只要浮水印是可視的,分為破壞性與可逆的。破壞性即使消除浮水印,則此印記或圖檔將無價值存在。旦目前技術尚無法遏制偷圖的技術。
目前以敦煌文獻資料庫中,當初由於要讓國外學者能在資料庫中查詢,因此應變方式為置入「透明的浮水印」而非現成的浮水印機制,且至於正中央,是破壞性的但卻又不傷害此圖檔。但目前只限於書籍圖檔,書畫由於圖檔過大仍需要在測試。傅圖善本除書影外,都有加透明浮水印。
另外若書況不佳,但批次下來透明浮水印是一致的,因此有時書況不佳時浮水印需要更透明避免破壞到原圖像。建議在批次加浮水印前要先評估此套書的書況後,才加浮水印。
八、 其他
問:印記數位化工作有哪些待挑戰的議題?
答:專家學者的考證,技術性的都可以克服,但仍需要有專業的人員加入來判讀真偽。
問:對於未來其他單位欲進行印記數位化工作,有何建言?
答:計畫在進行數位化時,要考量本身藏品的數量以及價值,例如紙張式的印記在每本都可見,必要性需要在可量。當初建置印記是想要輔助善本考證版本,提供動態性的脈絡可供鑑定。建議全面性評估其典藏品有加分、有價值、有效益、目的及數量後,在進行數位化工作。
若故宮典藏印章對於傅圖的印記資料庫是否有幫助,由於故宮典藏室供中藏品,傅圖則是私家典藏,若是當初供中有搜羅民間藏品,如次資料庫的串聯有其價值性。