女性書寫之典藏與再現-布朗大學的「女性作家計畫(Women Writers Project)」
文/謝筱琳
計畫名稱:The Brown University Women Writers Project
計畫(網站)網址:http://www.wwp.brown.edu/
計畫(網站)主持人/單位:Julia Flanders/Center for Digital Scholarship, Brown University Library
一、總論
(一)計畫緣起及歷史回顧
布朗大學的「女性作家計畫(Women Writers Project,簡稱WWP)」成立於1988年,宗旨是將西元1526年至1850年間出版的女性書寫文本,揀其稀有和難以獲取者,全文轉錄謄打,進行數位化的保存與應用。該計畫所收納的文本類型與主題廣泛,使得早期女性書寫文化能夠受到重視,成為教學上和研究上不可多得的資料來源。
女性作家計畫的發展契機,是根基於1980年代末期的兩項學術需求與發展:一是對於早期現代女性作家書寫的重視,亟欲將這些書寫找回,以還原其文化上的重要性;另一是新發展的電子文獻編碼技術,可以改善文獻的可親近性(accessibility),並且長久保存全文資料。作為一種能夠將難以獲取的文獻資料變得廣泛使用的方法,「電子檔案」因承諾將克服女性書寫長久以來無法見世的困難:難以獲取和稀有性,而成為實體檔案的理想後繼者。於是,檔案學和電腦技術蔚為世界文獻編碼的最佳執行綱要,也成為該計畫的施行宗旨與準則,進而發展了「女性作家在線(Women Writers Online,簡稱WWO)」的全文資料庫。
在計畫開始的前五年內,他們將200件文獻轉錄成電子文本,並開始製作適於教學與研究的可印刷草稿。在與牛津大學出版社(Oxford University Press)合作之下,也嘗試以傳統印刷形式出版選文,像是《Women Writers in English, 1350–1850》這套叢書,仍然再版中。
1993年,隨著文獻編碼計畫(Text Encoding Initiatives,簡稱TEI)出版了擴充版指南,女性作家也計畫開始了三年一期的研究計畫,研究重點在於如何將新的指南用於呈現早期女性文獻、如何將舊有的文獻編碼轉換成新的系統。這個階段,他們並沒有完成非常多的編碼,反而是建立了一套新的編碼方法、改良版了計畫的系統操作說明(documentation)和人員訓練方式,並且開始了漫長的資料轉換過程。
有了新的編碼系統,女性作家計畫持續將文獻編碼直到1996年。1997年到2000年間,由於The Andrew W. Mellon Foundation的獎助,他們得以從漫長的文藝復興時期挑選了100件介紹性的材料,外包製作,在女性作家在線(WWO)的框架之下製成了副作品集──文藝復興女性(Renaissance Women Online),研究電子文本對於教學與研究的影響。另外,在羅德島人文委員會(Rhode Island Committee for the Humanities)的資助下,他們也贊助了以英國女皇伊麗莎白一世的一生與寫作做為獨角戲的數位典藏計畫──「女王說(In Her Own Words)」。1999年,國家人文基金會(National Endowment for the Humanities)掖注更多資金於製作其他的新文本,例如與諷刺、性別政治、以及英國十八世紀時期的文化與環境相關之文獻。
1999年也同時是女性作家在線的一個重要的分水嶺,因為它終於得以上線,讓過去十年所製作的電子文本都能透過電子化取得。從此開始,女性作家在線提供「線上訂閱」給各大專院校、圖書館、以及一般讀者,為數共超過220個不同的機構與單位。訂閱費用仍舊是女性作家在線的主要收入來源,不過,必要時,他們也提供優惠和免費的訂閱專案,以擴展資料庫的使用性。
隨著女性作家計畫的上線,其他新的契機也跟著出現。他們出版了計畫的《系統操作說明》和《學術文本編碼指南》。同時,他們也開始提供編碼相關的工作坊與研討會,並召開一年一度的學術研討會:檔案中的女性(Women in the Archives)。
(二)計畫未來展望
女性作家計畫持續擴增女性作家在線資料庫的廣度與深度。近年來,他們每年新增15件文本,並且計以此出版速度持之以恆地朝未來前進。為了方便讀者隨時檢視是否有最新資料上線,他們也在計畫網站上張貼各種書名資訊,像是已數位化書目、新增書目,以及「即將數位化書目(狀態為轉錄、編碼以及預備出版中)」。
此外,他們也一直改善女性作家在線的資料庫介面,除了將舊式的編碼都轉換成現行的XML標記語言,也加入全文搜尋、書目資料搜尋,以及完成一個比較簡潔的閱讀介面。
根據計畫網站介紹,新的介面只是另一個新的開始,他們預計增加一系列特色藏品,像是可以免費取得的(與資料庫文獻研究相關的)研究論文、現代的評論和讀者反應。屆時,讀者對於閱讀材料的掌控將更周全,其他圖像化的資訊如地圖和其他視覺化資料也將加入讀者探索中。
(三)計畫組織及參與機構
女性作家計畫最初成立於布朗大學英語系,一段時間後,被納入另一個系所組織──電腦與資訊服務(Computing and Information Services),作為由Allen Renear新成立的學術科技群組(Scholarly Technology Group,簡稱STG)的一部份。在2009年,他們和電腦科技群組(STG)又再次被遷移到圖書館,加入新成立的數位學術中心(Center for Digital Scholarship)。
(四)計畫經費及其來源
計畫經費的來源很廣。最重要的來源是女性作家在線的授權(訂閱)費用,此收入可供女性作家計畫持續維護網站並擴充藏品,但無法完全負擔所有運作的支出,所以他們同時也申請許多獎助金,並且透過幫其他計畫舉辦研討會與提供諮詢服務等,增加收入。
二、數位典藏計畫經營措施
(一)策略及規範之制訂
文獻編碼是女性作家計畫的基礎,然而在他們的創始初期(1980年末期),通行的標準通用標示語言(Standard Generalized Markup Language)僅在軍事與國防工業上廣泛使用,適用於學術文本的標記語言不是尚未出現、就是還在草創時期,所以女性作家計畫花了很多時間與精力在文獻學的研究與技術研發上。
他們最先採用的編碼方式為Waterloo Script,不過很快就轉換成新崛起的TEI指引(先是P1版,然後P2)。早期將「原始文獻(primary source)」編碼的方式,是將實體文件上所有的外觀資訊極盡所能的記錄下來,例如字體、空行、縮行、字體、和連字符等等;然而在「縮微膠片」和「複印件」上,這個方法卻不適用。當《TEI指引》修正版於1993年釋出,編碼方式不再強調原始文獻上的外觀細節,而是重視文本的結構與內容,女性作家計畫又花很了長一段時間研究如何修改他們的編碼。在這段自學的階段,文獻資料庫基本上是處於凍結的,除非已經發展出一個令人滿意的新系統,他們不會貿然將舊有資料轉換為不熟悉的新方法。
當新的系統變得可行,他們又繼續將新的文獻編碼,同時也將早期的編碼轉換到新的系統。從那時起,他們持續在編碼上做一些小變動以適用於他們對於早期文本的認識。2002年,他們又將資料轉換到P4版本,也就是XML版本的《TEI指引》(在此之前,TEI都是建構在SGML上)。2010年初期,再次轉換XML到P5,也就是《TEI指引》的最新版本。
(二)計畫管理與人力資源之運用和培訓
女性作家計畫的主要管理員為計畫主持人Julia Flanders、資深程式設計和分析師Syd Bauman,還有文獻庫編輯與計畫管理人John Melson。
他們的文本編碼工作是由大學部與研究生學生所組成,而工作機會都是公布在布朗大學的人才招募網站上。學生負責的工作包括轉錄(謄打)、編碼、修訂文本、以及標示與協助解決新的編碼問題。從1988年計畫開始起,女性作家計畫已經雇用約200名學生,他們多數為布朗大學的學生,少部分為其他機構的短期訪客。
此外,他們也有來自各大學(布朗大學、渥大華大學、賓州大學、亞伯他大學、新漢普夏大學、伊立諾大學等)的9位執行委員,和7位研究委員、2位計畫顧問(一為圖書館員,另一為書誌學者)。
(三)資訊設施及技術開發
有關資訊設備方面,計畫網站並未多做著墨,所以無從得知;然而在技術開發上女性作家計畫從創始開始,就一直從事編碼技術的開發、應用、與分享,這些技術演變在前文都已介紹,這裡就不再贅述。
三、數位藏品
(一)藏品之種類、媒材、數量
女性作家在線的藏品包括320多餘件1526年到1850間以英文寫作的女性書寫文本(有政治的、哲學的、科學的),和宗教資料、詩詞、戲劇、小說,以及大量挑戰傳統文本類別的多元文本。該計畫希望能夠收藏所有1850年前後的英文女性印刷文本,也希望能納入同時期的女性手稿文本;然而,礙於時間與經費的限制,他們決定優先處理目前已經絕版的、或者最受研究學者需要且符合目前編碼需求的文本。他們有一個文本取得委員會(Text Acquisition Committee),能根據目前學界最感興趣的時期、文類、議題,將最符合學術社群興趣的文本給予最高的優先處理權。
除了由女性撰寫的英文文本外,女性作家計畫的文獻庫也收錄由男性合著的文本、作者存疑但可能為女性的文本、由女性翻譯成英文的文本(原始作者可能是男性,這些作品通常沒有較高的優先性)、由女性以其他語言書寫但經過男性翻譯成英文的文本(同樣的,這個優先權較低)、歷史判決或其他直接或間接記錄女性文字的事件、由女性口述而作家聽寫的敘事(即便聽寫似乎不是逐字紀錄)、由女性匿名書寫但以女性讀物作為流通的文本(無論作者是否真為女性,這種文本也有較低的優先權)。
這些選擇的背後動機,是為了能夠建構一個完整的書寫文化。聽寫敘事可以將文盲的女性納入(像是奴隸敘事),避免因為「作者身份」的嚴格限制而將其排除在外,同樣的,女性在歷史紀錄上的文字(像是女巫審判)也可以將難以獲得的女性論述再現,而翻譯文本在英國女性書寫的文化上佔有一個重要的地位。
(二)藏品數位化機制及標準
簡單來說,他們將文本完整編碼,而非節錄,且轉錄(謄打)工作包含正文的前、後頁(如扉頁、序言、目錄、附件、索引等)。計畫的轉錄編碼標準為XML,且遵循TEI編碼的特殊和擴充規格,以符合他們現有的文集和研究。
他們針對每一份文本產生一個仿真的轉錄本,保存其原有的拼法、排字印刷上的錯誤、斷行、連字、以及其他細節。他們同時也記錄排字印刷的正確內容、罕見縮寫的全稱、以及老式排版印刷的慣用字,例如以「i」代表「j」,以「u」 代表「v」。這些選擇提供了再現時的彈性:利用一個適當的套用樣式(style sheet),可以選擇是否以原始斷行、排版等呈現。
另外,每個文件都被視為一個流通的文化藝術品,為此,他們不修訂文本、不評論或綜合不同版本。每個編碼的文本都是一個實體物件的轉錄謄打。
四、數位資料保護
有關「數位資料的儲存、備份及管理」或者「數位資料的移轉機制」,或許是因為計畫藏品尚只有三百多件,且多為XML標記文本,在儲存和轉移上,較其他藏品數量龐大且媒材形式多元的計畫為簡單,故網站沒有任何說明。至於「數位資料之智財權保護措施」方面,所有女性作家在線的文獻資料(原始文獻的收藏),是女性作家計畫裡唯一僅限訂閱者付費使用;其他材料,例如數位化相關論文、應用網站資源的課程大綱、教材,和網站作業系統說明等,都是免費提供大眾閱讀使用。
五、網站系統建置
(一)網站內容架構
(二)檢索技術及介面設計
最新的女性作家在線資料庫介面是在2012年3月啟用,拋棄過去的線性搜尋模式,新的搜尋介面利用「非同步」的過濾器和「可增加或刪除」的搜尋結果變相,使用者可以輕鬆依照需求與喜好,以動態、互動的方式搜尋藏品。使用介面將畫面切割成三個欄位:
* 最左邊的是搜尋面板(如下圖2黃色1處),使用者可以自訂搜尋或者限制搜尋結果,以選取目標藏品。
* 中間欄為搜尋結果面板(如下圖2黃色2處),搜尋結果會依照時間順序一一排列。
* 最右欄為全文閱讀面板(如下圖2黃色3處),使用者可以閱覽單獨文本的全文內容。
未來,計畫還將針對此介面進行擴充,例如在搜尋結果面板裡,除了將文本以時間順序方式呈現外,也將提供以地圖(根據文本的出版地)或者文類群組方式呈現。同樣的,目前的全文閱讀面板僅提供一種瀏覽方式,未來,使用者將有多重選擇(包括顯示原始或常用拼字、顯示或隱藏分頁資訊等),來顯示全文。
(一)後設資料之建置
因為使用TEI文獻編碼模組,女性作家計畫有關轉錄和文件本身的後設資料已全部記錄在TEI的標頭資訊內,有關TEI標頭資訊,詳見《 TEI指引》。
六、結語
布朗大學的女性作家計畫算是文獻編碼的先驅,也是最勤奮的研究者和培訓者。他們從1980年代末起,在數位典藏環境還在萌芽、大多數位科技尚未出現的年代,即投身實驗、製作電子文獻資料庫,並且樂於將他們所研究出來的結果(像是整個網站的系統操作說明、學術文獻編碼指南、以及其他在數位化過程裡激盪出來的論文資料等)分享給其他相似的計畫做為參考。當然,為了推廣資料庫的使用與實用性,該計畫也推出一系列工作坊、研討會和年會,供學者、教師、學生等更加瞭解他們所使用的資料。再者,在TEI成為學術文獻編碼的主要標記語言後,女性作家計畫從頭到尾的參與、實驗與協助修正,更加顯示其領先群雄的前瞻性和持續不懈的向上精神,值得繼續關注其成長。