國立臺灣師範大學臺灣文化及語言文學研究所 台灣教會公報白話字文獻數位典藏計畫, 1885~1969 數位化工作流程
Tags: 徵稿, 數位典藏, 數位學習, 會議 發表: 2009-12-18, 點閱: 3,993 , 加入收藏櫃 , 列印 , 轉寄
計畫單位:國立臺灣師範大學臺灣文化及語言文學研究所
計畫主持人:李勤岸 臺灣文化及語言文學研究所 副教授兼所長
計畫名稱:台灣教會公報白話字文獻數位典藏計畫,1885~1969
Digital Archives Program for Taiwanese Romanized Writings in Taiwan Church Press, 1885~1969
《台灣教會公報》自其前身《台南府城教會報》於1885年創刊以後,至1969年改為華文出刊為止,84年間所累積的以台語白話字所書寫之史料著實相當豐富。然而這批豐富而珍貴的史料目前並未被學界所充份運用,關鍵就在於資料取得不易。雖教會公報社已出版有70 冊之《台灣教會公報全覽》,然而未經分類整理,且未加以數位化,以致資料龐雜,檢閱不易。台灣教會公報白話字文獻數位典藏計畫即是要在前人研究之基礎上,將其中之文學作品,包含議論文與報導文學揀選出來,將之掃描及數位化典藏並出版各文類作品之精選集,以供給台灣文學研究者充足之白話字文學相關資料,補足台灣文學之歷史資量,以利於台灣本土相關研究之發展。
|
一、掃瞄《台灣教會公報》內之所有白話字文學作品,建立圖片檔。並予以全文鍵入建立電子檔案,同時翻寫成漢 羅合用之文體。預計將有600~800筆圖片檔及電子檔案之成果展現。
二、建置白話字文學資料網站,除本計畫建立之檔案外,也將合併呂興昌與楊允言之計畫目前已完成並上線的檔案,成為白話字文學相關資料之最大網站。
三、精選《台灣教會公報》中之文學作品,預計編成下列12 冊,每冊均附一篇導論及MP3有聲檔案:
(一)白話字論述kap教材(蔣為文)
(二)翻譯kap改寫文學
(三)詩(何信翰)
(四)小說kap戲劇(李勤岸)
(五)散文
台灣教會公報白話字文獻數位典藏計畫之重要性,在於將白話字文學作品加以數位典藏,能夠吸引研究者之注目,提供研究者充份之資訊,推動相關研究之發展,進而發揮學術研究之最大功能。特別是《台灣教會公報》中為數頗巨之議論文,不僅在基督教義、傳教事工上有諸多的討論,更有政治、歷史、宗教信仰、慣習…等主題的探討。由此可見,在《台灣教會公報》於1969年被迫以華語發刊之前,長達80年的台語白話字時期,所顯現出的台灣歷時性思想變遷之痕跡,足可提供相關領域研究者新的資料與新的研究視角,也能提供語言學研究上豐富的語料,由此衍生出的台灣研究效益不可謂不豐。本計劃在執行過程初期,於收集相關史料、請求相關單位授權時,在淡江中學校史館找到《KOÀ-CHHÀI-CHÍ》(芥菜子)月報之創刊號至第22期合訂本,《芥菜子》於第23期後,併入《台灣教會公報》合印刊行;前22期的完整資料即收藏於淡江中學校史館之陳清忠先生遺物櫃,推測應由陳清忠牧師本人手工製成的合訂本。《芥菜子》之外,淡江中學校史館還收藏本戰前白話字文獻,這些史料的出土出土,不僅增加白話字出版品的歷史文獻意義,由於台灣基督長老教會早期在南北教會尚未完全合作的狀況下,《芥菜子》的發行呈現北部教會拓展情況,刊物內容有助於吾人更了解北部教會的更迭、傳道者們的思考,以及北台灣接受西方文明教育的另一條線索。特別是《芥菜子》發行人為被譽作台灣「橄欖球之父」、「合唱團之父」的陳清忠先生(曾任淡江中學校長),不僅在刊物中是重要主筆,其許多文學創作(包括小說、論述、翻譯,甚至是音樂創作等等)皆刊載於《芥菜子》,這些作品發表於1926-1927年間,其時代意義則更加深遠,可期未來在台灣文學史上有突破性的觀點論述。
除此之外,藉由作品精選集之出版,不但能提供目前推動中之九年一貫鄉土語言教育相關的教材,同時也能增加台語文學與大眾認識之機會,使大眾認識台語文學之美、台灣思想之豐,以及台灣文化之多元。
計畫網站: http://140.122.80.250/pojbh/script/index.php
藏品來源主要為《台灣教會公報》白話字文獻、北部台灣教會公報《芥菜子》白話字文獻二種刊物,依照詩、散文、小說、戲劇、翻譯…等類別,並依年代、作者、篇名、文類的項目進行分類與登錄作業,作業規範如下:
1.檔名:檔名除篇名之外,請在前面再加上刊出日期及文類(散文為「sb」;小說「ss」;詩「si」);例如原本的散文檔名為「Koan-he7 hun-in bian7 tam5 e5 sit8-che3 bun7-te5」,未來請改為「196104sb-Koan-he hun-in bian tam e sit-che bun-te」,以便日後歸檔。
2.標題:如有漢字專欄名稱也請一併輸入;羅馬字大小寫皆請照原始資料輸入。
3.行距:單行間距,並請設定段落之前後段距離為「0.5列」。
(全文請編為「左右對齊」)
4.前文、後文:許多篇章皆有「話頭」,或文後有附「作者資料」等,這些字都比較小,但皆請勿漏掉。
5.經文:行文中時有括號註明聖經經文的章節數目,也請別漏掉。
6.校對:每篇文章打完之後,都請至少做初步校對。(因時有部分的段落遺漏。)
檔案主要歸為兩種類別, 文字件名制定規則:檔名先標刊日期(年代及月份),次文類(例如散文為「sb」;小說「ss」;詩「si」);最後為文章篇名:(例:Koan-hē hun-in biān tâm ê si̍t-chè būn-tê,僅以「Koan-he hun-in bian-tam e sit-che bun-te」標出。故,完整檔名將為「196104sb-Koan-he hun-in bian tam e sit-che bun-te」。日後歸檔及查詢則具有規則性。 圖像件名制定規則:目前以新出土史料典藏為主要考量。如《芥菜子》系列檔名則首先標為「KCC」,再標明冊數(如02)、發行之年月日(如19251001)及篇序(如08),最後為篇名;中間以「-」連結;故完整檔名為「KCC02-19251001-08-tong-sat-ni-iok」。
圖一、經標示的白話字文獻史料1 |
|
圖二、 經標示的白話字文獻史料2 |
包含翻拍、掃瞄、授權、轉檔等相關作業,部份圖像則直接由持有物件的單位授權檔案格式使用,後製的部份主要為剪裁檔案及修改大小;上稿過程則由程式轉換為適合網頁呈現的各式規格。
由專任及兼任助理(具快讀白話字文獻能力)先判定逐篇文獻的文類,經標記後交由工讀人員打字數位化。
圖九、工作人員進行文字輸入 |
|
圖十、將經過標示的白話字文獻數位化 |
1. 打字
一篇以一個word為一單位,以資料夾分類年代。翻譯對照皆置於白話字之下。
2.翻譯
參考教育部頒定之漢字用字,僅可能譯為漢字,少部份則保留羅馬字。需注意的是許多文獻皆與聖經教義相關,故有許多專有名詞有其固定漢字用字,需考查相關文獻來比對,其注意事項如下:
(1)漢字標準:以教育部公告常用字為準。
(2)專有名詞:人名、地名等用字,皆按基督教相關文獻原始用字為準。
(3)翻譯、校對:白話字建檔已做初步校對,而翻譯時,應再以原件對照,做二校工作。
3. 校對
在初步打字時即有工讀生進行逐篇打完的首次校對。漢羅翻譯過程中亦對照原稿校對一次,整個譯完再校對一次用字及白話字符號的精確度。資料有長有短,有時差異極大。平均來講,一篇打完需要二小時,翻譯二小時,校對一小時,故一篇平均需要五小時。
圖十一、輸入之後的文獻需再次進行校對 |
史料分析相當於史料研究,意即搜尋相關史料文獻參酌,再重新撰寫網站所需之文字說明。目前僅針對背景說明進行史料分析,並有漢文、英文版。為使大眾更了解白話字相關時代背景,先以漢文撰寫各個詞條,再逐一簡化英譯。
網站採委外方式進行建置,先與設計師討論概念,工程師寫完程式後再多與討論頁面呈現的修改,包括各層頁面版面、搜尋格式、圖文比例與後台上稿格式…等。
後台部份,亦有直接對照的平台,上稿後即可直接比對資料如符調的呈現與用字精確度。網站建置時程約三個月,但不含後續細部修改。刊名、卷期、年代、作者、篇名均為重要搜尋關鍵,打字數位化時,即已將這些關鍵列於各檔案的開頭,便於分類。網站分層及檢索分類:
1. 首頁選項:包括,最新消息、計劃內容、關於「白話字」、白話字文獻典藏、資料庫檢索、網站地圖、白話字史料影像、討論區等。
2. 主要典藏區及檢索分類:文獻典藏做初步選取將數位化的文學作品,再分類歸檔。而檢索則暫以年代、文類、作者等三項作搜尋選項。
(年代)— 1885-1895、1896-1905、1906-1915、1916-1925、1926-1935、1936-1945、1946-1955、1956-1969
(文類)— 詩文、散文(含雜文、傳記、遊記、議論)、小說、戲齣等。
(作者)— 巴克禮、蔡培火、陳清義、賴仁聲、林燕臣、林茂生、陳清忠等人之作品。(期未來能增列白話字作者人名資料)
是依各篇文獻判斷重要性關鍵詞。其他範圍則以台灣歷史、文化、文學等相關為主要選取考量。以下是關鍵詞初步選取規劃。
a.含「異名」:如「巴克禮」、「巴牧師」、「Thomas Barclay」;如「馬偕」、「偕牧師」、「George Leslie Mackay」;如「腓尼基」、「黎巴嫩」
b.聖經篇名:如「馬太」,一律寫作「馬太福音」;如「約翰」:一律寫作「約翰福音」。
1.作者:如「巴克禮」、「陳清忠」、「賴仁聲」、「馬偕」、「文姑娘」、「編輯室」
2.專欄關鍵字:如「社論」(社說)、「研究」、「論說」、「講壇」、「雜錄」
3.地名:如「嘉義」、「玉井」、「大社」、「東京」、「義大利」、「福建」
4.人名:如「耶穌」、「上帝」、「主」、「主耶穌」、「余饒禮」、「蘭醫生」、「吳文水」、「高金聲」
5.聖經地名:如「埃及」、「希伯來」、「耶路撒冷」
6.聖經人名:如「保羅」、「約翰」、「路加」、「提摩太」、「彼得」、「雅各」、「司提反」
7.聖經章節:如「詩篇」、「馬太福音」、「利未記」、「約翰福音」
8.書名文章名:如「聖經」、「天路歷程」、「十項管見」、〈二崙迫害記〉
9.事件名:如「噍吧哖事件」、「羅馬字運動」、「倍加運動」
10.雜項:如「阿美族」、「鴉片」、「人道主義」、「教育」、「白話字」、「羅馬字」、(含社團名、報社名…等等)。
附件一、 調查表
數位典藏國家型科技計畫內容發展分項計畫數位典藏工作流程調查表
單位:國立台灣師範大學台灣文化及語言文學研究所
數位化物件名稱: 台灣教會公報白話字文獻
子計畫名稱:台灣教會公報白話字文獻數位典藏計畫, 1885~1969
分項計畫名稱:
主持人: 李勤岸;khinhoan@gmail.com;02-3365-2962 聯絡人:呂美親;ibh5427@gmail.com;02-3365-2962
程序 |
工作內容 |
操作人員(數量、專業能力之要求) |
硬體(名稱、版本、價格) |
軟體(名稱、版本、價格等) |
依循標準(技術規範、成品規格、品質要求…等) |
耗時 |
總結(困難、缺失、特色…等) |
成本估算 |
備註 |
1 |
台灣教會公報白話字文獻資料彙整 |
專任助理與兼任助理共同執行。前置作業尚包括計劃內容的掌握、數位化工作分配執行及進度掌控、文獻相關資料搜集、內容分析、考證修訂與文字撰寫。而白話字文獻資料彙整部份, |
PC |
Windows xp (約8,290元)、Office xp(約7,000元) |
台灣教會公報白話字文獻選取,以文學作品為主,包括詩、散文、小說、戲劇、報導、雜文等。 |
白話字文獻的資料彙整,初步以篇名揀選,然進一步再依內容增刪;而教會公報內容龐雜,揀選工作無法密集,故以內容作修訂,光是資料彙整約算估計一個月工作天。 |
比一般中文的閱讀困難度更高,選取及彙整資料所費時間更多。 |
*總人事成本估算: (1)專任助理:35000×12(元/月)=420,000; (2)兼任助理:8000×12(元/月)=96,000 (3)計時工讀:4000×3×12(元/位/月)=144,000 基本人事成本 共計:660,000元 *授權及差旅費用: 大約估算10,000元。 |
大體而言,此計劃需再擴充研究團隊(包括白話字分析及研究者、數位化人員)與經費。 |
2 |
聯繫白話字文獻授權單位 |
由專任助理執行;白話字文獻相關文字、圖像之於助益網站製作,需向台灣教會公報社、台灣基督教長老教會教會歷史委員會、真理大學牛津學堂(校史館)、淡水中學校史館等單位授權相關資料使用。 |
專用電話一支 PC |
Windows xp- outlook (約8,290元) |
台灣教會公報社授權台灣教會公報內容;台灣基督教長老教會教會歷史委員會、真理大學牛津學堂(校史館)、淡水中學校史館等單位,授權教會歷史相關圖照。 |
依文獻、史料提供者聯繫的情形而視,一般為提供速度快慢之差。 |
為助益網站製作,需向相關單位授權所需圖像(有些有現成、有些需重拍),時間上無法完全自我掌握。 |
||
3 |
文獻相關圖像數位化 |
由專任助理執行;為建構網站使用,需相關歷史圖像輔助, |
單眼數位相機 |
Canon相機(含配備)約50,000元 |
新出土文獻:每一本書設一資料夾,主要為內容一頁為一單位,或兩頁為一單位。視出版品開數大小而定。 |
圖像拍攝後仍需剪裁整理,有時需重拍。 |
史料無法帶回掃描,僅能現場拍攝,但效果可能不佳。 |
||
4 |
簽訂授權書 |
由專任助理執行; |
PC |
授權單位:A4紙張,一頁;一式兩份。 數位公司:A4紙張,兩頁;一式兩份。 |
授權書一式兩份,簽訂完成。 |
因有些單位授權必需經過年度大會,時間無法如期或即時授權,使拍攝進度延遲。 |
|||
5 |
揀選欲數位化之白話字作品、建立文字資料清單 |
由專任助理與兼任助理共同執行。 |
PC |
Windows xp (約8,290元)、Office xp(約7,000元) 台語翻譯軟體 (免費) |
表格:檔名、年代、期數、篇名、作者、文類。 |
文獻龐雜,白話字閱讀較慢,不易揀選。 |
比一般中文的閱讀困難度更高,選取及彙整資料、打字、翻譯、校對所費時間多很多倍。 |
||
6 |
建立圖像資料清單 |
由專任助理執行 |
PC |
表格:檔名、年代、書名、作者、文類。 |
|||||
7 |
白話字文獻數位化(一): 打字 |
由研究生三名與大學生一名共同協力執行。(文獻龐雜,人員仍需擴增,但經費之礙,暫以此限。) |
PC |
註明篇名、年代、期數、內容。 |
白話字文獻數位化易漏字、漏行。 |
||||
8 |
白話字文獻數位化(二):翻譯 |
由專任助理及兼任助理共同執行。 |
PC |
漢字依教育部訂定漢字為主。 |
漢羅比例有時不定。 |
||||
9 |
白話字文獻數位化(三):校對 |
由專任助理及兼任助理共同執行。 |
打字時一次、翻譯時一次。最後再校一次。 |
校對工作因前行作業較緩,恐有延遲。 |
|||||
10 |
史料脈絡化分析工作(含英日文譯寫) |
由專任助理及兼任助理共同執行。 |
PC |
先進行中文資料彙整書寫條目。依條目內容進行英文與日文翻譯。 |
史料不易消化,網站介紹條目不易撰寫。 |
||||
11 |
典藏網頁製作 |
數位公司(委外) |
網站製作硬體 |
網站製作軟體 |
網站主頁一頁、內容格式各一頁,各層依格式與需要擴充頁數。 |
網站製作軟體未必各項程式皆與台語文軟體相容。嚐試克服。 |
網頁製作費:本年度網頁製作費含在業務費中,因經費不足而縮編成本製作初步工程:費用預算僅160,000元。 |
||
12 |
資料庫系統工程 |
數位公司(委外) |
|||||||
13 |
進行資料數位化及品管 |
數位公司(委外) |
|||||||
14 |
網站維護 |
資訊系所研究生 |
研究生助理一名,具網站管理能力。 |
資料庫與網頁問題之解決。 |
|||||
15 |
關鍵詞選取(下半年度重點工作準備) |
由專任助理及兼任助理共同執行。對白話字文獻及聖經內容、台灣基督教長老教會歷史的掌握度及判斷力夠高。能準確選取所需之關鍵詞。(作更精確的檢索) |
許多關鍵詞的取捨具爭議性。 |
含在基本人事費中。 |
註:若程序多於七個,請複製本表使用
調查人: 呂美親 調查地點: 國立台灣師範大學台灣文化及語言文學研究所 調查日期:2008/01/29
全文下載 (1.4 MB, 1,096 hits)