1024x768 1280x800   Decrease font size for  - 拓展台灣數位典藏 - 數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫網站 Reset to normal font size for  - 數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫網站 - 拓展台灣數位典藏 Increase font size for  - 拓展台灣數位典藏
 


國史館 典藏國家檔案與總統文物數位化工作流程簡介

發表日期: 2008-08-08, 點閱數: 6,854 , 加入收藏櫃 , 加入書籤

 

 

計畫單位:國史館

 

計畫名稱:典藏國家檔案與總統文物數位化中程計畫

 

計畫簡介

 

國史館隸屬總統府,以纂修國史及典藏國家重要史料文獻為職掌,亦為我國總統、副總統文物的專責主管機關。該館大多數檔案與文物為手稿本或紙質文件,內涵極為珍貴,其中若干檔案文物已逾百年。因此,為避免原件因天然災害或過度使用而愈加受損,在政府運臺舊檔與在臺已失時效檔案中,審選讀者調閱較多且較重要之全宗檔案,如:「國民政府檔案」、「蔣中正總統文物」、「資源委員會檔案」、「蔣經國總統文物」及「臺灣省政府地政處檔案」等,優先分別進行整理、編目建檔、影像掃描等數位化方式製作複本,建置符合國際通用標準規格之數位典藏系統,產出數位資料,並利用其永不失真褪色、可快速複製、多元儲存及多樣化呈現的特性,讓數位檔案永久典藏,開放各界查詢應用,並達到與世界各國檔案館、圖書館及數位博物館等進行資訊交換分享之目的。

 

以下就國史館進行數位化的工作流程做一說明。

 

(more…)

國立交通大學電視新聞多媒體資料館數位化工作流程簡介

發表日期: 2008-08-08, 點閱數: 6,814 , 加入收藏櫃 , 加入書籤

 

 

計畫簡介

 

電視新聞多媒體資料館,為國科會數位典藏計畫中之新聞傳播資料庫。本計畫由交通大學資工所多媒體團隊,傳播所多媒體團隊以及中華電視公司合作,希望能將國內多年累積的新聞影音資料加以數位化,妥善保存珍貴新聞資料並提供更多功能的運用。

 

本計畫發展了一個多媒體新聞網站,以導覽教學的方式引導使用者更深入了解新聞的起源、發展與應用;並且提供電視新聞製作的技巧,除供學術研究者運用,也可讓一般有興趣民眾進入影音新聞的世界。另外,在資料庫方面,交大資工系利用多媒體視訊分析技術,將華視留存之89及90兩年晚間新聞錄影帶轉成數位文字、影像及影音資料。未來,使用者除了可用關鍵字查詢新聞內容外,並可以影像或語音來搜尋需要的新聞內容。

 

此計畫的長程目標,則利用中華電視公司提供該公司所典藏新聞錄影帶(其內容涵蓋台灣人民生活,政治,外交,經濟及科技等全方位之紀錄),建立一個多媒體新聞資訊數位資料館。如此將可廣泛提供國人與國際人士瀏覽這份珍貴資源,不但可以供個人充實知識,亦可以供學者專家作學術研究之用。

 

在91年度計畫中,將進行與華視簽約89年及90年的新聞帶共約有450卷,由專任助理及工讀生在華視轉換MPEG2檔案格式完成後,帶回交大進行新聞故事自動切割、關鍵畫面抽取及ASF檔案轉換程式,並將在此電視新聞檢索系統,開發應用程式作多功能的加值應用。

 

(more…)

國立自然科學博物館 臺灣原住民民族誌標本典藏數位化

發表日期: 2008-08-08, 點閱數: 4,050 , 加入收藏櫃 , 加入書籤

計畫目標:本子計畫針對本館人類學組台灣原住民蒐藏品:如原住民各族標本文物、影像資料、聲音、影片等相關紀錄之收藏作品,利用本館人類學組已建立之〝台灣原住民民族誌〞資料庫為基礎,將標本文物約1600件、影像資料1700件、錄音資料約25小時、錄影資料約20小時及原住民知識約160篇等之台灣原住民民族誌收藏品數位化。並以原住民族群所居住的領域為主要範疇,從事相關知識的訪查、紀錄、描述與詮釋及列出重要參考文獻,以掌握原住民族的民族誌標本與其相關知識的基本內容與範疇,據以建立其數位化資料庫,作為本館民族誌資源中心、展示、教育等工作長期發展之依據。

計畫簡介:國立自然科學博物館民族學門的民族誌標本,在規劃標本分類系統時明確的列出標本屬性,例如:「族群、使用者、使用場合、使用年代、材質」等;另外,又簡略的依功能分為十四類,例如:「宗教、婚嫁、喪葬、節慶、飲食具、建築、家具、運輸工具、醫藥、服飾、兵器、戰利品、娛樂、其它」。在利用分類系統時,有些器物可能同時隸屬於不同類別。查詢者利用這些屬性,再搭配提供的簡略分類,根據自己的需求加以排列組合,訂出合於自己研究的分類標準。

本計劃試圖深入的詮釋標本文物、並將「後設資料(meta-data)」予以數位化。

 

(more…)

閩南語兒童語料數位化工作流程簡介

發表日期: 2008-08-08, 點閱數: 7,405 , 加入收藏櫃 , 加入書籤

 

 

計畫單位:國立中正大學語言學研究所

 

計畫名稱:台灣兒童語料庫計畫

 

計畫簡介

 

「台灣兒童語料庫」Taiwan Child Language Corpus(簡稱TAICORP)是將所收集之台灣兒童口語錄音語料,依照世界標準的兒童語料交換系統 Child Language Data Exchange System(簡稱 CHILDES; MacWhinney and Snow 1985, MacWhinney 1995)格式,建構成語料庫。其主要目的在(1)提供國內外學者語料共享的便利性與語料分析工具;(2)藉由標準規格的設定,使台灣兒童語料的收集能更有系統、更有效率,並且快速地涵蓋台灣地區所有語言。語料庫最終將設立網站,開放國內外學者使用。

 

在新生一代普遍使用國語的時代背景之下,台灣閩南語兒童語言習得的語料彌足珍貴。本語料庫可提供語音學、音韻學、構詞學、句法學、語意學、語用學等不同層面的語言學與兒童語言習得研究,也可提供語音工程方面的研發與應用。本計畫由國立中正大學語言學研究所蔡素娟教授主持,從1997年10月開始錄音,經轉記、標記、格式化等過程,歷時將近九年。共收錄431人次錄音檔案,錄音總長共約330 小時。文字檔共約五十萬句,一百六十多萬詞。

 

(more…)

中央研究院民族學研究所 人類學口述訪談數位化工作流程

發表日期: 2008-08-08, 點閱數: 3,831 , 加入收藏櫃 , 加入書籤

 

計畫單位: 中央研究院民族學研究所

 

 

計畫名稱: 台灣原住民數位典藏計畫

 

 

計畫簡介:

 

「台灣原住民數位典藏計畫」,主要是以中央研究院民族學研究所博物館、圖書館以及研究人員所典藏有關台灣原住民之研究資料為基礎,進行各類型資料的數位化與典藏管理,並建置影像、文物、人口、聚落、書目、表格、研究地圖、契約文書、音樂、影音、口述訪談、多媒體出版品、故宮原住民檔案等十三種資料庫及其搜尋機制,以提供研究人員、教育人員以及社會大眾,在研究、教學及相關資訊交流方面的便利,希望藉此能促進族群間的相互了解與尊重,以及不同文化間的交流與保存。

 

(more…)

國立故宮博物院 清代軍機處檔案數位化工作流程簡介

發表日期: 2008-08-08, 點閱數: 6,682 , 加入收藏櫃 , 加入書籤

 

 

計畫單位:國立故宮博物院圖書文獻處

 

計畫名稱:故宮文物數位典藏系統之研製—故宮清代檔案數位典藏子計畫

 

計畫簡介

 

國立故宮博物院(以下簡稱故宮)所藏清代檔案,來自清宮舊藏。民國二十二年,日本侵華事起,故宮文物南遷,其後輾轉播遷,於民國三十八年運抵台灣,其中清代檔案共二百零四箱,包括:宮中檔—硃批奏摺(約十五萬件)、軍機處檔摺件(約十九萬件)、軍機處檔冊、內閣部院檔、史館檔等約四十萬件。民國五十七年故宮設立圖書文獻處,即著手將遷運來台的清代檔案開箱整理,盡發所藏,分類編號,摘由建卡,逐步於故宮附屬圖書館中開放借閱。民國七十一年所有清代檔案的整理工作完竣,出版《國立故宮博物院清代文獻檔案總目》,至此故宮所藏之清代檔案已全部公開。

 

在上列檔冊中,以「軍機處檔摺件」的紙質最為脆弱;故宮自民國八十五年起即編列預算,先以數位照相機拍攝方式,將「軍機處檔摺件」原件製成影像檔,存入光碟保存,經校對後發現其效果不如以掃描器所建的影像檔,因此自九十年度加入國家數位典藏計畫的同時,全面改用高析度掃描器繼續建檔,並將前以數位相機建置的影像檔進行校對,效果不佳者,再改以掃描方式重新建檔,至九十三年十月已完成十三萬件影像檔。配合影像檔的建置,亦建置目錄檢索檔,以內容提要、具奏人姓名、具奏人官職、具奏日期、硃批內容、硃批日期、文獻編號等七個欄位,為每件「軍機處檔摺件」建置檢索目錄,至九十二年底完成初步的自動化檢索系統,共十九萬件。目前則持續校對修改,並增建部分欄位資料,例如:展覽記錄、裱修狀況、借閱記錄、出版情況等,以臻至完善。

 

故宮圖書文獻處進行清代軍機處檔案的數位化工作,主要分成四個部分進行:一、軍機處檔摺件影像資料庫建置;二、軍機處檔摺件目錄資料庫建置;三、清代檔案文獻總目資料庫建置;四、軍機處檔人名權威檔建置。

 

 

(more…)

中央研究院歷史語言研究所史語所藏漢代簡牘數位化工作流程簡介

發表日期: 2008-08-08, 點閱數: 8,714 , 加入收藏櫃 , 加入書籤

 

計畫單位:中央研究院歷史語言研究所

 

計畫名稱:珍藏歷史文物數位化典藏計畫-分支二:拓片與古文書數位典藏計畫之漢代簡牘

 

計畫簡介

 

中央研究院歷史語言研究所歷史文物陳列館(以下簡稱史語所文物館)典藏的漢簡,以1930年至1931年瑞典考古學家貝格曼(Folke Bergman)在內蒙古與甘肅境內之額濟納河流域發掘的「居延漢簡」為主,約一萬一千餘枚,另外還包括1930年、1934年黃文弼在新疆鹽澤發現的「羅布淖爾漢簡」(五十八枚),以及於1944年、1945年夏鼐、閻文儒勘查玉門關、陽關及漢代邊防烽燧遺址路線,所發現的「敦煌小方盤城漢簡」(七十六枚)、「武威剌麻灣漢簡」(七枚)。這批珍貴的考古遺物歷經戰亂,由北京經香港轉運美國,1965年由美國運回台北入藏史語所。

  

這些漢代邊塞地區出土的簡牘文書,直接、生動地記錄了西漢中晚期到東漢初期,當地軍民之軍事、法律、教育、經濟、信仰以及日常生活的情形,舉凡漢代的吏制、養老、撫恤、秩奉、農墾屯田、眥算、上計、邊塞防禦、算數、曆法等問題,均可從所藏簡牘得到深具價值的研究素材,是國內一批價值非凡的文化資產。

 

有鑒於電腦應用在漢簡研究上的突破性,史語所簡牘整理小組自九十年代初期起,即以紅外線攝影儀、掃描器、電腦,重新釋讀所藏簡牘,並進行影像、釋文資料數位化,同時也進行「簡帛金石資料庫」以及《居延漢簡補編》紅外線影像檔系統之建置,可謂台灣學術界數位典藏之先驅。

 

拓片與古文書數位典藏計畫在前述的基礎上,建置「歷史語言研究所藏漢代簡牘資料庫」,提供檢索漢簡基本資料、釋文以及彩色照、黑白照、紅外線照、遺址平面圖等數位影像線上瀏覽,此外建置歷史語言研究所藏居延漢簡遺址查詢系統、秦漢歷史地圖查詢系統等史地工具,藉此增進漢簡研究的便利性。網站部分將提供漢代簡牘導覽,以深入淺出的文字與圖像,提供社會大眾認識漢代簡牘的窗口,介紹本所漢代簡牘的典藏特色與價值。

 

以下為中研院史語所藏漢代簡牘數位典藏數位化工作流程圖,相關說明如後。

 

(more…)

台灣大學植物標本館典藏數位化計畫 數位化工作流程

發表日期: 2008-08-08, 點閱數: 20,972 , 加入收藏櫃 , 加入書籤

 

 

單位:台灣大學植物學系標本館

 

計畫主持人:台灣大學植物系 謝長富先生

 

計畫簡介

 

國立台灣大學植物標本館成立於1928年,從日據時期便開始大量蒐藏台灣本地植物,迄今已有二十五萬份以上。這些標本代表台灣維管束植物種類百分之九十五以上,其中三分之二的標本為台灣地區固有的種類。由於從日據時期便開始蒐藏,除了藏有植物學上最珍貴的模式標本一千餘外,並藏有五十年前所採集的本省固有植物且深具研究價值的老標本六萬餘份。

 

為更有效利用及管理這些標本,本子計畫擬於五年內完成館藏資料庫之數位化並納入網站,以利永久典藏、學術研究、專業教學及通俗教育之用。

 

(more…)

語言分佈GIS系統建置數位化工作流程簡介

發表日期: 2008-08-08, 點閱數: 9,343 , 加入收藏櫃 , 加入書籤

 

 

計畫單位:中央研究院語言學研究所

 

計畫名稱:語言典藏計畫

 

計畫簡介

 

閩南語和客家話是漢語的主要方言,是重要的語言資產,主要分佈於福建南部、廣東、台灣與東南亞,但受到學校教育、媒體大量使用國語(普通話)的影響,這二種語言能使用的人口有越來越少的傾向,成為相對的弱勢語言,亟待研究與保存。然而目前學界尚未有詳細標記的閩客語文獻語料庫,致使研究上,往往事倍功半。

 

臺灣人口流通量大而頻繁,語言接觸日益密切,語言生態丕變,方言中的「地區變體」與「社會變體」之消長分合,變化快速。近年方有學者開始積極調查繪製臺灣地區語言地圖,然電子語言地圖的繪製還在起步階段,展現語言分佈情況的語言地圖更付之闕如。  
  

 

該計畫為中央研究院「語言典藏」分項計畫「漢語典藏與典藏架構」的五個子計畫之一,擬以大眾文學之劇本、歌仔冊二種文體為範圍,建立閩南語、客家語語料庫。並以閩客雜居的新竹縣新豐鄉為對象,調查居民用語,研究閩客用語交互之影響。從歷史語言與語言分佈兩點切入,結合文獻語言與生活語言,進行語言標誌,建置閩客語語料庫、詞彙庫與語言分布地理資訊系統,為學界提供有力的研究工具。    

 

由於新竹縣新豐鄉是閩客雜居的鄉鎮,所以該計畫以新竹新豐鄉為範圍,進行語言分佈的調查研究,發展語言分佈地理資訊系統。    

 

(more…)

漢籍電子文獻資料庫數位化工作流程簡介

發表日期: 2008-08-08, 點閱數: 7,116 , 加入收藏櫃 , 加入書籤

 

計畫單位:中央研究院歷史語言研究所漢籍工作室

 

計畫名稱:中央研究院漢籍全文資料庫

 

計畫簡介

 

古籍是歷代流傳下來的文化瑰寶,因年代久遠,加上種種破壞與耗損,使得大多數的古籍難以完整保存,能夠保存下來的古籍自然更顯珍貴。因此整理及保存古籍的完整性是一項非常重要,且需長期投入的工作。

 

鑑於古籍數量龐大,加上善本取得不易,匯集古籍的工作十分困難。從搜集、編目到進行各種研究,都必須花費相當的人力與物力;而人力不足及人工作業疏失,有時難免造成缺誤。

 

古籍電子化後,透過電腦的處理及全球網際網路的優越性,這些資料可無限制地被使用者利用。再者,使用計算機進行處理,可以進行大量且連續的操作,將資料匯集起來,經過學者專家相互的比對參照,常能發現前人所未見的新資訊,所以古籍電子化對於研究工作是極為重要的突破。

 

中央研究院歷史語言研究所(以下簡稱史語所)與中央研究院計算中心於1990年完成共同開發的二十五史資料庫,於1995年將WWW檢索程式上線命名為「瀚典全文檢索系統」,1997年瀚典改版至1.3版,但為了因應電腦軟硬體不斷擴充與使用者需求,更為精益求精,在現任主持人史語所袁國華副研究員的帶領下,已再次規劃改版事宜,以期能達成人文為本、科技為用的目標。

 

早期的檢索系統是在UNIX作業系統下開發的,歷經多次修訂,目前重新使用JAVA程式開發系統。資料庫乃以保存原書的文字與排版為基礎,由層級(hierarchical)的目錄來對應書本的章、節、段落等結構,讓使用者得以據其調閱公文,或訂定檢索的範圍。

 

為因應資料庫改版,舊系統的資料需重新校對,標誌需要修改;同時新資料的電子化工作也必須持續進行。

 

正在建構中尚未完成之書籍約有兩億二百零二萬字。其中已完成校對的書籍有《宋人傳記資料索隱》等二十種,約五千五百三十九萬字,於2005年上線。校對中的書籍,有《明代律例彙編》等二十五種,約三千零六十四萬字。另外待校對書籍,有《文苑英華》等二十六種,約一億四千四百二十一萬字,正陸續建構中。

 

(more…)