發表日期: 2008-08-08,
點閱數: 7,116 ,
加入收藏櫃
, 加入書籤
計畫單位:中央研究院歷史語言研究所漢籍工作室
計畫名稱:中央研究院漢籍全文資料庫
計畫簡介:
古籍是歷代流傳下來的文化瑰寶,因年代久遠,加上種種破壞與耗損,使得大多數的古籍難以完整保存,能夠保存下來的古籍自然更顯珍貴。因此整理及保存古籍的完整性是一項非常重要,且需長期投入的工作。
鑑於古籍數量龐大,加上善本取得不易,匯集古籍的工作十分困難。從搜集、編目到進行各種研究,都必須花費相當的人力與物力;而人力不足及人工作業疏失,有時難免造成缺誤。
古籍電子化後,透過電腦的處理及全球網際網路的優越性,這些資料可無限制地被使用者利用。再者,使用計算機進行處理,可以進行大量且連續的操作,將資料匯集起來,經過學者專家相互的比對參照,常能發現前人所未見的新資訊,所以古籍電子化對於研究工作是極為重要的突破。
中央研究院歷史語言研究所(以下簡稱史語所)與中央研究院計算中心於1990年完成共同開發的二十五史資料庫,於1995年將WWW檢索程式上線命名為「瀚典全文檢索系統」,1997年瀚典改版至1.3版,但為了因應電腦軟硬體不斷擴充與使用者需求,更為精益求精,在現任主持人史語所袁國華副研究員的帶領下,已再次規劃改版事宜,以期能達成人文為本、科技為用的目標。
早期的檢索系統是在UNIX作業系統下開發的,歷經多次修訂,目前重新使用JAVA程式開發系統。資料庫乃以保存原書的文字與排版為基礎,由層級(hierarchical)的目錄來對應書本的章、節、段落等結構,讓使用者得以據其調閱公文,或訂定檢索的範圍。
為因應資料庫改版,舊系統的資料需重新校對,標誌需要修改;同時新資料的電子化工作也必須持續進行。
正在建構中尚未完成之書籍約有兩億二百零二萬字。其中已完成校對的書籍有《宋人傳記資料索隱》等二十種,約五千五百三十九萬字,於2005年上線。校對中的書籍,有《明代律例彙編》等二十五種,約三千零六十四萬字。另外待校對書籍,有《文苑英華》等二十六種,約一億四千四百二十一萬字,正陸續建構中。
(more…)
分類: 數位化書籍 |
Tags: 影像, 掃描, 數位典藏, 數位化, 數位化工作流程, 文書, 檔案, 資料庫, 資訊
| 回應: 0人
發表日期: 2008-08-08,
點閱數: 7,636 ,
加入收藏櫃
, 加入書籤
計畫單位:中央研究院
計畫名稱:近代中國歷史地圖與遙測影像資訊典藏計畫
計畫目標:
廣泛搜集台灣與大陸地區最主要的各類地圖與遙測影像資料,予以數位化後保存。並建置分散式的時間與空間的整合資訊應用環境,以提供最適當便利之空間資訊應用。
計畫簡介:
中央研究院計算中心與歷史語言研究所等中研院院內各領域研究人員,一直致力於探討與研發具有空間關聯屬性的表達方式與技術、建立時間與空間資訊基礎架構,並發展相關資訊處理技術,以建立有效的支援與服務模式。
在過去數年中,積極進行的重點工作為近代中國各類空間資訊之蒐集及數位化典藏,以期能建立中國歷史文明時空之基礎架構。近代中國歷史地圖為數眾多,包括內政部庫藏約30,000件,中研院相關研究所館藏約20,000餘件,國防單位收藏約30,000件,另還可能包括其他政府機構所藏地圖,共將達十餘萬件。而遙測影像部分雖自四○年代後之影像方進行數位化,但數量卻更為龐大,高達百萬件之多。
為免這些珍貴史料因年代久遠而腐損,故該計畫期望能長期規劃,進行系統之數位化,以保存各類空間資訊,建立標準數位化程序與格式規範,進而建構完整之時空基礎架構與空間知識之應用環境。
(more…)
分類: 數位化書籍 |
Tags: Metadata, 中央研究院, 地圖, 影像, 掃描, 數位典藏, 數位化工作流程, 資料庫
| 回應: 0人
發表日期: 2008-08-08,
點閱數: 6,491 ,
加入收藏櫃
, 加入書籤
計畫單位:國史館臺灣文獻館
計畫名稱:典藏日據與光復初期史料數位化計畫
計畫簡介:
史料的保存與運用為典藏管理首要的工作,「保存」又是「運用」的基礎。國史館臺灣文獻館進行檔案大尺寸圖檔(以下簡稱大圖,尺寸的型式數量請參考附件一)的數位化工作,其目的便是為達成原始史料的永久保存,並藉以提供廣泛、重複使用的可能性。原始檔案十之八九為手稿式史料,非印刷品或複製品,內容珍貴但形式脆弱,其特性即其「唯一性」。若干檔案文書已超過一百年以上,文書紙張自然老化的現象無法避免;但史料應以能提供研究、法律信證或歷史事件稽核為其保存下來的積極目的,應設法善用此一資源。透過數位化保存,則可達到永久傳承史料文物之目的,且就積極面而言,已數位化之檔案史料,將可充分提供各種運用,發揮典藏管理的目標。
以下便就國史館臺灣文獻館進行數位化的工作流程做一說明、介紹。
(more…)
分類: 數位化書籍 |
Tags: Metadata, 典藏, 工作流程, 掃描, 掃描器, 數位, 數位典藏, 數位化工作流程, 文書, 文物, 檔案, 資料庫
| 回應: 0人
發表日期: 2008-08-08,
點閱數: 5,443 ,
加入收藏櫃
, 加入書籤
計畫單位:中央研究院歷史語言研究所傅斯年圖書館
計畫名稱:珍藏歷史文物數位典藏子計畫-分支三:
史語所傅斯年圖書館藏善本圖籍
計畫簡介:
中央研究院歷史語言研究所自民國十七年立所以來,即重視學術文獻的蒐集。歷經已故傅孟真(斯年)所長、胡適之(適)院長等的規劃,文獻耆宿張菊生(元濟)等先生的襄助,以及史語所同仁的努力經營下,七十年之間,蒐藏了舉世稱羨的漢學圖籍。
傅斯年圖書館(以下簡稱傅圖)重要典藏包括善本圖籍、李宗侗等名家舊藏歷代金石拓片、極具特色的俗文學資料、類善本書、古籍線裝書。
雖然傅圖在善本圖籍數位化工作已行之有年,也獲得相當的經驗與成果,於今電腦及通訊(網路)科技日新月異,「資訊共享」以及「全球村」也隱然成為人類普遍的共同願望,更促使傅圖有重新評估如何提昇數位典藏的質量,豐富資料庫的內容,加強資料管理與檢索的效能,強化與世界其他數位資料的互通性,以及向漢學界及社會大眾提供寶貴的文化資產的必要性。
傅圖為配合「數位典藏國家型科技計畫—中央研究院機構計畫—珍藏歷史文物數位典藏計畫」,與國家圖書館、國立故宮博物院等單位合作執行,同時也考慮與國外重要漢學研究及收藏單位合作,希望以既有的數位化經驗為基礎,共同發展並建置專題數位典藏資料庫。
九十年度傅圖善本圖籍的數位化工作因受限於經費與網路頻寬,全部以全彩300dpi TIFF格式進行影像掃描,希望以最少的經費、最短的時間,將館藏善本圖籍予以數位化外,並期望儘早提供到館及遠端讀者研究參考之用,也希望藉此機會參酌國科會數位博物館專案計畫訂立之規範,而與合作館共同研議最優化的規格與標準,一體施用,以期建置高品質的數位典藏資料庫。未來在「古籍附圖數位典藏」擬選擇600dpi TIFF全彩圖像品質之數位化典藏規格。
目前主要進程為第一階段先與國圖、故宮合作,就合作館之館藏「明版明人詩文集」、「古籍附圖數位典藏」等為共同主題進行研發;第二階段將針對傅圖館藏醫學、考古、金石等相關研究主題之古籍予以數位化。
(more…)
分類: 數位化書籍 |
Tags: Metadata, 中央研究院, 圖書館, 影像, 掃描, 數位典藏, 數位化工作流程, 數位攝影, 資料庫, 資訊
| 回應: 0人
發表日期: 2008-08-08,
點閱數: 4,119 ,
加入收藏櫃
, 加入書籤
分類: 數位化書籍 |
Tags: 中央研究院, 影像, 掃描, 數位典藏, 數位化, 文書, 文物, 民族學, 資料庫, 資訊
| 回應: 0人
發表日期: 2008-08-08,
點閱數: 4,306 ,
加入收藏櫃
, 加入書籤
計畫單位:臺灣大學人類學系
計畫名稱:臺灣大學人類學系典藏文物數位化計畫
分項計畫名稱:臺灣原住民各族藏品資料整理研究與數位化
計畫簡介:
臺灣大學標本陳列室典藏豐富而珍貴的民族學與考古學標本,為該系教學及研究之特色,並肩負保存地方文化資產的使命。標本陳列室除供教學研究之用,並適度對外開放參觀。近年來陸續開設博物館學相關課程,希望藉此提高學生學習興趣,並拓展人類學專業知識。
臺灣大學人類學系標本收藏始於1928年「土俗人種學講座」創設時期。陳列室歷經草創、茁壯、戰爭破壞、戰後復原等變遷,所藏標本均為前身「講座」和本系最重要的資產。目前民族學標本約有三千多件,包括臺灣各地區原住民的傳統
器物和衣飾,如家屋樑、木柱、雕像、佩刀、木盤、碗、煙斗、珠衣、皮帽、刺繡、祭壺與獵首用具等;另有少數海南島、東南亞及太平洋地區的民族學標本
(more…)
分類: 數位化書籍 |
Tags: Metadata, 人類學, 影像, 掃描, 數位典藏, 數位化工作流程, 檔案, 民族學, 資訊
| 回應: 0人
發表日期: 2008-08-08,
點閱數: 3,708 ,
加入收藏櫃
, 加入書籤
計畫單位:中研院植物所
計畫主持人:中研院植物所 彭鏡毅研究員
計畫簡介:
中研院植物所典藏豐富的台灣本土植物資料、文獻、珍貴標本、野生植物及棲地影像資料庫可供學術研究、生態保育、環境影響評估、相關產業開發等之諮詢及參考。本計畫擬將台灣本土植物標本典藏紀錄、野生植物及標本影像、相關文獻等加以數位化,配合台灣本土植物資料庫,建置一套兼具文字與影像的台灣植物資源查詢系統提供各界人士使用。
(more…)
分類: 數位化書籍 |
Tags: 主題小組, 影像, 掃描, 掃描器, 數位, 智慧財產權, 資訊
| 回應: 0人
發表日期: 2008-05-27,
點閱數: 4,713 ,
加入收藏櫃
, 加入書籤
內容發展分項計畫/ 高芷彤
百度搜尋引擎公司Baidu.com由超鏈分析專利發明人李彥宏及其好友徐勇在美國矽谷成立公司,並於2000年回到中國,以專門搜索和收錄中文網頁之搜尋引擎為主。Baidu創辦人李彥宏以辛棄疾的《青玉案》中的「萬里尋他千百度」來象徵對於追求中文資訊檢索技術的執著。他主要產品及服務是針對不同企業及各機構網路化的基本需求而設計的,分為對於全球互聯網的中文網頁檢索,以及對於解決企業級的資訊檢索等兩方面,此外Baidu還利用遍佈在全國龐大的CDN網路提供的資訊傳遞技術(即網站加速及網路緩存技術),它的使用者包括深圳商報,四川新聞網,中國基礎教育網等。2001年正式發佈Baidu搜尋引擎,專注於中文搜索的層面,提出競價排名的服務。此服務是以用戶(通常為企業)為自己的網頁出資購買關鍵字排名,按點擊計費的一種服務。不同於Google以PageRank排名,Baidu通過競價排名,搜索結果的順序將根據競價的多少由高到低排列,同時奉行不點擊不收費的原則。也就是說,Baidu將自己的搜索引擎變成廣告平台,提供用戶(通常為企業)在虛擬平台上廣告行銷。由於以Baidu提出的統計報表為主,因此要特別注意是否有與用戶提出統計量相異的矛盾產生,樂臣數碼公司則是在這遊戲規則下提出質疑以及訴訟的用戶。
圖表 1、http://www.baigoodugle.com/
(more…)
分類: 數位典藏觀察室 |
Tags: 掃描, 搜尋引擎
| 回應: 0人