國立交通大學蘭嶼原住民 媒體資料庫建置與數位典藏計畫
Tags: Metadata, 原住民, 影音, 掃描, 搜尋, 數位化工作流程, 檔案, 資料庫 發表: 2009-11-13, 點閱: 5,402 , 加入收藏櫃 , 列印 , 轉寄
計畫單位:國立交通大學傳播研究所
計畫名稱:蘭嶼原住民媒體資料庫建置與數位典藏計畫
該資料庫建立目的主要為了透過數位典藏機制來保存蘭嶼原住民的珍貴媒體資料,同時也希望能有助於蘭嶼原住民部落對自我認同之建構,並促進族群文化交流,讓外界進一步瞭解蘭嶼原住民的生活、文化與歷史 。
在主流媒介長期忽視與邊陲化之下,台灣原住民長久以來運用口語文化的傳統與社區媒介來進行溝通。其中,原住民媒介與文字紀錄,成為族群文化延續及弱勢族群發聲的重要管道。蘭嶼原住民 能擁有屬於自己的傳播媒體,間接擁有發言權、文化解釋權及外部社會的對話權,對內得以凝聚共識與認同,對外則表達蘭嶼族群文化的觀點。
該資料庫主要與擁有蘭嶼珍貴之近代媒體材料的「蘭恩文教基金會」進行合作,取得 相關媒體資料授權,進行數位化與資料庫建置典藏工作,試圖透過原住民媒體資料庫的建置與保存,以「弱勢族群媒體」發聲為 主要關懷,建構起原住民媒體的保存價值與傳播意義,以促成上述對內及對外的訊息傳播功能。
該計劃將蘭恩文教基金會所提供之影音資料、音訊資料以及文字資料進行整理轉檔與數位化的工作,在此就針對VHS/DV影帶、廣播檔案以及蘭嶼雙週刊這三類資料的數位化方式進行說明。
蘭嶼媒體資料庫建置工作流程圖:
製作日期:2008/06/09
(一)整理影音母帶:
將欲數位化的VHS/DV影帶先進行清查、排列與清點數量等工作(圖一),因為蘭嶼當地相當潮濕,許多錄影帶皆以受潮不堪使用無法進行數位化工作,必須事先清查錄影帶的狀況,損壞太過嚴重則無法轉檔。
圖一、錄影帶的清點與整理
(二)VHS/DV影帶的轉檔:
將影帶利用影像轉換器UPMOST-MPB680及軟體WinAVI Converter將檔案輸出為典藏用之MPEG-2格式(圖二),另外也將檔案轉換為WMV格式以作為網路瀏覽使用,檔案命名方式則依照錄影帶上原本之名稱為標準。
圖二、將影像輸出至電腦
(三)錄影帶全文輸入:
將錄影帶內之內容、場景以及人物對話利用Microsoft Word進行全文輸入之工作(圖三),標點符號皆用全形呈現,字體統一為新細明體和Times News Roman,並依照場景輸入時間段落;如場景有所變換,則另起一個時間段落;格式定為00:00:00-00:00:00,冒號與-都以全型輸入,時間段落必須明顯切割,並加上場景內容說明和頁碼。影帶全文輸入之目的在於輔助關鍵字搜尋影片以及當影片內容不清楚時,可供查詢對話內容所使用。
圖三、將錄影帶內容輸入成全文資料
(四)影音檔案的剪輯:
將轉檔完成的WMV網路瀏覽影音檔案,依照全文輸入的影片段落為標準,利用軟體Power Director將影音檔案進行分段剪輯(圖四),以符合網路瀏覽影像與全文輸入對照之需求。
圖四、剪輯網路瀏覽影音檔
(五)建立Metadata:
Metadata欄位是依照Dublin Core為標準,在討論設計出符合該計畫數位化藏品之欄位(圖五)。Metadata撰寫必須登入計劃網站後台來執行(圖六),將數位化完成並且切割好之影音資料,依照所需資料依序輸入相對應之欄位。
圖五、Metadata欄位
圖六、Metadata資料撰寫
(六)上傳匯入資料及備份
將數位化完成影音檔案及全文輸入檔案,分別上傳至FTP伺服器及資料庫進行備份和供使用者查詢使用(圖七),另外,典藏級檔案也將燒錄成DVD光碟進行備份。
圖七、上傳資料至伺服器備份
(一)整理原始廣播檔案:
將MP3與CD音樂格式之原始廣播檔案,轉檔成符合網路瀏覽用之規格,MP3格式、取樣率:44.1 kHz / 16bit / sample、頻寬:64Kbps。轉檔完成之檔案再上傳至FTP伺服器中備份,以利後續資料下載處理方便。
(二)廣播全文輸入:
先至FTP下載要進行全文輸入之MP3廣播節目檔案,再利用Microsoft Word進行全文輸入之工作(圖八)。檔案內容須註明,節目名稱、主題、播出時間及主持人,標點符號用全形呈現,字體統一用新細明體和Times News Roman,歌曲、音樂和說話內容等時間段落要切割清楚,時間段落格式定為00:00:00-00:00:00,冒號與-都以全型輸入,並插入頁碼。
圖八、將廣播內容輸入成全文資料
(三)剪輯聲音檔案:
至FTP下載完成全文輸入之MP3廣播節目檔案,依照全文輸入的廣播段落為標準,利用Adobe Audition軟體將聲音檔案進行分段切割(圖九),將節目內容切割為中文、達悟語、達悟音樂(無歌詞)、達悟歌曲(有歌詞),讓每個檔案都成為一個重要片段的完整內容,每段內容至多15分鐘,超過再依序給予編號註記,以符合網路瀏覽影像與全文輸入對照之需求。
圖九、剪輯聲音檔案
(四)全文資料校稿:
針對全文輸入之檔案進行校稿,檢查文字內容與剪輯完成之廣播檔案,在內容或格式上是否有錯誤(圖十),以避免後續建立Metadata時鍵入錯誤資料。
圖十、檢查文件內容與格式
(五)建立Metadata:
Metadata欄位是依照Dublin Core為標準,在討論設計出符合該計畫數位化藏品之欄位。Metadata撰寫必須登入計劃網站後台來執行(圖十一),將剪輯完成之廣播檔案,依照所需資料依序輸入相對應之欄位。
圖十一、Metadata資料撰寫
(六)上傳匯入資料及備份
將剪輯完成之廣播檔案及全文輸入檔案,分別上傳至FTP伺服器及資料庫進行備份(圖十二)和供使用者查詢使用,另外,典藏級檔案也將燒錄成DVD光碟進行備份。
圖十二、上傳資料至伺服器備份
將收集到的文件資料依照書籍、蘭嶼雙週刊和蘭恩通訊三大類進行分類和期數排列,在此除了檢查書籍和文件資料是否有破損的情形,是否適合進行數位化之外;還需將蘭嶼雙週刊合訂本進行裁切拆裝,按照期數排列好以方便數位化工作的進行(圖十三)。
圖十三、整理分類文字資料
(二)書面資料掃描:
1. 文件掃描
先將欲掃描之文件進行整理攤平,依照紙張尺寸小於A4使用HP Scanjet 8200掃描器(圖十四),大於A4則使用UMAX PowerLook 2100XL掃描器,掃描規格以300dpi為標準進行掃描。
圖十四、攤平文件進行掃描(示範者:陳群典)
2. 轉檔與修圖
掃瞄完成後之圖檔先裁去邊框多餘的部份、去除掃瞄檔上的污漬、調整文件水平和對比,最後再將檔案存為典藏用之TIFF檔(圖十五)。
圖十五、調整文件對比
(三)全文資料輸入:
1.文章輸入
將雙週刊掃描檔按照原稿格式輸入成記事本(*.txt)檔案(圖十六),加入頁碼,並且包含標題、作者及日期,檔案命名格式為biweekly001(期數)01(版次)01(文章編號)。
圖十六、將雙週刊內容輸入成全文資料
2格式規範
標點符號用全形呈現,字體統一用新細明體和Times News Roman,碰到照片或圖片時連同說明圖片內容的文字一起輸入,並按照圖片順序編號,例如,圖片說明:XXX,攝影:XXX。另外,廣告、表格不作全文輸入,只作圖檔掃描和Metadata建置,但仍需建立一Word檔標題為「廣告」或「表格」以及備註作者、日期。
(四)文章加框與淡化處理:
將TIFF格式之掃描檔利用軟體Photoshop CS3,選取欲後製之報導文章,加框設定10%,並將其他部份淡化50%以突顯主題(圖十七);再將檔案轉存為JPEG檔案、高品質、100dpi格式,存檔名稱必須和全文資料之檔案相同,以避免後續校對找不到檔案。
圖十七、選取範圍進行加框設定
(五)全文資料校稿:
列印掃描完成檔案進行全文輸入校對工作(圖十八),檢查全文資料內容、格式是否有錯,並加以修改。
圖十八、檢查文件內容與格式
(六)建立Metadata:
Metadata欄位是依照Dublin Core為標準,在討論設計出符合該計畫數位化藏品之欄位。Metadata撰寫必須登入計劃網站後台來執行,將數位化完成之掃描檔案,依照所需資料依序輸入相對應之欄位。
圖十九、Metadata資料撰寫
(七)上傳匯入資料及備份
將掃描完成之檔案及全文輸入檔案,分別上傳至FTP伺服器及資料庫進行備份和供使用者查詢使用,另外,典藏級檔案也將燒錄成DVD光碟進行備份(圖二十)。
圖二十、燒錄DVD備份光碟
※ 製作單位:國立交通大學傳播研究所─
蘭嶼原住民媒體資料庫建置與數位典藏計畫
數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫
※ 文字撰寫:國立交通大學傳播研究所─
蘭嶼原住民媒體資料庫建置與數位典藏計畫
計畫助理 陳群典、蔡欣蓓
數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫
藝術與圖像主題小組助理 高朗軒
※ 圖片拍攝:數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫
計畫助理 王雅萍、高朗軒
※ 圖文編輯:數位典藏與數位學習國家型科技計畫 拓展台灣數位典藏計畫
藝術與圖像主題小組助理 高朗軒
致謝:
感謝國立交通大學傳播研究所「蘭嶼原住民媒體資料庫建置與數位典藏計畫」主持人 郭良文教授撥冗指導及提供實地拍攝與簡介編寫,並感謝陳群典、蔡欣蓓等相關計畫人員之協助。
數位典藏國家型科技計畫內容發展分項計畫數位典藏工作流程調查表
單位: 國立交通大學傳播研究所
數位化物件名稱:蘭嶼雙週刊、廣播、錄影帶、照片
子計畫名稱: 新聞小組
分項計畫名稱: 蘭嶼原住民媒體資料庫建置與數位典藏計畫
主持人(負責人)(E-mail、Tel):郭良文 lwkuo@mail.nctu.edu.tw (03)5712121分機58210
聯絡人(E-mail、Tel):蔡欣蓓 paye7442@yahoo.com.tw (03)5712121分機58213 傳真:(03)5713010
程序 |
工作內容 |
操作人員(數量、專業能力之要求) |
硬體(名稱、版本、價格) |
軟體(名稱、版本、價格等) |
依循標準(技術規範、成品規格、品質要求…等) |
耗時 |
總結(困難、缺失、特色…等) |
成本估算 |
備註 |
1 |
資料蒐集與分類整理 |
人數:4 能力: 1.計畫主持人 2.共同主持人 3.專任助理 |
PC(自組、約3萬元/台) NB(IBM、X31、約5萬元/台) |
Windows XP、Office 2007 |
無 |
8天(192小時) |
由於資料皆須親赴蘭嶼當地才可取得,易受天候不穩影響。 |
約7萬元 |
|
2 |
書面資料掃瞄建檔 |
人數:1 能力:熟悉平面影像軟體操作 |
PC(自組、約4萬元/台×2台) HP掃瞄器(Scanjet 8200、約1.6萬元/台) UMAX掃瞄器( PowerLook 2100XL、約6萬元/台) |
Photoshop CS3 |
1.典藏用: TIFF檔、300dpi。 2.網路用: JPEG檔、100dpi。 |
3個月 |
本計畫以符合數位畫標準的300dpi進行掃描。 |
約12萬元 |
|
3 |
影像資料轉換與建檔 |
人數:4 能力:熟悉數位影像軟體剪輯 |
PC(自組、約4萬元/台×2台) 影像轉換器(UPMOST-MP680、6500元/台×1台) |
WinAVI Converter Power Director |
1.典藏用: MPEG-2、720*480。 2.網路用: WMV、320*240。 |
約360小時 |
蘭嶼當地相當潮濕,錄影帶受潮太嚴重則無法進行轉檔。 |
約10萬元 |
|
4 |
音訊資料轉換與建檔 |
人數:3 能力:熟悉數位影音軟體剪輯 |
PC(自組、約4萬元/台×1台) |
Adobe Audition |
網路用:MP3、取樣率:44.1 kHz / 16bit / sample。 |
約580小時 |
取得之原始檔案格式不一,有CD和MP3,故統一轉檔為MP3格式。 |
約9萬 |
|
5 |
全文資料輸入與校稿 |
人數:8 能力:會使用Microsoft Office軟體 |
PC(工作者自家電腦) |
Windows XP Microsoft Office 2003 |
檔案內容格式必須設定統一之標準。 |
約2000小時 |
易受工讀生工作是否拖延產生後續進度延宕的狀況。 |
約20萬元 |
|
6 |
建立Metadata |
人數:4 能力:會使用Microsoft Office軟體、剪接影音內容以及影像處理軟體。 |
PC(工作者自家電腦) |
Windows XP Microsoft Office 2003 Photoshop CS3 Adobe Audition |
依照Dublin Core為標準,討論設計出符合該計畫數位化藏品之欄位。 |
約1200小時 |
易受工讀生工作是否拖延產生後續進度延宕的狀況。 |
約20萬元 |
|
7 |
Metadata資料審核 |
人數:2 能力:計畫主持人、共同主持人。 |
PC(自組、約3萬元/台) NB(IBM、X31、約5萬元/台) |
Windows XP Microsoft Office 2003 |
無 |
約2400小時 |
資料審核者其中為圖書管理專業領域學者。 |
||
8 |
匯入伺服器備份 |
人數:12 能力:會使用FlashFXP、NERO |
PC(自組、約3萬元/台) |
Windows XP FlashFXP NERO |
備份方式: 1.FTP伺服器 2.資料庫 3.燒錄DVD光碟 |
約900小時 |
需要常常檢查FTP是否運作正常以利其他人方便上傳備份 |
||
9 |
網站建置與維護 |
人數:1 能力:熟悉資料庫運作 |
PC(自組、約4萬元/台) |
SQL Server2000 |
.NET platform |
約1000小時 |
資料庫升級後提高所收納資料的價值、正確性以及未來進行線上檢索的速度 |
約17萬 |
註:若程序多於七個,請複製本表使用
調查人:蔡欣蓓 調查地點:國立交通大學傳播研究所 調查日期:2007年12月
全文下載 (2.3 MB, 1,430 hits)