數位典藏觀察室 » Blog Archive » 常見輸入方式概述

常見輸入方式概述

內容發展分項計畫/程婉如94.10

　　目前市面上有多種輸入方式，能讓使用者接受的程度也不盡相同，依其設計理念與目標對象的使用動機有密切關係。若要同時達到「簡單易學」、「功能完整」、「操作方便」、「經濟實用」等四大目標實不容易，端視使用者如何選擇適合自己並能永續學習的輸入方法。目前常用的四種輸入方式有：鍵盤輸入法、手寫輸入法、語音辨識法、OCR光學文字辨識法。

一、鍵盤輸入法（Keyboard）

　　鍵盤輸入法是上述輸入法中發展最久者，因鍵盤是每部電腦主要配備，可用於輸入之基本鍵數，一般而言約有26個英文字母鍵、10個數字鍵及11個符號鍵，使用時亦不需特殊工具，且多數系統已內含不少輸入法，乃為目前主要的輸入方式。鍵盤輸入法其實是從電腦的內建字元集當中挑選出所要的字元，再經由輸入程式將該字元的字元碼傳送給應用程式。以英文字元而言，總數還不及100個，而中文字集則包含上萬個字，使得中文輸入要比英文輸入複雜許多，為解決因中文字數龐大所引起的難題，於是各式各樣的中文輸入法陸續發展出來。早期以使用者直接人工選字的「直選式輸入法」，現多只保留「內碼輸入法」，其主要用以輸入特殊符號。目前逐漸發展為主流的輸入方式為電腦協助選字的「委選式輸入法」，其基本方式有「音碼輸入法」及「形碼輸入法」。

1.音碼輸入法（注音類─注音符號）

定義：以字的發音為主，每一個音對應一個字鍵，組字時依照發音順序輸入。

優點：

不必記字根，會唸便可

沒有複雜的組字規則，輸入簡單

缺點：

不會唸的字無法輸入

同音字多，選字耗時

常見輸入法：注音、自然、微軟、漢音、何式、許氏注音、普實台文、漢語拼音、注音二式、客語注音、鐵雄一號、零壹注音、大千注音等。

2.形碼輸入法（字根類─拆字）

定義：將字分解為數個字根，組字時依照一定規則輸入字根所代表的鍵

優點：

不必認得字也可拆字碼

同碼字少，可快速輸入（輸入時無須注視螢光幕）

缺點：

字根數太多，需要相當時間訓練

取碼規則和書寫習慣不一致，邏輯性較差

　　常見輸入法：倉頡（三代、簡易、標準、快速）、嘸蝦米、大易、四角號碼、三角碼、婆婆、簡單、饒氏筆形、五筆字型、輕鬆、行列（三十、四十）、王碼二代、華象直覺、象形王碼、文宜快鍵、盛興、快碼等。

二、手寫輸入法（Handwritten Recognition）

　　手寫辨識能讓使用者透過最自然的手寫方式進行文字輸入，讓電腦辨識出使用者筆跡，取代以鍵盤打字的輸入方式。手寫辨識的輸入設備有許多種，像是透過電磁感應數位觸控式手寫板、感壓式(Touch Pad)手寫板，或是PDA上的觸控面板等。舉例而言：微軟Tablet PC手寫辨識輸入設備中，內含數位筆（digitizer）、特殊LCD螢幕以及辨識軟體等。

　　這幾年手寫中文辨識系統開發進展得很快，例如寫易、博士筆、蒙恬筆、筆通手寫精靈、懶人筆、精品漢筆等上市產品。操作環境簡易上手，只要會寫字即可，如果擁有手寫辨識PC，就能簡單幾筆便可形成簡單的繪畫和文字，立即迅速發出郵件。假若收到需簽字確認的資料，只需手寫簽上命令便可立即回覆。而手寫文字既可以圖像格式保存，以便於日後進行修改，在書寫記憶部分也可進行全文檢索，較不至於發生搜尋不到紙本文件的窘境。雖然辨識成功率與個人寫字習慣有關，但對於不會輸入的人，總是一個解決輸入的方法，故多半吸引完全不會中文輸入的使用者，唯使用光筆或電子筆在手寫板或數位板上操作與拿筆紙之真實感覺不同，筆劃順序、字形標準、書法工整性與接觸壓力都很重要，需加以調適，且其速度與寫字相仿，動作次數較頻繁者容易疲勞。目前手寫辨識技術也正向實用化邁進，進一步應用技術為筆跡鑑別技術，此目的不作為辨別文字，而是針對書寫者筆跡進行鑑定，涉及簽名筆跡辨識大多用於刑事或民事訴訟等案件等，是未來值得深究的方向之ㄧ。

三、語音辨識法（Speech Recognition）

　　回顧人類歷史，必然先語言後留下文字記錄，「語言」是人與人之間最佳的溝通橋樑，在網際網路盛行的時代，如何以聲音和電腦溝通？語音輸入可望大幅縮短了人類與電腦之間的距離，其最大好處在於輕鬆簡單，使用者不必強記任何規則，會說話即可。

　　語音辨識最主要的目的是希望電腦能夠聽懂人類說話的聲音，透過麥克風的傳導，將聲音（類比信號）轉變成電腦易處理的數位信號，以設計好的程式進行聲波比對，進而執行聲音與內建樣本文字相對應工作。語音辨識技術依照辨識對象的變化程度，而有不同的困難度。語音特性的變化因素包括：不同語者的變化（聲帶特徵、說話方式、口音）、噪音、環境變化、電腦系統配備等。

　　目前中文語音辨識技術已漸漸成熟，上市者有成功大學研發的「音中仙」、聲碩公司與台灣大學合作的「說亦通」、聲碩公司與碁峰公司合作的「任你說」、IBM「Via Voice快樂頌」、IBM與翔威國際合作的「超級耳朵」、IBM與蒙恬科技公司合作的「聽寫王」、蘋果電腦推出的「神筆天韻」等軟體，目前國內推出連續語音輸入產品的業者大多是採IBM「Via Voice」與國科會產學計畫「金聲三號」為核心技術，產品兼具語言及手寫辨識功能；另外，為因應大量資料輸入之需要，亦研發數位錄音機，可將錄下來的類比聲音直接數位化，應用在演講記錄等極為便利。

附註：所謂的語音辨識有別於語者辨識（Speech Identification），語音辨識著重的是聲音代表的意義，而語者辨識是要辨識說話者的身份，兩者各不同的應用範圍，前者可應用於將聲音轉成文字的場合，而後者可用在門禁系統等。

四、OCR光學文字辨識法（Optical Character Recognition）

　　近年來電腦技術日新月異，網路資訊蓬勃發展，以及各種生動活潑的多媒體影音技術，不僅帶給人們相當的方便性，也為未來無紙張的世界鋪路。然而，對於現存的大量紙張式文件，如何將其數位化，以方便保存與快速流通，則是愈顯重要的課題。傳統將整張文件掃描經過壓縮存成影像檔的儲存方法，不僅占用空間龐大，且內文不易修改、編排或複製，一旦涉及建檔、索引、歸類等資料庫處理時更是一項繁瑣且廢時的工作，若能將文件中影像部分壓縮，再利用OCR將文字部分加以數位化轉成字碼方式儲存，則不但節省大量檔案儲存空間，且新增、刪除或修改文字內容均極為容易。

　　因此，OCR光學文字辨識也就應運而生，其中包括文件分析與文字辨識的研究。文件分析包括彩色背景的去除、文件區塊（文字、影像、表格）的分離、直橫排的偵測、閱讀順序的決定等。光學文字辨識則包括文字切割、手寫印刷字的判斷、印刷字體的偵測、手寫及印刷中文和英數字的辨認核心等。然而目前市面上辨識軟體對於多語言夾雜文件的辨識結果仍有待突破，一般而言皆會進行影像處理、版面切割、傾斜校正等前處理，待辨識完成後再加強系統學習功能等後處理，以提高辨識率。目前主要OCR廠商在台灣有力新國際、蒙恬科技、全景軟體，在大陸則以清華文通和北京漢王最著名。

附註：OCR光學文字辨識之軟體、技術分析及實際測試等，可詳閱「期刊報紙全文輸入工作流程參考標準」17~26頁。

加入書籤