用於發送簡訊的語音輸入方法
2023-06-07 03:21:51 1
專利名稱:用於發送簡訊的語音輸入方法
技術領域:
本發明涉及本一種語音輸入方法,特別涉及一種用於發送簡訊的語音輸入方法。
背景技術:
隨著行動通訊裝置的普遍使用,應用在行動通訊裝置上的輸入方法也越來越重要。由於行動通訊裝置上一般均不會設置太多按鍵,在有限的按鍵上鍵入信息往往耗時費力,通常需不斷的在屏幕選單中上下搜尋才能取得想要輸入的信息。且行動通訊裝置的按鍵大小通常都比較小,不符合人體工學上的設計需求,使用者按鍵久了會有手指痛等症狀,因此語音輸入方法在行動通訊裝置上應用成為必然的趨勢。另外,行動通訊裝置均設置有發送簡訊的功能,發送簡訊是時尚年輕人喜愛的聯絡方式之一,但是已有技術中的發送簡訊均需通過按鍵來完成,會造成上述不便。
如圖1所示,圖1為已有技術的一種語音輸入方法示意圖,其中至少包含語音接收模塊11、語音辨識模塊12以及語音資料庫13。語音接收模塊11接收外界語音信號14,該語音信號14一般為使用者的語音信號。接著語音辨識模塊12對語音信號14進行分析,由於語音信號14通常為連續發音的文字,需要將連續發音的文字進行辨識,語音辨識模塊12還可包含音節辨識器121。音節辨識器121用以將連續發音的語音信號14拆解成連續的單音信號。以中文普通話為例,單音信號大約為一千三百多種,包含平仄四聲等發音方式以及音調等等,但是對應的中文文字卻有數十萬字,即使以常用中文字也有五萬餘字。一個單音信號對應多個中文文字,所以無法僅憑單獨的單音信號轉換成對應的中文文字,但是有些慣用的規則,例如特定幾個單音信號的順序排列即代表某個特定的文字語詞等,利用紀錄上述慣用規則的語音資料庫13,可以取得單音信號組合對應的句子15。最後將轉換得到的句子15連續輸出即完成語音輸入的方法。該方法可以將接收的語音信號14轉換為對應的句子15後輸出。
如圖2所示,圖2為依據圖1所示的一種語音輸入方法流程圖,首先語音接收模塊接收語音信號S21,其次音節辨識器辨析語音信號成單音信號S22,再次語音辨識模塊以及語音資料庫辨析單音信號組合得到句子S23,最後輸出句子到對應的接收裝置S24。
上述的語音輸入方法具有免動手輸入的方便性,且使用者只需會說話發聲即可使用該語音輸入方法。但是由於各地方使用者口音不盡相同,往往使得語音辨識模塊在辨識語音信號時造成誤判,反而讓使用者在修改誤判時花費更多精力,造成極度不便。又由於單音信號組合對應文字詞語的數據量非常龐大,且實時處理前述的對應關係需要使用高速處理單元進行處理,因此已有技術中的該語音輸入方法大多局限於計算機等具有龐大儲存媒體以及脈衝較高、信號較強的中央處理器的工具可以使用,而一般行動通訊裝置由於內部儲存媒體較少,且中央處理單元執行效率也較慢,這些因素使得較難實施上述語音輸入方法。尤其在行動通訊裝置發送簡訊這項功能上,如果要以上述的語音輸入方法進行簡訊發送,則勢必要建立龐大的語音資料庫,這樣會減慢行動通訊裝置的執行效率,以及增加開機時間等等,反而無法達到預期的效果。
筆劃輸入法為目前一般行動通訊裝置都具有的一種輸入方法,其實施方式是將一個字拆解成多個筆劃單元的排列,而筆劃單元的總數一般為六個,可由行動通訊裝置上的按鍵鍵入該筆劃單元,而取得對應的文字。以中文文字為例,其中多個筆劃單元可為「橫」、「豎」、「撇」、「捺」、「折」及「勾」,所對應的文字結構單元為「一」、「丨」、「丿」、「乀」、「乛」及「亅」,可以由該些筆劃單元的順序組合而得對應的文字。以文字「王」為例,其拆解的文字結構單元順序組合為「一一丨一」,當使用者依序輸入「橫」、「橫」、「豎」、「橫」的筆劃單元組合時,即可輸入文字「王」的信息。
如圖3所示,圖3為已有技術的一種筆劃輸入法的示意圖,其中至少包含輸入模塊31、處理單元32以及資料庫33。輸入模塊31可為鍵盤或為按鍵,用以接收使用者鍵入的輸入信號34並將該輸入信號轉換成對應的筆劃單元後,傳送至處理單元32。當處理單元32接收到多個筆劃單元後,通過資料庫33比較該多個筆劃單元順序組合對應的文字35,若有符合的文字35,則輸出該文字35。其中資料庫33含有該多個筆劃單元對應該文字的對照表。以中文文字為例,中文常用字有數萬字,當使用者鍵入的筆劃單元個數不足以順序組合出對應的特定文字時,此筆劃輸入法可提供多個候選字供使用者選擇,其中該多個候選字對應的筆劃單元順序組合均可滿足使用者輸入的筆劃單元。
如圖4所示,圖4為圖3的一種用於發送簡訊的筆劃輸入法的流程圖。首先使用者利用輸入裝置鍵入筆劃單元S41,接著利用資料庫根據使用者輸入筆劃單元順序組合篩選可能的候選字S42,其中候選字對應的筆劃單元順序組合均可滿足使用者輸入的筆劃單元,由於顯示屏幕可能放不下所有的候選字,使用者可以捲動窗口尋找正確的候選字,以決定候選字是否正確S43?若是,則確認文字S44即為該候選字,並輸出,若否,則使用者繼續鍵入筆劃單元S41,以縮小篩選可能的候選字S42的範圍讓使用者確認。接著,系統會詢問是否輸入完畢S45?若否,則使用者則繼續鍵入筆劃單元S41,以繼續輸入文字作為簡訊的組合,若是,則可進行設定收件人S46,接著發送簡訊S47。
上述已有技術用於發送簡訊的筆劃輸入法的特點在於其資料庫很小,不需要很大的儲存媒體即可實施此筆劃輸入法,又由於中文文字結構的特殊性,將中文文字拆解成筆劃單元的順序組合非常容易讓使用者使用,該種筆劃輸入法特別適用於中文文字的輸入,但不僅限於中文文字的輸入。另外,由於此筆劃輸入法在輸入每一個文字時,均需要使用者確認,如此可以大幅降低誤判等錯誤情事的發生。儘管筆劃輸入法具有上述的種種特點,但是仍需要使用鍵盤或按鍵鍵入相關信息,造成非常不便,尤其對於行動通訊裝置而言,其設置的按鍵大小通常都比較小,不符合人體工學上的設計需求,使用者按鍵久了甚至會有手指痛等症狀。另外,有些年老的使用者視力並不是很好,要看清楚較小的按鍵是件吃力的事情,使上述用於發送簡訊的筆劃輸入法無用武之地。
發明內容
本發明所要解決的技術問題是提供一種用於發送簡訊的語音輸入方法,該方法可以不需要龐大的儲存媒體,誤判率較低,辨識速度較快。
為解決上述技術問題,本發明一種用於發送簡訊的語音輸入方法,首先,語音接收模塊接收預設語音信號,其中該預設語音信號可為使用端預先設定的語音信號,使用端可為使用者。其次,語音辨識模塊辨識上述預設語音信號並取得該預設語音信號對應的多個筆劃單元,其中該筆劃單元可對應於文字結構單元,藉由多個筆劃單元的順序組合可對應特定文字。第三步,在紀錄前述對應關係的資料庫中取得該多個筆劃單元對應的文字作為簡訊的組合。最後,發送簡訊。
本發明提供的一種於行動通訊裝置中發送簡訊的語音輸入方法,使用者無需按鍵即可發送簡訊,可以讓使用者發送簡訊更加方便;且由於該預設語音信號為使用者預先輸入,可配合使用者口音而使辨識率提高;本發明不需要龐大的儲存媒體存放語音資料庫,非常適合在行動通訊裝置上使用。
下面結合附圖和實施例對本發明作進一步描述圖1為已有技術的一種語音輸入方法的功能模塊示意圖;圖2為對應於圖1的一種語音輸入方法流程圖;圖3為已有技術的一種筆劃輸入法的功能模塊示意圖;圖4為對應於圖3的一種用於發送簡訊的筆劃輸入法的流程圖;
圖5為本發明用於發送簡訊的語音輸入方法功能模塊示意圖;圖6為本發明用於發送簡訊的語音輸入方法流程圖;圖7為本發明中預先設定預設語音信號的流程圖;圖8為依據本發明的用於發送簡訊的語音輸入方法的操作流程示意圖;圖9為延續圖8的用於發送簡訊的語音輸入方法的操作流程示意圖。
其中11為語音接收模塊;12為語音辨識模塊;121為音節辨識器;13為語音資料庫;14為語音信號;15為句子;31為輸入模塊;32為處理單元;33為資料庫;34為輸入信號;35為文字;51為語音接收模塊;52為語音辨識模塊;53為預設語音信號;54為文字;S21-S24、S41-S47、S61-S69、S71-S74為流程步驟;S81-S89為屏幕畫面。
具體實施例方式
本發明提出一種用於發送簡訊的語音輸入方法,適用於在行動通訊裝置中發送簡訊,先將使用者輸入的預設語音信號轉換為對應的筆劃單元,利用資料庫搜尋出該筆劃單元順序組合對應的文字作為該簡訊的組合,在發送簡訊。
如圖5所示,圖5為本發明用於發送簡訊的語音輸入方法功能模塊示意圖。其中至少包含語音接收模塊51、語音辨識模塊52、處理單元32以及資料庫33。首先,語音接收模塊51接收預設語音信號53,該預設語音信號53可為使用端預先設定的語音信號,其中使用端可為使用者。其次,語音辨識模塊52對預設語音信號53進行分析。由於預設語音信號53為使用者預先輸入,所以可以依據先前紀錄使用者的口音語調而能迅速準確地將預設語音信號53轉換為對應的多個筆劃單元。其中該筆劃單元可對應於文字結構單元,由多個筆劃單元的順序組合可對應於特定文字。以中文文字為實施例,其中多個筆劃單元可為「橫」、「豎」、「撇」、「捺」、「折」及「勾」,其所對應的文字結構單元為「一」、「丨」、「丿」、「乀」、「乛」及「亅」,可以由該些筆劃單元的順序組合而得對應的文字。以文字「王」為例,其拆解的文字結構單元順序組合為「一一丨一」,當依序輸入「橫」、「橫」、「豎」、「橫」的筆劃單元組合時,即可輸入文字「王」的信息。由於筆劃單元的數量不多,對應的預設語音信號也就不多,也因此不需要很龐大的儲存媒體存放預設語音信號轉換筆劃單元的語音資料庫。再次,處理單元32接收到多個筆劃單元,通過資料庫比較該多個筆劃單元順序組合對應的文字54,若有符合的文字54,則輸出該文字54。在此實施例中,該資料庫33含該多個筆劃單元對應該文字的對照表。最後,將該文字作為簡訊的組合,並發送該簡訊。又以中文文字為例,其常用字有數萬字,當使用者鍵入的筆劃單元個數不足以順序組合出對應的特定文字時,筆劃輸入法可提供多個候選字供使用者選擇,其中該多個候選字對應的筆劃單元順序組合均可滿足使用者輸入的筆劃單元。
如圖6所示,圖6為本發明用於發送簡訊的語音輸入方法流程圖。首先,啟動簡訊功能S61;第二步,語音接收模塊接收預設語音信號S62。其中該預設語音信號為使用者發出;第三步,語音辨識模塊分析該預設語音信號並取得對應的筆劃單元S63;第四步,通過資料庫依據筆劃單元順序組合可能的候選字S64;第五步,使用者可以在屏幕顯示錶中尋找正確的候選字,以決定候選字是否正確S65?若是,則進行第六步確認文字S66;即為該候選字並輸出,若否,則回到第二步語音接收模塊接收預設語音信號S62;語音辨識模塊分析該預設語音信號並取得對應的筆劃單元S63;縮小篩選可能的候選字範圍S64,決定候選字是否正確S65,直到第六步使用者確認文字S66;第七步,系統會詢問是否輸入完畢S67;若否,則回到第二步使用者輸入預設語音信號使語音接收模塊繼續接收預設語音信號S62,以繼續輸入文字作為簡訊的組合;若是,則進行第八步繼續利用語音輸入設定收件人S68;第九步,發送簡訊S69。
如圖7所示,圖7為本發明中預先設定預設語音信號的流程圖。第一步,使用者輸入預設語音信號S71;其中預設語音信號對應筆劃單元。以筆劃單元「橫」為例,預設語音信號為使用者說出「橫」的讀音,第二步,使用者確認預設語音信號對應的筆劃單元S72;第三步,儲存設定S73;由於可設定不止一個預設語音信號,因此,第四步,行動通訊裝置接著會詢問使用者是否設定完成S74。若否,則回到第一步,使用者再次輸入預設語音信號S71;若是,則完成預先設定筆劃單元對應的預設語音信號。
如圖8所示,圖8為依據本發明的用於發送簡訊的語音輸入方法的操作流程示意圖,針對行動通訊裝置屏幕的畫面說明本發明的語音輸入方法的操作流程。首先如S81所示,進入語音輸入功能選單,系統會顯示要求使用者輸入內容。以使用者欲輸入文字「王」為例,使用者發出語音信號,該語音信號為「橫」的讀音,用以表示「橫」的筆劃單元,即為「一」的文字結構單元。當使用者輸入後,如S82所示,系統屏幕會顯示「一」的文字結構單元,並根據該對應的筆劃單元順序組合搜尋出可能的候選字,並顯示在屏幕上。由於屏幕容量有限無法顯示所有的候選字,所以系統會自動挑出較常用的顯示在屏幕上,如「一二三大天木」,由於文字「王」並不在屏幕顯示上,使用者必須要繼續輸入語音信號。接著,使用者又輸入「橫」的讀音的語音信號,如S83所示,系統屏幕會顯示「一一」的文字結構單元,並根據該對應的筆劃單元順序組合搜尋出可能的候選字,並顯示在屏幕上,由於S83與S82的筆劃單元順序組合不同,故對應的候選字也會不同,如「二三天青表次」。繼續如S84所示,使用者繼續輸入「豎」以及「橫」的語音信號,而系統屏幕顯示對應「一一丨一」的文字結構單元,並根據該對應的筆劃單元順序組合搜尋出可能的候選字,並顯示在屏幕上,由於文字「王」已經顯示在屏幕的候選字中,使用者可用語音輸入確認,系統自動彈出數字標號,如S85所示。最後如S86所示,由於文字「王」對應於1的數字標號,所以使用者可直接語音輸入『1』的讀音,以選取該對應的文字。
如圖9所示,圖9為延續圖8的用於發送簡訊的語音輸入方法的操作流程示意圖。當使用者輸入完簡訊文字後,可以語音輸入「發送簡訊」的讀音,系統跳出設定收件者的畫面,在本實施例中,則為輸入收件者電話號碼,如S87所示,接著如S88所示,使用者可直接語音輸入「0937123456」的讀音以輸入電話號碼,最後確認發送簡訊,則如S89所示,屏幕顯示發送簡訊中的相關內容。
本發明提供的一種用於發送簡訊的語音輸入方法,先將使用者輸入的預設語音信號轉換為對應的筆劃單元,利用資料庫搜尋出該筆劃單元順序組合對應的文字作為該簡訊的組合,不需要龐大的儲存媒體以存放語音資料庫,使得非常適合於行動通訊裝置上使用。
權利要求
1.一種用於發送簡訊的語音輸入方法,其特徵在於,包含以下步驟第一步,語音接收模塊接收預設語音信號;第二步,語音辨識模塊辨識上述預設語音信號並獲取該語音信號對應的多個筆劃單元;第三步,資料庫中調用上述多個筆劃單元對應的文字作為該簡訊的組合。
2.如權利要求1所述的一種用於發送簡訊的語音輸入方法,其特徵在於,所述的預設語音信號為外部語音信號。
3.如權利要求1所述的一種用於發送簡訊的語音輸入方法,其特徵在於,所述的多個筆劃單元包括「橫」、「豎」、「撇」、「捺」、「折」及「勾」。
4.如權利要求1所述的一種用於發送簡訊的語音輸入方法,其特徵在於,所述的資料庫含有所述的多個筆畫單元及對應文字的對照表。
5.如權利要求1所述的一種用於發送簡訊的語音輸入方法,其特徵在於,資料庫中包含利用所述的多個筆劃單元的各種排列方式排列所對應的文字。
6.如權利要求1所述的一種用於發送簡訊的語音輸入方法,其特徵在於,所述的文字為中文文字。
全文摘要
本發明公開了一種用於發送簡訊的語音輸入方法。首先利用語音接收模塊接收預設語音信號,其中該預設語音信號可為使用端預先設定的語音信號。接著利用語音辨識模塊取得該預設語音信號對應的多個筆劃單元,其中多個筆劃單元的順序組合可對應特定文字。最後利用記錄前述對應關係的資料庫取得該多個筆劃單元對應的文字作為簡訊的組合,並發送該簡訊。本發明採用語音筆畫輸入方式,不佔用大的存儲空間,適合移動通訊各種設備。
文檔編號H04M1/27GK1873776SQ200510026359
公開日2006年12月6日 申請日期2005年6月1日 優先權日2005年6月1日
發明者朱元博, 蔡世光, 何代水 申請人:英華達(上海)電子有限公司