利用語音操作電腦的系統及方法
2023-05-31 13:58:56
利用語音操作電腦的系統及方法
【專利摘要】本發明涉及一種電腦控制系統與方法,尤其涉及一種利用語音控制電腦的系統和方法。本發明的利用語音操作電腦的系統,包括聲音過濾模塊、聲音處理模塊、控制指令識別模塊、語音指令編碼庫、電腦控制模塊、電腦系統、聲音朗讀模塊,聲音過濾模塊通過聲音處理模塊與控制指令識別模塊連接,控制指令識別模塊分別與語音指令編碼庫、電腦控制模塊連接,電腦控制模塊分別與電腦系統、聲音朗讀模塊連接。本發明的使用語音操作電腦的系統和方法,可以讓用戶通過自己的語音完成對電腦的操作,極大地方便了用戶使用電腦,並增強了電腦用戶的使用感受。
【專利說明】利用語音操作電腦的系統及方法
【技術領域】
[0001]本發明涉及一種電腦控制系統與方法,尤其涉及一種利用語音控制電腦的系統和方法。
【背景技術】
[0002]現在電腦上已經集成了各種前沿技術,例如觸控、體感等,但是傳統的操作電腦的方式還是使用滑鼠、鍵盤。對於雙手不方便的用戶來說,如何使用電腦成了一種奢望。
[0003]語音識別技術,也被稱為自動語音識別,其目標是將人類的語音中的詞彙內容轉換為計算機可讀的輸入,例如按鍵、二進位編碼或者字符序列。與說話人識別及說話人確認不同,後者嘗試識別或確認發出語音的說話人而非其中所包含的詞彙內容。
[0004]語音識別技術的應用包括語音撥號、語音導航、室內設備控制、語音文檔檢索、簡單的聽寫數據錄入等。語音識別技術與其他自然語言處理技術如機器翻譯及語音合成技術相結合,可以構建出更加複雜的應用,例如語音到語音的翻譯。
【發明內容】
[0005]本發明的技術效果能夠克服上述缺陷,提供一種利用語音操作電腦的系統,其可以通過語音控制電腦的操作,解放了雙手。
[0006]為實現上述目的,本發明採用如下技術方案:其包括聲音過濾模塊、聲音處理模塊、控制指令識別模塊、語音指令編碼庫、電腦控制模塊、電腦系統、聲音朗讀模塊,聲音過濾模塊通過聲音處理模塊與控制指令識別模塊連接,控制指令識別模塊分別與語音指令編碼庫、電腦控制模塊連接,電腦控制模塊分別與電腦系統、聲音朗讀模塊連接。
[0007]本發明可以利用語音操作電腦,包括但不限於打開記事本、打開音樂播放器等。可以讓用戶通過自己的語音完成對電腦的操作,極大地方便了用戶使用電腦,並增強了電腦用戶的使用感受。克服了現有技術中使用滑鼠、鍵盤操作電腦的習慣,解放雙手,提供一種使用語音技術,較快捷地操作電腦,通過電腦麥克風接收用戶的聲音,聲音過濾模塊對聲音進行過濾,識別出有效聲音數據,並傳給聲音處理模塊,聲音處理模塊負責把有效聲音轉換為電腦控制數據,並傳給電腦控制模塊,電腦控制模塊把把電腦控制數據轉換為電腦操作指令,並操作電腦執行相應的指令,同時把執行結果反饋給聲音朗讀模塊,把執行結果朗讀出來。
[0008]本發明的另一個目的是提供一種利用語音操作電腦的方法,包括如下步驟:
[0009](I)聲音過濾模塊接收電腦麥克風聲音數據;
[0010](2)聲音過濾模塊將聲音數據進行預處理,傳遞給聲音處理模塊;
[0011](3)聲音處理模塊對聲音數據進行處理,處理後的數據包括喚醒數據和識別數據;
[0012](4)喚醒數據交由喚醒引擎處理,喚醒引擎比對喚醒關鍵詞,判斷是否高於預設門限值,是,返回到步驟(I);否,結束識別;[0013](5)識別數據交由識別引擎處理,匹配語音控制指令,判斷是否匹配結果大於預設置信度,是,執行電腦操作後,結束識別;否,直接結束識別。
[0014]本發明的使用語音操作電腦的系統和方法,可以讓用戶通過自己的語音完成對電腦的操作,極大地方便了用戶使用電腦,並增強了電腦用戶的使用感受。針對現有技術,使用滑鼠、鍵盤操作電腦的習慣,解放雙手,提供一種使用語音技術,較快捷地操作電腦的技術。對於雙手不方便的用戶來說,也可以快速操作電腦。
【專利附圖】
【附圖說明】
[0015]圖1為本發明的模塊示意圖;
[0016]圖2為本發明的流程示意圖。
【具體實施方式】
[0017]本發明的利用語音操作電腦的系統包括聲音過濾模塊、聲音處理模塊、控制指令識別模塊、語音指令編碼庫、電腦控制模塊、電腦系統、聲音朗讀模塊,聲音過濾模塊通過聲音處理模塊與控制指令識別模塊連接,控制指令識別模塊分別與語音指令編碼庫、電腦控制模塊連接,電腦控制模塊分別與電腦系統、聲音朗讀模塊連接。
[0018]本發明的利用語音操作電腦的方法,包括如下步驟:
[0019](I)聲音過濾模塊接收電腦麥克風聲音數據;
[0020](2)聲音過濾模塊將聲音數據進行預處理,傳遞給聲音處理模塊;
[0021](3)聲音處理模塊對聲音數據進行處理,處理後的數據包括喚醒數據和識別數據;
[0022](4)喚醒數據交由喚醒引擎處理,喚醒引擎比對喚醒關鍵詞,判斷是否高於預設門限值,是,返回到步驟(I);否,結束識別;
[0023](5)識別數據交由識別引擎處理,匹配語音控制指令,判斷是否匹配結果大於預設置信度,是,執行電腦操作後,結束識別;否,直接結束識別。
[0024]所述門限值是指,接收到的喚醒聲音數據域預設喚醒關鍵詞的聲音數據比對值,如果該值高於預設門限值,則認為喚醒關鍵詞正確,可以把軟體喚醒,否則,不喚醒軟體。
[0025]所述門限值可以根據用戶使用環境設置。
[0026]所述控制指令語音編碼庫是指,對可以識別到的控制指令提前進行語音編碼,並存儲在電腦軟體中。
[0027]所述控制指令語音編碼庫中的指令,控制指令與語音編碼是一一對應的關係,即不能出現一個語音對應多個指令,或者多個語音對應一個指令的情況。
[0028]所述預設的置信度是指,本次輸入識別出的語音指令與語音編碼庫中的指令進行比對,其比對值為置信度,如果置信度大於預設值,則認為是正確語音指令,否則,認為屬於無效指令。
[0029]識別出正確的電腦操作指令後,則去執行相應的電腦操作,並把執行結果朗讀出來。例如,識別出關機指令後,則去關閉電腦,並朗讀「正在為您執行關機」。執行完電腦操作指令後,識別結束。
[0030]所述執行結果包括:執行正確,朗讀「正在為您執行***」;執行錯誤,則朗讀「本地識別錯誤」。
【權利要求】
1.一種利用語音操作電腦的系統,其特徵在於,包括聲音過濾模塊、聲音處理模塊、控制指令識別模塊、語音指令編碼庫、電腦控制模塊、電腦系統、聲音朗讀模塊,聲音過濾模塊通過聲音處理模塊與控制指令識別模塊連接,控制指令識別模塊分別與語音指令編碼庫、電腦控制模塊連接,電腦控制模塊分別與電腦系統、聲音朗讀模塊連接。
2.一種利用語音操作電腦的方法,其特徵在於,包括如下步驟: (1)聲音過濾模塊接收電腦麥克風聲音數據; (2)聲音過濾模塊將聲音數據進行預處理,傳遞給聲音處理模塊; (3)聲音處理模塊對聲音數據進行處理,處理後的數據包括喚醒數據和識別數據; (4)喚醒數據交由喚醒引擎處理,喚醒引擎比對喚醒關鍵詞,判斷是否高於預設門限值,是,返回到步驟(1);否,結束識別; (5)識別數據交由識別引擎處理,匹配語音控制指令,判斷是否匹配結果大於預設置信度,是,執行電腦操作後 ,結束識別;否,直接結束識別。
【文檔編號】G10L15/00GK103902034SQ201210584336
【公開日】2014年7月2日 申請日期:2012年12月30日 優先權日:2012年12月30日
【發明者】於忠清, 王兵, 張鋒, 翟偉偉, 崔九梅, 王愛玲, 趙紅雷 申請人:青島海爾軟體有限公司