一種語音控制的方法及對應的系統、終端設備與流程

2023-11-07 03:58:52 5

本發明涉及終端設備控制
技術領域：
：，尤其涉及一種語音控制的方法及對應的系統、終端設備。
背景技術：
：：隨著通信領域相關技術(特別是語音技術)的快速提升，語音技術正快速應用於移動電子設備中，目前語音技術實現的功能越來越多，為了提升產品的品味，很多產品都加入了語音控制的功能。然而，目前技術的語音控制中，如果用戶想要使用語音控制功能，必須要打斷當前終端設備正在運行任務，然後進入到單獨的語音界面，之後再說語音指令。這樣不僅給用戶帶來較差的用戶體驗，而且極大地限制了語音控制的應用場景。此外，也有這樣的一種場景，通過先在終端設備上預置某些語音文件，並指定對應的功能，當用戶輸入的語音和預置的語音文件中的語音匹配時執行對應的功能。但是這種做法不但佔用系統的內存，而且只能識別某些特定的語音，完成某些少數特定的功能，不僅不夠智能，而且也限制了語音控制的使用範圍。當然，也有更智能一點的做法，是在終端設備中預先預置一個文本文件，該文本文件中包含該終端設備支持的所有的文字形式的關鍵詞，終端設備在接收到用戶輸入的語音時，將語音轉換成文字，然後和文本中的關鍵詞進行匹配，完成關鍵詞對應的指令。該方法雖然在一定程度上給用戶帶來很大方便，但其支持的指令仍然有限的，當用戶輸出的語音超出預置關鍵詞的範圍時，則不支持語音控制，因此，該方法也是很不智能。技術實現要素：本發明的主要目的在於提出一種語音控制的方法及對應的系統、終端設備，旨在解決現有技術的語音控制的方法操作比較機械，完成功能有限，且大大限制語音控制的使用場景，從而給用戶帶來不好體驗感的技術問題。為實現上述目的，本發明提供的一種語音控制的方法，該方法包括以下步驟：通過語音錄入模塊對用戶輸入的語音進行錄入，並通過語音轉換模塊將錄入的語音轉換成文字指令；將文字指令與預存的動作關鍵詞集進行匹配，以獲取待操作指令動詞；遍歷搜索由用戶打開的當前待語音控制界面中的所有信息，並將文字指令與當前待語音控制界面中的所有信息進行匹配，以獲取待操作指令名詞；將獲取的待操作指令動詞和待操作指令名詞組成待操作指令，並根據待操作指令完成相應的語音控制。優選地，將文字指令與預存的動作關鍵詞集進行匹配，以獲取待操作指令動詞具體包括：當文字指令僅匹配到預存的動作關鍵詞集中的一個關鍵詞時，則該關鍵詞為待操作指令動詞；當文字指令未匹配到預存的動作關鍵詞集中的任何一個關鍵詞時，則將預設的默認關鍵詞作為待操作指令動詞。優選地，將文字指令與當前待語音控制界面中的所有信息進行匹配，以獲取待操作指令名詞具體包括：將文字指令與當前待語音控制界面中的各個視圖對應的文字以及各個按鈕對應的文字進行匹配，當文字指令匹配到當前待語音控制界面中的某一個視圖或某一個按鈕，則該視圖或按鈕為待操作指令名詞。優選地，所述語音控制的方法還包括：當文字指令未匹配到當前待語音控制界面中的某一個視圖或某一個按鈕時，遍歷搜索終端設備中其它界面的各個視圖對應的文字，以及各個按鈕對應的文字，當文字指令匹配到其它界面中的某一個視圖或某一個按鈕，則該視圖或按鈕為待操作指令名詞。優選地，所述語音控制的方法還包括：當文字指令匹配到預存的動作關鍵詞集中的兩個或兩個以上關鍵詞時，結束流程。為實現上述目的，本發明還提供了一種語音控制的系統，該系統包括：文字指令生成模塊，用於通過語音錄入模塊對用戶輸入的語音進行錄入，並通過語音轉換模塊將錄入的語音轉換成文字指令；第一獲取模塊，用於將文字指令與預存的動作關鍵詞集進行匹配，以獲取待操作指令動詞；第二獲取模塊，用於遍歷搜索由用戶打開的當前待語音控制界面中的所有信息，並將文字指令與當前待語音控制界面中的所有信息進行匹配，以獲取待操作指令名詞；以及操作指令生成模塊，用於將獲取的待操作指令動詞和待操作指令名詞組成待操作指令，並根據待操作指令完成相應的語音控制。優選地，第一獲取模塊包括：第一待操作指令動詞獲取單元，用於當文字指令僅匹配到預存的動作關鍵詞集中的一個關鍵詞時，則該關鍵詞為待操作指令動詞；第二待操作指令動詞獲取單元，用於當文字指令未匹配到預存的動作關鍵詞集中的任何一個關鍵詞時，則將預設的默認關鍵詞作為待操作指令動詞。優選地，第二獲取模塊包括：第一待操作指令名詞獲取單元，用於將文字指令與當前待語音控制界面中的各個視圖對應的文字以及各個按鈕對應的文字進行匹配，當文字指令匹配到當前待語音控制界面中的某一個視圖或某一個按鈕，則該視圖或按鈕為待操作指令名詞。優選地，所述語音控制的系統還包括：結束流程模塊，用於當文字指令匹配到預存的動作關鍵詞集中的兩個或兩個以上關鍵詞時，結束流程。為實現上述目的，本發明還提供了一種終端設備，包括上述任一項所述的語音控制的系統。本發明提出的語音控制的方法及對應的系統、終端設備，通過語音錄入模塊先把語音錄入到終端中，再把語音轉換成文字，再把轉換後的文字中，分兩步識別，第一步識別其中的動詞(比如打開、關閉、進入、返回)，第二步通過該文字查找終端設備中當前界面的視圖，如果視圖上的文字包含在語音轉換的文字中，就表示要對當前視圖進行操作。這樣就得到了完整的終端設備可識別的操作指令(比如：打開照相機)，從而便完成相應的語音操作。本發明可以在任何界面操作任何一個有文字描述的視圖，使語音能夠控制終端設備上的每一個帶文字描述的視圖，從而使得指令不單單是少量的關鍵詞，進而大大提高了語音控制的使用場景，即大大地提升了用戶體驗感。附圖說明圖1為實現本發明各個實施例的移動終端設備的硬體結構示意圖；圖2為如圖1所示的移動終端設備的無線通信系統示意圖；圖3為本發明語音控制的方法提出的第一實施例的方法流程圖；圖4為本發明語音控制的方法提出的第二實施例的方法流程圖；圖5為本發明語音控制的方法提出的第三實施例的方法流程圖；圖6為本發明語音控制的系統提出的第四實施例的結構框圖；圖7為本發明語音控制的系統提出的第五實施例的結構框圖。本發明目的的實現、功能特點及優點將結合實施例，參照附圖做進一步說明。具體實施方式應當理解，此處所描述的具體實施例僅僅用以解釋本發明，並不用於限定本發明。在後續的描述中，使用用於表示元件的諸如「模塊」、「部件」或「單元」的後綴僅為了有利於本發明的說明，其本身沒有特定的意義。因此，「模塊」、「部件」或「單元」可以混合地使用。終端設備可以以各種形式來實施。例如，本發明中描述的終端設備可以包括諸如手機、平板電腦、筆記本電腦、掌上電腦、個人數字助理(personaldigitalassistant，pda)、便捷式媒體播放器(portablemediaplayer，pmp)、導航裝置、可穿戴設備、智能手環、計步器等移動終端設備，以及諸如數字tv、臺式計算機等固定終端設備。後續描述中將以移動終端設備為例進行說明，本領域技術人員將理解的是，除了特別用於移動目的的元件之外，根據本發明的實施方式的構造也能夠應用於固定類型的終端設備。請參閱圖1，其為實現本發明各個實施例的一種移動終端設備的硬體結構示意圖，該移動終端設備100可以包括：rf(radiofrequency，射頻)單元101、wifi模塊102、音頻輸出單元103、a/v(音頻/視頻)輸入單元104、傳感器105、顯示單元106、用戶輸入單元107、接口單元108、存儲器109、處理器110、以及電源111等部件。本領域技術人員可以理解，圖1中示出的移動終端設備結構並不構成對移動終端設備的限定，移動終端設備可以包括比圖示更多或更少的部件，或者組合某些部件，或者不同的部件布置。下面結合圖1對移動終端設備的各個部件進行具體的介紹：射頻單元101可用於收發信息或通話過程中，信號的接收和發送，具體的，將基站的下行信息接收後，給處理器110處理；另外，將上行的數據發送給基站。通常，射頻單元101包括但不限於天線、至少一個放大器、收發信機、耦合器、低噪聲放大器、雙工器等。此外，射頻單元101還可以通過無線通信與網絡和其他設備通信。上述無線通信可以使用任一通信標準或協議，包括但不限於gsm(globalsystemofmobilecommunication，全球移動通訊系統)、gprs(generalpacketradioservice，通用分組無線服務)、cdma2000(codedivisionmultipleaccess2000，碼分多址2000)、wcdma(widebandcodedivisionmultipleaccess,寬帶碼分多址)、td-scdma(timedivision-synchronouscodedivisionmultipleaccess，時分同步碼分多址)、fdd-lte(frequencydivisionduplexing-longtermevolution，頻分雙工長期演進)和tdd-lte(timedivisionduplexing-longtermevolution，分時雙工長期演進)等。wifi屬於短距離無線傳輸技術，移動終端設備通過wifi模塊102可以幫助用戶收發電子郵件、瀏覽網頁和訪問流式媒體等，它為用戶提供了無線的寬帶網際網路訪問。雖然圖1示出了wifi模塊102，但是可以理解的是，其並不屬於移動終端設備的必須構成，完全可以根據需要在不改變發明的本質的範圍內而省略。音頻輸出單元103可以在移動終端設備100處於呼叫信號接收模式、通話模式、記錄模式、語音識別模式、廣播接收模式等等模式下時，將射頻單元101或wifi模塊102接收的或者在存儲器109中存儲的音頻數據轉換成音頻信號並且輸出為聲音。而且，音頻輸出單元103還可以提供與移動終端設備100執行的特定功能相關的音頻輸出(例如，呼叫信號接收聲音、消息接收聲音等等)。音頻輸出單元103可以包括揚聲器、蜂鳴器等等。a/v輸入單元104用於接收音頻或視頻信號。a/v輸入單元104可以包括圖形處理器(graphicsprocessingunit，gpu)1041和麥克風1042，圖形處理器1041對在視頻捕獲模式或圖像捕獲模式中由圖像捕獲裝置(如攝像頭)獲得的靜態圖片或視頻的圖像數據進行處理。處理後的圖像幀可以顯示在顯示單元106上。經圖形處理器1041處理後的圖像幀可以存儲在存儲器109(或其它存儲介質)中或者經由射頻單元101或wifi模塊102進行發送。麥克風1042可以在電話通話模式、記錄模式、語音識別模式等等運行模式中經由麥克風1042接收聲音(音頻數據)，並且能夠將這樣的聲音處理為音頻數據。處理後的音頻(語音)數據可以在電話通話模式的情況下轉換為可經由射頻單元101發送到移動通信基站的格式輸出。麥克風1042可以實施各種類型的噪聲消除(或抑制)算法以消除(或抑制)在接收和發送音頻信號的過程中產生的噪聲或者幹擾。移動終端設備100還包括至少一種傳感器105，比如光傳感器、運動傳感器以及其他傳感器。具體地，光傳感器包括環境光傳感器及接近傳感器，其中，環境光傳感器可根據環境光線的明暗來調節顯示面板1061的亮度，接近傳感器可在移動終端設備100移動到耳邊時，關閉顯示面板1061和/或背光。作為運動傳感器的一種，加速計傳感器可檢測各個方向上(一般為三軸)加速度的大小，靜止時可檢測出重力的大小及方向，可用於識別手機姿態的應用(比如橫豎屏切換、相關遊戲、磁力計姿態校準)、振動識別相關功能(比如計步器、敲擊)等；至於手機還可配置的指紋傳感器、壓力傳感器、虹膜傳感器、分子傳感器、陀螺儀、氣壓計、溼度計、溫度計、紅外線傳感器等其他傳感器，在此不再贅述。顯示單元106用於顯示由用戶輸入的信息或提供給用戶的信息。顯示單元106可包括顯示面板1061，可以採用液晶顯示器(liquidcrystaldisplay，lcd)、有機發光二極體(organiclight-emittingdiode,oled)等形式來配置顯示面板1061。用戶輸入單元107可用於接收輸入的數字或字符信息，以及產生與移動終端設備的用戶設置以及功能控制有關的鍵信號輸入。具體地，用戶輸入單元107可包括觸控面板1071以及其他輸入設備1072。觸控面板1071，也稱為觸控螢幕，可收集用戶在其上或附近的觸摸操作(比如用戶使用手指、觸筆等任何適合的物體或附件在觸控面板1071上或在觸控面板1071附近的操作)，並根據預先設定的程式驅動相應的連接裝置。觸控面板1071可包括觸摸檢測裝置和觸摸控制器兩個部分。其中，觸摸檢測裝置檢測用戶的觸摸方位，並檢測觸摸操作帶來的信號，將信號傳送給觸摸控制器；觸摸控制器從觸摸檢測裝置上接收觸摸信息，並將它轉換成觸點坐標，再送給處理器110，並能接收處理器110發來的命令並加以執行。此外，可以採用電阻式、電容式、紅外線以及表面聲波等多種類型實現觸控面板1071。除了觸控面板1071，用戶輸入單元107還可以包括其他輸入設備1072。具體地，其他輸入設備1072可以包括但不限於物理鍵盤、功能鍵(比如音量控制按鍵、開關按鍵等)、軌跡球、滑鼠、操作杆等中的一種或多種，具體此處不做限定。進一步的，觸控面板1071可覆蓋顯示面板1061，當觸控面板1071檢測到在其上或附近的觸摸操作後，傳送給處理器110以確定觸摸事件的類型，隨後處理器110根據觸摸事件的類型在顯示面板1061上提供相應的視覺輸出。雖然在圖1中，觸控面板1071與顯示面板1061是作為兩個獨立的部件來實現移動終端設備的輸入和輸出功能，但是在某些實施例中，可以將觸控面板1071與顯示面板1061集成而實現移動終端設備的輸入和輸出功能，具體此處不做限定。接口單元108用作至少一個外部裝置與移動終端設備100連接可以通過的接口。例如，外部裝置可以包括有線或無線頭戴式耳機埠、外部電源(或電池充電器)埠、有線或無線數據埠、存儲卡埠、用於連接具有識別模塊的裝置的埠、音頻輸入/輸出(i/o)埠、視頻i/o埠、耳機埠等等。接口單元108可以用於接收來自外部裝置的輸入(例如，數據信息、電力等等)並且將接收到的輸入傳輸到移動終端設備100內的一個或多個元件或者可以用於在移動終端設備100和外部裝置之間傳輸數據。存儲器109可用於存儲軟體程序以及各種數據。存儲器109可主要包括存儲程序區和存儲數據區，其中，存儲程序區可存儲作業系統、至少一個功能所需的視圖(比如聲音播放功能、圖像播放功能等)等；存儲數據區可存儲根據手機的使用所創建的數據(比如音頻數據、電話本等)等。此外，存儲器109可以包括高速隨機存取存儲器，還可以包括非易失性存儲器，例如至少一個磁碟存儲器件、快閃記憶體器件、或其他易失性固態存儲器件。處理器110是移動終端設備的控制中心，利用各種接口和線路連接整個移動終端設備的各個部分，通過運行或執行存儲在存儲器109內的軟體程序和/或模塊，以及調用存儲在存儲器109內的數據，執行移動終端設備的各種功能和處理數據，從而對移動終端設備進行整體監控。處理器110可包括一個或多個處理單元；優選的，處理器110可集成應用處理器和調製解調處理器，其中，應用處理器主要處理作業系統、用戶界面和視圖等，調製解調處理器主要處理無線通信。可以理解的是，上述調製解調處理器也可以不集成到處理器110中。移動終端設備100還可以包括給各個部件供電的電源111(比如電池)，優選的，電源111可以通過電源管理系統與處理器110邏輯相連，從而通過電源管理系統實現管理充電、放電、以及功耗管理等功能。儘管圖1未示出，移動終端設備100還可以包括藍牙模塊等，在此不再贅述。為了便於理解本發明實施例，下面對本發明的移動終端設備所基於的通信網絡系統進行描述。請參閱圖2，圖2為本發明實施例提供的一種通信網絡系統架構圖，該通信網絡系統為通用移動通信技術的lte系統，該lte系統包括依次通訊連接的ue(userequipment，用戶設備)201，e-utran(evolvedumtsterrestrialradioaccessnetwork，演進式umts陸地無線接入網)202，epc(evolvedpacketcore，演進式分組核心網)203和運營商的ip業務204。具體地，ue201可以是上述終端設備100，此處不再贅述。e-utran202包括enodeb2021和其它enodeb2022等。其中，enodeb2021可以通過回程(backhaul)(例如x2接口)與其它enodeb2022連接，enodeb2021連接到epc203，enodeb2021可以提供ue201到epc203的接入。epc203可以包括mme(mobilitymanagemententity，移動性管理實體)2031，hss(homesubscriberserver，歸屬用戶伺服器)2032，其它mme2033，sgw(servinggateway，服務網關)2034，pgw(pdngateway，分組數據網絡網關)2035和pcrf(policyandchargingrulesfunction，政策和資費功能實體)2036等。其中，mme2031是處理ue201和epc203之間信令的控制節點，提供承載和連接管理。hss2032用於提供一些寄存器來管理諸如歸屬位置寄存器(圖中未示)之類的功能，並且保存有一些有關服務特徵、數據速率等用戶專用的信息。所有用戶數據都可以通過sgw2034進行發送，pgw2035可以提供ue201的ip地址分配以及其它功能，pcrf2036是業務數據流和ip承載資源的策略與計費控制策略決策點，它為策略與計費執行功能單元(圖中未示)選擇及提供可用的策略和計費控制決策。ip業務204可以包括網際網路、內聯網、ims(ipmultimediasubsystem，ip多媒體子系統)或其它ip業務等。雖然上述以lte系統為例進行了介紹，但本領域技術人員應當知曉，本發明不僅僅適用於lte系統，也可以適用於其他無線通信系統，例如gsm、cdma2000、wcdma、td-scdma以及未來新的網絡系統等，此處不做限定。基於上述移動終端設備硬體結構以及通信網絡系統，提出本發明方法各個實施例。本發明提出的一種語音控制的方法，應用於終端設備(移動終端設備)中，通過語音錄入模塊先把語音錄入到終端中，再把語音轉換成文字，再把轉換後的文字中，分兩步識別，第一步識別其中的動詞(比如打開、關閉、進入、返回)，第二步通過該文字查找終端設備中當前界面的視圖，如果視圖上的文字包含在語音轉換的文字中，就表示要對當前視圖進行操作。這樣就得到了完整的終端設備可識別的操作指令(比如：打開照相機)，從而便完成相應的語音操作。本發明可以在任何界面操作任何一個有文字描述的視圖，使語音能夠控制終端設備上的每一個帶文字描述的視圖，從而使得指令不單單是少量的關鍵詞，進而大大提高了語音控制的使用場景，即大大地提升了用戶體驗感。實施例一如圖3所示，本發明語音控制的方法提出的第一實施例的方法流程圖，該方法包括以下步驟：s300，通過語音錄入模塊對用戶輸入的語音(如「打開照相機拍照」)進行錄入，並通過語音轉換模塊將錄入的語音轉換成文字指令(如「打開照相機拍照」)。上述語音錄入模塊的功能是將錄入的語音轉換成文字指令，其可採用現有技術的功能模塊實現，且基本原理是將人的話音轉換成聲音信號，經過特殊處理，與計算機中已存儲的已有聲音信號進行比較，然後反饋出識別的結果。上述語音轉換模塊的功能是將錄入的語音轉換成文字指令，其可採用現有技術的功能模塊實現，且基本原理是讓機器通過識別和理解過程把語音信號轉變為相應的文本或命令的高技術。其主要包括特徵提取技術、模式匹配準則及模型訓練技術三個方面。s301，將文字指令與預存的動作關鍵詞集進行匹配，且當文字指令僅匹配到預存的動作關鍵詞集中的一個關鍵詞(如「打開」)時，則該關鍵詞為待操作指令動詞(如「打開」)。該步驟s301中，所述預存的動作關鍵詞集是指預先存儲在終端設備中的一些動作關鍵詞，例如包括打開、關閉、進入和返回等，當然包含且不限於這些關鍵詞，在此不做一一例舉。優選地，根據用戶需求，還可對預存的動作關鍵詞集中包含的關鍵詞進行增加並更新，以進一步提高了語音控制的使用場景。具體實施中，所述當前待語音控制界面中的所有信息包括所有視圖對應的文字，以及所有按鈕對應的文字，當然還包括當前待語音控制界面中的其它觸控鍵對應的文字，在此不做一一例舉。s302，遍歷搜索由用戶打開的當前待語音控制界面(如launcher桌面界面)中的所有信息，並將文字指令與當前待語音控制界面中的所有信息進行匹配，且當文字指令匹配到當前待語音控制界面中的某一個視圖(如「照相機」對應的視圖)，則該視圖為待操作指令名詞；可以理解的是，當文字指令匹配到當前待語音控制界面中的某一個按鈕或其它某一個觸控鍵時，則該按鈕或觸控鍵為待操作指令名詞。s303，將獲取的待操作指令動詞和待操作指令名詞組成待操作指令(如「打開照相機拍照」)，並根據待操作指令完成相應的語音控制，如打開照相機程序。該實施例一通過語音錄入模塊先把語音錄入到終端中，再把語音轉換成文字，再把轉換後的文字中，分兩步識別，第一步識別其中的動詞(比如打開、關閉、進入、返回)，第二步通過該文字查找終端設備中當前界面的視圖，如果視圖上的文字包含在語音轉換的文字中，就表示要對當前視圖進行操作。這樣就得到了完整的終端設備可識別的操作指令(比如：打開照相機)，從而便完成相應的語音操作。本發明可以在任何界面操作任何一個有文字描述的視圖，使語音能夠控制終端設備上的每一個帶文字描述的視圖，從而使得指令不單單是少量的關鍵詞，進而大大提高了語音控制的使用場景，即大大地提升了用戶體驗感。實施例二如圖4所示，本發明語音控制的方法提出的第二實施例的方法流程圖。實施例二與實施例一的技術方案基本相似，區別在於，實施例二還包括步驟s403，即當文字指令未匹配到當前待語音控制界面中的某一個視圖或按鈕時，遍歷搜索終端設備中其它界面的各個視圖的文字以及各個按鈕上的文字，當文字指令匹配到其它界面中的某一個視圖(如「支付寶視圖」)，則該視圖(如「支付寶視圖」)為待操作指令名詞。這樣使得本實施例的語音控制方法更智能，不僅限於用戶打開的當前待語音控制界面，還包括操作終端設備的其它界面，從而進一步增加了用戶的使用體驗感。實施例二的語音控制的方法包括以下步驟：s400，通過語音錄入模塊對用戶輸入的語音(如「關閉支付寶視圖」)進行錄入，並通過語音轉換模塊將錄入的語音轉換成文字指令(如「關閉支付寶視圖」)。該步驟s400中語音錄入模塊和語音轉換模塊所實現的功能與本發明實施例一的功能相同，如其可採用現有技術的功能模塊實現，在此不做重複說明。s401，將文字指令(如「關閉支付寶視圖」)與預存的動作關鍵詞集進行匹配，且當文字指令僅匹配到預存的動作關鍵詞集中的一個關鍵詞(如「關閉」)時，則該關鍵詞為待操作指令動詞(如「關閉」)。該步驟s401中，所述預存的動作關鍵詞集是指預先存儲在終端設備中的一些動作關鍵詞，例如包括打開、關閉、進入和返回等，當然包含且不限於這些關鍵詞，在此不做一一例舉。優選地，根據用戶需求，還可對預存的動作關鍵詞集中包含的關鍵詞進行增加並更新，以進一步提高了語音控制的使用場景。具體實施中，所述當前待語音控制界面中的所有信息包括所有視圖對應的文字，以及所有按鈕對應的文字，當然還包括當前待語音控制界面中的其它觸控鍵對應的文字，在此不做一一例舉。s402，遍歷搜索由用戶打開的當前待語音控制界面(如微信視圖操作界面)中的所有信息，並將文字指令與當前待語音控制界面中的所有信息進行匹配；s403，當文字指令未匹配到當前待語音控制界面中的某一個視圖或按鈕時，遍歷搜索終端設備中其它界面的各個視圖的文字以及各個按鈕上的文字，當文字指令匹配到其它界面中的某一個視圖(如「支付寶視圖」)，則該視圖(如「支付寶視圖」)為待操作指令名詞。可以理解的是，當文字指令匹配到其它界面中的某一個按鈕或其它某一個觸控鍵時，則該按鈕或觸控鍵為待操作指令名詞。s404，將獲取的待操作指令動詞和待操作指令名詞組成待操作指令(如「關閉支付寶視圖」)，並根據待操作指令完成相應的語音控制，如關閉支付寶視圖。該實施例二通過語音錄入模塊先把語音錄入到終端中，再把語音轉換成文字，再把轉換後的文字中，分兩步識別，第一步識別其中的動作關鍵詞，第二步通過該文字查找終端設備中當前界面和/或終端設備的其它界面中的視圖，如果視圖上的文字包含在語音轉換的文字中，就表示要對當前視圖進行操作。這樣就得到了完整的終端設備可識別的操作指令，從而便完成相應的語音操作。本發明實施例的語音控制方法不僅限於用戶打開的當前待語音控制界面，還包括終端設備的其它界面，從而進一步增加了用戶的使用體驗感。實施例三如圖5所示，本發明語音控制的方法提出的第三實施例方法流程圖，實施例三與實施例一基本相似，區別在於，實施例三包括的步驟s501和實施例一包括的步驟s301不同。本實施例三的語音控制的方法包括以下步驟：s500，通過語音錄入模塊對用戶輸入的語音(如「打開ue瀏覽器」)進行錄入，並通過語音轉換模塊將錄入的語音轉換成文字指令(如「打開ue瀏覽器」)。該步驟s500中語音錄入模塊和語音轉換模塊所實現的功能與本發明實施例一、實施例二的功能相同，如其可採用現有技術的功能模塊實現，在此不做重複說明。s501，將文字指令與預存的動作關鍵詞集進行匹配，且當文字指令未匹配到預存的動作關鍵詞集中的任何一個關鍵詞，則將預設的默認關鍵詞(如「打開」)作為待操作指令動詞；具體地，所述預設的默認關鍵詞可由設計人員自由設定，例如其可為「打開」或「關閉」，當然還可以為其它動作關鍵詞，且預設的默認關鍵詞還可定時進行更新，以更加符合用戶需求。在此需說明的是，當文字指令匹配到預存的動作關鍵詞集中的兩個或兩個以上關鍵詞(如「打開」和「關閉」)時，此時說明用戶輸入的語音為無效指令，結束流程。該步驟s501中，所述預存的動作關鍵詞集是指預先存儲在終端設備中的一些動作關鍵詞，例如包括打開、關閉、進入和返回等，當然包含且不限於這些關鍵詞，在此不做一一例舉。優選地，根據用戶需求，還可對預存的動作關鍵詞集中包含的關鍵詞進行增加並更新，以進一步提高了語音控制的使用場景。具體實施中，所述當前待語音控制界面中的所有信息包括所有視圖對應的文字，以及所有按鈕對應的文字，當然還包括當前待語音控制界面中的其它觸控鍵對應的文字，在此不做一一例舉。s502，遍歷搜索由用戶打開的當前待語音控制界面(如launcher桌面界面)中的所有信息，並將文字指令與當前待語音控制界面中的所有信息進行匹配，且當文字指令匹配到當前待語音控制界面中的某一個視圖(如「ue瀏覽器」對應的視圖)，則該視圖為待操作指令名詞(如「ue瀏覽器」對應的視圖)；s503，將獲取的待操作指令動詞和待操作指令名詞組成待操作指令(如「打開ue瀏覽器」)，並根據待操作指令完成相應的語音控制，如打開ue瀏覽器。在此需說明的是，當文字指令匹配到預存的動作關鍵詞集中的兩個或兩個以上關鍵詞(如「打開」和「關閉」)時，此時說明用戶輸入的語音為無效指令，結束流程。同理，當在上述步驟s502中，文字指令匹配到當前待語音控制界面中的某一個視圖(如「ue瀏覽器」對應的視圖或「圖片」對應視圖)，此時說明用戶輸入的語音為無效指令，結束流程。該實施例三通過語音錄入模塊先把語音錄入到終端中，再把語音轉換成文字，再把轉換後的文字中，分兩步識別，第一步識別其中的動詞(比如打開、關閉、進入、返回)，第二步通過該文字查找終端設備中當前界面的視圖，如果視圖上的文字包含在語音轉換的文字中，就表示要對當前視圖進行操作。這樣就得到了完整的終端設備可識別的操作指令(比如：打開ue瀏覽器)，從而便完成相應的語音操作。本發明可以在任何界面操作任何一個有文字描述的視圖，使語音能夠控制終端設備上的每一個帶文字描述的視圖，從而使得指令不單單是少量的關鍵詞，進而大大提高了語音控制的使用場景，即大大地提升了用戶體驗感。本發明還提出了一種語音控制的系統，該系統應用於終端設備(如移動終端設備)，下面通過具體實施例詳細闡述該系統的工作原理。實施例四如圖6所示，本發明語音控制的系統提出了第四實施例的結構框圖，該系統包括：文字指令生成模塊600，用於通過語音錄入模塊對用戶輸入的語音(如「打開照相機拍照」)進行錄入，並通過語音轉換模塊將錄入的語音轉換成文字指令(如「打開照相機拍照」)；該文字指令生成模塊600中語音錄入模塊和語音轉換模塊所實現的功能與本發明上述語音控制的方法的功能相同，如其可採用現有技術的功能模塊實現，在此不做重複說明。第一獲取模塊601，用於將文字指令與預存的動作關鍵詞集進行匹配，且當文字指令僅匹配到預存的動作關鍵詞集中的一個關鍵詞(如「打開」)時，則該關鍵詞為待操作指令動詞(如「打開」)；該第一獲取模塊601中，所述預存的動作關鍵詞集是指預先存儲在終端設備中的一些動作關鍵詞，例如包括打開、關閉、進入和返回等，當然包含且不限於這些關鍵詞，在此不做一一例舉。優選地，根據用戶需求，還可對預存的動作關鍵詞集中包含的關鍵詞進行增加並更新，以進一步提高了語音控制的使用場景。第二獲取模塊602，用於遍歷搜索由用戶打開的當前待語音控制界面(如launcher桌面界面)中的所有信息，並將文字指令與當前待語音控制界面中的所有信息進行匹配，且當文字指令匹配到當前待語音控制界面中的某一個視圖(如「照相機」對應的視圖)，則該視圖為待操作指令名詞；以及操作指令生成模塊603，用於將獲取的待操作指令動詞和待操作指令名詞組成待操作指令(如「打開照相機拍照」)，並根據待操作指令完成相應的語音控制，如打開照相機拍照。本實施例四通過語音錄入模塊先把語音錄入到終端中，再把語音轉換成文字，再把轉換後的文字中，分兩步識別，第一步識別其中的動詞(比如打開、關閉、進入、返回)，第二步通過該文字查找終端設備中當前界面的視圖，如果視圖上的文字包含在語音轉換的文字中，就表示要對當前視圖進行操作。這樣就得到了完整的終端設備可識別的操作指令(比如：打開照相機)，從而便完成相應的語音操作。本發明可以在任何界面操作任何一個有文字描述的視圖，使語音能夠控制終端設備上的每一個帶文字描述的視圖，從而使得指令不單單是少量的關鍵詞，進而大大提高了語音控制的使用場景，即大大地提升了用戶體驗感。實施例五如圖7所示，本發明語音控制的系統提出了第五實施例的結構框圖。實施例五與實施例四基本相似，區別在於，實施例五還包括搜索模塊702，且實施例五的第二獲取模塊703與實施例四的第二獲取模塊602所執行的功能不同。本實施例五的語音控制的系統包括：文字指令生成模塊700，用於通過語音錄入模塊對用戶輸入的語音(如「關閉支付寶視圖」)進行錄入，並通過語音轉換模塊將錄入的語音轉換成文字指令(如「關閉支付寶視圖」)。該文字指令生成模塊700中語音錄入模塊和語音轉換模塊所實現的功能與本發明實施例一的功能相同，如其可採用現有技術的功能模塊實現，在此不做重複說明。第一獲取模塊701，用於將文字指令(如「關閉支付寶視圖」)與預存的動作關鍵詞集進行匹配，且當文字指令僅匹配到預存的動作關鍵詞集中的一個關鍵詞(如「關閉」)時，則該關鍵詞為待操作指令動詞(如「關閉」)。該第一獲取模塊701中，所述預存的動作關鍵詞集是指預先存儲在終端設備中的一些動作關鍵詞，例如包括打開、關閉、進入和返回等，當然包含且不限於這些關鍵詞，在此不做一一例舉。優選地，根據用戶需求，還可對預存的動作關鍵詞集中包含的關鍵詞進行增加並更新，以進一步提高了語音控制的使用場景。具體實施中，所述當前待語音控制界面中的所有信息包括所有視圖對應的文字，以及所有按鈕對應的文字，當然還包括當前待語音控制界面中的其它觸控鍵對應的文字，在此不做一一例舉。搜索模塊702，用於遍歷搜索由用戶打開的當前待語音控制界面(如微信視圖操作界面)中的所有信息，並將文字指令與當前待語音控制界面中的所有信息進行匹配；第二獲取模塊703，用於當文字指令未匹配到當前待語音控制界面中的某一個視圖或按鈕時，遍歷搜索終端設備中其它界面的各個視圖的文字以及各個按鈕上的文字，當文字指令匹配到其它界面中的某一個視圖(如「支付寶視圖」)，則該視圖(如「支付寶視圖」)為待操作指令名詞。操作指令生成模塊704，用於將獲取的待操作指令動詞和待操作指令名詞組成待操作指令(如「關閉支付寶視圖」)，並根據待操作指令完成相應的語音控制，如關閉支付寶視圖。本實施例五通過語音錄入模塊先把語音錄入到終端中，再把語音轉換成文字，再把轉換後的文字中，分兩步識別，第一步識別其中的動作關鍵詞，第二步通過該文字查找終端設備中當前界面和/或終端設備的其它界面中的視圖，如果視圖上的文字包含在語音轉換的文字中，就表示要對當前視圖進行操作。這樣就得到了完整的終端設備可識別的操作指令，從而便完成相應的語音操作。本發明實施例五的語音控制方法不僅限於用戶打開的當前待語音控制界面，還包括終端設備的其它界面，從而進一步增加了用戶的使用體驗感。本發明還提供了一種終端設備，該終端設備包括上述任一實施例的語音控制的系統。所述終端設備可為移動終端、掌上電腦等其它智能終端設備，在此不做一一例舉。需要說明的是，在本文中，術語「包括」、「包含」或者其任何其他變體意在涵蓋非排他性的包含，從而使得包括一系列要素的過程、方法、物品或者裝置不僅包括那些要素，而且還包括沒有明確列出的其他要素，或者是還包括為這種過程、方法、物品或者裝置所固有的要素。在沒有更多限制的情況下，由語句「包括一個……」限定的要素，並不排除在包括該要素的過程、方法、物品或者裝置中還存在另外的相同要素。上述本發明實施例序號僅僅為了描述，不代表實施例的優劣。通過以上的實施方式的描述，本領域的技術人員可以清楚地了解到上述實施例方法可藉助軟體加必需的通用硬體平臺的方式來實現，當然也可以通過硬體，但很多情況下前者是更佳的實施方式。基於這樣的理解，本發明的技術方案本質上或者說對現有技術做出貢獻的部分可以以軟體產品的形式體現出來，該計算機軟體產品存儲在一個存儲介質(如rom/ram、磁碟、光碟)中，包括若干指令用以使得一臺終端設備(可以是手機，計算機，伺服器，空調器，或者網絡設備等)執行本發明各個實施例所述的方法。上面結合附圖對本發明的實施例進行了描述，但是本發明並不局限於上述的具體實施方式，上述的具體實施方式僅僅是示意性的，而不是限制性的，本領域的普通技術人員在本發明的啟示下，在不脫離本發明宗旨和權利要求所保護的範圍情況下，還可做出很多形式，這些均屬於本發明的保護之內。當前第1頁12當前第1頁12

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

一種語音控制的方法及對應的系統、終端設備與流程

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法