語音接聽方法與移動終端裝置製造方法

2023-09-23 05:47:40 4

語音接聽方法與移動終端裝置製造方法【專利摘要】一種語音接聽方法與移動終端裝置，其中移動終端裝置具有通常模式及第一模式。語音接聽方法包括以下步驟。從通常模式切換為第一模式。當於第一模式接收到來電通話時，發送語音通知，並啟動接收語音信號。解析語音信號以獲得語音辨識結果，以及根據語音辨識結果，執行對應的應答操作。【專利說明】語音接聽方法與移動終端裝置【
技術領域：
】[0001]本發明涉及一種語音操控的技術，且特別涉及一種自動開啟免持系統的語音接聽方法與使用此方法的移動終端裝置。【
背景技術：
】[0002]隨著科技的發展，具有語音系統的移動終端裝置已日漸普及。上述的語音系統是通過語音理解技術，讓使用者與移動終端裝置進行溝通。舉例來說，使用者只要對上述的移動終端裝置講出某項要求，例如想要查車次、查天氣或是欲撥打電話等，系統便會依據使用者的語音信號，採取對應的動作。上述的動作可能是以語音方式回答使用者問題或是依照使用者指令去驅使移動終端裝置的系統進行動作。[0003]以語音系統啟動的便捷性來說，目前大都是觸發移動終端裝置的屏幕其所顯示的應用程式來啟動，或者通過移動終端裝置所設置的實體按鍵來啟動。因此，使用者必須直接觸及移動終端裝置的屏幕或所設置的實體按鍵，以通過移動終端裝置本身來啟動語音系統，然而這對於使用者來說，在某些場合，上述的設計卻是相當的不便。比如說：在行車期間，或者在廚房做菜時，需要撥打位於客廳的行動電話，以詢問友人食譜細節等使用者無法立即觸及移動終端裝置，但需使語音系統開啟的情況。更進一步，開啟語音對話後，如何進行更符合人類對話自然規律的完全脫手的多次交互對話。換句話說，目前使用者仍必須通過手，來啟動移動終端裝置的語音系統，而無法做到完全擺脫手的操作。[0004]基此，如何改進上述的這些缺點，成為亟待解決的議題。【
發明內容】[0005]本發明提供一種語音接聽方法與移動終端裝置，其中當移動終端裝置接收到來電通話時，移動終端裝置便會自動開啟其免持系統，方便地讓使用者與移動終端裝置進行語音溝通，且移動終端裝置可根據使用者所說的內容來回應此來電通話，使得使用者在對話過程中不再需要手動參與。藉此，本發明可以實現人機對話的完全脫手，藉以更方便、快速地提供語音服務。[0006]本發明提出一種語音接聽方法，用於具有通常模式及第一模式的移動終端裝置。語音接聽方法包括以下步驟。從通常模式切換為第一模式。當於第一模式接收到來電通話時，發送語音通知，並啟動接收語音信號。解析語音信號以獲得語音辨識結果。根據語音辨識結果，執行對應的應答操作。[0007]本發明另提出一種移動終端裝置，其包括語音輸出單元、語音接收單元、語言理解模塊以及來電通信單元。語音輸出單元用以發送語音通知。語音接收單元用以接收語音信號。語言理解模塊耦接於語音接收單元，用以解析語音信號。來電通信單元耦接於語音輸出單元與語言理解模塊。來電通信單元用以接收來電通話及執行應答操作。其中，移動終端裝置從通常模式切換為第一模式，且當來電通信單元接收來電通話時，來電通信單元通過語音輸出單元發送語音通知，並啟動語音接收單元接收語音信號。並且，語言理解模塊解析語音信號以獲得語音辨識結果，以及來電通信單元根據語音辨識結果執行對應的應答操作。[0008]基於上述，當移動終端裝置在第一模式接收到來電通話時，移動終端裝置可自動發送語音通知以詢問使用者，而讓使用者可根據語音通知，通過語音的方式來操控移動終端裝置進行回應。並且，移動終端裝置可根據來自使用者所說的話，執行對應的應答操作。如此一來，移動終端裝置可自動開啟其免持系統以快速地提供語音服務，讓使用者更加便利且更便捷地通過語音的方式來操控移動終端裝置，藉此，當移動終端裝置接收到來電通話時，使用者可完全脫離手動操作來進行回應。[0009]為讓本發明的上述特徵和優點能更明顯易懂，下文特舉實施例，並配合附圖作詳細說明如下。【專利附圖】【附圖說明】[0010]圖1是依照本發明一實施例所繪示的移動終端裝置的方塊圖。[0011]圖2是依照本發明一實施例所繪示的語音接聽方法的流程圖。[0012]圖3是依照本發明一實施例所繪示的移動終端裝置的方塊圖。[0013]圖4是依照本發明一實施例所繪示的語音操控方法的流程圖。[0014]圖5是依照本發明一實施例所繪示的語音操控方法的流程圖。[0015]【符號說明】[0016]100、300:移動終端裝置[0017]104、304:輔助操控裝置[0018]106、306:語義資料庫[0019]110、310:語音輸出單元[0020]120、320:語音接收單元[0021]130、330:語目理解|旲塊[0022]140、340:來電通信單元[0023]350:語音喚醒模塊[0024]A1:語音應答[0025]C:來電通話[0026]V1、V2、V3:語音信號[0027]SD:語音辨識結果[0028]S0:語音通知[0029]SI:語音信號S202、S204、S206、S208:語音接聽方法的各步驟[0030]S402、S404、S406、S408、S410、S412、S414、S502、S504、S506、S508、S510:語音操控方法的流程圖【具體實施方式】[0031]雖然現今的移動終端裝置已可提供語音系統，以讓使用者發出語音來和移動終端裝置溝通，但使用者在啟動此語音系統時，仍必須通過移動終端裝置本身來啟動。因此在使用者無法立即觸及移動終端裝置，但需使語音系統開啟的情況，往往無法滿足使用者立即的需求。更進一步，即使能夠喚醒語音對話系統，但目前的移動裝置在對話過程中仍然需要手的不時參與，比如使用者提問結束後，需要再次詢問時需要手動再次開啟語音對話系統，極不方便。為此，本發明提出一種語音接聽方法、語音操控方法及移動終端裝置，讓使用者能夠更便捷地開啟語音系統。更進一步，本發明能夠使得使用者在整個對話過程中，擺脫手的操作，使得對話更加便捷快速自然。為了使本發明之內容更為明了，以下特舉實施例作為本發明確實能夠據以實施的範例。[0032]圖1是依照本發明一實施例所繪示的移動終端裝置的方塊圖。請參照圖1，移動終端裝置100具有語音輸出單元110、語音接收單元120、語言理解模塊130以及來電通信單元140。移動終端裝置100例如為行動電話（Cellphone)、個人數字助理（PersonalDigitalAssistant,PDA)手機、智慧型手機（Smartphone),或是安裝有通信軟體的掌上型計算機（PocketPC)、平板型計算機（TabletPC)或筆記型計算機等等。移動終端裝置100可以是任何具備通信功能的可攜式（Portable)移動裝置，在此並不限制其範圍。此外，移動終端裝置100可使用Android作業系統、Microsoft作業系統、Android作業系統、Linux作業系統等等，不限於上述。在本實施例中，移動終端裝置100會通過來電通信單元140接收到來電通話C。當來電通信單元140接收到來電通話C時，移動終端裝置100會通過語音輸出單元110,自動發送語音通知S0以詢問使用者如何進行回應。此時，移動終端裝置100會通過語音接收單元120以接收來自使用者的語音信號SI，並通過語言理解模塊130來對此語音信號SI進行解析以產生語音辨識結果SD。最後，移動終端裝置100會通過來電通信單元140,以根據語音辨識結果SD來執行對應的應答操作。上述的模塊與單元的功能分述如下。[0033]語音輸出單元110例如是揚聲器。語音輸出單元110具有擴音功能，用以輸出語音通知以及來自通話對象的語音。具體來說，當移動終端裝置1〇〇接收到來電通話C時，移動終端裝置100可通過語音輸出單元110發送語音通知S0,以告知使用者來電通話C的來源（例如通話對象）或詢問使用者是否要接聽此來電通話C等等。例如，來電通信單元140可依據來電通話C而通過語音輸出單元110發出關於來電通話C的電話號碼信息，或進而依據聯絡人通信錄而查出撥出此來電通話C的聯絡人名稱，不限於上述。舉例來說，來電通信單元140可通過語音輸出單元110而發送出"王大明給您來電，現在接聽嗎？"、"X公司給您來電，現在接聽嗎？"、"來電是0922-123564,現在接聽嗎？"或"來電是886922-123564，現在接聽嗎？"等關於來電通話C的信息。此外，倘若此來電通話C未提供電話號碼，則來電通信單元140也可通過語音輸出單元110而送出預設的語音通知S0,例如，"這是未知電話，現在接聽嗎？"等等。另一方面，當使用者接通來電通話C後，使用者也會通過語音輸出單元110來進行接聽。[0034]語音接收單元120例如為麥克風，用以接收使用者的聲音，以獲得來自使用者的語音信號SI。[0035]語言理解模塊130耦接於語音接收單元120,用以解析語音接收單元120所接收的語音信號SI，以獲得語音辨識結果。具體而言，語言理解模塊130可包括語音辨識模塊以及語音處理模塊（未繪示），其中，語音辨識模塊可會接收從語音接收單元120傳來的語音信號SI，以將語音信號轉換成多個分段語義(例如詞彙或字句等)。語音處理模塊則可依據這些分段語義而解析出這些分段語義所代表的意指(例如意圖、時間、地點等)，進而判斷出上述語音信號SI中所表示的意思。此外，語音處理模塊還會根據所解析的結果產生對應的應答內容。[0036]更進一步而言，在計算機系統架構下的自然語言理解中，通常會使用固定詞語法來提取語音信號SI的語句，以解析這些語句所意指的指令或意圖（例如接聽來電通話C、拒絕接聽來電通話C或發送簡訊等動作）等，而判斷出語音信號SI的意思，藉以獲得語音辨識結果。在本實施例中，語言理解模塊130的語音處理模塊，可通過語義資料庫106,來查詢語音信號SI中所分割成的分段語義是對應於哪些指令，其中語義資料庫106可記錄有各種分段語義與各種命令的關係。在本實施例中，根據上述各種分段語義，語言理解模塊130的語音處理模塊還可判斷出語音信號SI中哪些是使用者欲回應來電通話C的信息。[0037]舉例來說，當使用者回應"好的"、"接聽"、"接一下"等之類表示要接聽來電通話C的語音信號SI時，語言理解模塊130可通過語義資料庫106來查詢"好的"、"接聽"、"接一下"等所對應的命令，而解析出上述的語音信號SI是用以表示接聽來電通話C。在另一實施例中，當使用者回應"不接"、"不"、"先不接"等之類表示要拒絕接聽來電通話C的語音信號SI時，語言理解模塊130可通過語義資料庫106來查詢"不接"、"不"、"先不接"等所對應的命令，而解析出上述的語音信號SI是用以表示拒絕接聽來電通話C。[0038]在另一實施例中，當使用者回應"先不接，告訴他我到公司後再打電話給他"等之類表示發送訊息以回應來電通話C的語音信號SI時，語言理解模塊130可通過語義資料庫106來查詢"先不接"所對應的命令，而解析出語音信號SI為表示拒絕接聽來電通話C。並且，語言理解模塊130還可通過語義資料庫106來判斷出"告訴他"是表示發送訊息的命令，藉以根據這個命令來執行通信操作，例如是根據這個命令來產生通信信號（如發送簡訊等）。其中，語言理解模塊130還可判斷出"告訴他"之後的語音是表示發送訊息時的應答內容（例如是"到公司後再打電話"）。[0039]需說明的是，在本實施例中，語言理解模塊130可由一個或數個邏輯門組合而成的硬體電路來實作，也可以是以電腦程式代碼來實作。值得一提的是，在另一實施例中，上述的語言理解模塊也可配置於雲端伺服器中。也就是說，移動終端裝置1〇〇也可與雲端伺服器（未繪示）連線，其中雲端伺服器連線具有語言理解模塊。如此一來，移動終端裝置100可將所接收到的語音信號SI，發送給雲端伺服器中的語言理解模塊進行解析，再從雲端伺服器獲得語音辨識結果。[0040]來電通信單元140耦接於語音接收單元120與語言理解模塊130。來電通信單元140用以接收來電通話C及執行通信操作。具體來說，來電通信單元140接收到來電通話C後，可根據使用者的語音（後將詳述），來進行接聽來電通話C、拒接來電通話C、傳送預設語音應答以回應來電通話C，或者傳送簡訊、語音應答等應答信號，以回應來電通話C，其中應答信號中具有使用者欲回應來電通話C的應答內容。[0041]在此說明的是，本實施例的移動終端裝置100具有通常模式及第一模式。其中，第一模式例如是移動終端裝置100用於移動中的行車裝置中而進入車載模式。更具體而言，在此第一模式中，當移動終端裝置100接收到來電通話C時，移動終端裝置100會自動發送語音通知（例如來電通話的來源）以詢問使用者是否接聽這個來電通話C，即移動終端裝置100可自動地開啟其免持系統，以和使用者進行語音交互。相對而言，通常模式例如是移動終端裝置100於非車載模式的時候。亦即，在此通常模式中，移動終端裝置100不會自動發送語音通知以詢問使用者是否接聽這個來電通話C，而無法根據使用者的語音信號來做回應，即移動終端裝置100不會自動地開啟其免持系統。[0042]如此一來，當移動終端裝置100切換為第一模式時，如果移動終端裝置100接收到來電通話，則會發送語音通知使用者，以讓使用者通過語音的方式，傳送語音信號至移動終端裝置100,使得移動終端裝置100可根據使用者所說的話，來回應此來電通話（例如接聽或拒絕接聽來電通話等通信操作）。[0043]需說明的是，本實施例的移動終端裝置100可自動從通常模式切換為第一模式。具體而言，當移動終端裝置100連線於輔助裝置104時，移動終端裝置100可從通常模式切換為第一模式。另一方面，當移動終端裝置1〇〇未連線於輔助裝置104時，移動終端裝置104可從第一模式切換為通常模式。在此，移動終端裝置1〇〇可匹配於輔助裝置104。其中，當移動終端裝置100通過無線傳輸信號或者電性連接於輔助裝置104時，可使移動終端裝置10自動切換為第一模式。[0044]此外，在另一實施例中，當移動終端裝置100用於移動中的行車裝置時，移動終端裝置100也可根據感應行車裝置的速度的大小，來決定是否切換成第一模式。例如，當行車裝置的速度超過閾值時，移動終端裝置100則會從通常模式切換為第一模式。另一方面，當行車裝置的速度未超過閾值時，移動終端裝置100則會從自第一模式切換為通常模式。如此一來，使用者可更加便利地通過語音來操控移動終端裝置100。[0045]圖2是依照本發明一實施例所繪示的語音接聽方法的流程圖。請同時參照圖1及圖2,在步驟202中，移動終端裝置100會從通常模式切換為第一模式。在移動終端裝置100於第一模式的情況下，如步驟S204所示，當來電通信單元140接收到來電通話C時，來電通信單元140會通過語音輸出單元110發送語音通知S0,並啟動語音接收單元120接收語音信號SI。根據上述的語音通知S0,使用者可得知來電通話C的來源，並可通過語音的方式來操控來電通信單元140以回應此來電通話C。因此，當來電通信單元140接收到來電通話C時，來電通信單元140會啟動語音接收單元120以接收來自使用者的語音信號SI。[0046]在步驟S206,語言理解模塊130會解析語音接收單元120所接收到的語音信號SI，以獲得語音辨識結果。在此，語言理解模塊130可接收來自語音接收單元120的語音信號SI，並將語音信號SI分割成多個分段語義。並且，語言理解模塊130會對上述分段語義進行自然語言理解，以辨識出語音信號SI中的應答信息。[0047]接著，在步驟S208,來電通信單元140會根據語言理解模塊130所解析出的語音辨識結果，執行對應的通信操作。在本實施例中，由於使用者可通過語音的方式，以命令移動終端裝置100進行接聽、拒接來電通話C、發送訊息或其他動作以回應來電通話C，因此語言理解模塊130解析語音信號SI之後，可判斷出語音信號SI中的命令。故來電通信單元140可根據語音信號SI中的命令來執行對一的通信操作。上述來電通信單元140所執行通信操作可以是接聽來電通話C、拒絕接聽來電通話C、傳送預設語音應答以回應來電通話C，或者傳送簡訊、語音應答等應答信號，以回應來電通話C，其中應答信號中具有使用者欲回應來電通話C的應答內容。[0048]為了使本領域技術人員進一步了解本實施例來電通信單元140所執行的通信操作，下文再舉諸實施例，其中，仍搭配圖1的移動終端裝置100來進行說明。[0049]當移動終端裝置100切換為第一模式時（例如移動終端裝置100用於移動中的行車裝置中而進入車載模式），假設來電通信單元140接收到來電通話C，且來電通信單元140會通過語音輸出單元110發送"王大明給您來電，現在接聽嗎？"這個語音通知SO。在本實施例中，倘若使用者回應"好的"這個語音信號SI，則來電通信單元140會接聽這個來電通話C。[0050]另一方面，倘若使用者回應"不接"這個語音信號SI，則來電通信單元140會拒絕接聽這個來電通話C。在一實施例中，來電通信單元140還可傳送"您撥的電話暫時無法接聽，請稍後再撥，或在『嗶』聲後留言"這個預設語音應答來回應來電通話C。[0051]此外，倘若使用者回應"先不接，告訴他我到公司後再打電話給他"這個語音信號SI，則來電通信單元140會拒絕接聽這個來電通話C，並且會自語音辨識結果取得應答內容，即"到公司後再打電話"這個應答內容以發送簡訊，其中例如在簡訊中記載"我在開會，稍後再回撥"這個簡訊內容來回應來電通話C。[0052]如此一來，在移動終端裝置100進入車載模式的情況下，移動終端裝置100可自動詢問使用者是否接聽來電通話C，以讓使用者直接通過語音的方式來操控移動終端裝置100進行接聽、拒絕接聽或其他通信操作。[0053]另外需說明的是，本實施利並不限制使用者通過語音的方式來回應來電通話C。在其他實施例中，使用者可通過按壓配置於移動終端裝置100的按鍵（未繪示），以令來電通信單元140進行接聽/拒接。或者，使用者也可通過連線於移動終端裝置100的輔助操控裝置（未繪示）（例如是具有藍牙功能或無線傳輸功能的隨身裝置），來操控來電通信單元140進行接聽/拒接。[0054]依據上述，移動終端裝置100可自動從通常模式切換為第一模式。並且，當來電通信單元140在第一模式接收到來電通話時，語音輸出單元110會發送語音通知以詢問使用者。當使用者發送語音信號時，語言理解模塊130會對此語音信號進行解析，且來電通信單元140會根據語言理解模塊130解析後所獲得的語音辨識結果，執行對應的通信操作。如此一來，移動終端裝置可更快速地提供語音服務，其中當移動終端裝置100在第一模式的情況下，例如用於移動中的行車裝置時，使用者可方便地根據移動終端裝置100所發送的語音通知，通過語音的方式來回應來電通話。藉此，使用者可更加便利地操控移動終端裝置。[0055]圖3是依照本發明一實施例所繪示的移動終端裝置的方塊圖。請參照圖3,移動終端裝置300具有語音輸出單元310、語音接收單元320、語言理解模塊330以及語音喚醒模塊350。本實施例的移動終端裝置300與圖1的移動終端裝置100相似，其不同之處在於：本實施例的移動終端裝置300更具有語音喚醒模塊350。[0056]語音喚醒模塊350用以判斷是否接收到具有識別信息的語音信號。在本實施例中，當語音喚醒模塊350未接收到具有識別信息的語音信號時，語音輸出單元310、語音接收單元320及語言理解模塊330可以處於待機或關閉等模式，即移動終端裝置300不會與使用者進行語音交互。而當語音喚醒模塊350接收到具有識別信息的語音信號時，移動終端裝置300則會啟動語音接收單元320以接收之後的語音信號，並通過語言理解模塊330來進行解析，即移動終端裝置300會依據此語音信號與使用者進行語音交互，且還可執行對應於語音信號的應答操作等。故在本實施例中，使用者可直接以語音的方式，說出具有識別信息的語音（例如特定的詞彙，如名字），來喚醒移動終端裝置300執行語音交互功能。此外，本實施例的語音喚醒模塊350可由一個或數個邏輯門組合而成的硬體電路來實作，也可以是以電腦程式代碼來實作。[0057]值得一提的是，由於語音接收單元320是在語音喚醒模塊350辨識出識別信息之後而被啟動，因此語言理解模塊330可避免對非語音信號（例如雜音信號）進行解析。此夕卜，由於語音喚醒模塊350隻要能辨識出識別信息所對應的音訊（例如"小茜"這個識別信息所對應的音訊），即會判斷所接收到的語音信號具有識別信息，因此語音喚醒模塊350可以不具備有自然語言理解的能力，而具有較低功率的消耗。如此一來，當使用者未提供具有識別信息的語音信號時，移動終端裝置300不會啟動語音交互功能，故移動終端裝置300不僅可方便使用者通過語音來進行操控，也可節省電源消耗。[0058]故在本實施例中，移動終端裝置300可通過語音喚醒模塊350來判斷是否接收到符合識別信息的語音信號（下文以語音信號VI表示），如果是，則移動終端裝置300會啟動語音接收單元320以接收音訊，並且通過語言理解模塊330判斷語音接收單元320是否在語音信號VI之後接收到另一語音信號（下文以語音信號V2表示）。倘若語言理解模塊330判斷語音接收單元320接收到語音信號V2,語言理解模塊330會解析語音信號V2而獲得語音辨識結果，以及判斷語音辨識結果中是否具有可執行請求信息。如果語音辨識結果具有可執行請求信息時，則移動終端裝置300會通過語言理解模塊330執行應答操作，並終止語音交互功能。[0059]然而，如果上述語音接收單元320在語音信號VI之後，未接收到另一語音信號V2，或者，語言理解模塊330解析語音信號V2而獲得的語音辨識結果，不具有可執行請求信息時，則移動終端裝置300會通過語言理解模塊330會執行語音對話模式，以和使用者進行語音溝通。其中，語言理解模塊330在執行語音對話模式時，語言理解模塊330會自動發送語音應答以詢問使用者的請求信息（即使用者的意圖）。此時，語言理解模塊330會判斷使用者所輸出的語音信號是否符合對話終止提示信息，或是否具有可執行請求信息。如果有，則會終止語音對話模式，或者在執行對應的可執行請求信息之後終止語音對話模式；如果否，則語言理解模塊330則會繼續執行語音對話模式，直到使用者所輸出的語音信號符合對話終止提示信息或具有可執行請求信息為止。[0060]以下即搭配上述移動終端裝置300來說明語音操控的方法。圖4是依照本發明一實施例所繪示的語音操控方法的流程圖。請同時參照圖3及圖4,在步驟S402中，語音喚醒模塊350會判斷是否接收到符合識別信息的語音信號（下文以語音信號VI表示）。詳細而言，識別信息可以是特定的詞彙（例如名字）所對應的預設音，其中此預設音會在特定音頻範圍或特定能量範圍之內。也就是說，語音喚醒模塊350可判斷是否接收到在特定音頻範圍或特定能量範圍之內的預設音，而判斷出是否接收到具有識別信息的語音信號VI。在本實施例中，使用者可預先通過移動終端裝置300的系統來設定這個識別信息，例如預先提供識別信息所對應的預設音，而語音喚醒模塊350可通過比對語音信號VI是否符合這個預設音，來判斷語音信號VI是否具有識別信息。舉例來說，假設識別信息為"小茜"這個名字所對應的預設音，則語音喚醒模塊350會判斷是否接收到具有"小茜"的語音信號VI。[0061]倘若語音喚醒模塊350未接收到符合識別信息的語音信號VI，則如步驟S404所示，移動終端裝置300不會啟動語音交互功能。由於語音喚醒模塊350未接收到符合識別信息的語音信號VI，因此語音接收單元320是成關閉狀態或休眠狀態而不會進行語音信號的接收，故移動終端裝置300中的語言理解模塊330不會取得到之後的語音信號來進行解析。舉例來說，假設識別信息為"小茜"，倘若使用者未說出"小茜"而是說出"小王"等其他語音，即語音喚醒模塊350無法接收到符合"小茜"的語音信號VI，故移動終端裝置300的語音交互功能不會被啟動。[0062]在步驟S406中，當語音喚醒模塊350判斷語音信號VI符合識別信息時，移動終端裝置300會啟動語音接收單元320以接收音訊。並且，語言理解模塊330會依據語音接收單元320所接收到的音訊，判斷語音接收單元320是否在語音信號VI之後接收到另一語音信號（下文以語音信號V2表示）。在本實施例中，語言理解模塊330可判斷語音接收單元320所接收到的音訊的能量是否超過一設定值。如果所述音訊的能量未超過設定值，則語言理解模塊330會判斷此音訊為雜音，藉以判斷語音接收單元320未接收到語音信號V2;如果所述音訊的能量已達設定值，則語言理解模塊330可判斷語音接收單元320已接收到語音信號V2,進而根據此語音信號V2來執行後續的步驟。[0063]倘若語言理解模塊330判斷語音接收單元320未接收到語音信號V2,則如步驟S408所示，語言理解模塊330會執行語音對話模式。在語音對話模式中，語言理解模塊330可通過語音輸出單元310發送語音應答，且可通過語音接收單元320繼續接收及解析來自使用者的另一個語音信號，據以做出另一個語音應答或者應答操作，直到語言理解模塊330判斷出具有對話終止提示信息的語音信號，或者移動終端裝置300已完成使用者的命令或請求為止。關於語音對話模式的詳細步驟，將於後詳述（如圖5所示）。[0064]倘若語言理解模塊330判斷語音接收單元320接收到語音信號V2,則如步驟S410所示，語言理解模塊330會解析語音信號V2而獲得語音辨識結果。語言理解模塊330可接收來自語音接收單元320的語音信號V2,並將語音信號V2分割成多個分段語義，以及對上述分段語義進行自然語言理解，以辨識出語音信號V2中的內容。如同圖1的語言理解模塊130,本實施例的語言理解模塊330可依據固定詞語法來提取語音信號V2的語句，以解析這些語句所意指的指令或意圖（例如命令句或者詢問句）等，而判斷出語音信號V2的意思，藉以獲得語音辨識結果。其中，語言理解模塊330可通過語義資料庫306,來查詢語音信號V2中所分割成的分段語義是對應於哪些指令，而上述語義資料庫306可記錄有各種分段語義與各種命令的關係。[0065]接著，如步驟S412所示，語言理解模塊330會判斷語音辨識結果中是否具有可執行請求信息。詳細而言，可執行請求信息例如是指讓移動終端裝置300完成請求操作。也就是說，語言理解模塊330可依據語音辨識結果中的可執行請求信息，讓移動終端裝置300執行一個動作，其中移動終端裝置300例如可通過一個或多個應用程式來完成。舉例來說，當語音信號V2為"幫我打電話給王大明"、"幫我查臺北明天的天氣"或"現在幾點"等，則語音信號V2具有可執行請求信息，因此，語言理解模塊330解析上述語音信號V2後，可令移動終端裝置300撥打電話給王大明、上網查並回報臺北明天的天氣、或者查詢並回報現在的時間等這些動作。[0066]另一方面，如果語音辨識結果不具有可執行請求信息，則表示語言理解模塊330無法依據語音辨識結果而判斷使用者的意圖，因此無法讓移動終端裝置300完成請求操作。舉例來說，當語音信號V2為"幫我打電話"、"幫我查天氣"、"現在"等，則語言理解模塊330解析語音信號V2後，無法令移動終端裝置300完成上述的請求操作。亦即，語言理解模塊330無法判斷出上述語音信號V2中的通話對象、查詢哪一時間內或哪一地點的天氣，以及無法根據一個不具完整語意的句子來執行。[0067]當語音辨識結果具有可執行請求信息時，則如步驟S414所示，語言理解模塊330會執行應答操作，且移動終端裝置300會關閉接收其他語音信號（下文以語音信號V3表示），藉以關閉移動終端裝置300的語音交互功能。[0068]具體來說，當可執行請求信息為操作指令時，則語言理解模塊330會啟動對應於操作指令的操作功能。例如，當可執行請求信息為"調低屏幕的亮度"，則語言理解模塊330會發出一調整亮度的信號於移動終端裝置300的系統，使其將屏幕的亮度調低。此外，當可執行請求信息為詢問句時，則語言理解模塊330會發送對應在此詢問句的語音應答。此時語言理解模塊330可辨識出詢問句中的一個或多個關鍵詞，並依據這些關鍵詞而自搜尋引擎中進行查詢對應的答案，再通過語音輸出單元310來輸出語音應答。例如，當可執行請求信息為"明天台北的溫度是幾度？"，則語言理解模塊330可發出一查詢信號以通過搜尋引擎查詢對應的答案，並通過語音輸出單元310來輸出"明天台北的溫度是26度"這個語音應答。[0069]在此說明的是，由於上述的可執行請求信息會讓移動終端裝置300完成請求操作，因此語言理解模塊330執行應答操作之後，此時的語音接收單元320會成關閉或休眠狀態，而不會接收到其他的語音信號V3。更進一步而言，當語音接收單元320被關閉接收語音信號V3時，如果使用者欲通過語音的方式來令移動終端裝置300執行請求操作，則使用者需再呼叫具有識別信息的語音，藉以通過語音喚醒模塊350來進行判斷，進而再次啟動語首接收單兀320。[0070]當語音辨識結果不具有可執行請求信息時，則如步驟S408所示，語言理解模塊330會執行語音對話模式（關於語音對話模式的詳細步驟，將於後詳述，如圖5所示）。在此，語言理解模塊330會根據語音信號V2通過語音輸出單元310發送語音應答，並且會通過語音接收單元320,繼續接收另一個語音信號。也就是說，語言理解模塊330會繼續接收及解析來自使用者的語音信號，據以做出另一個語音應答或者應答操作，直到語言理解模塊330判斷出具有對話終止提示信息的語音信號，或者移動終端裝置300已完成使用者的命令或請求為止。如此一來，在本實施例中，使用者僅需發送具有識別信息的語音信號，即可方便地與移動終端裝置300進行語音溝通。由於移動終端裝置300可再關閉語音接收單元320之後，再次根據所述具有識別信息的語音信號而自動打開語音交互功能，故使用者可完全地解放雙手，而和移動終端裝置300進行對話，並完全通過語音的方式來操控移動終端裝置300執行對應的應答操作等等。[0071]為了使本領域技術人員進一步了解上述語言理解模塊330所執行的語音對話模式，下文再舉諸實施例為例，其中仍搭配圖3的移動終端裝置300來進行說明。[0072]圖5是依照本發明一實施例所繪示的語音操控方法的流程圖。請同時參照圖3、圖4與圖5,語言理解模塊330在執行語音對話模式（如圖4的步驟S408)時，在圖5的步驟S502中，語言理解模塊330會產生語音應答，下文以語音應答A1表示，並通過語音輸出單元310輸出。由於語言理解模塊330會因未接收到語音信號V2(如圖4的步驟S406)而執行語音對話模式，或者是因接收到不具有可執行請求信息的語音信號V2而執行語音對話模式（如圖4的步驟S412)，故此時，語言理解模塊330會自動發送語音應答A1以詢問使用者的請求信息（即使用者的意圖）。[0073]舉例來說，當語音接收單元320未接收到語音信號V2時，語言理解模塊330可通過語音輸出單元310發送"有什麼事嗎？"、"需要提供什麼服務？"等，不限於此，藉以詢問使用者。此外，當語言理解模塊330所接收到的語音信號V2不具有可執行請求信息時，語言理解模塊330可通過語音輸出單元310發送"您說的是哪一個地方的天氣？"、"您說的是誰的電話？"或"您說的是什麼意思？"等等，不限於此。[0074]需說明的是，語言理解模塊330也可根據這個不具有可執行請求信息的語音信號V2,而找出匹配此語音信號V2的語音應答。換句話說，語言理解模塊330可進入語音聊天的模式，以和使用者進行溝通。其中，語言理解模塊330可透語義資料庫306來實現上述的語音聊天的模式。詳細而言，語義資料庫306可記錄有多種候選答案，而語言理解模塊330依據優先順序來選取這些候選答案的其中之一來作為語音應答。例如，語言理解模塊330可依據眾人使用習慣，以決定這些候選答案的優先順序。或者，語言理解模塊330可依據使用者的喜好或者習慣，以決定這些候選答案的優先順序。值得一提的是，語義資料庫306中也可記錄先前語言理解模塊330所輸出的語音應答的內容，並依據先前的內容來產生語音應答。上述選出語音應答的方法為舉例說明，本實施例並不以此為限制。[0075]當語言理解模塊330通過語音輸出單元310輸出語音應答之後，在步驟S504中，語言理解模塊330會判斷語音接收單元320是否再接收到其他語音信號（下文以語音信號V4表示）。此處與圖4的步驟S406相似，可參照前述的說明。[0076]當語音接收單元320接收語音信號V4時，則如步驟S506所示，語言理解模塊330會判斷語音信號V4是否符合對話終止提示信息，或者語音信號V4是否具有可執行請求信息。對話終止提示信息例如是特定詞彙，用以表示對話終止。亦即，語言理解模塊330會對語音信號V4進行解析，倘若解析到上述的特定詞彙，則判斷語音信號V4符合對話終止提示信息。舉例來說，當語音信號V4符合"再見"或"沒事了"等這些對話終止提示信息，則語音接收單元320不會繼續接收語音信號。另一方面，如果語音信號V4具有可執行請求信息，則語言理解模塊330即會執行對應於可執行請求信息的應答操作。並且，語言理解模塊330會終止語音對話模式，而語音接收單元320亦不再繼續接收語音信號。在此與圖4的步驟S414相似，可參照前述的說明。[0077]在步驟S506中，如果語音信號V4符合對話終止提示信息，或者具有可執行請求信息時，則如步驟S508所示，語言理解模塊330則終止語音對話模式，並終止接收之後的語音信號，據以結束移動終端裝置300和使用者進行語音溝通。也就是說，此時若使用者欲通過語音的方式來操控移動終端裝置300,則需說出具有識別信息（例如"小茜"這個名子）的語音信號，才可再啟動移動終端裝置300執行語音交互。[0078]此外，在步驟S506中，如果語音信號V4不符合對話終止提示信息，亦不具有可執行請求信息時，則回到步驟S502,語言理解模塊330會繼續通過語音輸出單元310發送語音應答來詢問使用者。[0079]另一方面，返回步驟S504,當語音接收單元320未接收到語音信號V4,則如步驟S510所示，語言理解模塊330會判斷於預設時間內未接收到語音信號V4的次數，是否超過預設次數。具體來說，如果於預設時間內未接收到語音信號V4,則語言理解模塊330會記錄一筆次數。如此一來，當所記錄的次數未超過預設次數時，則回到步驟S502,語言理解模塊330會繼續通過語音輸出單元310發送語音應答，藉以詢問使用者的意圖。其中，語言理解模塊330可在語音接收單元320未接收到語音信號V4的預設時間之後，產生語音應答。上述的語音應答例如是"您還在嗎？"、"需要提供什麼服務？"等問句，不限於此。[0080]反之，在步驟S510中，當所記錄的次數為超過預設次數時，則如步驟S508所示，語言理解模塊330會終止此語音對話模式，且語音接收單元320會終止接收之後的語音信號，亦即移動終端裝置300會結束與使用者進行語音溝通，以結束語音交互。[0081]值得一提的是，當移動終端裝置300結束語音交互功能之後，使用者不僅可呼叫具有識別信息的語音信號，以和移動終端裝置300溝通，使用者也可通過輔助操控裝置304,從輔助操控裝置304發出無線傳輸信號至移動終端裝置300,以啟動語音交互功能。在此，移動終端裝置300便會啟動語音接收單元320來接收語音信號。[0082]依據上述，本實施例的移動終端裝置300可據符合識別信息的語音信號，而啟動移動終端裝置300的語音交互功能，藉以可更快速地提供語音服務。其中，在移動終端裝置300未啟動其語音交互功能時，語音喚醒模塊350會偵測符合識別信息的語音信號。倘若語音喚醒模塊350接收到上述符合識別信息的語音信號時，語音接收單元320則會被啟動，以接收在上述語音信號之後的另一個語音信號。之後，語言理解模塊330則會根據上述另一個語音信號來做出應答操作並終止移動終端裝置300的語音交互功能；或者根據上述另一個語音信號發送語音應答，藉以獲得使用者的意圖或和使用者對話，直到解析到對話終止提示信息或做出應答操作為止。如此一來，使用者僅需發送具有識別信息的語音信號，即可方便地與移動終端裝置300進行語音溝通，並在通話過程中可以完全解放雙手，因為移動終端裝置300是在一個對話回合後自動打開語音交互功能。藉此，使用者可更加便利地操控移動終端裝置300。[0083]綜上所述，在本發明的語音接聽方法與移動終端裝置中，移動終端裝置可自動從通常模式切換為第一模式。並且，當移動終端裝置在第一模式接收到來電通話時，移動終端裝置可發送語音通知以詢問使用者，而讓使用者可通過語音的方式發送語音信號來操控移動終端裝置進行回應。此時，移動終端裝置可根據來自使用者的語音信號進行解析，並根據解析後所獲得的語音辨識結果，執行對應的應答操作。如此一來，使用者可方便地根據移動終端裝置所發送的語音通知，通過語音的方式來回應來電通話。[0084]此外，在本發明的語音操控方法與移動終端裝置中，移動終端裝置可據符合識別信息的語音信號，以啟動語音交互功能。在移動終端裝置未啟動其語音交互功能時，倘若移動終端裝置接收到符合識別信息的語音信號，移動終端裝置則會接收在上述語音信號之後的另一個語音信號。之後，移動終端裝置會根據上述另一個語音信號來做出應答操作並終止語音交互功能；或者根據上述另一個語音信號發送語音應答，藉以獲得使用者的意圖或和使用者對話，直到解析到對話終止提示信息或做出應答操作為止。如此一來，使用者僅需發送具有識別信息的語音信號，即可方便地與移動終端裝置進行語音溝通，並在通話過程中可以完全解放雙手，因為移動終端裝置總是在一個對話回合後自動打開語音輸入。且移動終端裝置可根據使用者所說的內容來終止語音交互，藉以可更快速地提供語音服務。基此，本發明的語音接聽方法、語音操控方法與移動終端裝置，可讓使用者可更加便利地操控移動終端裝置。[〇〇85]雖然本發明已以實施例公開如上，然其並非用以限定本發明，本領域技術人員在不脫離本發明的精神和範圍內，當可作些許的更動與潤飾，故本發明的保護範圍當視所附權利要求書界定範圍為準。【權利要求】1.一種語音接聽方法，用於具有一通常模式及一第一模式的一移動終端裝置，該方法包括：當該移動終端裝置連線於一輔助裝置時，該移動終端裝置自該通常模式切換為該第一模式；當於該第一模式接收到一來電通話時，發送一語音通知，並啟動接收一語音信號；解析該語音信號以獲得一語音辨識結果；根據該語音辨識結果，執行對應的一通信操作；以及當該移動終端裝置未連線於該輔助裝置時，該移動終端裝置自該第一模式切換為該通常模式。2.如權利要求1所述的語音接聽方法，其中該移動終端裝置用於移動中的一行車裝置，該語音接聽方法還包括：當該行車裝置的速度超過一閾值時，該移動終端裝置自該通常模式切換為該第一模式；以及當該行車裝置的速度未超過該閾值時，該移動終端裝置自該第一模式切換為該通常模式。3.如權利要求1所述的語音接聽方法，其中該第一模式為該移動終端裝置用於移動中的一行車裝置。4.如權利要求1所述的語音接聽方法，其中在執行對應的該通信操作的步驟包括：接聽該來電通話或拒絕接聽該來電通話，其中在拒絕接聽該來電通話的步驟包括傳送一預設語音應答以回應該來電通話。5.如權利要求1所述的語音接聽方法，還包括：自該語音辨識結果取得一應答內容，並根據該應答內容產生一應答信號以回應該來電通話。6.如權利要求1所述的語音接聽方法，還包括：自一輔助操控裝置接收一操控信號，以接聽或拒絕接聽該來電通話。7.-種移動終端裝置，包括：一語音輸出單元，用以發送一語音通知；一語音接收單元，用以接收一語音信號；一語言理解模塊，耦接於該語音接收單元，用以解析該語音信號；一來電通信單元，耦接於該語音輸出單元與該語言理解模塊，該來電通信單元用以接收一來電通話及執行一通信操作，其中當該移動終端裝置連線於一輔助裝置時，該移動終端裝置自一通常模式切換為一第一模式，以及當該來電通信單元於該第一模式接收到該來電通話時，該來電通信單元通過該語音輸出單元發送該語音通知，並啟動該語音接收單元接收該語音信號，該語言理解模塊解析該語音信號以獲得一語音辨識結果，該來電通信單元根據該語音辨識結果執行對應的該通信操作，以及當該移動終端裝置未連線於該輔助裝置時，該移動終端裝置自該第一模式切換為該通常模式。8.如權利要求7所述的移動終端裝置，其中該移動終端裝置用於移動中的一行車裝置，且當該行車裝置的速度超過一閾值時，該移動終端裝置自該通常模式切換為該第一模式，以及當該行車裝置的速度未超過該閾值時，該移動終端裝置自該第一模式切換為該通常模式。9.如權利要求7所述的移動終端裝置，其中該第一模式為該移動終端裝置用於移動中的一行車裝置。10.如權利要求7所述的移動終端裝置，其中該來電通信單元根據該語音辨識結果，接聽該來電通話或拒絕接聽該來電通話，其中該來電通信單元拒絕接聽該來電通話時，傳送一預設語音應答以回應該來電通話。11.如權利要求7所述的移動終端裝置，其中該來電通信單元自該語音辨識結果取得一應答內容，並根據該應答內容產生一應答信號以回應該來電通話。12.如權利要求7所述的移動終端裝置，其中該來電通信單元自一輔助操控裝置接收一操控信號，以接聽或拒絕接聽該來電通話。【文檔編號】H04M1/725GK104104789SQ201310291083【公開日】2014年10月15日申請日期:2013年7月11日優先權日:2013年4月10日【發明者】尋亮,張國峰申請人:威盛電子股份有限公司

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

語音接聽方法與移動終端裝置製造方法

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法