新四季網

語音指令的處理方法、裝置、車輛和存儲介質與流程

2023-05-16 05:29:23



1.本發明涉及汽車技術領域,尤其涉及一種語音指令的處理方法、裝置、車輛和存儲介質。


背景技術:

2.當前,汽車智能化的趨勢越來越明顯。汽車智能化不僅能夠駕駛員提供更加便捷的交互方式,提高駕駛的安全性,而且能夠解放駕駛員的雙手和雙眼,具有使用門檻低、學習成本低、友好性交互等特點,極大的提高了用戶的體驗。尤其是在傳遞聲學方法,能夠進行語音識別,根據說話者的語音指令對車輛進行控制。
3.然而,現有技術中,語音指令的處理方式較為單一,導致較易出現語音指令誤識別以及對車輛出現錯誤控制的情況。


技術實現要素:

4.本發明提供了一種語音指令的處理方法、裝置、車輛和存儲介質,以豐富語音指令的處理方式。
5.根據本發明的一方面,提供了一種語音指令的處理方法,包括:
6.採集語音信號;
7.如果所述語音信號中攜帶有至少一個當前語音指令,則根據所述語音信號確定目標車輛所處的環境類型;
8.如果所述環境類型為多人語音環境,則根據所述語音信號確定所述至少一個當前語音指令的語音音量,並基於所述語音音量確定所述至少一個當前語音指令中的當前待處理語音指令,其中,所述當前待處理語音指令的語音音量大於或等於預設音量閾值;
9.對所述當前待處理語音指令進行處理。
10.根據本發明的另一方面,提供了一種語音指令的處理裝置,包括:
11.信號採集模塊,用於採集語音信號;
12.音量確定模塊,用於響應於所述語音信號中攜帶有至少一個當前語音指令的情況,根據所述語音信號確定目標車輛所處的環境類型;
13.音量確定模塊,用於響應於所述環境類型為多人語音環境的情況,根據所述語音信號確定所述至少一個當前語音指令的語音音量;
14.指令確定模塊,用於基於所述語音音量確定所述至少一個當前語音指令中的當前待處理語音指令,其中,所述當前待處理語音指令的語音音量大於或等於預設音量閾值;
15.第一處理模塊,用於對所述當前待處理語音指令進行處理。
16.根據本發明的另一方面,提供了一種車輛,所述車輛包括:
17.至少一個處理器;以及
18.與所述至少一個處理器通信連接的存儲器;其中,
19.所述存儲器存儲有可被所述至少一個處理器執行的電腦程式,所述電腦程式
被所述至少一個處理器執行,以使所述至少一個處理器能夠執行本發明任一實施例所述的語音指令的處理方法。
20.根據本發明的另一方面,提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機指令,所述計算機指令用於使處理器執行時實現本發明任一實施例所述的語音指令的處理方法。
21.本發明實施例提供的語音指令的處理方法、裝置、車輛和存儲介質,採集語音信號;如果該語音信號中攜帶有至少一個當前語音指令,則根據該語音信號確定目標車輛所處的環境類型;如果該環境類型為多人語音環境,則根據該語音信息確定上述至少一個當前語音指令的語音音量,並基於該語音音量確定上述至少一個當前語音指令中的當前待處理語音指令,其中,該當前待處理語音指令的語音音量大於或等於預設音量閾值;對當前待處理語音指令進行處理。本發明實施例通過採用上述技術方案,當車輛處於多人語音環境時,根據語音音量,採用不同的方式對語音信號中所攜帶的語音指令進行處理,能夠豐富語音指令的處理方式,提高語音指令識別的效率以及對語音指令反饋的及時性,並降低基於語音指令對車輛進行錯誤控制的概率。
22.應當理解,本部分所描述的內容並非旨在標識本發明的實施例的關鍵或重要特徵,也不用於限制本發明的範圍。本發明的其它特徵將通過以下的說明書而變得容易理解。
附圖說明
23.為了更清楚地說明本發明實施例中的技術方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
24.圖1為本發明實施例一提供的一種語音指令的處理方法的流程示意圖;
25.圖2為本發明實施例二提供的一種語音指令的處理方法的流程示意圖;
26.圖3為本發明實施例三提供的一種語音指令的處理裝置的結構框圖;
27.圖4為本發明實施例四提供的一種車輛的結構示意圖。
具體實施方式
28.為了使本技術領域的人員更好地理解本發明方案,下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分的實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都應當屬於本發明保護的範圍。
29.需要說明的是,本發明的說明書和權利要求書及上述附圖中的術語「第一」、「第二」等是用於區別類似的對象,而不必用於描述特定的順序或先後次序。應該理解這樣使用的數據在適當情況下可以互換,以便這裡描述的本發明的實施例能夠以除了在這裡圖示或描述的那些以外的順序實施。此外,術語「包括」和「具有」以及他們的任何變形,意圖在於覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統、產品或設備不必限於清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或對於這些過程、方法、產品
或設備固有的其它步驟或單元。
30.實施例一
31.圖1為本發明實施例一提供了一種語音指令的處理方法的流程圖,本實施例可適用於對語音指令進行處理的情況,該方法可以由語音指令的處理裝置來執行,該語音指令的處理裝置可以採用硬體和/或軟體的形式實現,該語音指令的處理裝置可配置於語音控制系統中,該語音控制系統可以配置於車輛內。如圖1所示,該方法包括:
32.s110、採集語音信號。
33.在本實施例中,語音控制系統可以具有喚醒狀態和休眠狀態,如用戶可以通過特定的語音或者通過觸發特定的觸摸控制項或物理按鍵喚醒車輛的語音控制系統,即將語音控制系統由休眠狀態切換為喚醒狀態。用戶也可以通過另一特定的語音指令或者通過觸發相應的觸摸控制項或物理按鍵將語音控制系統由喚醒切換為休眠狀態。當處於喚醒狀態時,語音控制系統可以實時採集語音信號,並基於該語音信號對車輛進行控制。此外,語音控制系統還可以在長時間(如10s或20s等)未採集到語音信號/語音指令時,自動由喚醒狀態切換為休眠狀態。
34.具體的,語音控制系統可以實時採集語音信號,如採集聲音信號,並提取該聲音信號中所包含的語音信號。其中,語音信號可以為語音的信號,如人聲的信號。
35.在本實施例中,當採集到語音信號之後,還可以進一步判斷所採集的語音信號中是否攜帶有語音指令,以在其攜帶有語音指令時,對語音信號中所攜帶的語音指令進行處理。此時,在所述採集語音信號之後,還可以包括:提取所述語音信號的目標語音特徵矢量;如果語音庫中存在與所述目標語音特徵矢量相匹配的目標標準語音特徵矢量,則將所述目標標準語音特徵矢量對應的標準語音指令作為所述語音信號中攜帶的當前語音指令。
36.其中,目標語音特徵矢量可以為語音控制系統當前所採集的語音信號的語音特徵矢量。目標標準語音特徵矢量可以為與目標語音特徵矢量相匹配的標準語音特徵矢量。該標準語音特徵矢量可以為標準語音指令的語音特徵矢量。該語音特徵矢量可理解為用於表徵語音特徵的矢量。該標準語音指令可以為對預先設置的標準播報語句進行播報得到的、標準的語音指令。當前語音指令可理解為該語音信號中所攜帶的語音指令,即當前採集到的語音信號中所攜帶的語音指令。該語音指令可理解為採用語音的方式對車輛進行控制的指令。
37.在本實施例中,可以預先設置不同語音指令對應的標準播報語句;針對每一個標準播報語句,分別採用不同國家和/或地區的語言對該標準播報語句進行播報,得到該標準播報語句對應的不同標準語音指令;進一步提取各標準語音指令的語音特徵矢量,作為相應標準語音指令的標準語音特徵矢量,並將各標準語音指令以及各標準語音指令的標準語音特徵矢量對應存儲於語音庫中。
38.從而,當獲取到語音信號之後,可以對語音信號中的幹擾信號進行過濾。在過濾完成後,對過濾後的語音信號進行標準化處理以提取語音信號的語音特徵,並採用預先訓練得到的隱馬爾可夫模型(hidden markov model,hmm)對所提取的語音特徵進行矢量計算,得到語音信號的目標語音特徵矢量。將語音信號的目標語音特徵矢量同語音庫中所存儲的各標準語音特徵矢量進行匹配,判斷語音庫中是否存在與目標語音特徵矢量相匹配的目標標準語音特徵矢量,若是,則判定語音信號中攜帶有語音指令,並將語音庫中所存儲的、目
標標準語音特徵矢量所對應的標準語音指令作為該語音信號中所攜帶的當前語音指令。
39.在本實施例中,通過在語音庫中設置採用不同國家和/或地區的語音對標準播報語句進行播報得到的標準語音,使得語音控制系統能夠適配不同國家和/或地區的語言,即用戶無論採用何種語言說出語音指令均能夠對車輛進行控制,從而,能夠提高語音指令的識別效率和識別精度。
40.s120、如果所述語音信號中攜帶有至少一個當前語音指令,則根據所述語音信號確定目標車輛所處的環境類型。
41.其中,目標車輛可理解為執行本實施例所提供的語音指令的處理方法的車輛,即語音控制系統所配置於的車輛。目標車輛所處的環境類型可以理解為目標車輛所處環境(包括目標車輛的車內環境和/或車外環境)的環境類型。該環境類型例如可以包括多人語音環境和單人語音環境。
42.具體的,當確定語音信號中攜帶有當前語音指令時,可以進一步根據該語音信號確定目標車輛所處的環境類型,如根據該語音信號確定說話者的數量,並根據說話者的數量確定目標車輛所處的環境是多人語音環境還是單人語音環境。
43.s130、如果所述環境類型為多人語音環境,則根據所述語音信號確定所述至少一個當前語音指令的語音音量,並基於所述語音音量確定所述至少一個當前語音指令中的當前待處理語音指令,其中,所述當前待處理語音指令的語音音量大於或等於預設音量閾值。
44.在本實施例中,可以預先設置不同的環境類型和/或不同語音音量所對應的處理方式,並在確定目標車輛所處的環境類型和/或語音信號中所攜帶的當前語音指令的語音音量之後,採用與目標車輛所處的環境類型和/或語音信號中所攜帶的當前語音指令的語音音量相對應的處理方式對語音信號中所攜帶的當前語音指令進行處理。此處不同各環境類型和/或不同語音音量所對應的處理方式進行限定。
45.在本實施例中,由於當處於較為嘈雜的環境時,如當多個人在聊天時,用戶一般會採用較高的音量播報語音指令,以使語音控制系統能夠正確接收其所播報的語音指令。故當處於多人語音環境時,可以僅對語音信號中所攜帶的一個或多個語音音量較大的語音指令進行響應,以避免出現將用戶的聊天內容誤識別為語音指令的情況,降低基於語音指令對車輛進行錯誤控制的概率。
46.其中,多人語音環境可理解為存在多個說話者的環境,即語音信號中包含多個人的語音的環境。當前待處理語音指令可以為語音音量大於或等於預設音量閾值的當前語音指令,其數量可以為一個或多個,優選可以為一個,即可以將語音音量大於或等於預設音量閾值的某一個當前語音指令作為當前待處理語音指令,如將語音音量最大且語音音量大於或等於預設音量閾值的當前語音指令作為當前待處理語音指令。此時,可選的,所述當前待處理語音指令為所述至少一個語音指令中語音音量最大的語音指令,以下以此種情況為例進行說明。該預設音量閾值可以根據需要進行設置,如可以將預設音量閾值設置為70db等。
47.示例性的,當目標車輛處於多人語音環境時,可以進一步根據語音信號確定語音信號中所攜帶的各當前語音指令的語音音量,根據該語音音量確定語音信號中所攜帶的語音音量最大的當前語音指令,判斷該當前語音指令的語音音量是否大於或等於預設音量閾值,如果該語音音量大於或等於預設音量閾值,則將該語音音量最大的當前語音指令確定為當前待處理語音指令。
48.相應的,如果該語音音量小於預設音量閾值,則可以不對語音信號中所攜帶的各當前語音指令進行響應,以避免出現誤響應的情況。此時,可選的,本實施例提供的語音指令的處理方法還包括:如果確定所述至少一個語音指令中不存在當前待處理語音指令,則不對所述至少一個語音指令進行處理。
49.s140、對所述當前待處理語音指令進行處理。
50.在本實施例中,確定當前待處理語音指令之後,可以對所確定的當前待處理語音指令進行處理。
51.具體的,可以將當前待處理語音指令轉換為控制指令,並通過該控制指令對目標車輛進行控制,如對目標車輛的車身硬體進行控制,或者,通過目標車輛的中樞系統對車輛上所安裝的軟體進行控制等。
52.在一個實施方式中,所述對所述當前待處理語音指令進行處理,包括:生成與所述當前待處理語音指令對應的控制指令,並將所述控制指令發送給所述目標車輛中的待控制對象的控制模塊,以通過所述控制模塊對所述待控制對象進行控制,所述待控制對象為與所述當前待處理語音指令對應的硬體或軟體。
53.具體的,可以根據當前待處理語音指令生成控制指令,確定該控制指令所對應的待控制對象,並將該控制指令發送該待控制對象的控制模塊。相應的,目標車輛中的待控制對象的控制模塊在接收到語音控制系統所發送的控制指令之後,可以依據該控制指令對待處理對象進行控制。
54.其中,當前待處理語音指令對應的控制指令的生成方式可以靈活設置,如可以採用現有技術中的控制指令生成方式生成當前待處理語音指令對應的控制指令,本實施例對此不進行限制。待控制對象可以為目標車輛的硬體,如目標車輛的車窗、天窗、座椅、空調、燈光、後備箱蓋等;也可以為目標車輛所安裝的軟體,如可以通過控制指令進行選臺、追劇、看直播/回放、聽歌、翻譯、音量、遊戲等方面的控制,從而進一步豐富語音控制系統的控制範圍。待處理對象的控制模塊可以為用於控制待處理對象的處理器或控制器等。
55.在一個實施方式中,所述對所述當前待處理語音指令進行處理,包括:如果所述當前待處理語音指令的接收時間與最後一次接收到喚醒指令的時間之間的時間間隔小於或等於預設時間長度,則在對歷史待處理語音指令進行處理的同時,對所述當前待處理語音指令進行處理;如果所述當前待處理語音指令的接收時間與最後一次接收到喚醒指令的時間之間的時間間隔大於預設時間長度,則在對歷史待處理語音指令處理完畢之後,對所述當前待處理語音指令進行處理;其中,所述歷史待處理語音指令為在所述當前待處理語音指令之前接收到的待處理語音指令。
56.其中,喚醒指令可理解為用於喚醒語音控制系統的指令,即用於將語音控制系統由休眠狀態切換為喚醒狀態的指令,其可以基於用戶的語音或者用戶對相應觸摸控制項或物理按鍵的觸發操作生成。相應的,最後一次接收到喚醒指令的時間可理解為語音控制系統本次由休眠狀態切換為喚醒狀態的時間,即語音控制系統本次處於喚醒狀態的起始時間。歷史待處理語音指令可理解為在本次採集語音信號之前所接收到、尚未響應完成的語音指令。預設時間長度可以根據需要進行設置,如可以將預設時間長度設置為10s或15s等。
57.在本實施例中,當語音控制系統處於喚醒狀態時,可以依據接收時間的不同,採用不同的處理方式對所接收到的當前待處理語音指令進行響應,從而,進一步豐富語音指令
的響應方式。
58.具體的,如果當前待處理語音指令的接收時間與語音控制系統本次處於喚醒狀態的起始時間之間的時間間隔小於或等於預設時間長度,則可以並行對該一個或多個當前待處理語音指令進行處理,進一步地,當存在尚未處理完成的歷史待處理語音指令時,可以並行對該一個或多個當前待處理語音指令以及該尚未處理完成的歷史待處理語音指令進行響應。如果當前待處理語音指令的接收時間與語音控制系統本次處於喚醒狀態的起始時間之間的時間間隔大於預設時間長度,則可以按照各語音指令的接收時間的先後順序,依次對該一個或多個當前待處理語音指令以及尚未處理完成的歷史待處理語音指令進行處理。
59.在一個實施方式中,在所述採集語音信號之後,還包括:根據所述語音信號確定說話者的情緒信息;輸出與所述情緒信息對應的提示信息,所述提示信息用於提示執行與所述情緒信息對應的目標操作。
60.在上述實施方式中,可以進一步根據所採集到的語音信號確定說話者的情緒,並提示或控制車輛執行與說話者的情緒相對應的操作,如採用與說話者的情緒相對應的語氣、音調等與說話者進行語音互動,或者,在說話者產生悲傷、憤怒、快樂等情緒波動時,採用相應的措施安撫說話者的情緒,等等,從而不僅能夠使說話者產生沉浸式的交流體驗,還能夠使說話者心態平穩的進行駕駛,降低交通事故出現的概率。
61.具體的,在採集到語音信號之後,可以通過智能晶片或者預先訓練得到的情緒識別模型根據該語音信號識別說話者的情緒信息,如根據該語音信號中說話者的語氣、音調、聲調和/或語音信號中所包含的感嘆詞等識別說話者的情緒信息;確定與該情緒信息對應的目標操作和提示信息,並輸出該提示信息,如播報該提示信息和/或顯示該提示信息,以通過該提示信息提示執行該目標操作。
62.可以理解的是,語音控制系統可以通過提示信息提示用戶目標車輛正在執行或即將執行目標操作,並控制目標車輛執行目標操作;也可以通過提示信息提示用戶執行目標操作;還可以通過提示信息提示用戶控制目標車輛執行目標操作,或者,通過提示信息詢問用戶是否允許目標車輛執行目標操作,並在接收到用戶的相應控制指令時,控制目標車輛執行目標操作,具體可以根據需要進行設置,本實施例不對此進行限制。
63.本發明實施例一提供的語音指令的處理方法,採集語音信號;如果該語音信號中攜帶有至少一個當前語音指令,則根據該語音信號確定目標車輛所處的環境類型;如果該環境類型為多人語音環境,則根據該語音信息確定上述至少一個當前語音指令的語音音量,並基於該語音音量確定上述至少一個當前語音指令中的當前待處理語音指令,其中,該當前待處理語音指令的語音音量大於或等於預設音量閾值;對當前待處理語音指令進行處理。本實施例通過採用上述技術方案,當車輛處於多人語音環境時,根據語音音,採用不同的方式對語音信號中所攜帶的語音指令進行處理,能夠豐富語音指令的處理方式,提高語音指令識別的效率以及對語音指令反饋的及時性,並降低基於語音指令對車輛進行錯誤控制的概率。
64.實施例二
65.圖2為本發明實施例二提供的一種語音指令的處理方法的流程示意圖。本實施例在上述實施例的基礎上進行優化。可選的,在所述對所述當前待處理語音指令進行處理之前,還包括:如果所述環境類型為單人語音環境,則將所述至少一個語音指令作為當前待處
理語音指令。
66.相應的,如圖2所示,本發明實施例二提供的語音指令的處理方法可以包括:
67.s210、採集語音信號。
68.s220、如果所述語音信號中攜帶有至少一個當前語音指令,則根據所述語音信號確定目標車輛所處的環境類型,執行s230或s240。
69.在本實施例中,目標車輛所處的環境可以包括單人語音環境或多人語音環境。根據語音信號確定目標車輛所處的環境類型的方式可以靈活設置,如可以判斷語音信號中是否存在多個說話者同時說話的語音片段,即在同一時刻存在多個說話者的語音的語音片段,若是,則判定目標車輛處於多人語音環境;若否,則判定目標車輛處於單人語音環境。優選可以判斷語音信號中是否包含多個說話者的語音,即在語音信號的採集時間段內存在多個說話者,若是,則判定目標車輛處於多人語音環境;若否,則判定目標車輛處於單人語音環境。
70.s230、如果所述環境類型為多人語音環境,則根據所述語音信號確定所述至少一個當前語音指令的語音音量,並基於所述語音音量確定所述至少一個當前語音指令中的當前待處理語音指令,執行s250,其中,所述當前待處理語音指令的語音音量大於或等於預設音量閾值。
71.s240、如果所述環境類型為單人語音環境,則將所述至少一個語音指令作為當前待處理語音指令。
72.具體的,若目標車輛處於單人語音環境,即若僅存在一個說話者,則可以將該語音信號中所攜帶的所有語音指令均作為當前待處理語音指令,以對各當前待處理語音指令進行響應。
73.s250、對所述當前待處理語音指令進行處理。
74.本發明實施例二提供的語音指令的處理方法,當車輛處於不同的環境時和/或語音指令的語音音量不相同時,採用不同的方式對語音信號中所攜帶的語音指令進行處理,能夠提高語音指令識別的效率以及對語音指令反饋的及時性,並降低基於語音指令對車輛進行錯誤控制的概率。
75.實施例三
76.圖3為本發明實施例三提供了一種語音指令的處理裝置的結構框圖,本實施例可適用於對語音指令進行處理的情況,該語音指令的處理裝置可以採用硬體和/或軟體的形式實現,該語音指令的處理裝置可配置於語音控制系統中,該語音控制系統可以配置於車輛內。如圖3所示,該裝置包括:信號採集模塊301、音量確定模塊302、指令確定模塊303和第一處理模塊304,其中,
77.信號採集模塊301,用於採集語音信號;
78.類型確定模塊302,用於響應於所述語音信號中攜帶有至少一個當前語音指令的情況,根據所述語音信號確定目標車輛所處的環境類型;
79.指令確定模塊303,用於響應於所述環境類型為多人語音環境的情況,根據所述語音信號確定所述至少一個當前語音指令的語音音量,並基於所述語音音量確定所述至少一個當前語音指令中的當前待處理語音指令,其中,所述當前待處理語音指令的語音音量大於或等於預設音量閾值;
80.第一處理模塊304,用於對所述當前待處理語音指令進行處理。
81.本發明實施例三提供的語音指令的處理裝置,通過信號採集模塊採集語音信號;通過類型確定模塊響應於該語音信號中攜帶有至少一個當前語音指令的情況,根據該語音信號確定目標車輛所處的環境類型;通過指令確定模塊響應於該環境類型為多人語音環境的情況,根據該語音信息確定上述至少一個當前語音指令的語音音量,並基於該語音音量確定上述至少一個當前語音指令中的當前待處理語音指令,其中,該當前待處理語音指令的語音音量大於或等於預設音量閾值;通過第一處理模塊對當前待處理語音指令進行處理。本實施例通過採用上述技術方案,當車輛處於多人語音環境時,根據語音音量,採用不同的方式對語音信號中所攜帶的語音指令進行處理,能夠豐富語音指令的處理方式,提高語音指令識別的效率以及對語音指令反饋的及時性,並降低基於語音指令對車輛進行錯誤控制的概率。
82.進一步地,本實施例提供的語音指令的處理裝置還可以包括:第二處理模塊,用於響應於確定所述至少一個語音指令中不存在當前待處理語音指令的情況,不對所述至少一個語音指令進行處理。
83.在上述方案中,所述當前待處理語音指令可以為所述至少一個語音指令中語音音量最大的語音指令。
84.在上述方案中,所述指令確定模塊303可以用於:響應於所述環境類型為單人語音環境的情況,將所述至少一個語音指令作為當前待處理語音指令,並對所述當前待處理語音指令進行響應。
85.在上述方案中,所述第一處理模塊304可以用於:響應於所述當前待處理語音指令的接收時間與最後一次接收到喚醒指令的時間之間的時間間隔小於或等於預設時間長度的情況,在對歷史待處理語音指令進行處理的同時,對所述當前待處理語音指令進行處理;響應於所述當前待處理語音指令的接收時間與最後一次接收到喚醒指令的時間之間的時間間隔大於預設時間長度的情況,在對歷史待處理語音指令處理完畢之後,對所述待處理語音指令進行處理;其中,所述歷史待處理語音指令為在所述當前待處理語音指令之前接收到的待處理語音指令。
86.在上述方案中,所述第一處理模塊304可以用於:生成與所述當前待處理語音指令對應的控制指令,並將所述控制指令發送給所述目標車輛中的待控制對象的控制模塊,以通過所述控制模塊對所述待控制對象進行控制,所述待控制對象為與所述當前待處理語音指令對應的硬體或軟體。
87.進一步地,本實施例提供的語音指令的處理裝置還可以包括:情緒確定模塊,用於在所述採集語音信號之後,根據所述語音信號確定說話者的情緒信息;提示模塊,用於輸出與所述情緒信息對應的提示信息,所述提示信息用於提示執行與所述情緒信息對應的目標操作。
88.進一步地,本實施例提供的語音指令的處理裝置還可以包括:特徵提取模塊,用於在所述採集語音信號之後,提取所述語音信號的目標語音特徵矢量;指令確定模塊,用於在語音庫中存在與所述目標語音特徵矢量相匹配的目標標準語音特徵矢量時,將所述目標標準語音特徵矢量對應的標準語音指令作為所述語音信號中攜帶的當前語音指令。
89.本發明實施例所提供的語音指令的處理裝置可執行本發明任意實施例所提供的
語音指令的處理方法,具備執行方法相應的功能模塊和有益效果。
90.實施例四
91.圖4示出了可以用來實施本發明的實施例的車輛10的結構示意圖。如圖4所示,車輛10包括至少一個處理器11,以及與至少一個處理器11通信連接的存儲器,如只讀存儲器(rom)12、隨機訪問存儲器(ram)13等,其中,存儲器存儲有可被至少一個處理器執行的電腦程式,處理器11可以根據存儲在只讀存儲器(rom)12中的電腦程式或者從存儲單元18加載到隨機訪問存儲器(ram)13中的電腦程式,來執行各種適當的動作和處理。在ram 13中,還可存儲車輛10操作所需的各種程序和數據。處理器11、rom 12以及ram 13通過總線14彼此相連。輸入/輸出(i/o)接口15也連接至總線14。
92.車輛10中的多個部件連接至i/o接口15,包括:輸入單元16,例如鍵盤、滑鼠等;輸出單元17,例如各種類型的顯示器、揚聲器等;存儲單元18,例如磁碟、光碟等;以及通信單元19,例如網卡、數據機、無線通信收發機等。通信單元19允許車輛10通過諸如網際網路的計算機網絡和/或各種電信網絡與其他設備交換信息/數據。
93.處理器11可以是各種具有處理和計算能力的通用和/或專用處理組件。處理器11的一些示例包括但不限於中央處理單元(cpu)、圖形處理單元(gpu)、各種專用的人工智慧(ai)計算晶片、各種運行機器學習模型算法的處理器、數位訊號處理器(dsp)、以及任何適當的處理器、控制器、微控制器等。處理器11執行上文所描述的各個方法和處理,例如語音指令的處理方法。
94.在一些實施例中,語音指令的處理方法可被實現為電腦程式,其被有形地包含於計算機可讀存儲介質,例如存儲單元18。在一些實施例中,電腦程式的部分或者全部可以經由rom 12和/或通信單元19而被載入和/或安裝到車輛10上。當電腦程式加載到ram 13並由處理器11執行時,可以執行上文描述的語音指令的處理方法的一個或多個步驟。備選地,在其他實施例中,處理器11可以通過其他任何適當的方式(例如,藉助於固件)而被配置為執行語音指令的處理方法。
95.本文中以上描述的系統和技術的各種實施方式可以在數字電子電路系統、集成電路系統、場可編程門陣列(fpga)、專用集成電路(asic)、專用標準產品(assp)、晶片上系統的系統(soc)、負載可編程邏輯設備(cpld)、計算機硬體、固件、軟體、和/或它們的組合中實現。這些各種實施方式可以包括:實施在一個或者多個電腦程式中,該一個或者多個電腦程式可在包括至少一個可編程處理器的可編程系統上執行和/或解釋,該可編程處理器可以是專用或者通用可編程處理器,可以從存儲系統、至少一個輸入裝置、和至少一個輸出裝置接收數據和指令,並且將數據和指令傳輸至該存儲系統、該至少一個輸入裝置、和該至少一個輸出裝置。
96.用於實施本發明的方法的電腦程式可以採用一個或多個程式語言的任何組合來編寫。這些電腦程式可以提供給通用計算機、專用計算機或其他可編程數據處理裝置的處理器,使得電腦程式當由處理器執行時使流程圖和/或框圖中所規定的功能/操作被實施。電腦程式可以完全在機器上執行、部分地在機器上執行,作為獨立軟體包部分地在機器上執行且部分地在遠程機器上執行或完全在遠程機器或伺服器上執行。
97.在本發明的上下文中,計算機可讀存儲介質可以是有形的介質,其可以包含或存儲以供指令執行系統、裝置或設備使用或與指令執行系統、裝置或設備結合地使用的計算
機程序。計算機可讀存儲介質可以包括但不限於電子的、磁性的、光學的、電磁的、紅外的、或半導體系統、裝置或設備,或者上述內容的任何合適組合。備選地,計算機可讀存儲介質可以是機器可讀信號介質。機器可讀存儲介質的更具體示例會包括基於一個或多個線的電氣連接、可攜式計算機盤、硬碟、隨機存取存儲器(ram)、只讀存儲器(rom)、可擦除可編程只讀存儲器(eprom或快閃記憶體)、光纖、便捷式緊湊盤只讀存儲器(cd-rom)、光學儲存設備、磁儲存設備、或上述內容的任何合適組合。
98.為了提供與用戶的交互,可以在車輛上實施此處描述的系統和技術,該車輛具有:用於向用戶顯示信息的顯示裝置(例如,crt(陰極射線管)或者lcd(液晶顯示器)監視器);以及鍵盤和指向裝置(例如,滑鼠或者軌跡球),用戶可以通過該鍵盤和該指向裝置來將輸入提供給車輛。其它種類的裝置還可以用於提供與用戶的交互;例如,提供給用戶的反饋可以是任何形式的傳感反饋(例如,視覺反饋、聽覺反饋、或者觸覺反饋);並且可以用任何形式(包括聲輸入、語音輸入或者、觸覺輸入)來接收來自用戶的輸入。
99.可以將此處描述的系統和技術實施在包括後臺部件的計算系統(例如,作為數據伺服器)、或者包括中間件部件的計算系統(例如,應用伺服器)、或者包括前端部件的計算系統(例如,具有圖形用戶界面或者網絡瀏覽器的用戶計算機,用戶可以通過該圖形用戶界面或者該網絡瀏覽器來與此處描述的系統和技術的實施方式交互)、或者包括這種後臺部件、中間件部件、或者前端部件的任何組合的計算系統中。可以通過任何形式或者介質的數字數據通信(例如,通信網絡)來將系統的部件相互連接。通信網絡的示例包括:區域網(lan)、廣域網(wan)、區塊鏈網絡和網際網路。
100.計算系統可以包括客戶端和伺服器。客戶端和伺服器一般遠離彼此並且通常通過通信網絡進行交互。通過在相應的計算機上運行並且彼此具有客戶端-伺服器關係的電腦程式來產生客戶端和伺服器的關係。伺服器可以是雲伺服器,又稱為雲計算伺服器或雲主機,是雲計算服務體系中的一項主機產品,以解決了傳統物理主機與vps服務中,存在的管理難度大,業務擴展性弱的缺陷。
101.應該理解,可以使用上面所示的各種形式的流程,重新排序、增加或刪除步驟。例如,本發明中記載的各步驟可以並行地執行也可以順序地執行也可以不同的次序執行,只要能夠實現本發明的技術方案所期望的結果,本文在此不進行限制。
102.上述具體實施方式,並不構成對本發明保護範圍的限制。本領域技術人員應該明白的是,根據設計要求和其他因素,可以進行各種修改、組合、子組合和替代。任何在本發明的精神和原則之內所作的修改、等同替換和改進等,均應包含在本發明保護範圍之內。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀