新四季網

一種多人語音通信中的語音控制方法及裝置的製作方法

2023-05-13 01:22:56 1

專利名稱:一種多人語音通信中的語音控制方法及裝置的製作方法
技術領域:
本發明涉及語音通信技術領域,尤其涉及一種多人語音通信中的語音控制方法及
>J-U ρ α裝直。
背景技術:
目前,多人語音軟體在網絡生活中已經被廣泛應用於遠程會議、遊戲團隊在線指揮和在線唱歌等各個領域。但是,目前在語音群聊時,如果多人同時說話,整個群聊聲音會變得嘈雜,無法分清每個人的聲音,整個群聊狀態變得不可使用。為了讓多人語音群聊具有 更好的聽覺效果,需要用戶手動佔用麥克風進行說話,一旦不佔用麥克風,則不再上傳他的語音數據。但是這需要用戶去單獨操作,費時費力。多人語音軟體通常都提供給用戶一些麥克風的管理方法。但是這些麥克風的管理方法,都需要去和伺服器通信,浪費網絡流量。同時,由於網絡延遲也會造成語音環境不穩定。一種技術是在語音軟體中提供麥克風的管理方法。例如,語音軟體將用戶分為頻道管理員和普通用戶,並提供多種通話模式,包括麥序模式,想說話的用戶點擊發言並輪流說話,每人默認有300秒時間,頻道管理員不受此限制;管理員模式,此時只允許管理員講話,普通會員不能講話;自由模式,任何人都可以講話。這種技術的缺點是,在開一個會議需要多人同時討論的時候,上述方法變得不那麼方便,麥序模式和管理員模式都只允許有限的人同時說話,自由模式無法控制同時說話人的數量,會使語音環境嘈雜混亂。另一種技術是在多人語音軟體的伺服器端設置同時傳遞用戶聲音的最大值,用戶想佔用麥克風的時候,需要從伺服器端獲取當前說話人的個數,然後根據當前的說話的人數來判斷是否能夠佔麥發言。這種技術的缺點是用戶端每次說話的時候都需要與伺服器通信一次,然後再判斷當前是否可以通話,如果有網絡延遲,還容易造成用戶端判斷不準確,本來可以上傳的語音被伺服器拋棄。

發明內容
本發明實施例提供一種多人語音通信中的語音控制方法及裝置,用於實時判斷用戶端當前是否可以佔用麥克風發言,不用每次發言之前都與多人語音伺服器通信確認是否可以發言,減少網絡延遲量,使用戶的佔麥信息得到實時響應。本發明的一個方面,提出了一種多人語音通信中的語音控制方法,包括以下步驟接收多人語音伺服器傳送的各路語音數據;根據所述各路語音數據確定語音來源數量;根據所述語音來源數量和預設閾值生成控制指令;根據所述控制指令控制是否上傳語音數據。採用該技術方案,能夠使多人語音通信的用戶端在判斷能否佔麥發言時,不需要通過與多人語音伺服器進行通信判定,能夠實時判斷並進行多人語音通信。優選的,根據所述各路語音數據確定語音來源數量的步驟包括對所述語音數據進行噪音分析;如果所述語音數據是語音信息、或語音信息和噪音信息的混合,則語音來源數量增加一個;如果所述語音數據是噪音信息,則語音來源數量不增加。該技術方案通過對語音數據進行噪音分析,能夠排除掉純噪音通話麥路,為其他用戶節省麥路語音,提高麥路的使用效率。優選的,如果所述語音數據包括噪音信息,則過濾所述噪音信息。該技術方案能夠使噪音大的麥路通話質量提高,提高多用戶通話效果。優選的,根據所述各路語音數據確定語音來源數量的步驟包括檢測所述語音數據是否來自於語音文件;如果是,則語音來源數量不增加。該技術方案能夠根據用戶需要使來自於語音文件的通話不佔用麥路,節省通話麥路。優選的,所述如果語音數據來自於語音文件,則過濾所述來自於語音文件的語音信息。該技術方案能夠根據用戶需要排除掉來自於語音文件的麥路語音數據,提高多人語音通話效果。
優選的,所述根據所述語音來源數量和預設閾值生成控制指令的步驟包括如果所述語音來源數量小於所述預設閾值,則生成上傳語音數據的控制指令;如果所述語音來源數量大於或等於所述預設閾值,則生成不上傳語音數據的控制指令。該技術方案能夠根據用戶需要設定通話人數,通過預設閾值和實時語音來源數量調節多人語音通話的人數,保證多人語音通信的通暢。本發明的另一個方面,提出了一種多人語音通信中的語音數據控制裝置,包括接收模塊、分析模塊、指令生成模塊和控制模塊,其中,所述接收模塊,用於接收多人語音伺服器傳送的各路語音數據;所述分析模塊,用於根據所述各路語音數據確定語音來源數量;所述指令生成模塊,用於根據所述語音來源數量和預設閾值生成控制指令;所述控制模塊,用於根據所述控制指令控制是否上傳語音數據。優選的,所述分析模塊包括噪音分析單元和來源數量計算單元,其中,所述噪音分析單元,用於對所述各路語音數據進行噪音分析;所述來源數量計算單元,用於在所述語音數據是語音信息、或語音信息和噪音信息的混合時,控制語音來源數量增加一個;以及在所述語音數據是噪音信息時,控制語音來源數量不增加。優選的,所述分析模塊還包括噪音過濾單元,用於過濾所述噪音信息。優選的,所述分析模塊還包括來源分析單元,用於檢測所述語音數據是否來自於語音文件;如果是,則所述來源數量計算單元控制語音來源數量不增加。優選的,所述分析模塊還包括語音文件過濾單元,用於過濾所述來自於語音文件的語音數據。優選的,所述指令生成模塊用於在所述語音來源數量小於所述預設閾值時,生成上傳語音數據的控制指令;以及在所述語音來源數量大於或等於所述預設閾值時,生成不上傳語音數據的控制指令。本發明的其它特徵和優點將在隨後的說明書中闡述,並且,部分地從說明書中變得顯而易見,或者通過實施本發明而了解。本發明的目的和其他優點可通過在所寫的說明書、權利要求書、以及附圖中所特別指出的結構來實現和獲得。下面通過附圖和實施例,對本發明的技術方案做進一步的詳細描述。


附圖用來提供對本發明的進一步理解,並且構成說明書的一部分,與本發明的實施例一起用於解釋本發明,並不構成對本發明的限制。在附圖中圖1為本發明實施例中語音控制方法的流程圖;圖2為本發明實施例中語音控制方法的一種優選實施方式的流程圖;圖3為本發明實施例中語音控制方法的另一種優選實施方式的流程圖;圖4為本發明實施例中語音控制裝置的結構示意圖;圖5為本發明實施例中一個多人語音界面的示意圖; 圖6為本發明實施例中語音控制裝置分析模塊的結構示意圖;圖7為本發明實施例中語音控制裝置分析模塊另一種優選實施方式的結構示意圖。
具體實施例方式以下結合附圖對本發明的優選實施例進行說明,應當理解,此處所描述的優選實施例僅用於說明和解釋本發明,並不用於限定本發明。實施例一如圖1所示,為一種多人語音通信中的語音控制方法的一種實施例,包括以下步驟步驟101、接收多人語音伺服器傳送的各路語音數據;步驟102、根據所述各路語音數據確定語音來源數量;步驟103、根據所述語音來源數量和預設閾值生成控制指令;步驟104、根據所述控制指令控制是否上傳語音數據。在該實施例中,用戶端接收語音伺服器發送的各麥路語音數據並進行分析,得到當前語音來源數量之後,與用戶端預先設置的閾值進行比較,判斷當前用戶端能否佔用麥克進行發言,不再需要通過與多人語音伺服器進行通信由伺服器進行判定,一方面節省了網絡流量,另一方面能夠實時判斷並進行多人語音通信。實施例二如圖2所示,為上述方法的一個優選實施例,包括以下步驟步驟201、接收多人語音伺服器傳送的各路語音數據;步驟202、對所述各路語音數據進行噪音分析;步驟203、根據所述各路語音數據確定語音來源數量,如果所述語音數據是語音信息、或語音信息和噪音信息的混合,則語音來源數量增加I個;如果所述語音數據是噪音信息,則語音來源數量不增加;步驟204、過濾包含噪音信息的麥路語音數據中的噪音信息;步驟205、根據所述語音來源數量和預設閾值生成控制指令;步驟206、根據所述控制指令控制語音數據的傳輸。在步驟205中,預設閾值為預先設置的或接收多人語音伺服器發送的允許同時說話人數閾值;其判斷過程是,如果所述語音來源數量小於所述預設閾值,則生成上傳語音數據的控制指令;如果所述語音來源數量大於或等於所述預設閾值,則生成不上傳語音數據的控制指令。
因為同時允許說話的人數限制,如果有人的麥克中噪音比較大,即使他停止說話,麥克仍然會有語音數據上傳,這時,在其他終端,該麥克始終佔據一個來源,影響他人說話。為了保證語音伺服器所傳來的數據都是用戶真正所說的話,而不是周圍噪音,該實施例對語音數據進行噪音分析,能夠排除掉純噪音通話麥路,為其他用戶節省出一路麥路語音,使其他用戶可以有機會說話,提高麥路的使用效率。如果語音數據同時包括噪音和語音信息,則對噪音進行消除處理,只保留語音信息,使噪音大的麥路通話質量提高,提高多用戶通話效果,並能夠根據用戶需要設定通話人數,通過預設閾值和實時語音來源數量調節多人語音通話的人數,保證多人語音通信的通暢。實施例三如圖3所示,為本發明方法實施例的另一種優選實施例,包括以下步驟步驟301、接收多人語音伺服器傳送的各路語音數據; 步驟302、對所述各路語音數據進行噪音分析;步驟303、過濾包含噪音信息的語音數據中的噪音信息;步驟304、檢測所述語音數據是否來自於語音文件;步驟305、過濾所述來自於語音文件的語音數據;步驟306、根據語音數據確定語音來源數量,如果所述語音數據是語音信息、或語音信息和噪音信息的混合,則語音來源數量增加I個;如果所述語音數據是噪音信息或來自於語音文件,則語音來源數量不增加;步驟307、根據所述語音來源數量和預設閾值生成控制指令;步驟308、根據所述控制指令控制語音數據的傳輸。多人語音軟體在使用過程中,會將正在聽的歌曲、背景音等不是由麥克風傳來的語音進行傳遞,同樣會佔用一路語音。為了保證語音數據來自於麥克風而不是語音文件,該實施例中對語音數據進行了來源分析,當檢測到的語音數據來自於某一語音文件時,屏蔽掉該語音信息,並不將其計算在語音來源數量中,從而達到節省麥路的目的。實施例四該實施例為多人語音通信中的語音控制裝置的實施例,如圖4所示,該裝置包括接收模塊401、分析模塊402、指令生成模塊403和控制模塊404,並依次連接。接收模塊401,用於接收多人語音伺服器傳送的各路語音數據。分析模塊402,用於對接收模塊接收到的各路語音數據進行分析,確定信息來源和語音信息,信息來源即語音來源數量,是當前多人語音通信中同時發言的人數。如圖5所示,為一個多人語音軟體的界面,信息來源即當前說話的人數,如圖5中所示名字前方有標誌的人,取得語音來源數量後將該信息發送給指令生成模塊403,語音信息則直接播放。指令生成模塊403中存儲有允許同時說話人數的一個閾值,默認值可以自己設置,或者由頻道管理員設置,通過伺服器向每個客戶端發送。指令生成模塊403根據語音來源數量和預設閾值生成控制指令,例如,假設預設閾值是X = 3,即同時允許3個人發言,而語音來源數量為1,則生成上傳指令並發送給控制模塊404。控制模塊404根據接收到的上傳指令上傳來自於麥克風的語音數據,此時用戶端可以進行發言。實施例五
如圖6所示,為語音控制裝置中分析模塊的一個優選實施例,該模塊包括噪音分析單元4011、噪音過濾單元4012和來源數量計算單元4013。噪音分析單元4011對接收模塊接收到的語音數據進行噪音分析,確定當前麥路語音數據是否包含噪音數據。如果包含噪音數據,則通過噪音過濾單元4012過濾掉噪音部分,如果都是噪音數據,沒有語音數據,則該路語音不接收。來源數量計算單元4013用於計算來源數量,當語音數據是語音信息或語音信息和噪音信息的混合時,控制語音來源數量增加I個;以及當所述語音數據是噪音信息時,控制語音來源數量不增加。指令生成模塊用於,在所述語音來源數量小於所述預設閾值時,生成上傳語音數據的控制指令;以及在所述語音來源數量大於或等於所述預設閾值時,生成不上傳語音數據的控制指令。實施例六如圖7所示,為語音控制裝置中分析模塊的另一個優選實施例,除實施例五中的 各單元外,該模塊還包括來源分析單元4014和語音文件過濾單元4015,來源分析單元4014用於檢測所述語音數據是否來自於語音文件;如果是,則來源數量計算單元在計算語音來源數量時不增加來源數量。語音文件過濾單元4015,用於過濾所述來自於語音文件的語音信息。由於在多人語音通信過程中一些歌曲或者背景音等來自於語音文件的語音數據是由發言人主動播放給大家的,因此不能在統計過程中排除掉該麥路語音,因此,根據具體情況,該實施例中的功能單元可以由發言人自行開關,以便於用戶適應具體情況。本發明實施例通過在多人語音通信的客戶端實時判斷,確定當前用戶是否可以佔用麥克風發言,將原本由多人語音伺服器完成的判定工作轉移到客戶端進行,節省了響應時間,減少了網絡延遲量,使用戶的佔麥信息可以得到實時響應。要說明的是,本發明各實施例考慮的背景是網絡運行正常的情況,當本地網絡狀況不好、延遲比較高的時候,用戶端檢測語音麥路數據時,可能一些麥路信息沒有傳遞過來,造成統計得到的用戶來源數量與實際情況不符,此時本地用戶端雖然判定可以通話,但實際上超過了麥路原來的設定。此種情況下,可以繼續在多人語音伺服器中保留麥路設定,這樣即使因為網絡延遲造成了本地的麥路開通,但是多人語音伺服器仍然會檢測該通話是否超過麥路限制,保證整個多人語音環境的暢通。本領域內的技術人員應明白,本發明的實施例可提供為方法、系統、或電腦程式產品。因此,本發明可採用完全硬體實施例、完全軟體實施例、或結合軟體和硬體方面的實施例的形式。而且,本發明可採用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(包括但不限於磁碟存儲器和光學存儲器等)上實施的電腦程式產品的形式。本發明是參照根據本發明實施例的方法、設備(系統)、和電腦程式產品的流程圖和/或方框圖來描述的。應理解可由電腦程式指令實現流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合。可提供這些電腦程式指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數據處理設備的處理器以產生一個機器,使得通過計算機或其他可編程數據處理設備的處理器執行的指令產生用於實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。這些電腦程式指令也可存儲在能引導計算機或其他可編程數據處理設備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產生包括指令裝置的製造品,該指令裝置實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。這些電腦程式指令也可裝載到計算機或其他可編程數據處理設備上,使得在計算機或其他可編程設備上執行一系列操作步驟以產生計算機實現的處理,從而在計算機或其他可編程設備上執行的指令提供用於實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。顯然,本領域的技術人員可以對本發明進行各種改動和變型而不 脫離本發明的精神和範圍。這樣,倘若本發明的這些修改和變型屬於本發明權利要求及其等同技術的範圍之內,則本發明也意圖包含這些改動和變型在內。
權利要求
1.一種多人語音通信中的語音控制方法,包括以下步驟 接收多人語音伺服器傳送的各路語音數據; 根據所述各路語音數據確定語音來源數量; 根據所述語音來源數量和預設閾值生成控制指令; 根據所述控制指令控制是否上傳語音數據。
2.如權利要求1所述的方法,其特徵在於,根據所述各路語音數據確定語音來源數量的步驟包括 對所述各路語音數據進行噪音分析; 如果所述語音數據包括語音信息、或語音信息和噪音信息的混合,則語音來源數量增加一個; 如果所述語音數據是噪音信息,則語音來源數量不增加。
3.如權利要求2所述的方法,其特徵在於,如果所述語音數據是噪音信息和語音信息的混合,則過濾所述噪音信息。
4.如權利要求1至3任一所述的方法,其特徵在於,根據所述各路語音數據確定語音來源數量的步驟包括 檢測所述語音數據的來源,如果所述語音數據來自於語音文件,則所述語音來源數量不增加。
5.如權利要求4所述的方法,其特徵在於,所述的方法還包括 過濾所述來自於語音文件的語音數據。
6.如權利要求1或2所述的方法,其特徵在於,所述根據所述語音來源數量和預設閾值生成控制指令的步驟包括 如果所述語音來源數量小於所述預設閾值,則生成上傳語音數據的控制指令; 如果所述語音來源數量大於或等於所述預設閾值,則生成不上傳語音數據的控制指令。
7.一種多人語音通信中語音控制裝置,包括接收模塊、分析模塊、指令生成模塊和控制模塊,其中, 所述接收模塊,用於接收多人語音伺服器傳送的各路語音數據; 所述分析模塊,用於根據所述各路語音數據確定語音來源數量; 所述指令生成模塊,用於根據所述語音來源數量和預設閾值生成控制指令; 所述控制模塊,用於根據所述控制指令控制是否上傳語音數據。
8.如權利要求7所述的裝置,其特徵在於,所述分析模塊進一步包括噪音分析單元和來源數量計算單元,其中, 所述噪音分析單元,用於對所述各路語音數據進行噪音分析; 所述來源數量計算單元,用於在所述語音數據包括語音信息、或語音信息和噪音信息的混合時,控制語音來源數量增加一個;以及在所述語音數據是噪音信息時,控制語音來源數量不增加。
9.如權利要求8所述的裝置,其特徵在於,所述分析模塊還包括噪音過濾單元,用於過濾所述噪音信息。
10.如權利要求7至9任一所述的裝置,其特徵在於,所述分析模塊還包括來源分析單元,用於檢測所述語音數據的來源; 所述來源數量計算單元用於在所述語音數據來自於語音文件時,控制語音來源數量不增加。
11.如權利要求10所述的裝置,其特徵在於,所述分析模塊還包括語音文件過濾單元,用於過濾所述來自於語音文件的語音數據。
12.如權利要求7或8所述的裝置,其特徵在於,所述指令生成模塊用於在所述語音來源數量小於所述預設閾值時,生成上傳語音數據的控制指令;以及在所述語音來源數量大於或等於所述預設閾值時,生成不上傳語音數據的控制指令。
全文摘要
本發明公開了一種多人語音通信中的語音控制方法。該方法包括接收多人語音伺服器傳送的各路語音數據;根據所述各路語音數據確定語音來源數量;根據所述語音來源數量和預設閾值生成控制指令;根據所述控制指令控制是否上傳語音數據。採用該技術方案,能夠使多人語音通信的用戶端在判斷能否佔麥發言時,不需要通過與多人語音伺服器進行通信判定,能夠實時判斷並進行多人語音通信。本發明還公開了用於實現所述方法的裝置。
文檔編號H04M7/00GK103024224SQ20121048045
公開日2013年4月3日 申請日期2012年11月22日 優先權日2012年11月22日
發明者林形省, 樊家麟, 張鵬飛 申請人:北京小米科技有限責任公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀