一種音頻處理方法、終端設備及系統的製作方法

2023-04-25 05:40:51 2

專利名稱：一種音頻處理方法、終端設備及系統的製作方法
技術領域：
本申請涉及語音通信技術領域，特別是涉及一種音頻處理方法、終端設備及系統。
背景技術：
現有電話會議系統中，包括多個具有麥克的終端設備，這些終端設備接入通信網絡中，比如 PSTN(Public Switched Telephone Network,公共交換電話網),IP (InternetProtocol，網際網路協議)網絡等。以三方電話會議為例，其中一方終端設備只需要提供兩條線路就可以把其它兩個終端設備聯繫在一起，實現三方通話。目前最常見的方式是交換機提供三方通話功能，或者運營商提供多方電話會議橋接服務，使得身處不同地方的人能夠克服地理位置或距離上困難，同時連接到會議系統中一起說話討論，彼此能聽到對方說話，就好像在同一個屋子裡開會一樣。
但是，發明人在對現有技術的研究過程中發現，對於一方終端設備側的用戶來說，當多個人同時參與會議時，多個語音信息將進行混音後，通過連接線路在終端上進行統一播放，經常有聽不清楚的情形，尤其是多個人同時說話的時候，一方面是由於電話線路有信號不好或者幹擾等原因，另一方面是發言者距離麥克風的距離不同導致拾入的信號強弱不齊，加上多個人的聲音同時響起，要讓對方聽清楚非常困難，為了解決這個問題，電話會議系統中，會議主持人經常會讓單個人發言，但這顯然降低了效率。與現場會議不同，現場會議中每個人除了通過識別不同人的音調和音質以外還可以通過聲音發出的方位判斷所要獲取的聲音信息，而對於電話會議，所有語音信息統一混音後，接收到該混音信息的終端通過揚聲器對其進行統一播放，因此難以聽清其中聲音較小的語音信息，如果將混音放大，則只能將所有聲音同一放大，因此仍然難以分辨單個語音信息。

發明內容
本申請實施例提供了一種音頻處理方法、終端設備及系統，以解決現有技術中難以分辨混音音頻中的單個語音信息，導致收聽方分辨效果不佳的問題。為了解決上述技術問題，本申請實施例公開了如下技術方案一種音頻處理方法，應用於具有至少兩個音頻通道的第一終端設備中，所述第一終端設備與至少一個第二終端設備連通，所述方法包括接收所述至少一個第二終端設備通過一條傳輸通道傳輸的混音音頻，所述混音音頻中包含混合在一起的至少兩個音頻信息；對所述混音音頻進行分離，獲得所述混音音頻中的至少一個獨立的音頻信息；至少將分離出的一個所述獨立的音頻信息通過一個音頻通道輸出。所述對混音音頻進行分離包括獲取預先設置的分離矩陣，所述分離矩陣為由每個音頻信息的特徵向量組成的矩陣；根據所述分離矩陣，通過快速獨立成分分析算法ICA從所述混音音頻中分離出獨立的音頻信息。所述對混音音頻進行分離後還包括判斷分離出的每個獨立的音頻信息是否為噪音；根據判斷結果，將為噪音的音頻信息進行過濾。還包括將分離出的多個獨立的音頻信息採用時分復用的方式通過少於所述音頻通道數量的揚聲器進行播放。
還包括獲取所述混音音頻的平均音量；根據所述平均音量調整通過所述一個音頻通道輸出的所述分離出的一個獨立的音頻信息的音量大小。還包括對所述分離出的一個所述獨立的音頻信息進行聲紋檢測，獲得聲紋特徵；分配用於輸出與所述聲紋特徵對應的音頻信息的音頻通道。一種終端設備，所述終端設備作為第一終端設備，與至少一個第二終端設備連通，所述第一終端設備具有至少兩個音頻通道，所述第一終端設備包括接收單元，用於接收所述至少一個第二終端設備通過一條傳輸通道傳輸的混音音頻，所述混音音頻中包含混合在一起的至少兩個音頻信息；分離單元，用於對所述混音音頻進行分離，獲得所述混音音頻中的至少一個獨立的音頻信息；輸出單元，用於至少將分離出的一個所述獨立的音頻信息通過一個音頻通道輸出。所述分離單元包括矩陣獲取單元，用於獲取預先設置的分離矩陣，所述分離矩陣為由每個音頻信息的特徵向量組成的矩陣；音頻分離單元，用於根據所述分離矩陣，通過快速獨立成分分析算法ICA從所述混音音頻中分離出獨立的音頻信息。還包括判斷單元，用於判斷分離出的每個獨立的音頻信息是否為噪音；過濾單元，用於根據所述判斷單元的判斷結果，將為噪音的音頻信息進行過濾。還包括播放單元，用於將分離出的多個獨立的音頻信息採用時分復用的方式通過少於所述音頻通道數量的揚聲器進行播放。還包括獲取單元，用於獲取所述混音音頻的平均音量；調整單元，用於根據所述平均音量調整通過所述一個音頻通道輸出的所述分離出的一個獨立的音頻信息的音量大小。還包括檢測單元，用於對所述分離出的一個所述獨立的音頻信息進行聲紋檢測，獲得聲紋特徵；分配單元，用於分配用於輸出與所述聲紋特徵對應的音頻信息的音頻通道。一種音頻處理系統，包括第一終端設備和與所述第一終端設備連接的至少一個第二終端設備，所述第一終端設備具有至少兩個音頻通道，所述第一終端設備，用於接收所述至少一個第二終端設備通過一條傳輸通道傳輸的混音音頻，所述混音音頻中包含混合在一起的至少兩個音頻信息，對所述混音音頻進行分離，獲得所述混音音頻中的至少一個獨立的音頻信息，至少將分離出的一個所述獨立的音頻信息通過一個音頻通道輸出。由上述實施例可以看出，本申請實施例中第一終端設備接收至少一個第二終端設備通過一條傳輸通道傳輸的混音音頻，該混音音頻中包含混合在一起的至少兩個音頻信息，對混音音頻進行分離，獲得混音音頻中的至少一個獨立的音頻信息，至少將分離出的一個獨立的音頻信息通過一個音頻通道輸出。應用本申請實施例，通過在終端設備上設置至少兩個音頻通道，以及對混音音頻進行分離，可以實現將一個獨立的音頻信息通過一個獨立的音頻通道進行輸出播放，由此可以增加單個音頻信息的清晰度，便於用戶進行分辨；進一步，根據分離出的獨立音頻信息，可以對其進行音量大小的調節，滿足用戶對不同音頻信息的收聽需求；並且，雖然傳輸通道上設置了多個音頻通道，但是無需為每個音頻通道配置揚聲器，而是採用時分復用方式共用揚聲器，在保證獨立音頻信息可以清晰播放的同時，節約了硬體成本。

為了更清楚地說明本申請實施例或現有技術中的技術方案，下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹，顯而易見地，對於本領域普通技術人員而言，在不付出創造性勞動性的前提下，還可以根據這些附圖獲得其他的附圖。圖I為本申請音頻處理方法的第一實施例流程圖；圖2A為本申請音頻處理方法的第二實施例流程圖；圖2B為圖2A中一種混音音頻分離的應用場景示意圖；圖3為本申請首頻處理方法的第二實施例流程圖；圖4為本申請首頻處理方法實施例的一種應用場景不意圖；圖5為本申請終端設備的第一實施例框圖；圖6為本申請終端設備的第二實施例框圖；圖7為本申請終端設備的第三實施例框圖；圖8為本申請終端設備的第四實施例框圖；圖9為本申請終端設備的第五實施例框圖；圖10為本申請語音處理系統的實施例框圖。
具體實施例方式本發明如下實施例提供了一種音頻處理方法、終端設備及系統。本發明實施例中的第一終端設備與至少一個第二終端設備連通，該第一終端設備具有至少兩個音頻通道。為了使本技術領域的人員更好地理解本發明實施例中的技術方案，並使本發明實施例的上述目的、特徵和優點能夠更加明顯易懂，下面結合附圖對本發明實施例中技術方案作進一步詳細的說明。參見圖1，為本申請音頻處理方法的第一實施例流程圖步驟101 :第一終端設備接收至少一個第二終端設備通過一條傳輸通道傳輸的混音音頻，該混音音頻中包含混合在一起的至少兩個音頻信息。其中，第一終端設備作為音頻接收端，可以通過PSTN網絡或者IP網絡等與至少一個第二終端設備連通。第一終端設備與至少一個第二終端之間連通的情況包括當第一終端設備連通一個第二終端設備時，該第二終端設備上可以設置一個麥克風，通過該一個麥克風接收多個用戶的語音音頻；或者，當第一終端設備連通一個第二終端設備時，該第二終端上可以設置多個麥克風，每個麥克風接收一個用戶的語音音頻；或者，當第一終端設備連通多個第二終端設備時，每一個第二終端設備上可以分別設置一個麥克風，每個麥克風接收一個用戶的語音音頻；或者，當第一終端設備連通多個第二終端設備時，有的第二設備上·設置多個麥克風，可以接收多個用戶的語音音頻，有的第二終端上設置一個麥克風，可以接收一個用戶的語音音頻。第一終端設備上與網絡交換機之間通過一條傳輸通道連通，該傳輸通道可以具體為語音傳輸通道，無論連接多少第二終端設備，這些第二終端設備傳輸的多個語音音頻通過網絡交換機進行混合，生成一路混音音頻，該混音音頻通過該一條語音傳輸通道傳輸到該第一終端設備。對應前述第一終端設備與至少一個第二終端之間連通的情況，第一終端設備接收到的混音音頻可以包括一個第二終端設備側同時有多個人說話，所獲得的混音音頻；或者，多個第二終端設備側的每一個第二終端設備都有一個人說話，所獲得的混音音頻；或者多個第二終端設備側，有的第二終端設備有一個人說話，有的第二終端設備有多個人說話，由此獲得的混音音頻。步驟102 :對混音音頻進行分離，獲得混音音頻中的至少一個獨立的音頻信息。具體的，可以獲取預先設置的分離矩陣，所述分離矩陣為由每個音頻信息的特徵向量組成的矩陣，根據所述分離矩陣，通過快速ICA (IndependentComponent Analysis,獨立成分分析)算法從所述混音音頻中分離出獨立的音頻信息。本實施例中，對混音音頻進行分離後，可以對分離出的每一個獨立的音頻信息打上唯一識別該音頻信息的標記，通過將該標記與第一終端設備上的某個特定的音頻通道進行匹配，由該音頻通道對該音頻信息進行輸出。步驟103 :至少將分離出的一個獨立的音頻信息通過一個音頻通道輸出。在分離出多個音頻信息的時候，可以根據第一終端設備上所具有音頻通道的數量對音頻信息進行輸出，但至少保證有一個獨立的音頻信息可以通過一個音頻通道單獨輸出播放。當分離出的音頻信息的數量小於音頻通道的數量的時候，可以根據用戶需要選擇與音頻通道數量一致或者小於音頻通道數量的音頻信息進行播放；或者，也可以採用時分復用的方式使多個音頻信息通過一個音頻通道進行輸出，例如，當一個音頻通道在播放完一個音頻信息的空閒時刻，通過該音頻通道播放另一個音頻信息。另外，音頻通道輸出的音頻信息通過與該音頻通道相連的揚聲器進行播放，通常可以為每個音頻通道配置一個揚聲器，但是處於節約成本的考慮，可以配置少於音頻通道數量的揚聲器，此時分離出的多個獨立的音頻信息也可以採用時分復用的方式通過少於音頻通道數量的揚聲器進行播放。需要說明的是，本實施例中採用的時分復用的方式，一般是指當一個發言者結束一小段說話段落後，其所用的揚聲器可以被另外一個發言者使用，而不是兩個發言者同時使用一個揚聲器。參見圖2A，為本申請音頻處理方法的第二實施例流程圖，該實施例示出了對混音音頻進行分離和過濾的詳細處理過程步驟201 :第一終端設備接收至少一個第二終端設備通過一條傳輸通道傳輸的混音音頻，該混音音頻中包含混合在一起的至少兩個音頻信息。其中，第一終端設備作為音頻接收端，可以通過PSTN網絡或者IP網絡等與至少一個第二終端設備連通。第一終端設備與至少一個第二終端之間連通的情況包括當第一終端設備連通一個第二終端設備時，該第二終端設備上可以設置一個麥克風，通過該一個麥克風接收多個用戶的語音音頻；或者，當第一終端設備連通一個第二終端設備時，該第二終端上可以設置多個麥克風，每個麥克風接收一個用戶的語音音頻；或者，當第一終端設備連通多個第二終端設備時，每一個第二終端設備上可以分別設置一個麥克風，每個麥克風接收一個用戶的語音音頻；或者，當第一終端設備連通多個第二終端設備時，有的第二設備上設置多個麥克風，可以接收多個用戶的語音音頻，有的第二終端上設置一個麥克風，可以接收一個用戶的語音音頻。第一終端設備上與網絡交換機之間通過一條傳輸通道連通，該傳輸通道可以具體為語音傳輸通道，無論連接多少第二終端設備，這些第二終端設備傳輸的多個語音音頻通過網絡交換機進行混合，生成一路混音音頻，該混音音頻通過該一條語音傳輸通道傳輸到該第一終端設備。對應前述第一終端設備與至少一個第二終端之間連通的情況，第一終端設備接收到的混音音頻可以包括一個第二終端設備側同時有多個人說話，所獲得的混音音頻；或者，多個第二終端設備側的每一個第二終端設備都有一個人說話，所獲得的混音音頻；或者多個第二終端設備側，有的第二終端設備有一個人說話，有的第二終端設備有多個人說話，由此獲得的混音音頻。步驟202 :對混音音頻進行分離，獲得混音音頻中的至少一個獨立的音頻信息。為了詳細描述本實施例中的混音音頻分離過程，下面結合圖2B所示的應用場景進行描述如下假設在一個會議場景中，vl和v2為兩個獨立的二維語音音頻輸入信號，ml和m2為兩個獨立的麥克風，每個麥克風收到的兩路語音音頻輸入信號二維隨機觀測信號。在這個實際的場景中，vl的聲音不僅會傳到ml，也會傳到m2，但是這兩個語音音頻輸入信號之間存在細微的區別，同樣的差別也發生在v2同時傳輸到ml和m2的情況。首先，可以在會議開始前通過事先的學習訓練，得到一個合適的H矩陣。即兩個發言人可以分別進行自我介紹，相當於先後輸入了 vl和v2，然後系統提取每個說話人的音頻特徵，具體可以使用幾秒長度平穩語音來進行訓練，然後根據MFCC Mel (Mel FrequencyCepstrum Coeff icient,頻率倒譜係數)提取vl和v2的特徵向量,然後用ICA的方式合併vl和v2得到矩陣H，H為2X2階滿秩混合矩陣。其次，在採用Fast ICA算法進行混音音頻分離時，假設已經去掉了音頻信號的均值,則ICA的線性混合模型可以表示為m = Hv = hlvl+hlvl+h2vl+h2v2,其中，h為v的特徵向量，m為每個麥克風接收到的vl和v2的混音音頻；則需要估計分離矩陣W，使得m通過W後的輸出為源信號的估計值y，即y(t)=Wm(t) = WHv (t) = Gv (t),其中G為全局矩陣,如果通過學習得到G = I,那麼y(t) = v(t),也就是說通過算法估計計算出來的信號y，可以還原出原始的聲音V。除了上述示出的採用Fast ICA算法進行混音音頻分離外，作為一個特例，可以簡單地將ml，m2中各個語音的到達時間作為提取特徵，比如vl到達ml的距離短，時間短，因此可以根據這個特徵，在ml中提取出vl ;簡單來說，就是在系統中分別比較vl，v2到達ml，m2的時間，然後進行相減的計算。具體地，類似於根據多個mic陣列消除噪音的原理，就是ml獲得相同語音分量的時間比m2早，那麼可以將m2中收取的聲音作為ml的噪音，對其進行去除，由此可以簡單地得到vl和v2的分離信號。步驟203 :判斷分離出的每個獨立的音頻信息是否為噪音。作為噪音的音頻信息具有特定的音頻特徵，將這些音頻特徵作為噪音特徵進行保存，對於分離出的每個獨立的音頻信息，分別與保存的噪音特徵進行比對，當匹配時，則確定音頻信息為噪音。步驟204 :根據判斷結果，將為噪音的音頻信息進行過濾。步驟205 :至少將分離出的一個獨立的音頻信息通過一個音頻通道輸出。在分離出多個音頻信息的時候，可以根據第一終端設備上所具有音頻通道的數量對音頻信息進行輸出，但至少保證有一個獨立的音頻信息可以通過一個音頻通道單獨輸出播放。當分離出的音頻信息的數量小於音頻通道的數量的時候，可以根據用戶需要選擇與音頻通道數量一致或者小於音頻通道數量的音頻信息進行播放；或者，也可以採用時分復用的方式使多個音頻信息通過一個音頻通道進行輸出，例如，當一個音頻通道在播放完一個音頻信息的空閒時刻，通過該音頻通道播放另一個音頻信息。步驟206 :通過與該音頻通道相連的揚聲器播放該獨立的音頻信息。音頻通道輸出的音頻信息通過與該音頻通道相連的揚聲器進行播放，通常可以為每個音頻通道配置一個揚聲器，但是處於節約成本的考慮，可以配置少於音頻通道數量的揚聲器，此時分離出的多個獨立的音頻信息也可以採用時分復用的方式通過少於音頻通道數量的揚聲器進行播放。需要說明的是，本實施例中採用的時分復用的方式，一般是指當一個發言者結束一小段說話段落後，其所用的揚聲器可以被另外一個發言者使用，而不是兩個發言者同時使用一個揚聲器。參見圖3，為本申請音頻處理方法的第三實施例流程圖，該實施例是出了對分離出的獨立音頻信息分配音頻通道並進行音量調整的過程步驟301 :第一終端設備接收所述至少一個第二終端設備通過一條傳輸通道傳輸的混音音頻，該混音音頻中包含混合在一起的至少兩個音頻信息。其中，第一終端設備作為音頻接收端，可以通過PSTN網絡或者IP網絡等與至少一個第二終端設備連通。第一終端設備與至少一個第二終端之間連通的情況包括當第一終端設備連通一個第二終端設備時，該第二終端設備上可以設置一個麥克風，通過該一個麥克風接收多個用戶的語音音頻；或者，當第一終端設備連通一個第二終端設備時，該第二終端上可以設置多個麥克風，每個麥克風接收一個用戶的語音音頻；或者，當第一終端設備連通多個第二終端設備時，每一個第二終端設備上可以分別設置一個麥克風，每個麥克風接收一個用戶的語音音頻；或者，當第一終端設備連通多個第二終端設備時，有的第二設備上設置多個麥克風，可以接收多個用戶的語音音頻，有的第二終端上設置一個麥克風，可以接收一個用戶的語音音頻。第一終端設備上與網絡交換機之間通過一條傳輸通道連通，該傳輸通道可以具體為語音傳輸通道，無論連接多少第二終端設備，這些第二終端設備傳輸的多個語音音頻通過網絡交換機進行混合，生成一路混音音頻，該混音音頻通過該一條語音傳輸通道傳輸到該第一終端設備。對應前述第一終端設備與至少一個第二終端之間連通的情況，第一終端設備接收到的混音音頻可以包括一個第二終端設備側同時有多個人說話，所獲得的混音音頻；或者，多個第二終端設備側的每一個第二終端設備都有一個人說話，所獲得的混音音頻；或者多個第二終端設備側，有的第二終端設備有一個人說話，有的第二終端設備有多個人說話，由此獲得的混音音頻。步驟302 :獲取混音音頻的平均音量，並記錄該平均音量。

步驟303 :對混音音頻進行分離，獲得混音音頻中的至少一個獨立的音頻信息。具體的，可以獲取預先設置的分離矩陣，所述分離矩陣為由每個音頻信息的特徵向量組成的矩陣，根據所述分離矩陣，通過快速ICA算法從混音音頻中分離出獨立的音頻信息。其中，當應用在會議場景時，可以在進行會議前進行語音訓練，將提取的語音的聲紋特徵通過網絡發送到音頻接收端，然後在音頻接收端根據語音的聲紋特徵從混音音頻中分離出獨立的音頻信息；另外，也可以由各個音頻接收端在會議開始前收集各個發言人的聲紋特徵，然後進行保存，然後在音頻接收端根據語音的聲紋特徵從混音音頻中分離出獨立的音頻信息。在提取語音的聲紋特徵時，可以對語音進行分析獲得的特徵包括頻譜、倒頻譜、共振峰、基音、反射係數等。步驟304 :對分離出的一個獨立的音頻信息進行聲紋檢測，獲得聲紋特徵。步驟305 :分配用於輸出與該聲紋特徵對應的音頻信息的音頻通道。步驟306 :根據記錄的平均音量調整通過所分配的音頻通道輸出的一個獨立的音頻信息的音量大小。步驟307 :通過與該音頻通道相連的揚聲器播放該獨立的音頻信息。音頻通道輸出的音頻信息通過與該音頻通道相連的揚聲器進行播放，通常可以為每個音頻通道配置一個揚聲器，但是處於節約成本的考慮，可以配置少於音頻通道數量的揚聲器，此時分離出的多個獨立的音頻信息也可以採用時分復用的方式通過少於音頻通道數量的揚聲器進行播放。需要說明的是，本實施例中採用的時分復用的方式，一般是指當一個發言者結束一小段說話段落後，其所用的揚聲器可以被另外一個發言者使用，而不是兩個發言者同時使用一個揚聲器。參見圖4,為本申請首頻處理方法實施例的一種應用場景不意圖其中，終端設備I為音頻接收端，終端設備2和終端設備3為音頻發送端，上述三個終端設備可以通過圖4中示出的PSTN網絡交換機相連，另外，也可以通過IP網絡相連。每個終端設備與PSTN網絡交換機之間相連的傳輸通道為一條，因此當有多個語音音頻需要傳輸時，該傳輸通道僅能傳輸多個語音音頻的混音。
假設終端設備2上有兩個麥克風，分別為麥克風I和麥克風2，終端設備3上有一個麥克風，為麥克風3，此時用戶間通過三個終端設備進行電話會議。其中，用戶I和用戶2在終端設備2上，分別使用麥克風I和麥克風2輸入語音，用戶3在終端設備3上使用麥克風3輸入語音，上述三個語音傳輸到PSTN網的交換機後，該交換機將三個語音進行混合後，通過終端設備I與該PSTN交換機之間的傳輸通道將混音音頻傳輸到終端設備I。終端設備I接收到混音音頻後，可以採用前述實施例中示出的音頻處理方法對混音音頻進行分離。假設終端設備I上預先設置了兩個音頻通道，如圖4所示，每一個音頻通道連接一個揚聲器，圖4中共不出兩個揚聲器,分別為揚聲器I和揚聲器2。對於分離出對應三個用戶的三個獨立的語音音頻，可以選擇性的進行播放，例如，可以通過揚聲器I輸出用戶I的語音音頻，通過揚聲器2輸出用戶3的語音音頻，對於用戶2的語音音頻可以選擇不輸出，或者在用戶I和用戶3的語音音頻輸出完畢後，再單獨輸出，對此本申請實施例不進行限制，只要保證可以通過一個音頻通道對應的一個揚聲器輸出並播放一個獨立的語音音頻即可。圖4中，對於每個揚聲器輸出的語音音頻的音量大小可以單獨進行調節；另外，也可以僅設置一個揚聲器，通過時分復用的方式輸出獨立的語音音頻，以節省硬體成本。與本申請音頻處理方法的實施例相對應，本申請還提供了終端設備和引用處理系統的實施例。其中，終端設備實施例中的終端設備均作為第一終端設備進行描述，該第一終端設備與至少一個第二終端設備連通，該第一終端設備具有至少兩個音頻通道。參見圖5，為本申請終端設備的第一實施例框圖該終端設備包括接收單元510、分離單元520和輸出單元530。其中，接收單元510，用於接收所述至少一個第二終端設備通過一條傳輸通道傳輸的混音音頻，所述混音音頻中包含混合在一起的至少兩個音頻信息；分離單元520，用於對所述混音音頻進行分離，獲得所述混音音頻中的至少一個獨立的音頻信息；輸出單元530，用於至少將分離出的一個所述獨立的音頻信息通過一個音頻通道輸出。參見圖6，為本申請終端設備的第二實施例框圖該終端設備包括接收單元610、分離單元620、判斷單元630、過濾單元640和輸出單元650。其中，接收單元610，用於接收所述至少一個第二終端設備通過一條傳輸通道傳輸的混音音頻，所述混音音頻中包含混合在一起的至少兩個音頻信息；分離單元620，用於對所述混音音頻進行分離，獲得所述混音音頻中的至少一個獨立的音頻信息；判斷單元630，用於判斷分離出的每個獨立的音頻信息是否為噪音；過濾單元640，用於根據所述判斷單元的判斷結果，將為噪音的音頻信息進行過濾；輸出單元650，用於至少將分離出的一個所述獨立的音頻信息通過一個音頻通道輸出。參見圖7，為本申請終端設備的第三實施例框圖
該終端設備包括接收單元710、分離單元720、輸出單元730和播放單元740。接收單元710，用於接收所述至少一個第二終端設備通過一條傳輸通道傳輸的混音音頻，所述混音音頻中包含混合在一起的至少兩個音頻信息；分離單元720，用於對所述混音音頻進行分離，獲得所述混音音頻中的至少一個獨立的音頻信息；輸出單元730，用於至少將分離出的一個所述獨立的音頻信息通過一個音頻通道輸出；播放單元740，用於將分離出的多個獨立的音頻信息採用時分復用的方式通過少於所述音頻通道數量的揚聲器進行播放。參見圖8，為本申請終端設備的第四實施例框圖
該終端設備包括接收單元810、獲取單元820、分離單元830、輸出單元840和調整單元850。接收單元810，用於接收所述至少一個第二終端設備通過一條傳輸通道傳輸的混音音頻，所述混音音頻中包含混合在一起的至少兩個音頻信息；獲取單元820，用於獲取所述混音音頻的平均音量；分離單元830，用於對所述混音音頻進行分離，獲得所述混音音頻中的至少一個獨立的音頻信息；輸出單元840，用於至少將分離出的一個所述獨立的音頻信息通過一個音頻通道輸出；調整單元850，用於根據所述平均音量調整通過所述一個音頻通道輸出的所述分離出的一個獨立的音頻信息的音量大小。參見圖9，為本申請終端設備的第五實施例框圖該終端設備包括接收單元910、分離單元920、檢測單元930、分配單元940和輸出單元950。其中，接收單元910，用於接收所述至少一個第二終端設備通過一條傳輸通道傳輸的混音音頻，所述混音音頻中包含混合在一起的至少兩個音頻信息；分離單元920，用於對所述混音音頻進行分離，獲得所述混音音頻中的至少一個獨立的音頻信息；檢測單元930，用於對所述分離出的一個獨立的音頻信息進行聲紋檢測，獲得聲紋特徵；分配單元940，用於分配用於輸出與所述聲紋特徵對應的音頻信息的音頻通道；輸出單元950，用於至少將分離出的一個所述獨立的音頻信息通過一個音頻通道輸出。上述圖5至圖9示出的終端設備實施例中，分離單元可以包括(圖5至圖9中未具體示出)矩陣獲取單元，用於獲取預先設置的分離矩陣，所述分離矩陣為由每個音頻信息的特徵向量組成的矩陣；音頻分離單元，用於根據所述分離矩陣，通過快速獨立成分分析算法ICA從所述混音音頻中分離出獨立的音頻信息。
參見圖10，為本申請音頻處理系統的實施例框圖該音頻處理系統包括第一終端設備1010和與所述第一終端設備連接的至少一個第二終端設備1020，所述第一終端設備具有至少兩個音頻通道。為了示例方便，圖10中僅示出兩個第二終端設備1020。其中，所述第一終端設備1010，用於接收所述至少一個第二終端設備1020通過一條傳輸通道傳輸的混音音頻，所述混音音頻中包含混合在一起的至少兩個音頻信息，對所述混音音頻進行分離，獲得所述混音音頻中的至少一個獨立的音頻信息，至少將分離出的一個所述獨立的音頻信息通過一個音頻通道輸出。進一步，所述第一終端設備1010，還用於判斷分離出的每個獨立的音頻信息是否為噪音，根據判斷結果，將為噪音的音頻信息進行過濾。進一步，所述第一終端設備1010，還用於將分離出的多個獨立的音頻信息採用時分復用的方式通過少於所述音頻通道數量的揚聲器進行播放。進一步，所述第一終端設備1010，還用於獲取所述混音音頻的平均音量，根據所述平均音量調整通過所述一個音頻通道輸出的所述分離出的一個獨立的音頻信息的音量大小。進一步，所述第一終端設備1010，還用於對所述分離出的一個所述獨立的音頻信息進行聲紋檢測，獲得聲紋特徵，分配用於輸出與所述聲紋特徵對應的音頻信息的音頻通道。通過對以上實施方式的描述可知，本申請實施例中第一終端設備接收至少一個第二終端設備通過一條傳輸通道傳輸的混音音頻，該混音音頻中包含混合在一起的至少兩個音頻信息，對混音音頻進行分離，獲得混音音頻中的至少一個獨立的音頻信息，至少將分離出的一個獨立的音頻信息通過一個音頻通道輸出。應用本申請實施例，通過在終端設備上設置至少兩個音頻通道，以及對混音音頻進行分離，可以實現將一個獨立的音頻信息通過一個音頻通道進行輸出播放，由於多個音頻通道的輸出揚聲器物理位置上分開，使得用戶還可以獲取音頻來自不同的方位的信息，由此可以增加單個音頻信息的清晰度，便於用戶進行分辨；進一步，根據分離出的獨立音頻信息，可以對其進行音量大小的調節，滿足用戶對不同音頻信息的收聽需求；並且，雖然傳輸通道上設置了多個音頻通道，但是無需為每個音頻通道配置揚聲器，而是採用時分復用方式共用揚聲器，在保證獨立音頻信息可以清晰播放的同時，節約了硬體成本。本領域的技術人員可以清楚地了解到本發明實施例中的技術可藉助軟體加必需的通用硬體平臺的方式來實現。基於這樣的理解，本發明實施例中的技術方案本質上或者說對現有技術做出貢獻的部分可以以軟體產品的形式體現出來，該計算機軟體產品可以存儲在存儲介質中，如R0M/RAM、磁碟、光碟等，包括若干指令用以使得一臺計算機設備(可以是個人計算機，伺服器，或者網絡設備等)執行本發明各個實施例或者實施例的某些部分所述的方法。本說明書中的各個實施例均採用遞進的方式描述，各個實施例之間相同相似的部分互相參見即可，每個實施例重點說明的都是與其他實施例的不同之處。尤其，對於系統實施例而言，由於其基本相似於方法實施例，所以描述的比較簡單，相關之處參見方法實施例的部分說明即可。
以上所述的本發明實施方式，並不構成對本發明保護範圍的限定。任何在本發明的精神和原則之內所作的修改、等同替換和改進等，均應包含在本發明的保護範圍之內。·
權利要求
1.一種音頻處理方法，其特徵在於，應用於具有至少兩個音頻通道的第一終端設備中，所述第一終端設備與至少一個第二終端設備連通，所述方法包括接收所述至少一個第二終端設備通過一條傳輸通道傳輸的混音音頻，所述混音音頻中包含混合在一起的至少兩個音頻信息；對所述混音音頻進行分離，獲得所述混音音頻中的至少一個獨立的音頻信息；至少將分離出的一個所述獨立的音頻信息通過一個音頻通道輸出。
2.根據權利要求I所述的方法，其特徵在於，所述對混音音頻進行分離包括獲取預先設置的分離矩陣，所述分離矩陣為由每個音頻信息的特徵向量組成的矩陣；根據所述分離矩陣，通過快速獨立成分分析算法ICA從所述混音音頻中分離出獨立的音頻信息。
3.根據權利要求I所述的方法，其特徵在於，所述對混音音頻進行分離後還包括判斷分離出的每個獨立的音頻信息是否為噪音；根據判斷結果，將為噪音的音頻信息進行過濾。
4.根據權利要求I所述的方法，其特徵在於，還包括將分離出的多個獨立的音頻信息採用時分復用的方式通過少於所述音頻通道數量的揚聲器進行播放。
5.根據權利要求I所述的方法，其特徵在於，還包括獲取所述混音音頻的平均音量；根據所述平均音量調整通過所述一個音頻通道輸出的所述分離出的一個獨立的音頻信息的音量大小。
6.根據權利要求I所述的方法，其特徵在於，還包括對所述分離出的一個所述獨立的音頻信息進行聲紋檢測，獲得聲紋特徵；分配用於輸出與所述聲紋特徵對應的音頻信息的音頻通道。
7.—種終端設備，其特徵在於，所述終端設備作為第一終端設備，與至少一個第二終端設備連通，所述第一終端設備具有至少兩個音頻通道，所述第一終端設備包括接收單元，用於接收所述至少一個第二終端設備通過一條傳輸通道傳輸的混音音頻，所述混音音頻中包含混合在一起的至少兩個音頻信息；分離單元，用於對所述混音音頻進行分離，獲得所述混音音頻中的至少一個獨立的音頻信息；輸出單元，用於至少將分離出的一個所述獨立的音頻信息通過一個音頻通道輸出。
8.根據權利要求7所述的終端設備，其特徵在於，所述分離單元包括矩陣獲取單元，用於獲取預先設置的分離矩陣，所述分離矩陣為由每個音頻信息的特徵向量組成的矩陣；音頻分離單元，用於根據所述分離矩陣，通過快速獨立成分分析算法ICA從所述混音音頻中分離出獨立的音頻信息。
9.根據權利要求7所述的終端設備，其特徵在於，還包括判斷單元，用於判斷分離出的每個獨立的音頻信息是否為噪音；過濾單元，用於根據所述判斷單元的判斷結果，將為噪音的音頻信息進行過濾。
10.根據權利要求7所述的終端設備，其特徵在於，還包括播放單元，用於將分離出的多個獨立的音頻信息採用時分復用的方式通過少於所述音頻通道數量的揚聲器進行播放。
11.根據權利要求7所述的終端設備，其特徵在於，還包括獲取單元，用於獲取所述混音音頻的平均音量；調整單元，用於根據所述平均音量調整通過所述一個音頻通道輸出的所述分離出的一個獨立的音頻信息的音量大小。
12.根據權利要求7所述的終端設備，其特徵在於，還包括檢測單元，用於對所述分離出的一個所述獨立的音頻信息進行聲紋檢測，獲得聲紋特徵；分配單元，用於分配用於輸出與所述聲紋特徵對應的音頻信息的音頻通道。
13.一種音頻處理系統，其特徵在於，包括第一終端設備和與所述第一終端設備連接的至少一個第二終端設備，所述第一終端設備具有至少兩個音頻通道，所述第一終端設備，用於接收所述至少一個第二終端設備通過一條傳輸通道傳輸的混音音頻，所述混音音頻中包含混合在一起的至少兩個音頻信息，對所述混音音頻進行分離，獲得所述混音音頻中的至少一個獨立的音頻信息，至少將分離出的一個所述獨立的音頻信息通過一個音頻通道輸出。
全文摘要
本申請實施例公開了一種音頻處理方法，應用於具有至少兩個音頻通道的第一終端設備中，所述第一終端設備與至少一個第二終端設備連通，所述方法包括所述第一終端設備接收所述至少一個第二終端設備通過一條傳輸通道傳輸的混音音頻，所述混音音頻中包含混合在一起的至少兩個音頻信息；對所述混音音頻進行分離，獲得所述混音音頻中的至少一個獨立的音頻信息；至少將分離出的一個所述獨立的音頻信息通過一個音頻通道輸出。應用本申請實施例，通過在終端設備上設置至少兩個音頻通道，以及對混音音頻進行分離，可以實現將一個獨立的音頻信息通過一個音頻通道進行輸出播放，由此可以增加單個音頻信息的清晰度，便於用戶進行分辨。
文檔編號G10L25/24GK102890936SQ20111020192
公開日2013年1月23日申請日期2011年7月19日優先權日2011年7月19日
發明者李眾慶申請人:聯想(北京)有限公司

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

一種音頻處理方法、終端設備及系統的製作方法

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法