新四季網

音頻信號處理系統和音頻信號處理方法與流程

2023-07-15 21:58:37


本發明涉及信號處理技術領域,尤其涉及一種音頻信號處理系統和音頻信號處理方法。



背景技術:

語音交互,已經遍及我們生活的各個領域,如手機、電視、車載、空調等等領域。能夠進行正常語音交互的前提是準確識別語音信號。以手機終端為例,由於環境噪聲的存在,手機終端的麥克風在採集用戶的有效聲源信號的同時,也會採集到環境噪聲信號,這些環境噪聲信號會對有效聲源信號的準確識別造成幹擾,因此,需要對麥克風採集到的語音信號進行降噪處理,降低噪聲對聲源信號的影響。

現有的一種較為常見的降噪處理方式是採用雙麥克風進行降噪處理。雙麥克風降噪主要思想是在終端上設置兩個麥克風,理想情況下主麥克風採集的主麥克風信號為帶環境噪聲的語音信號,輔麥克風採集的輔麥克風信號僅包括環境噪聲,且主、輔麥克風採集的環境噪聲特性一致,兩者相減則得到純淨的聲源信號。

目前,在諸如手機終端等場景中,用戶在使用手機終端時,聲音源方位相對固定,從而雙麥克風位置固定,即靠近用戶說話的位置處設置主麥克風,遠離用戶說話的位置設置輔麥克風。但是,隨著各種智能交互產品的不斷問世,語音交互的場景發生了很大改變,聲音源相對智能交互產品的方位不再固定不變,此時,固定設置某個麥克風作為主麥克風、另一麥克風作為輔麥克風已經不能靈活適應智能語音交互場景的需求,很可能導致聲源信號的識別準確性大大降低。



技術實現要素:

有鑑於此,本發明實施例提供一種音頻信號處理系統和音頻信號處理方法,能夠自適應語音交互場景,有助於提高語音識別結果的準確性。

本發明實施例提供一種音頻信號處理系統,包括:

背向設置的第一麥克風陣列和第二麥克風陣列,連接組件,控制器,以及降噪組件;其中,

所述第一麥克風陣列和所述第二麥克風陣列的設置間距大於預設距離;

所述控制器上設置有主麥克接口和輔麥克接口;

所述降噪組件的輸入端與所述控制器連接;

所述連接組件,用於使所述第一麥克風陣列和所述第二麥克風陣列與所述主麥克接口和所述輔麥克接口具有當前的輸入連接關係;

所述控制器,用於對從所述主麥克接口接收到的第一音頻信號與從所述輔麥克接口接收到的第二音頻信號進行信號強度比較,根據比較結果通過所述連接組件保持或改變所述輸入連接關係。

本發明實施例提供一種音頻信號處理方法,包括:

接收從第一輸入接口輸入的第一音頻信號,以及從第二輸入接口輸入的第二音頻信號;

對所述第一音頻信號和所述第二音頻信號進行信號強度比較;

根據所述信號強度的比較結果,保持或切換所述第一音頻信號和所述第二音頻信號的輸入接口;

對從所述第一輸入接口輸入的音頻信號和從所述第二輸入接口輸入的音頻信號進行降噪處理。

本發明實施例提供的音頻信號處理系統和音頻信號處理方法,該系統中包括背向間隔設置的第一麥克風陣列和第二麥克風陣列,連接組件,控制器,以及降噪組件,控制器上設置有主麥克接口和輔麥克接口。假設當前連接組件使得第一麥克風陣列和第二麥克風陣列與主麥克接口和輔麥克接口具有某種輸入連接關係,在該輸入連接關係下,控制器對從主麥克接口接收到的第一音頻信號與從輔麥克接口接收到的第二音頻信號進行信號強度比較,以根據比較結果控制連接組件保持或改變輸入連接關係。也就是說,如果發現在該輸入連接關係下,從主麥克接口輸入的第一音頻信號的信號強度小於從輔麥克輸入的第二音頻信號的信號強度,則說明與主麥克接口連接的麥克風陣列不應該再連接在主麥克接口,應該切換連接到輔麥克接口,從而切換兩個麥克風陣列與主、輔麥克接口的連接關係,從而實現了根據音頻信號強度自適應地切換主、輔麥克接口輸入信號,以自適應當前的智能語音交互場景,也保證了良好的降噪效果,有助於提高語音識別結果的準確性。

附圖說明

為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發明的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。

圖1為本發明實施例提供的音頻信號處理系統實施例一的結構示意圖;

圖2為本發明實施例提供的音頻信號處理系統實施例二的結構示意圖;

圖3為本發明實施例提供的音頻信號處理方法實施例一的流程圖。

具體實施方式

為使本發明實施例的目的、技術方案和優點更加清楚,下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都屬於本發明保護的範圍。

在本發明實施例中使用的術語是僅僅出於描述特定實施例的目的,而非旨在限制本發明。在本發明實施例和所附權利要求書中所使用的單數形式的「一種」、「所述」和「該」也旨在包括多數形式,除非上下文清楚地表示其他含義,「多種」一般包含至少兩種,但是不排除包含至少一種的情況。

應當理解,本文中使用的術語「和/或」僅僅是一種描述關聯對象的關聯關係,表示可以存在三種關係,例如,A和/或B,可以表示:單獨存在A,同時存在A和B,單獨存在B這三種情況。另外,本文中字符「/」,一般表示前後關聯對象是一種「或」的關係。

應當理解,儘管在本發明實施例中可能採用術語第一、第二、第三等來描述XXX,但這些XXX不應限於這些術語。這些術語僅用來將XXX彼此區分開。例如,在不脫離本發明實施例範圍的情況下,第一XXX也可以被稱為第二XXX,類似地,第二XXX也可以被稱為第一XXX。

取決於語境,如在此所使用的詞語「如果」、「若」可以被解釋成為「在……時」或「當……時」或「響應於確定」或「響應於檢測」。類似地,取決於語境,短語「如果確定」或「如果檢測(陳述的條件或事件)」可以被解釋成為「當確定時」或「響應於確定」或「當檢測(陳述的條件或事件)時」或「響應於檢測(陳述的條件或事件)」。

還需要說明的是,術語「包括」、「包含」或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的商品或者系統不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種商品或者系統所固有的要素。在沒有更多限制的情況下,由語句「包括一個……」限定的要素,並不排除在包括所述要素的商品或者系統中還存在另外的相同要素。

圖1為本發明實施例提供的音頻信號處理系統實施例一的結構示意圖,如圖1所示,該系統包括:

背向設置的第一麥克風陣列1和第二麥克風陣列2,連接組件3,控制器4,以及降噪組件5。

其中,為了保證第一麥克風陣列1和第二麥克風陣列2分別採集的音頻信號具有一定的區分度,第一麥克風陣列1和第二麥克風陣列2的設置間距需要大於預設距離,該預設距離可以根據實際應用環境而設定。

第一麥克風陣列1和第二麥克風陣2具有相同的陣列結構,可選地,可以採用現有技術中已經提供的任一陣列結構,比如可以為線性麥克風陣列。

另外,為了保證這兩個麥克風陣列作為一個整體能夠實現音頻信號的全向採集即360度採集,同時,保證單個麥克風陣列具有一定的聲音指向性,避免不相關環境噪聲對其採集音頻信號的過多幹擾,可以設置令第一麥克風陣列1和第二麥克風陣列2分別覆蓋180度的音頻採集範圍。

本實施例中提供的上述音頻信號處理系統可以適用於多種智能交互產品中,本實施例中,以應用在智能移動機器人中為例。此時,第一麥克風陣列1和第二麥克風陣列2可以設置在機器人機身上、距離地面相同高度的位置,比如:第一麥克風陣列1和第二麥克風陣列2可以設置在機器人頭部的前、後兩側。

當該機器人被啟動語音交互功能後,第一麥克風陣列1和第二麥克風陣列2分別用於採集用戶交互語音。

如圖1所示,作為採集外部音頻信號的音頻採集器件的第一麥克風陣列1和第二麥克風陣列2通過一個連接組件3與控制器4連接。具體地,控制器4上設置有主麥克接口41和輔麥克接口42,連接組件3使得第一麥克風陣列1和第二麥克風陣列2與主麥克接口41和輔麥克接口42具有當前的輸入連接關係。

其中,主麥克接口41和輔麥克接口42可以被視為是對這兩個麥克風陣列分別採集的音頻信號的信號屬性的表徵。具體來說,可以將從主麥克接口41輸入的音頻信號視為聲音源信號,即含有有效語音成分更多的信號,將從輔麥克接口42輸入的音頻信號視為噪聲信號。

其中,當前的輸入連接關係可以是預先默認設置的某個連接關係,也可以是上一次語音交互時所採用的連接關係。舉例來說,假設當前的輸入連接關係是,連接組件3使得第一麥克風陣列1與主麥克接口41連接,第二麥克風陣列2與輔麥克接口42連接。那麼此時,控制器4將從主麥克接口41接收到第一麥克風陣列1採集的音頻信號,從輔麥克接口42接收到第二麥克風陣列2採集的音頻信號。

在上述當前的輸入連接關係下,此時如果用戶觸發了語音輸入,則第一麥克風陣列1和第二麥克風陣列2分別採集到音頻信號,並基於當前的輸入連接關係,這兩個麥克風陣列將各自採集到的音頻信號輸入控制器,此時,控制器4對從主麥克接口41接收到的第一音頻信號與從輔麥克接口42接收到的第二音頻信號進行信號強度比較,根據比較結果通過連接組件3保持或改變當前的該輸入連接關係。

在上述舉例中,此時的第一音頻信號為第一麥克風陣列1採集到的音頻信號,第二音頻信號為第二麥克風陣列2採集到的音頻信號,控制器4可以通過對這兩個音頻信號分別進行一定的信號處理,比如放大、濾波等處理,求取這兩個音頻信號的信號強度,進行比較。

如果比較結果顯示第一音頻信號的信號強度大於第二音頻信號的信號強度,說明此時從主麥克接口41輸入的第一音頻信號確實為聲音源信號,從輔麥克接口42輸入的第二音頻信號為噪聲信號,當前無需改變第一麥克風陣列1與主麥克接口41的連接關係以及第二麥克風陣列2與輔麥克接口42的連接關係。

相反地,如果比較結果顯示第一音頻信號的信號強度小於第二音頻信號的信號強度,說明此時從主麥克接口41輸入的第一音頻信號應該視為噪聲信號,而從輔麥克接口42輸入的第二音頻信號應該為聲音源信號,則需要改變第一麥克風陣列1與主麥克接口41的連接關係以及第二麥克風陣列2與輔麥克接口42的連接關係,改變為第一麥克風陣列1與輔麥克接口42連接,第二麥克風陣列2與主麥克接口41連接。

其中,該輸入連接關係的改變可以是控制器4通過控制連接組件3來實現的,具體可選地,連接組件3可以實現為切換開關,從而,控制器4可以在確定其從主麥克接口41收到的第一音頻信號的信號強度小於其從輔麥克接口42收到的第二音頻信號的信號強度時,向切換開關發送切換控制信號,以控制切換開關改變當前的輸入連接關係。

本實施例中,可選地,控制器4可以使用各種應用專用集成電路(ASIC)、數位訊號處理器(DSP)、數位訊號處理設備(DSPD)、可編程邏輯器件(PLD)、現場可編程門陣列(FPGA)、微中控元件、微處理器或其他電子元件實現。

在執行完上述主、輔麥克接口的輸入音頻信號的切換控制後,可以基於雙麥克降噪原理,採用降噪組件5對輸入的兩路音頻信號進行降噪處理。

具體地,降噪組件5的輸入端與控制器4連接,控制器4可以將其不斷從主、輔麥克接口接收到的音頻信號輸入到降噪組件5的輸入端。具體來說,降噪組件5一般具有主信號輸入端和輔信號輸入端,主信號輸入端用於輸入主麥克接口41接收到的音頻信號,輔信號輸入端用於輸入輔麥克接口42接收到的音頻信號,以主信號輸入端和輔信號輸入端輸入的音頻信號做相減運算,完成降噪處理。該降噪處理過程僅為簡單示意性描述,實際的降噪處理過程可以參見現有技術的處理過程。

值得說明的是,在上述切換控制策略中,切換與否的依據是基於已經通過主、輔麥克接口輸入的音頻信號的信號強度,該已經輸入的音頻信號相對於一次語音交互過程中輸入的全部音頻信號而言,是非常短的,因此理想情況下,該部分音頻信號可以認為只用於切換判定之用,對於後續的降噪、語音識別過程沒有影響,即不會輸入到後續組件中。

本實施例中,假設當前連接組件使得第一麥克風陣列和第二麥克風陣列與主麥克接口和輔麥克接口具有某種輸入連接關係,在該輸入連接關係下,控制器對從主麥克接口接收到的第一音頻信號與從輔麥克接口接收到的第二音頻信號進行信號強度比較,以根據比較結果控制連接組件保持或改變輸入連接關係。也就是說,如果發現在該輸入連接關係下,從主麥克接口輸入的第一音頻信號的信號強度小於從輔麥克輸入的第二音頻信號的信號強度,則說明與主麥克接口連接的麥克風陣列不應該再連接在主麥克接口,應該切換連接到輔麥克接口,從而切換兩個麥克風陣列與主、輔麥克接口的連接關係,從而實現了根據音頻信號強度自適應地切換主、輔麥克接口輸入信號,以自適應當前的智能語音交互場景,也保證了良好的降噪效果,有助於提高語音識別結果的準確性。

圖2為本發明實施例提供的音頻信號處理系統實施例二的結構示意圖,如圖2所示,在圖1所示實施例基礎上,可選地,該系統還包括:

第一防塵防風裝置6和第二防塵防風裝置7。其中,第一麥克風陣列1安裝在第一防塵防風裝置6內,第二麥克風陣列2安裝在第二防塵防風裝置7內。

本實施例中,為了物理上儘量保證環境因素對語音識別結果的不利影響,在麥克風陣列的組裝工藝上提供了第一防塵防風裝置6和第二防塵防風裝置7,以儘量降低環境因素對語音識別結果的不利影響。

其中,第一防塵防風裝置6和第二防塵防風裝置7中比如包括防風棉、防塵網等結構,以降低風聲、粉塵對麥克風陣列的影響。

可選地,該系統還包括:語音識別組件8和交互組件9。

其中,語音識別組件8分別與降噪組件5的輸出端和控制器4連接,用於對降噪後的音頻信號進行語音識別,將語音識別結果輸入給控制器4。

控制器4還用於根據語音識別結果控制交互組件9進行相應的交互反饋。

本發明實施例提供的音頻信號處理系統一般適用於智能語音交互的產品中,為了實現智能語音交互功能,在通過降噪組件5對輸入的音頻信號進行了降噪處理後,降噪後的音頻信號輸入給語音識別組件,以完成用戶輸入語音的語音識別處理。同時,為了實現基於語音的智能交互,以機器人為例,需要基於語音識別結果向用戶進行相應的反饋。本實施例中,以機器人為例,該交互組件9比如可以是語音播放器,控制器4可以基於語音識別結果通過語音播放器向用戶反饋應答語音;再比如可以是顯示屏,控制器4可以基於語音識別結果通過顯示屏向用戶反饋某種業務操作界面;再比如還可以是運動部件,控制器4可以基於語音識別結果通過控制運動部件使機器人執行相應的反饋動作,等等。

圖3為本發明實施例提供的音頻信號處理方法實施例一的流程圖,本實施例提供的該音頻信號處理方法可以由一音頻信號處理系統來執行,該音頻信號處理系統可以實現為硬體,或者實現為軟體和硬體的組合,該音頻信號處理系統可以集成設置比如移動機器人等語音交互設備中,比如可以是圖1、圖2所示的系統結構。如圖3所示,該方法包括如下步驟:

步驟101、接收從第一輸入接口輸入的第一音頻信號,以及從第二輸入接口輸入的第二音頻信號。

本實施例中,上述第一輸入接口對應於前述實施例中的主麥克接口,第二輸入接口對應於輔麥克接口。

步驟102、對第一音頻信號和第二音頻信號進行信號強度比較。

步驟103、根據信號強度的比較結果,保持或切換第一音頻信號和第二音頻信號的輸入接口。

步驟104、對從第一輸入接口輸入的音頻信號和從第二輸入接口輸入的音頻信號進行降噪處理。

具體地,對從第一輸入接口輸入的音頻信號和從第二輸入接口輸入的音頻信號進行降噪處理,包括:

若根據信號強度的比較結果,保持第一音頻信號和第二音頻信號的輸入接口,則以第二音頻信號為噪聲信號,對作為聲音源信號的第一音頻信號進行降噪處理;

若根據信號強度的比較結果,切換第一音頻信號和第二音頻信號的輸入接口,則以第一音頻信號為噪聲信號,對作為聲音源信號的第二音頻信號進行降噪處理。

本實施例提供的音頻信號處理方法的具體適用場景和詳細過程,可以參見前述實施例中的說明,在此不贅述。

以上所描述的系統實施例僅僅是示意性的,其中所述作為分離部件說明的單元(諸如各種組件、裝置等)可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位於一個地方,或者也可以分布到多個網絡單元上。可以根據實際的需要選擇其中的部分或者全部模塊來實現本實施例方案的目的。本領域普通技術人員在不付出創造性的勞動的情況下,即可以理解並實施。

通過以上的實施方式的描述,本領域的技術人員可以清楚地了解到各實施方式可藉助加必需的通用硬體平臺的方式來實現,當然也可以通過硬體。基於這樣的理解,上述技術方案本質上或者說對現有技術做出貢獻的部分可以以產品的形式體現出來,該計算機產品可以存儲在計算機可讀存儲介質中,如ROM/RAM、磁碟、光碟等,包括若干指令用以使得一臺計算機裝置(可以是個人計算機,伺服器,或者網絡裝置等)執行各個實施例或者實施例的某些部分所述的方法。

最後應說明的是:以上實施例僅用以說明本發明的技術方案,而非對其限制;儘管參照前述實施例對本發明進行了詳細的說明,本領域的普通技術人員應當理解:其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分技術特徵進行等同替換;而這些修改或者替換,並不使相應技術方案的本質脫離本發明各實施例技術方案的精神和範圍。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀