一種語音識別頻道選擇系統、方法及頻道轉換裝置的製作方法

2023-07-04 17:01:51 3

專利名稱：一種語音識別頻道選擇系統、方法及頻道轉換裝置的製作方法
技術領域：
本發明涉及通信技術領域，尤其涉及一種通過語音識別進行頻道選擇系統、裝置及方法。
背景技術：
近年來隨著信息技術和廣播電視技術的發展，有線數位電視和IPTV等業務發展迅速。在機頂盒(Set-top Box， STB),如IP機頂盒和數字機頂盒等，逐步市場化的趨勢下，機頂盒的完備功能逐漸取代了傳統的VCD機和 DVD機。另一方面，隨著自動語音識別技術的發展，使得機頂盒通過語音來選擇頻道成為可能，該技術也成為業界研發的重點。
傳統的語音識別選擇頻道有兩種方式一種是通過在遙控器上增加語音識別處理器的方式，在識別時通過用戶輸入下載語音模板與用戶輸入的語音數據匹配確定的語音數據來轉換頻道；一種是通過在網絡中設置專門的語音識別伺服器。
發明人在實現本發明的過程中發現傳統的語音識別選擇頻道的方式至少存在如下缺點通過在遙控器上增加語音識別處理器的方式，由於在識別時每次更新語音模板都需要用戶手動操作下載到遙控器上，操作起來十分復雜、不便，同時，也增加了遙控器的成本；通過在網絡中設置專門的語音識別伺服器的方式，由於識別語音時需要將語音信號上傳到網絡，響應時間較長，並且通過網絡上行和下行傳輸兩次數據包丟失的可能性也會增大，另外專門的語音識別伺服器也增加了構建網絡的成本。

發明內容
有鑑於此，實有必要提供一種操作方便、節省成本的語音識別頻道選擇方法。
同時，提供一種操作方便、節省成本的語音識別頻道轉換系統。同時，提供一種操作方便、節省成本的頻道轉換裝置。
一種語音識別頻道選擇方法，包括如下步驟控制器接收用戶的語音輸入信號；
頻道轉換裝置根據輸入的語音信號及識別詞表識別出待匹配名稱；根據所述待匹配名稱與匹配表進行匹配得出需要切換的頻道；切換到所述需要切換的頻道。
一種語音識別頻道選擇系統，包括控制器，用於與頻道轉換處理裝置進行通信；
所述控制器用於接收用戶的語音輸入信號；
所述頻道轉換處理裝置用於根據所述輸入的語音輸入信號及識別詞表識別出待匹配名稱，根據所述待匹配名稱與匹配表進行匹配得出需要切換的頻道，並切換到所述需要切換的頻道。
一種頻道轉換裝置，包括
接收模塊，用於接收控制器發送的用戶的語音輸入信號；識別處理模塊，用於根據所述輸入的語音輸入信號及識別詞表識別出待匹配名稱；
查詢匹配模塊，用於根據所述待匹配名稱與匹配表進行匹配得出需要切換的頻道；
頻道轉換控制模塊，用於切換到所述需要切換的頻道。與現有技術相比，本發明實施例通過控制器接收用戶的語音輸入信號，通過頻道轉換裝置根據所述輸入的語音輸入信號識別出待匹配名稱，根據所述待匹配名稱與匹配表進行匹配得出需要切換的頻道，並切換到所述需要切換的頻道，避免了在控制器上進行語音識別操作複雜和成本高的問題，使得用戶在搡作起來十分方便，並且充分利用頻道轉換裝置的性能，節省了控制的成本。通過頻道轉換裝置識別出待匹配名稱，不需要在網絡中設置專門的語音識別伺服器，防止響應時間過長，避免了由於網絡傳輸數據丟失的問題，並且節約了構建網絡的成本。

圖1為本發明實施例語音識別頻道轉換系統結構示意圖。
圖2為本發明實施例控制器結構示意圖。
圖3為本發明實施例頻道轉換處理裝置結構示意圖。
圖4為本發明實施例語音識別頻道選擇方法流程圖。圖5為本發明實施例頻道和節目表更新方法流程圖。圖6為本發明實施例識別詞表和匹配表更新方法流程圖。
具體實施例方式
請參看圖l，本發明實施例語音識別頻道轉換系統100包括控制器102、頻道轉換裝置104和電子節目指南(Electronic Program Guide, EPG)伺服器106。控制器102,用於接收用戶的語音輸入信號。頻道轉換裝置104，用於根據輸入的語音輸入信號及識別詞表識別出待匹配名稱，根據待匹配名稱與匹配表進行匹配得出需要切換的頻道，並切換到需要切換的頻道。EPG伺服器106，用於提供待更新的最新的匹配表和/或最新的更新的識別詞表，頻道轉換裝置104可以根據最新的匹配表更新匹配表，和/或才艮據最新的識別詞表更新識別詞表。控制器102可以是系統外接控制器、HS (Handset,手機)或遙控器，本實施例中，以遙控器為例。頻道轉換裝置104可以是PC( Personal Computer,個人電腦)、STB( Set-top Box，才幾頂盒)、NB( NotebookComputer,筆記本電腦)、HS (Handset,手才幾)、GP ( Game Player,遊戲機)或ODD ( Optical Disc Drive,光碟機)等，本實施例中，以STB為例進行說明。
請結合參看圖2，本實施例中，控制器102包括語音接收模塊202、語音信號處理模塊204、輸入模塊210、控制器接收模塊212和發送模塊216。語音信號接收模塊202,用於接收用戶的語音輸入信號，本實施例中，語音輸入模塊可以是一個遙控器上的麥克風。
語音信號處理模塊204，用於處理用戶的語音輸入信號。語音信號處理才莫塊204還包括語音轉換單元206和語音編碼單元208。語音轉換單元206,用於將語音信號轉換成為數位訊號，本實施例中，語音轉換單元206可以是A/D轉換電路。語音編碼單元208，用於編碼語音轉換單元206轉換後的數位訊號，該編碼可以是壓縮編碼，包括有損壓縮編碼或無損壓縮編碼。用戶的語音採集和處理可以有不同的方案，本實施例中，以16KHz採樣率進行採樣，按16或8bit的精度進行量化。語音信號經過採樣和處理後的編碼格式為PCM ( Pulse Code Modulation,脈衝編碼調製)格式。
輸入模塊210，用於接收用戶輸入的指令，如，語音激活指令，用於控制頻道轉換裝置激活語音，本實施例中，輸入模塊210可以是鍵盤或觸控螢幕。
控制器接收模塊212，用於接收頻道轉換裝置104發送的信號，該信號包括返回的指令信號和通知消息等。
發送模塊216,用於發送用戶輸入的語音編碼後的信號和操作信號，本實施例中，發送模塊216可以是紅外、藍牙等無線通訊裝置，如可以通過Bluetooth2.0(藍牙2.0技術)，紫蜂Zigbee或高速紅外協議等能夠保證PCM(Pulse Code Modulation,脈衝編碼調製)語音數據能夠實時傳輸的高速無線通信技術。發送模塊216還包括操作信號發送單元218，用於發送用戶輸入的操作信號，例如，鍵盤輸入和觸控螢幕輸入信號。語音信號發送單元214，用於發送用戶輸入的語音信號，該信號為經過A/D轉換的數位訊號，也可以是壓縮編碼後的信號。
請結合參看圖3,本實施例中，頻道轉換裝置104 (STB)包括接收模塊302、靜音控制模塊308、語言選擇模塊310、識別處理模塊312、發送模塊322、拒絕識別提示模塊324、存儲模塊326、查詢匹配模塊336、頻道轉換控制模塊338和更新模塊340。
接收模塊302，用於接收控制器發送的用戶的語音輸入信號和用戶的操作控制指令，本實施例中，用戶輸入信號包括用戶的語音輸入信號和用戶的操作控制指令，若全部為語音輸入，也可以不包含用戶控制指令信號。用戶
的語音輸入信號為經過模擬/數字A/D轉換後的數字語音信號。接收模塊302還包括操作信號接收單元304和語音信號接收單元306。操作信號接收單元304用於接收用戶的操作控制指令，例如激活語音控制指令。語音信號接收單元306用於接收用戶的語音輸入信號。
靜音控制模塊308，用於根據用戶輸入的激活語音的指令，將頻道轉換裝置置為靜音狀態，及在語音採集後將靜音狀態切換為非靜音狀態。
語言選擇模塊310,用於根據用戶輸入的語言選擇信號，選擇一個與所述語言選擇信號對應的聲學模型。
識別處理模塊312,用於根據輸入的語音信號及識別詞表識別出待匹配名稱。識別處理模塊312包括語音激活;險測單元314、語音特徵提取單元316、語音識別單元318和語音判斷單元320。
語音激活檢測單元314，用於檢測實際語音段的起點和終點。本實施例中，語音激活檢測單元314採用穩健的端點檢測算法檢測出實際語音的起點和終點，以區分出輸入的語音信號中實際語音段和非語音段。
語音特徵提取單元316，用於將語音信號進行語音特徵提取。本實施例中，語音特徵提取單元316將話音激活檢測單元314傳送過來的語音信號進行處理，提取出語音特徵數據。語音特徵類型可以採用MFCC( Mel-FrequencyCeptral Coefficients,美爾頻率倒譜係數)特徵，PLP (Perceptually LinearPrediction,感知線性預測)特^正或LPCC ( Linear Predictive Cepstral Coding,線性預測倒譜係數)特徵，為了提高抗噪效果，可以在語音特徵提取過程中運用倒譜均值減的處理。考慮到MFCC特徵利用了人耳的聲學感知特性而對噪音具有較好的穩健性，優選MFCC特徵作為語音特徵。語音信號作為短時平穩信號，語音幀之間具有幀間相關性，為此可以對MFCC特徵提取一階差分或一階及二階差分來提高語音識別的準確率。
語音識別單元318，用於根據聲學模型和識別詞表計算出輸入的語音特徵數據相對於詞條的聲學距離。本實施例中，語音識別單元318根據聲學模
型數據和孤立詞表數據得到每個孤立詞的最短累積聲學距離，然後取最短聲學距離最小的孤立詞作為該語音首選識別結果。語音識別採用的聲學模型包
括連續的HMM (Hidden Markov Model隱含馬爾可夫模型)模型和離散 HMM才莫型。此外，語音識別單元318還可以給出多個候選的識別結果讓用戶選擇，排序的依據為最短累積聲學距離。
語音判斷單元320，用於判斷語音特徵數據相對於詞條的聲學距離是否小於閾值，若語音特徵數據相對於詞條的聲學距離小於閾值，根據識別詞表和匹配表計算出當前語音對應的頻道名稱。
發送模塊322,用於向控制器102發送識別處理信號，在識別處理完畢後，控制器102可以停止採集用戶的語音輸入信號。本實施例中，發送模塊 322也可以採用藍牙、紅外等無線方式傳送信號。
拒絕識別提示模塊324，用於在識別結果為非語音時，提示用戶重新輸入語音。該提示可以是消息提示、視頻顯示提示或聲音提示，本實施例中，採用在屏幕上顯示提示文字的方式提示用戶。
存儲模塊326，用於存儲頻道和節目表、識別詞表、聲學模型和匹配表等數據。本實施例中，存儲模塊326包括頻道和節目表存儲單元328、識別詞表存儲單元330、聲學模型存儲單元332、匹配表存儲單元334。
頻道和節目表存儲單元328，用於存儲頻道和節目對應表，本實施例中，表的每一個記錄項為直#番電-見的頻道名稱以及當前時刻該頻道正在^番;故的
節目名稱。該頻道和節目對應表可以根據EPG伺服器106更新，更新周期可以設置為一天或一個星期，具體的時間間隔可以參考IPTV或有線數字電視系統的EPG伺服器更新間隔。
識別詞表存儲單元330,用於存儲識別詞表，本實施例中，識別詞表還包括一張用於孤立詞語音識別的《瓜立詞表。
聲學模型存儲單元332,用於存儲待匹配的聲學模型。本實施例中，採用包含針對HMM模型的雙語種混合建模的聲學模型的模型參數。雙語種混合聲學模型的參數與說話人無關，即為針對非特定人的模型。模型參數需要事先根據標註好的預料數據經過訓練器進行訓練，訓練得到的參數就可以固化到聲學模型參數存儲部用於孤立詞的語音識別，聲學模型參數包括隱含馬爾可夫模型的狀態參數和狀態輸出觀測特徵矢量的概率分布函數。
匹配表存儲單元334，用於存儲匹配表，匹配表存儲了用戶需要切換的頻道與用戶的語音輸入的頻道對應關係。
查詢匹配模塊336，用於根據待匹配的名稱與匹配表進行匹配得出需要切換的頻道。本實施例中，以識別出的孤立詞作為查詢關4定字，首先在頻道節目表中查詢所包含表的頻道名列中查詢符合關^t詞的記錄項。
頻道轉換控制模塊338，用於切換到需要切換的頻道。若存在匹配的記錄項，查詢結果為單個記錄項時，控制機頂盒直播電視切換到記錄項中頻道名屬性標識的頻道；查詢結果為多個記錄時，控制電視屏幕顯示多個記錄項的頻道名的屬性值，並提示用戶通過遙控器選擇其中一個頻道觀看直播電視節目，待用戶完成選擇後，控制電視切換到用戶選擇的頻道。
更新模塊340,用於根據EPG伺服器跟新匹配表和/或識別詞表。更新才莫塊340還包括更新定時單元342和更新控制單元344。更新定時單元342, 用於記錄更新的時間，並在更新時間到達或超時時，觸發更新，本實施例中，頻道和節目表更新時間可以設置為每天更新，識別詞表和匹配表更新時間可以設置為每分鐘更新。更新控制單元344，用於在滿足更新時間時，控制更新匹配表和/或識別詞表。
本發明實施例通過控制器接收用戶的語音輸入信號，通過頻道轉換裝置
根據所述輸入的語音輸入信號識別出待匹配名稱，根據所述待匹配名稱與匹
配表進行匹配得出需要切換的頻道，並切換到所述需要切換的頻道，避免了
在控制器上進行語音識別操作複雜和成本高的問題，使得用戶在操作起來十
分方便，並且充分利用頻道轉換裝置的性能，節省了控制的成本。通過頻道
轉換裝置識別出待匹配名稱，不需要在網絡中設置專門的語音識別伺服器，
防止響應時間過長，避免了由於網絡傳輸數據丟失的問題，並且節約了構建網絡的成本。本發明實施例通過截取實際語音段，語音識別的準確率得到提高。通過靜音控制單元控制語音輸入時，將機頂盒靜音，防止電視播放的聲
音對用戶語音的幹擾。通過更新模塊從EPG伺服器自動更新頻道和節目表，
識別詞表和匹配表避免了用戶手工造作帶來操作不便的弊端。
請結合參看圖4，本發明實施例語音識別頻道選擇方法，包括如下步驟步驟402，控制器接收用戶輸入的激活語音指令。本實施例中，語音激
活指令可以是用戶輸入的按鍵信號，用戶可以通過鍵盤或觸控螢幕等輸入設備
輸入的指令信號。
步驟404，控制器向頻道轉換裝置發送啟動語音識別控制指令信號。本實施例中，以藍牙、高速紅外協議、紫蜂Zigbee等無線發送方式為例，通過遙控器向機頂盒發送啟動語音識別控制指令信號。
步驟406，頻道轉換裝置置為靜音狀態。
步驟408,頻道轉換裝置向控制器發送啟動語音採集控制指令信號。若不採用靜音功能時，也可以不包括以上步驟，不再贅述。
步驟410,控制器接收用戶的語音輸入信號，採集和處理用戶輸入的語音信號，本實施例中，通過A/D轉換器將模擬語音信號轉換成數字語音信號，並通過無線方式傳送給頻道轉換裝置。
步驟412，頻道轉換裝置檢測實際語音段的起點和終點，根據實際語音段的起點和終點用於識別出待匹配的名稱。本實施例中，語音激活檢測採用穩健的端點檢測算法檢測出實際語音的起點和終點，以區分出輸入的語音信號中實際語音段和非語音段。
步驟414，頻道轉換裝置向控制器發送停止語音採集控制信號。在識別處理完畢後，控制器可以停止採集用戶的語音輸入信號。本實施例中，發送方式也可以採用藍牙、高速紅外協議和Zigbee等無線方式傳送信號。
步驟416,控制器根據頻道轉換裝置的停止語音採集控制信號的控制停止採集和處理語音信號。
步驟418，將起點和終點之間的實際語音段的信號傳送給語音特徵提取
12單元。步驟418和步驟414可以沒有先後關係，也可以先執行步驟418後執行步驟416，不再贅述。
步驟420，語音特徵提取單元根據輸入的語音信號提取語音特徵，將語音信號進行特徵提取，本實施例中，若之前有獲取實際語音段落檢測的步驟，就只需提取實際語音段。語音特徵類型可以採用MFCC特徵，PLP特徵或 LPCC特徵，為了提高抗噪效果，可以在語音特徵提取過程中運用倒譜均值減的處理。考慮到MFCC特徵利用了人耳的聲學感知特性而對噪音具有較好的穩健性，優選MFCC特徵作為語音特徵。語音信號作為短時平穩信號，語音幀之間具有幀間相關性，為此可以對MFCC特徵提取一階差分或一階及二階差分來提高語音識別的準確率。
步驟422,根據聲學模型和識別詞表計算出輸入的語音特徵數據相對於詞條的聲學距離。本實施例中，語音識別根據聲學模型數據和孤立詞表數據得到每個孤立詞的最短累積聲學距離，然後取最短聲學距離最小的孤立詞作為該語音首選識別結果。語音識別採用的聲學模型包括連續HMM模型和離散HMM模型。此外，語音識別還可以給出多個候選的識別結果讓用戶選擇，排序的依據為最短累積聲學距離。本實施例中，採用包含針對HMM的雙語種混合建模的聲學模型的模型參數。雙語種混合聲學模型的參數與說話人無關，即為針對非特定人的模型。模型參數需要事先根據標註好的預料數據經過訓練器進行訓練，訓練得到的參數就可以固化到聲學模型參數存儲部用於孤立詞的語音識別，聲學模型參數包括HMM的狀態參數和狀態輸出觀測特徵矢量的概率分布函數。本步驟之前，還可以包含根據用戶輸入的語言選擇信號，選擇一個與該語言選擇信號對應的聲學模型的步驟。
步驟424，判斷語音特徵數據相對於每個詞條聲學距離是否小於閾值，若聲學距離不小於閾值，執行步驟426;若聲學距離小於閾值，執行步驟428。
步驟426，若語音特徵數據相對於詞條的聲學距離大於或等於閾值，識別結果為非語音，提示用戶重新輸入。該提示可以是消息提示、視頻顯示提示或聲音提示，本實施例中，採用在屏幕上顯示提示文字的方式提示用戶。執行完步驟426後，結束本識別過程。
步驟428,若語音特徵數據相對於詞條的聲學距離小於閾值，根據識別詞表和匹配表計算出當前語音對應的頻道名稱。本實施例中，根據聲學模型數據和孤立詞表數據得到每個孤立詞的最短累積聲學距離，然後取最短聲學距離最小的孤立詞作為該語音首選識別結果。語音識別採用的聲學模型包括連續HMM模型和離散HMM模型。此外，還可以給出多個候選的識別結果讓用戶選擇，排序的依據為最短累積聲學距離。
步驟430，根據識別出來的頻道名稱切換到需要切換的頻道。若存在匹配的記錄項，查詢結果為單個記錄項時，控制機頂盒直播電視切換到記錄項中頻道名屬性標識的頻道；查詢結果為多個記錄時，控制電視屏幕顯示多個記錄項的頻道名的屬性值，並提示用戶通過遙控器選擇其中一個頻道觀看直播電視節目，待用戶完成選擇後，控制電視切換到用戶選擇的頻道。
請結合參看圖5，本發明實施例頻道和節目表更新方法包括如下步驟
步驟502，檢查頻道和節目表是否滿足更新設置條件，更新設置條件可以根據用戶的需求設置，識別詞表和匹配表的更新可以設置為一天。若滿足更新設置件執行步驟504,否則返回步驟502。
步驟504，頻道轉換裝置從EPG伺服器下載最新的頻道和節目表數據，更新頻道和節目表。
該更新的目標可以是EPG伺服器，也可以是本地的網絡或光碟等。
請結合參看圖6,本發明實施例識別詞表和匹配表更新方法包括如下步
驟
步驟602,檢查識別詞表和匹配表是否滿足更新設置條件，更新設置條件可以根據用戶的需求設置，識別詞表和匹配表的更新可以設置為一分鐘。若滿足更新設置條件執行步驟604，否則返回步驟602。
步驟604,根據頻道和節目表更新本地的識別詞表和匹配表。本領域普通技術人員可以理解，上述方法中的全部或部分步驟可以通過程序指令相關的硬體完成，該程序可以存儲在計算機可讀存儲介質中，該存儲介質如，RAM、 ROM或光碟等。
本發明實施例通過控制器接收用戶的語音輸入信號，通過頻道轉換裝置根據所述輸入的語音輸入信號識別出待匹配名稱，根據所述待匹配名稱與匹配表進行匹配得出需要切換的頻道，並切換到所述需要切換的頻道，避免了在控制器上進行語音識別操作複雜和成本高的問題，使得用戶在操作起來十分方便，並且充分利用頻道轉換裝置的性能，節省了控制的成本。通過頻道轉換裝置識別出待匹配名稱，不需要在網絡中設置專門的語音識別伺服器，防止響應時間過長，避免了由於網絡傳輸數據丟失的問題，並且節約了構建網絡的成本。本發明實施例通過截取實際語音段，語音識別的準確率得到提高，並且去除了噪音的幹擾。通過靜音控制單元控制語音輸入時，將機頂盒靜音，防止電視播放的聲音對用戶語音的幹擾。通過更新模塊從EPG服務器自動更新頻道和節目表，識別詞表和匹配表避免了用戶手工造作帶來操作不便的弊端。
綜上所述，以上僅為本發明的較佳實施例而已，並非用於限定本發明的保護範圍。凡在本發明的精神和原則之內，所作的任何修改、等同替換、改進等，均應包含在本發明的保護範圍之內。
權利要求
1.一種語音識別頻道選擇方法，其特徵在於，該方法包括控制器接收用戶的語音輸入信號；頻道轉換裝置根據輸入的語音信號及識別詞表識別出待匹配名稱；根據所述待匹配名稱與匹配表進行匹配得出需要切換的頻道；切換到所述需要切換的頻道。
2. 如權利要求1所述的語音識別頻道選^^方法，其特徵在於，該方法進一步包括接收用戶輸入的激活語音的指令，該指令用於控制所述頻道轉換裝置激活語音，並且將頻道轉換裝置置為靜音狀態。
3. 如權利要求1所述的語音識別頻道選擇方法，其特徵在於，所述頻道轉換裝置才艮據輸入的語音信號識別出待匹配名稱包括採集和處理用戶輸入的語音信號，檢測實際語音段的起點和終點，根據所述實際語音段的起點和終點識別出所述待匹配名稱。
4. 如權利要求1所述的語音識別頻道選擇方法，其特徵在於，所述頻道轉換裝置根據輸入的語音信號識別出待匹配名稱包括將語音信號進行語音特徵提取；根據聲學模型和識別詞表計算出所述語音特徵數據相對於識別詞表中的詞條的聲學距離；若語音特徵數據相對於詞條的聲學距離小於閾值，根據識別詞表和匹配表計算出當前語音對應的頻道名稱。
5. 如權利要求4所述的語音識別頻道選擇方法，其特徵在於，該方法還包括若語音特徵數據相對於詞條的聲學距離大於或等於閾值，提示用戶重新輸入語音。
6. 如權利要求5所述的語音識別頻道選擇方法，其特徵在於，所述提示用戶重新輸入語音的方式為通過電視屏幕顯示用戶當前輸入的語音無法識別，提示用戶重新輸入。
7. 如權利要求1所述的語音識別頻道選擇方法，其特徵在於，該方法還進一步包括頻道轉換裝置向控制器發送停止語音採集控制信號，控制器根據所述停止語音採集控制信號的控制停止採集和處理語音信號。
8. 如權利要求1所述的語音識別頻道選擇方法，其特徵在於，該方法進一步包括頻道轉換裝置根據電子節目指南EPG伺服器更新所述匹配表和/或所述識別詞表。
9. 如權利要求1所述的語音識別頻道選擇方法，其特徵在於，該方法進一步包括根據用戶輸入的語言選擇信號，選擇一個與所述語言選擇信號對應的聲學模型。
10. 如權利要求1所述的語音識別頻道選擇方法，其特徵在於，所述控制器與所述頻道轉換裝置通過無線傳輸協議進行通信。
11. 如權利要求IO所述的語音識別頻道選擇方法，其特徵在於，所述無線傳輸協議包括高速紅外協議、藍牙傳輸協議和紫蜂Zigbee傳輸協議中的一種或多種。
12. —種語音識別頻道選擇系統，其特徵在於，該系統包括控制器，用於與頻道轉換處理裝置進行通信；所述控制器用於接收用戶的語音輸入信號；所述頻道轉換處理裝置用於根據所述輸入的語音輸入信號及識別詞表識別出待匹配名稱，根據所述待匹配名稱與匹配表進行匹配得出需要切換的頻道，並切換到所述需要切換的頻道。
13. 如權利要求2所述的語音識別頻道選擇系統，其特徵在於，該系統還包括電子節目指南EPG伺服器，用於提供待更新的匹配表和/或最更新的識別詞表，所述頻道轉換裝置根據所述待更新的匹配表更新所述匹配表，和/或根據所述最新的識別詞表更新所述識別詞表。
14. 一種頻道轉換裝置，其特徵在於，該裝置包括接收模塊，用於接收控制器發送的用戶的語音輸入信號；識別處理模塊，用於根據所述輸入的語音輸入信號及識別詞表識別出待匹配名稱；查詢匹配模塊，用於根據所述待匹配名稱與匹配表進行匹配得出需要切換的頻道；頻道轉換控制模塊，用於切換到所述需要切換的頻道。
15. 如權利要求14所述的頻道轉換裝置，其特徵在於，該裝置還包括靜音控制模塊，用於根據用戶輸入的激活語音的指令，將頻道轉換裝置置為靜音狀態。
16. 如權利要求14所述的頻道轉換裝置，其特徵在於，所述識別處理模塊進一步包括語音激活檢測單元，用於檢測實際語音段的起點和終點。
17. 如權利要求14所述的頻道轉換裝置，其特徵在於，所述識別處理模塊進一步包括語音特徵提取單元，用於對語音信號進行語音特徵提取；語音識別單元，用於根據聲學模型和識別詞表計算出輸入的語音特徵數據相對於識別詞表中詞條的聲學距離；語音判斷單元，用於判斷語音特徵數據相對於詞條的聲學距離是否小於閾值，若語音特徵數據相對於詞條的聲學距離小於閾值，根據識別詞表和匹配表計算出當前語音對應的頻道名稱。
18..如權利要求17所述的頻道轉換裝置，其特徵在於，該裝置還包括拒絕識別提示模塊，用於在識別結果為非語音時，提示用戶重新輸入語音。
19. 如權利要求14所述的頻道轉換裝置，其特徵在於，該裝置還包括更新模塊，用於根據電子節目指南EPG伺服器更新所述匹配表和/或所述識別詞表。
20. 如權利要求14所述的頻道轉換裝置，其特徵在於，該裝置還包括語言選擇模塊，用於根據用戶輸入的語言選擇信號，選擇一個與所述語言選擇信號對應的聲學模型。
全文摘要
本發明提供一種語音識別頻道選擇系統、方法及頻道轉換裝置，該方法包括控制器接收用戶的語音輸入信號；頻道轉換裝置根據輸入的語音信號及識別詞表識別出待匹配名稱；根據待匹配名稱與匹配表進行匹配得出需要切換的頻道；切換到需要切換的頻道。本發明避免了在控制器上進行語音識別操作複雜和成本高的問題，使得用戶在操作起來十分方便，並且充分利用頻道轉換裝置的性能，節省了控制的成本。通過頻道轉換裝置識別出待匹配名稱，不需要在網絡中設置專門的語音識別伺服器，防止響應時間過長，避免了由於網絡傳輸數據丟失的問題，並且節約了構建網絡的成本。
文檔編號H04N5/44GK101516005SQ20081006541
公開日2009年8月26日申請日期2008年2月23日優先權日2008年2月23日
發明者吳治國, 張勤偉申請人:華為技術有限公司

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

一種語音識別頻道選擇系統、方法及頻道轉換裝置的製作方法

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法