一種雲數據中心語音識別方法
2023-08-04 03:34:46 1
專利名稱:一種雲數據中心語音識別方法
技術領域:
本發明涉及計算機應用領域,具體地說是一種雲數據中心語音識別方法。
背景技術:
隨著信息科技的發展,雲計算逐步成為業界的發展熱點,國內外各大廠商的雲計算服務平臺也開始紛紛投入到科學、教育、文化、衛生、政府、高性能計算、電子商務、物聯網等多個領域進行使用。為了保障雲數據中心的安全,大多數雲數據中心的機房中安裝了密碼身份識別系統。但是由於傳統的文本密碼具有易複製、易失竊、易遺忘等缺點,導緻密碼身份識別系統存在很多安全漏洞。語音作為一種生物特徵,具有人體所固有的不可複製的唯一性。將語音識別系統與雲數據中心相連,可以將不同用戶的不同聲音信息作為密鑰,識別用戶的身份,並決定用戶的使用權限。這樣,相對於傳統的文本密碼,更加難以破譯,具有更高的安全性。除此之外,針對市場上語音識別系統一般為單特定人識別和非特定人識別的局限,本系統提出多特定人語音識別方案,解決了雲數據中心多用戶使用權限的分配問題。
發明內容
本發明的目的是提供一種雲數據中心語音識別方法。本發明的目的是按以下方式實現的,利用HBRllO晶片,通過動態時間規整算法進行語音處理與分析,識別語音所有者的權限,實現語音的識別,系統包括1)整體架構設計, 2)硬體設計和3)軟體設計,其中,
1)整體架構設計,是該系統的首要設計工作,通過分析系統需求與調研市場上的主流語音識別產品,設計系統整體架構;選擇人語音識別處理器HBRl 10晶片,結合8031單片機、 音頻放大電路、SPI FLASH存儲器以及必要的外圍電路,利用動態時間規整算法進行語音處理與分析,實現語音識別和權限分配的安全功能;
2)硬體設計,硬體設計工作,包括系統原理圖設計、PCB設計;
3)軟體設計,軟體的設計工作,使用彙編語言對8031單片機進行編程,實現對硬體系統的控制;控制HBRllO晶片完成如下操作
Sl預處理包括語音信號採樣、反混疊帶通濾波、去除個體發音差異和設備、環境引起的噪聲影響,並涉及到語音識別基元的選取和端點檢測問題;
S2特徵提取用於提取語音中反映本質特徵的聲學參數,包括平均能量、平均跨零率、 共振峰;
S3訓練在識別之前通過讓講話者多次重複語音,從原始語音樣本中去除冗餘信息, 保留關鍵數據,再按照一定規則對數據加以聚類,形成模式庫;
S4模式匹配是整個語音識別系統的核心,它根據一定規則以及專家知識,計算輸入特徵與庫存模式之間的相似度,判斷出輸入語音的語意信息。
本發明的有益效果是
a)多特定人語音識別技術突破了目前市場上一般為單特定人識別或非特定人識別的語音識別系統局限;
b)權限分配提高安全性本系統能夠針對不同用戶分配不同的使用權限,從而提高了系統的安全性能;
c)獨特口音的處理技術用戶不須使用標準發音,即可順暢使用該系統;
d)多樣化語音模型樣本機器訓練時輸入的語音模型可由用戶需求而定,不必使用系統提供的特定樣本。經過實驗驗證,本系統具有較高的準確性和實用性,語音匹配正確率達90%以上。
圖1是語音識別流程圖; 圖2是語音識別硬體架構圖。
具體實施例方式
參照說明書附圖對本發明的方法作以下詳細地說明。本發明的一種雲數據中心語音識別方法,其結構是由
本系統的實現流程如附圖1所示。正如發明內容中所描述的,本發明的體系結構主要包括整體架構設計,硬體設計,軟體設計。其中,整體架構設計是系統的首要設計工作,通過廣泛調研,選擇採用如附圖2的硬體架構。協處理器HBRllO負責完成對聲音的輸入、識別、處理、輸出工作由,主控晶片 8031負責完成相應的控制操作,後者通過程序控制整個系統的工作,是系統的核心。硬體設計是系統設計的第二步。通過綜合分析各電子元件的元件特性、散熱要求、 工作環境等,分別設計主處理器8031單片機、協處理器HBRllO晶片的外圍電路及音頻放大電路和SPI FLASH存儲設備電路,完成系統原理圖和PCB圖。軟體設計是系統設計的最後一步。使用彙編語言對8031單片機進行編程,控制 HBRllO晶片完成如下操作
Sl預處理包括語音信號採樣、反混疊帶通濾波、去除個體發音差異和設備、環境引起的噪聲影響等,並涉及到語音識別基元的選取和端點檢測問題;
S2特徵提取用於提取語音中反映本質特徵的聲學參數,如平均能量、平均跨零率、共振峰等;
S3訓練在識別之前通過讓講話者多次重複語音,從原始語音樣本中去除冗餘信息, 保留關鍵數據,再按照一定規則對數據加以聚類,形成模式庫;
S4模式匹配是整個語音識別系統的核心,它根據一定規則以及專家知識,計算輸入特徵與庫存模式之間的相似度,判斷出輸入語音的語意信息。除說明書所述的技術特徵外,均為本專業技術人員的已知技術。
權利要求
1. 一種雲數據中心語音識別方法,其特徵在於利用HBRllO晶片,通過動態時間規整算法進行語音處理與分析,識別語音所有者的權限,實現語音的識別,系統包括1)整體架構設計,2 )硬體設計和3 )軟體設計,其中,1)整體架構設計,是該系統的首要設計工作,通過分析系統需求與調研市場上的主流語音識別產品,設計系統整體架構;選擇人語音識別處理器HBRl 10晶片,結合8031單片機、 音頻放大電路、SPI FLASH存儲器以及必要的外圍電路,利用動態時間規整算法進行語音處理與分析,實現語音識別和權限分配的安全功能;2)硬體設計,硬體設計工作,包括系統原理圖設計、PCB設計;3)軟體設計,軟體的設計工作,使用彙編語言對8031單片機進行編程,實現對硬體系統的控制;控制HBRllO晶片完成如下操作Sl預處理包括語音信號採樣、反混疊帶通濾波、去除個體發音差異和設備、環境引起的噪聲影響,並涉及到語音識別基元的選取和端點檢測問題;S2特徵提取用於提取語音中反映本質特徵的聲學參數,包括平均能量、平均跨零率、 共振峰;S3訓練在識別之前通過讓講話者多次重複語音,從原始語音樣本中去除冗餘信息, 保留關鍵數據,再按照一定規則對數據加以聚類,形成模式庫;S4模式匹配是整個語音識別系統的核心,它根據一定規則以及專家知識,計算輸入特徵與庫存模式之間的相似度,判斷出輸入語音的語意信息。
全文摘要
本發明提供一種雲數據中心語音識別方法,利用HBR110晶片,通過動態時間規整算法進行語音處理與分析,識別語音所有者的權限,實現語音的識別,系統包括1)整體架構設計,2)硬體設計和3)軟體設計,其中,1)整體架構設計,是該系統的首要設計工作,通過分析系統需求與調研市場上的主流語音識別產品,設計系統整體架構;選擇人語音識別處理器HBR110晶片,結合8031單片機、音頻放大電路、SPIFLASH存儲器以及必要的外圍電路,利用動態時間規整算法進行語音處理與分析,實現語音識別和權限分配的安全功能。
文檔編號H04L29/08GK102402983SQ20111038016
公開日2012年4月4日 申請日期2011年11月25日 優先權日2011年11月25日
發明者呂廣傑, 朱波, 朱錦雷 申請人:浪潮電子信息產業股份有限公司