語料數據的查詢方法和裝置製造方法
2023-05-25 00:39:01 1
語料數據的查詢方法和裝置製造方法
【專利摘要】本發明公開了一種語料數據的查詢方法和裝置。其中,該語料數據的查詢方法包括:獲取用戶的第一聲紋模型;從語料資料庫的預存聲紋模型中查找與第一聲紋模型的相匹配的聲紋模型,得到第二聲紋模型;根據語料資料庫中預先存儲的預存聲紋模型與語料數據的關聯關係,獲取與第二聲紋模型相關聯的第一語料數據;以及將第一語料數據發送給用戶。通過本發明,解決了現有技術中查找語料數據的效率比較低的問題,進而達到了提高查找語料數據的效率的效果。
【專利說明】語料數據的查詢方法和裝置
【技術領域】
[0001]本發明涉及多媒體領域,具體而言,涉及一種語料數據的查詢方法和裝置。
【背景技術】
[0002] 隨著多媒體技術的不斷發展和進步,越來越多的語料數據產生並存儲。在需要調 用這些語料數據時,需要在存儲的文件中按照語料數據的文件名逐個比對查找,對於大量 的語料數據來說,通過逐個對比文件名的方式查找語料數據的方式顯然效率比較低。另外, 通過文件名查找語料數據的方法在文件名的命名規則不規範時,無法準確查找到相應的語 料數據,甚至無法查找到語料數據。
[0003] 針對現有技術中查找語料數據的效率比較低的問題,目前尚未提出有效的解決方 案。
【發明內容】
[0004] 本發明的主要目的在於提供一種語料數據的查詢方法和裝置,以解決現有技術中 查找語料數據的效率比較低的問題。
[0005] 為了實現上述目的,根據本發明的一個方面,提供了一種語料數據的查詢方法。根 據本發明的語料數據的查詢方法包括:獲取用戶的第一聲紋模型;從語料資料庫的預存聲 紋模型中查找與所述第一聲紋模型的相匹配的聲紋模型,得到第二聲紋模型;根據所述語 料資料庫中預先存儲的所述預存聲紋模型與語料數據的關聯關係,獲取與所述第二聲紋模 型相關聯的第一語料數據;以及將所述第一語料數據發送給所述用戶。
[0006] 進一步地,獲取與所述第二聲紋模型相關聯的第一語料數據包括:從所述語料數 據庫中查找與所述第二聲紋模型具有映射關係的對象標識;獲取與所述對象標識關聯的第 二語料數據;以及將與所述對象標識關聯的所述第二語料數據作為所述第一語料數據。
[0007] 進一步地,將所述第一語料數據發送給所述用戶包括:獲取所述對象標識的對象 信息;以及在將所述第一語料數據發送給所述用戶時,將所述對象信息發送給所述用戶。
[0008] 進一步地,從語料資料庫的預存聲紋模型中查找與所述第一聲紋模型的相匹配的 聲紋模型,得到第二聲紋模型包括:利用後驗概率分別計算所述第一聲紋模型與所述預f 聲紋模型中的每個預存聲紋模型的相似度,得到多個相似度;比較所述多個相似^彳^^最 大相似度;以及將所述預存聲紋模型中具有所述最大相似度的聲紋模型作為所述第一屍紋 模型。 #
[0009] 進-步地,在原順獅麵存聲紋麵巾誠與難第-聲猶型的相匹^ 的聲紋模型之前,臟方法還包括:收集多個對象標砸指示的多個對細語料數據^獲 取所述多個對象的語料數據的聲紋模型,得到所述預存聲紋模型;以及建立所述預存聲紋 臟語料娜與臓鄉個雜_識趣1關聯;提取與臟鄉頓脅V、巾每1對象標 V、 關聯的所有語料數據中每一幀語音信號的語音特徵參數;對提取到的所述每個對象標識的 語音特徵參數進行訓練,得到屬於所述每個對象標識的聲紋模型;以及將屬於所述每個對 象標識的聲紋模型作為所述預存聲紋模型。
[0011] 進一步地,在建立所述預存聲紋模型與所述多個對象標識的對應關係之後,且獲 取用戶的第一聲紋模型之前,所述方法還包括:獲取第一對象的語料數據;識別所述第一 對象的語料數據中的聲紋模型;從所述預存聲紋模型中查找與所述第一對象的聲紋模型匹 配的聲紋模型;以及將所述第一對象的語料數據關聯到查找到的聲紋模型所對應的對象標 識。
[0012] 為了實現上述目的,根據本發明的另一方面,提供了一種語料數據的查詢裝置。根 據本發明的語料數據的查詢裝置包括:第一獲取單元,用於獲取用戶的第一聲紋模型;第 一查找單元,用於從語料資料庫的預存聲紋模型中查找與所述第一聲紋模型的相匹配的聲 紋模型,得到第二聲紋模型;第二獲取單元,用於根據所述語料資料庫中預先存儲的所述預 存聲紋模型與語料數據的關聯關係,獲取與所述第二聲紋模型相關聯的第一語料數據;以 及發送單元,用於將所述第一語料數據發送給所述用戶。
[0013] 進一步地,所述第一獲取單元包括:查找模塊,用於從所述語料資料庫中查找與所 述第二聲紋模型具有映射關係的對象標識;第一獲取模塊,用於獲取與所述對象標識關聯 的第二語料數據;以及第一確定模塊,用於將與所述對象標識關聯的所述第二語料數據作 為所述第一語料數據。
[0014] 進一步地,所述發送單元包括:第二獲取模塊,用於獲取所述對象標識的對象信 息;以及發送模塊,用於在將所述第一語料數據發送給所述用戶時,將所述對象信息發送給 所述用戶。
[0015] 進一步地,所述查找單元包括:計算模塊,用於利用後驗概率分別計算所述第一聲 紋模型與所述預存聲紋模型中的每個預存聲紋模型的相似度,得到多個相似度;比較模塊, 用於比較所述多個相似度,得到最大相似度;以及第二確定模塊,用於將所述預存聲紋模型 中具有所述最大相似度的聲紋模型作為所述第二聲紋模型。
[0016] 進一步地,所述裝置還包括:收集單元,用於在從語料資料庫的預存聲紋模型中查 找與所述第一聲紋模型的相匹配的聲紋模型之前,收集多個對象標識所指示的多個對象的 語料數據;第三獲取單元,用於獲取所述多個對象的語料數據的聲紋模型,得到所述預存聲 紋模型;以及建立單元,用於建立所述預存聲紋模型與所述多個對象標識的對應關係。
[0017] 進一步地,所述第三獲取單元包括:關聯模塊,用於將所述語料數據與所述多個對 象的標識進行關聯;提取模塊,用於提取與所述多個對象標識中每個對象標識關聯的所有 語料數據中每一幀語音信號的語音特徵參數;訓練模塊,用於對提取到的所述每個對象標 識的語音特徵參數進行訓練,得到屬於所述每個對象標識的聲紋模型;以及第三確定模塊, 用於將屬於所述每個對象標識的聲紋模型作為所述預存聲紋模型。
[0018] 進一步地,所述裝置還包括:第四獲取單元,用於在建立所述預存聲紋模型與所述 多個對象標識的對應關係之後,且獲取用戶的第一聲紋模型之前,獲取第一對象的語料數 據;識別單元,用於識別所述第一對象的語料數據中的聲紋模型;第二查找單元,用於從所 述預存聲紋模型中查找與所述第一對象的聲紋模型匹配的聲紋模型;以及關聯單元,用於 將所述第一對象的語料數據關聯到查找到的聲紋模型所對應的對象標識。
[001幻通過本發明,在語料資料庫中保存第二聲紋模型以及第二聲紋模型與語料數據的 映 ?關?,因此,從語料資料庫中找到與第一聲紋模型匹配的第二聲紋模型,就能找到與第 二聲紋模型相關聯的語料數據,從而找到與用戶的第一聲紋模型向匹配的所有語料數據, 解決了現有技術中查找語料數據的效率比較低的問題,進而達到了提高查找語料數據的效 率的效果。
【專利附圖】
【附圖說明】
[0020]構成本申請的一部分的附圖用來提供對本發明的進一步理解,本發明的示意性實 施例及其說明用於解釋本發明,並不構成對本發明的不當限定。在附圖中:
[0021]圖1是根據本發明實施例的語料數據的查詢方法的流程圖;
[0022]圖2是根據本發明又一實施例的語料數據的查詢方法的流程圖;
[0023]圖3是根據本發明實施例的通過對象標識將語料數據表與對象信息表關聯的示 意圖;以及
[0024]圖4是根據本發明實施例的語料數據的查詢裝置的示意圖。
【具體實施方式】
[0025]需要說明的是,在不衝突的情況下,本申請中的實施例及實施例中的特徵可以相 互組合。下面將參考附圖並結合實施例來詳細說明本發明。
[0026]為了使本【技術領域】的人員更好地理解本發明方案,下面將結合本發明實施例中的 附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是 本發明一部分的實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術 人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都應當屬於本發明保護的範 圍。
[0027]需要說明的是,本發明的說明書和權利要求書及上述附圖中的術語"第一"、"第 二"等是用於區別類似的對象,而不必用於描述特定的順序或先後次序。應該理解這樣使用 的數據在適當情況下可以互換,以便這裡描述的本發明的實施例能夠以除了在這裡圖示或 描述的那些以外的順序實施。此外,術語"包括"和"具有"以及他們的任何變形,意圖在於 覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統、產品或設備不必限 於清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或對於這些過程、方法、產 品或設備固有的其它步驟或單元。
[0028] 本發明提供了一種語料數據的查找方法。圖1是根據本發明實施例的語料數據的 查找方法的流程圖。如圖所示,該語料數據的查找方法包括如下步驟:
[0029] 步驟S102,獲取用戶的第一聲紋模型;
[0030] 步驟S104,從語料資料庫的預存聲紋模型中查找與第一聲紋模型的相匹配的聲紋 模型,得到第二聲紋模型;
[0031] 步驟S106,根據語料資料庫中預先存儲的預存聲紋模型與語料數據的關聯關係, 獲取與第二聲紋模型相關聯的第一語料數據;以及
[0032] 步驟S108,將第一語料數據發送給用戶。
[0033] 語料資料庫中保存了第二聲紋模型以及第二聲紋模型與語料數據的映射關係,因 此,從語料資料庫中找到與第一聲紋模型匹配的第二聲紋模型,就能找到與第二聲紋模型 相關聯的語料數據,從而找到與用戶的第一聲紋模型向匹配的所有語料數據,提高了查找 語料數據的效率,並且能夠準確匹配到需要查找的語料數據。
[0034] 以下結合表1對本實施例進行說明。
[0035] 表 1
[0036]
【權利要求】
1. 一種語料數據的查詢方法,其特徵在於,包括: 獲取用戶的第一聲紋模型; 從語料資料庫的預存聲紋模型中查找與所述第一聲紋模型的相匹配的聲紋模型,得到 第二聲紋模型; 根據所述語料資料庫中預先存儲的所述預存聲紋模型與語料數據的關聯關係,獲取與 所述第二聲紋模型相關聯的第一語料數據;以及 將所述第一語料數據發送給所述用戶。
2. 根據權利要求1所述的方法,其特徵在於,獲取與所述第二聲紋模型相關聯的第一 語料數據包括: 從所述語料資料庫中查找與所述第二聲紋模型具有映射關係的對象標識; 獲取與所述對象標識關聯的第二語料數據;以及 將與所述對象標識關聯的所述第二語料數據作為所述第一語料數據。
3. 根據權利要求2所述的方法,其特徵在於,將所述第一語料數據發送給所述用戶包 括: 獲取所述對象標識的對象信息;以及 在將所述第一語料數據發送給所述用戶時,將所述對象信息發送給所述用戶。
4. 根據權利要求1所述的方法,其特徵在於,從語料資料庫的預存聲紋模型中查找與 所述第一聲紋模型的相匹配的聲紋模型,得到第二聲紋模型包括: 利用後驗概率分別計算所述第一聲紋模型與所述預存聲紋模型中的每個預存聲紋模 型的相似度,得到多個相似度; 比較所述多個相似度,得到最大相似度;以及 將所述預存聲紋模型中具有所述最大相似度的聲紋模型作為所述第二聲紋模型。
5. 根據權利要求1所述的方法,其特徵在於,在從語料資料庫的預存聲紋模型中查找 與所述第一聲紋模型的相匹配的聲紋模型之前,所述方法還包括: 收集多個對象標識所指示的多個對象的語料數據; 獲取所述多個對象的語料數據的聲紋模型,得到所述預存聲紋模型;以及 建立所述預存聲紋模型與所述多個對象標識的對應關係。
6. 根據權利要求5所述的方法,其特徵在於,獲取多個對象的語料數據的聲紋模型,得 到所述預存聲紋模型包括: 將所述語料數據與所述多個對象的標識進行關聯; 提取與所述多個對象標識中每個對象標識關聯的所有語料數據中每一幀語音信號的 語音特徵參數; 對提取到的所述每個對象標識的語音特徵參數進行訓練,得到屬於所述每個對象標識 的聲紋模型;以及 將屬於所述每個對象標識的聲紋模型作為所述預存聲紋模型。
7. 根據權利要求5所述的方法,其特徵在於,在建立所述預存聲紋模型與所述多個對 象標識的對應關係之後,且獲取用戶的第一聲紋模型之前,所述方法還包括: 獲取第一對象的語料數據; 識別所述第一對象的語料數據中的聲紋模型; 從所述預存聲紋模型中查找與所述第一對象的聲紋模型匹配的聲紋模型;以及 將所述第一對象的語料數據關聯到查找到的聲紋模型所對應的對象標識。
8. -種語料數據的查詢裝置,其特徵在於,包括: 第一獲取單元,用於獲取用戶的第一聲紋模型; 第一查找單元,用於從語料資料庫的預存聲紋模型中查找與所述第一聲紋模型的相匹 配的聲紋模型,得到第二聲紋模型; 第二獲取單元,用於根據所述語料資料庫中預先存儲的所述預存聲紋模型與語料數據 的關聯關係,獲取與所述第二聲紋模型相關聯的第一語料數據;以及 發送單元,用於將所述第一語料數據發送給所述用戶。
9. 根據權利要求8所述的裝置,其特徵在於,所述第一獲取單元包括: 查找模塊,用於從所述語料資料庫中查找與所述第二聲紋模型具有映射關係的對象標 識; 第一獲取模塊,用於獲取與所述對象標識關聯的第二語料數據;以及 第一確定模塊,用於將與所述對象標識關聯的所述第二語料數據作為所述第一語料數 據。
10. 根據權利要求9所述的裝置,其特徵在於,所述發送單元包括: 第二獲取模塊,用於獲取所述對象標識的對象信息;以及 發送模塊,用於在將所述第一語料數據發送給所述用戶時,將所述對象信息發送給所 述用戶。
11. 根據權利要求8所述的裝置,其特徵在於,所述查找單元包括: 計算模塊,用於利用後驗概率分別計算所述第一聲紋模型與所述預存聲紋模型中的每 個預存聲紋模型的相似度,得到多個相似度; 比較模塊,用於比較所述多個相似度,得到最大相似度;以及 第二確定模塊,用於將所述預存聲紋模型中具有所述最大相似度的聲紋模型作為所述 第二聲紋模型。
12. 根據權利要求8所述的裝置,其特徵在於,所述裝置還包括: 收集單元,用於在從語料資料庫的預存聲紋模型中查找與所述第一聲紋模型的相匹配 的聲紋模型之前,收集多個對象標識所指示的多個對象的語料數據; 第三獲取單元,用於獲取所述多個對象的語料數據的聲紋模型,得到所述預存聲紋模 型;以及 建立單元,用於建立所述預存聲紋模型與所述多個對象標識的對應關係。
13. 根據權利要求12所述的裝置,其特徵在於,所述第三獲取單元包括: 關聯模塊,用於將所述語料數據與所述多個對象的標識進行關聯; 提取模塊,用於提取與所述多個對象標識中每個對象標識關聯的所有語料數據中每一 幀語音信號的語音特徵參數; 訓練模塊,用於對提取到的所述每個對象標識的語音特徵參數進行訓練,得到屬於所 述每個對象標識的聲紋模型;以及 第三確定模塊,用於將屬於所述每個對象標識的聲紋模型作為所述預存聲紋模型。
14. 根據權利要求12所述的裝置,其特徵在於,所述裝置還包括: 第四獲取單元,用於在建立所述預存聲紋模型與所述多個對象標識的對應關係之後, 且獲取用戶的第一聲紋模型之前,獲取第一對象的語料數據; 識別單元,用於識別所述第一對象的語料數據中的聲紋模型; 第二查找單元,用於從所述預存聲紋模型中查找與所述第一對象的聲紋模型匹配的聲 紋模型;以及 關聯單元,用於將所述第一對象的語料數據關聯到查找到的聲紋模型所對應的對象標 識。
【文檔編號】G10L17/00GK104268279SQ201410549904
【公開日】2015年1月7日 申請日期:2014年10月16日 優先權日:2014年10月16日
【發明者】張徵, 張爍 申請人:魔方天空科技(北京)有限公司