新四季網

語料數據的查詢方法和裝置製造方法

2023-05-25 00:39:01

語料數據的查詢方法和裝置製造方法
【專利摘要】本發明公開了一種語料數據的查詢方法和裝置。其中,該語料數據的查詢方法包括:獲取用戶的第一聲紋模型;從語料資料庫的預存聲紋模型中查找與第一聲紋模型的相匹配的聲紋模型,得到第二聲紋模型;根據語料資料庫中預先存儲的預存聲紋模型與語料數據的關聯關係,獲取與第二聲紋模型相關聯的第一語料數據;以及將第一語料數據發送給用戶。通過本發明,解決了現有技術中查找語料數據的效率比較低的問題,進而達到了提高查找語料數據的效率的效果。
【專利說明】語料數據的查詢方法和裝置

【技術領域】
[0001]本發明涉及多媒體領域,具體而言,涉及一種語料數據的查詢方法和裝置。

【背景技術】
[0002] 隨著多媒體技術的不斷發展和進步,越來越多的語料數據產生並存儲。在需要調 用這些語料數據時,需要在存儲的文件中按照語料數據的文件名逐個比對查找,對於大量 的語料數據來說,通過逐個對比文件名的方式查找語料數據的方式顯然效率比較低。另外, 通過文件名查找語料數據的方法在文件名的命名規則不規範時,無法準確查找到相應的語 料數據,甚至無法查找到語料數據。
[0003] 針對現有技術中查找語料數據的效率比較低的問題,目前尚未提出有效的解決方 案。


【發明內容】

[0004] 本發明的主要目的在於提供一種語料數據的查詢方法和裝置,以解決現有技術中 查找語料數據的效率比較低的問題。
[0005] 為了實現上述目的,根據本發明的一個方面,提供了一種語料數據的查詢方法。根 據本發明的語料數據的查詢方法包括:獲取用戶的第一聲紋模型;從語料資料庫的預存聲 紋模型中查找與所述第一聲紋模型的相匹配的聲紋模型,得到第二聲紋模型;根據所述語 料資料庫中預先存儲的所述預存聲紋模型與語料數據的關聯關係,獲取與所述第二聲紋模 型相關聯的第一語料數據;以及將所述第一語料數據發送給所述用戶。
[0006] 進一步地,獲取與所述第二聲紋模型相關聯的第一語料數據包括:從所述語料數 據庫中查找與所述第二聲紋模型具有映射關係的對象標識;獲取與所述對象標識關聯的第 二語料數據;以及將與所述對象標識關聯的所述第二語料數據作為所述第一語料數據。
[0007] 進一步地,將所述第一語料數據發送給所述用戶包括:獲取所述對象標識的對象 信息;以及在將所述第一語料數據發送給所述用戶時,將所述對象信息發送給所述用戶。
[0008] 進一步地,從語料資料庫的預存聲紋模型中查找與所述第一聲紋模型的相匹配的 聲紋模型,得到第二聲紋模型包括:利用後驗概率分別計算所述第一聲紋模型與所述預f 聲紋模型中的每個預存聲紋模型的相似度,得到多個相似度;比較所述多個相似^彳^^最 大相似度;以及將所述預存聲紋模型中具有所述最大相似度的聲紋模型作為所述第一屍紋 模型。 #
[0009] 進-步地,在原順獅麵存聲紋麵巾誠與難第-聲猶型的相匹^ 的聲紋模型之前,臟方法還包括:收集多個對象標砸指示的多個對細語料數據^獲 取所述多個對象的語料數據的聲紋模型,得到所述預存聲紋模型;以及建立所述預存聲紋 臟語料娜與臓鄉個雜_識趣1關聯;提取與臟鄉頓脅V、巾每1對象標 V、 關聯的所有語料數據中每一幀語音信號的語音特徵參數;對提取到的所述每個對象標識的 語音特徵參數進行訓練,得到屬於所述每個對象標識的聲紋模型;以及將屬於所述每個對 象標識的聲紋模型作為所述預存聲紋模型。
[0011] 進一步地,在建立所述預存聲紋模型與所述多個對象標識的對應關係之後,且獲 取用戶的第一聲紋模型之前,所述方法還包括:獲取第一對象的語料數據;識別所述第一 對象的語料數據中的聲紋模型;從所述預存聲紋模型中查找與所述第一對象的聲紋模型匹 配的聲紋模型;以及將所述第一對象的語料數據關聯到查找到的聲紋模型所對應的對象標 識。
[0012] 為了實現上述目的,根據本發明的另一方面,提供了一種語料數據的查詢裝置。根 據本發明的語料數據的查詢裝置包括:第一獲取單元,用於獲取用戶的第一聲紋模型;第 一查找單元,用於從語料資料庫的預存聲紋模型中查找與所述第一聲紋模型的相匹配的聲 紋模型,得到第二聲紋模型;第二獲取單元,用於根據所述語料資料庫中預先存儲的所述預 存聲紋模型與語料數據的關聯關係,獲取與所述第二聲紋模型相關聯的第一語料數據;以 及發送單元,用於將所述第一語料數據發送給所述用戶。
[0013] 進一步地,所述第一獲取單元包括:查找模塊,用於從所述語料資料庫中查找與所 述第二聲紋模型具有映射關係的對象標識;第一獲取模塊,用於獲取與所述對象標識關聯 的第二語料數據;以及第一確定模塊,用於將與所述對象標識關聯的所述第二語料數據作 為所述第一語料數據。
[0014] 進一步地,所述發送單元包括:第二獲取模塊,用於獲取所述對象標識的對象信 息;以及發送模塊,用於在將所述第一語料數據發送給所述用戶時,將所述對象信息發送給 所述用戶。
[0015] 進一步地,所述查找單元包括:計算模塊,用於利用後驗概率分別計算所述第一聲 紋模型與所述預存聲紋模型中的每個預存聲紋模型的相似度,得到多個相似度;比較模塊, 用於比較所述多個相似度,得到最大相似度;以及第二確定模塊,用於將所述預存聲紋模型 中具有所述最大相似度的聲紋模型作為所述第二聲紋模型。
[0016] 進一步地,所述裝置還包括:收集單元,用於在從語料資料庫的預存聲紋模型中查 找與所述第一聲紋模型的相匹配的聲紋模型之前,收集多個對象標識所指示的多個對象的 語料數據;第三獲取單元,用於獲取所述多個對象的語料數據的聲紋模型,得到所述預存聲 紋模型;以及建立單元,用於建立所述預存聲紋模型與所述多個對象標識的對應關係。
[0017] 進一步地,所述第三獲取單元包括:關聯模塊,用於將所述語料數據與所述多個對 象的標識進行關聯;提取模塊,用於提取與所述多個對象標識中每個對象標識關聯的所有 語料數據中每一幀語音信號的語音特徵參數;訓練模塊,用於對提取到的所述每個對象標 識的語音特徵參數進行訓練,得到屬於所述每個對象標識的聲紋模型;以及第三確定模塊, 用於將屬於所述每個對象標識的聲紋模型作為所述預存聲紋模型。
[0018] 進一步地,所述裝置還包括:第四獲取單元,用於在建立所述預存聲紋模型與所述 多個對象標識的對應關係之後,且獲取用戶的第一聲紋模型之前,獲取第一對象的語料數 據;識別單元,用於識別所述第一對象的語料數據中的聲紋模型;第二查找單元,用於從所 述預存聲紋模型中查找與所述第一對象的聲紋模型匹配的聲紋模型;以及關聯單元,用於 將所述第一對象的語料數據關聯到查找到的聲紋模型所對應的對象標識。
[001幻通過本發明,在語料資料庫中保存第二聲紋模型以及第二聲紋模型與語料數據的 映 ?關?,因此,從語料資料庫中找到與第一聲紋模型匹配的第二聲紋模型,就能找到與第 二聲紋模型相關聯的語料數據,從而找到與用戶的第一聲紋模型向匹配的所有語料數據, 解決了現有技術中查找語料數據的效率比較低的問題,進而達到了提高查找語料數據的效 率的效果。

【專利附圖】

【附圖說明】
[0020]構成本申請的一部分的附圖用來提供對本發明的進一步理解,本發明的示意性實 施例及其說明用於解釋本發明,並不構成對本發明的不當限定。在附圖中:
[0021]圖1是根據本發明實施例的語料數據的查詢方法的流程圖;
[0022]圖2是根據本發明又一實施例的語料數據的查詢方法的流程圖;
[0023]圖3是根據本發明實施例的通過對象標識將語料數據表與對象信息表關聯的示 意圖;以及
[0024]圖4是根據本發明實施例的語料數據的查詢裝置的示意圖。

【具體實施方式】
[0025]需要說明的是,在不衝突的情況下,本申請中的實施例及實施例中的特徵可以相 互組合。下面將參考附圖並結合實施例來詳細說明本發明。
[0026]為了使本【技術領域】的人員更好地理解本發明方案,下面將結合本發明實施例中的 附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是 本發明一部分的實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術 人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都應當屬於本發明保護的範 圍。
[0027]需要說明的是,本發明的說明書和權利要求書及上述附圖中的術語"第一"、"第 二"等是用於區別類似的對象,而不必用於描述特定的順序或先後次序。應該理解這樣使用 的數據在適當情況下可以互換,以便這裡描述的本發明的實施例能夠以除了在這裡圖示或 描述的那些以外的順序實施。此外,術語"包括"和"具有"以及他們的任何變形,意圖在於 覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統、產品或設備不必限 於清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或對於這些過程、方法、產 品或設備固有的其它步驟或單元。
[0028] 本發明提供了一種語料數據的查找方法。圖1是根據本發明實施例的語料數據的 查找方法的流程圖。如圖所示,該語料數據的查找方法包括如下步驟:
[0029] 步驟S102,獲取用戶的第一聲紋模型;
[0030] 步驟S104,從語料資料庫的預存聲紋模型中查找與第一聲紋模型的相匹配的聲紋 模型,得到第二聲紋模型;
[0031] 步驟S106,根據語料資料庫中預先存儲的預存聲紋模型與語料數據的關聯關係, 獲取與第二聲紋模型相關聯的第一語料數據;以及
[0032] 步驟S108,將第一語料數據發送給用戶。
[0033] 語料資料庫中保存了第二聲紋模型以及第二聲紋模型與語料數據的映射關係,因 此,從語料資料庫中找到與第一聲紋模型匹配的第二聲紋模型,就能找到與第二聲紋模型 相關聯的語料數據,從而找到與用戶的第一聲紋模型向匹配的所有語料數據,提高了查找 語料數據的效率,並且能夠準確匹配到需要查找的語料數據。
[0034] 以下結合表1對本實施例進行說明。
[0035] 表 1
[0036]

【權利要求】
1. 一種語料數據的查詢方法,其特徵在於,包括: 獲取用戶的第一聲紋模型; 從語料資料庫的預存聲紋模型中查找與所述第一聲紋模型的相匹配的聲紋模型,得到 第二聲紋模型; 根據所述語料資料庫中預先存儲的所述預存聲紋模型與語料數據的關聯關係,獲取與 所述第二聲紋模型相關聯的第一語料數據;以及 將所述第一語料數據發送給所述用戶。
2. 根據權利要求1所述的方法,其特徵在於,獲取與所述第二聲紋模型相關聯的第一 語料數據包括: 從所述語料資料庫中查找與所述第二聲紋模型具有映射關係的對象標識; 獲取與所述對象標識關聯的第二語料數據;以及 將與所述對象標識關聯的所述第二語料數據作為所述第一語料數據。
3. 根據權利要求2所述的方法,其特徵在於,將所述第一語料數據發送給所述用戶包 括: 獲取所述對象標識的對象信息;以及 在將所述第一語料數據發送給所述用戶時,將所述對象信息發送給所述用戶。
4. 根據權利要求1所述的方法,其特徵在於,從語料資料庫的預存聲紋模型中查找與 所述第一聲紋模型的相匹配的聲紋模型,得到第二聲紋模型包括: 利用後驗概率分別計算所述第一聲紋模型與所述預存聲紋模型中的每個預存聲紋模 型的相似度,得到多個相似度; 比較所述多個相似度,得到最大相似度;以及 將所述預存聲紋模型中具有所述最大相似度的聲紋模型作為所述第二聲紋模型。
5. 根據權利要求1所述的方法,其特徵在於,在從語料資料庫的預存聲紋模型中查找 與所述第一聲紋模型的相匹配的聲紋模型之前,所述方法還包括: 收集多個對象標識所指示的多個對象的語料數據; 獲取所述多個對象的語料數據的聲紋模型,得到所述預存聲紋模型;以及 建立所述預存聲紋模型與所述多個對象標識的對應關係。
6. 根據權利要求5所述的方法,其特徵在於,獲取多個對象的語料數據的聲紋模型,得 到所述預存聲紋模型包括: 將所述語料數據與所述多個對象的標識進行關聯; 提取與所述多個對象標識中每個對象標識關聯的所有語料數據中每一幀語音信號的 語音特徵參數; 對提取到的所述每個對象標識的語音特徵參數進行訓練,得到屬於所述每個對象標識 的聲紋模型;以及 將屬於所述每個對象標識的聲紋模型作為所述預存聲紋模型。
7. 根據權利要求5所述的方法,其特徵在於,在建立所述預存聲紋模型與所述多個對 象標識的對應關係之後,且獲取用戶的第一聲紋模型之前,所述方法還包括: 獲取第一對象的語料數據; 識別所述第一對象的語料數據中的聲紋模型; 從所述預存聲紋模型中查找與所述第一對象的聲紋模型匹配的聲紋模型;以及 將所述第一對象的語料數據關聯到查找到的聲紋模型所對應的對象標識。
8. -種語料數據的查詢裝置,其特徵在於,包括: 第一獲取單元,用於獲取用戶的第一聲紋模型; 第一查找單元,用於從語料資料庫的預存聲紋模型中查找與所述第一聲紋模型的相匹 配的聲紋模型,得到第二聲紋模型; 第二獲取單元,用於根據所述語料資料庫中預先存儲的所述預存聲紋模型與語料數據 的關聯關係,獲取與所述第二聲紋模型相關聯的第一語料數據;以及 發送單元,用於將所述第一語料數據發送給所述用戶。
9. 根據權利要求8所述的裝置,其特徵在於,所述第一獲取單元包括: 查找模塊,用於從所述語料資料庫中查找與所述第二聲紋模型具有映射關係的對象標 識; 第一獲取模塊,用於獲取與所述對象標識關聯的第二語料數據;以及 第一確定模塊,用於將與所述對象標識關聯的所述第二語料數據作為所述第一語料數 據。
10. 根據權利要求9所述的裝置,其特徵在於,所述發送單元包括: 第二獲取模塊,用於獲取所述對象標識的對象信息;以及 發送模塊,用於在將所述第一語料數據發送給所述用戶時,將所述對象信息發送給所 述用戶。
11. 根據權利要求8所述的裝置,其特徵在於,所述查找單元包括: 計算模塊,用於利用後驗概率分別計算所述第一聲紋模型與所述預存聲紋模型中的每 個預存聲紋模型的相似度,得到多個相似度; 比較模塊,用於比較所述多個相似度,得到最大相似度;以及 第二確定模塊,用於將所述預存聲紋模型中具有所述最大相似度的聲紋模型作為所述 第二聲紋模型。
12. 根據權利要求8所述的裝置,其特徵在於,所述裝置還包括: 收集單元,用於在從語料資料庫的預存聲紋模型中查找與所述第一聲紋模型的相匹配 的聲紋模型之前,收集多個對象標識所指示的多個對象的語料數據; 第三獲取單元,用於獲取所述多個對象的語料數據的聲紋模型,得到所述預存聲紋模 型;以及 建立單元,用於建立所述預存聲紋模型與所述多個對象標識的對應關係。
13. 根據權利要求12所述的裝置,其特徵在於,所述第三獲取單元包括: 關聯模塊,用於將所述語料數據與所述多個對象的標識進行關聯; 提取模塊,用於提取與所述多個對象標識中每個對象標識關聯的所有語料數據中每一 幀語音信號的語音特徵參數; 訓練模塊,用於對提取到的所述每個對象標識的語音特徵參數進行訓練,得到屬於所 述每個對象標識的聲紋模型;以及 第三確定模塊,用於將屬於所述每個對象標識的聲紋模型作為所述預存聲紋模型。
14. 根據權利要求12所述的裝置,其特徵在於,所述裝置還包括: 第四獲取單元,用於在建立所述預存聲紋模型與所述多個對象標識的對應關係之後, 且獲取用戶的第一聲紋模型之前,獲取第一對象的語料數據; 識別單元,用於識別所述第一對象的語料數據中的聲紋模型; 第二查找單元,用於從所述預存聲紋模型中查找與所述第一對象的聲紋模型匹配的聲 紋模型;以及 關聯單元,用於將所述第一對象的語料數據關聯到查找到的聲紋模型所對應的對象標 識。
【文檔編號】G10L17/00GK104268279SQ201410549904
【公開日】2015年1月7日 申請日期:2014年10月16日 優先權日:2014年10月16日
【發明者】張徵, 張爍 申請人:魔方天空科技(北京)有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀