一種習慣用語的獲取方法、裝置及系統的製作方法
2023-04-29 16:12:06 3
一種習慣用語的獲取方法、裝置及系統的製作方法
【專利摘要】本發明實施例公開了一種習慣用語的獲取方法,包括:若終端檢測到用戶發出的語音信號,則所述終端獲取所述語音信號對應的語音數據,並將所述語音數據發送至伺服器;所述伺服器接收所述終端發送的語音數據,並根據預設的語音字節閾值,從所述語音數據中篩選出所述語音字節閾值對應數目的目標語音字節;所述伺服器對目標語音字節進行解析,並獲取包含所述用戶的習慣用語的解析結果。本發明實施例還公開了一種習慣用語獲取裝置及系統。採用本發明,能夠有針對性地獲取相關用戶的習慣用語。
【專利說明】—種習慣用語的獲取方法、裝置及系統
【技術領域】
[0001]本發明涉及媒體【技術領域】,尤其涉及一種習慣用語的獲取方法、裝置及系統。
【背景技術】
[0002]日常生活中,人們不可避免地要與他人進行交流。然而,在與人交流過程中,人們都有自己的言辭習慣,因此在交流時可能攜帶一些習慣用語。其中,有的用語習慣如不文明言辭可能會破壞交流環境,比如在某個較為正式的場合中,無意識的冒出幾句不文明的口頭禪,則會影響人們之間交流的和諧性,可能給說話者帶來負面影響,甚至造成一定的損失。因此,及時地掌握自身的言辭習慣成為關鍵。然而,現有技術中不存在對用戶言辭習慣進行分析,而且也不能通過目前的通信工具,獲取相關用戶的言辭習慣。
【發明內容】
[0003]本發明實施例提供了一種習慣用語的獲取方法、裝置及系統,可有針對性地獲取相關用戶的習慣用語。
[0004]本發明實施例提供了一種習慣用語的獲取方法,包括:
[0005]若終端檢測到用戶發出的語音信號,則所述終端獲取所述語音信號對應的語音數據,並將所述語音數據發送至伺服器;
[0006]所述伺服器接收所述終端發送的語音數據,並根據預設的語音字節閾值,從所述語音數據中篩選出所述語音字節閾值對應數目的目標語音字節;
[0007]所述伺服器對目標語音字節進行解析,並獲取包含所述用戶的習慣用語的解析結果O
[0008]相應地,本發明實施例還提供了一種習慣用語獲取方法,包括:
[0009]伺服器接收終端發送的語音數據,並根據預設的語音字節閾值,從所述語音數據中篩選出所述語音字節閾值對應數目的目標語音字節,所述語音數據為所述終端在檢測到用戶發出的語音信號時所獲取的與所述語音信號對應的語音數據;
[0010]所述伺服器對目標語音字節進行解析,並獲取包含所述用戶的習慣用語的解析結果O
[0011]相應地,本發明實施例還提供了一種習慣用語獲取裝置,包括:
[0012]篩選單元,用於根據預設的語音字節閾值,從終端發送的語音數據中篩選出所述語音字節閾值對應數目的目標語音字節,所述語音數據為所述終端在檢測到用戶發出的語音信號時所獲取的與所述語音信號對應的語音數據;
[0013]獲取單元,用於對所述篩選單元篩選出的目標語音字節進行解析,並獲取包含所述用戶的習慣用語的解析結果。
[0014]相應地,本發明實施例還提供了一種習慣用語獲取系統,包括:終端和伺服器;其中,
[0015]所述終端,用於若檢測到用戶發出的語音信號,則獲取所述語音信號對應的語音數據,並將所述語音數據發送至所述伺服器;
[0016]所述伺服器,用於接收所述終端發送的語音數據,並根據預設的語音字節閾值,從所述語音數據中篩選出所述語音字節閾值對應數目的目標語音字節;對所述目標語音字節進行解析,並獲取包含所述用戶的習慣用語的解析結果。
[0017]本發明實施例可在檢測到用戶發出的語音信號時,獲得相應的語音數據,通過對該語音數據中篩選出的目標語音字節進行分析,從而得到當前用戶的習慣用語,可有針對性地獲取相關用戶的習慣用語,靈活性較強。
【專利附圖】
【附圖說明】
[0018]為了更清楚地說明本發明實施例的技術方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
[0019]圖1是本發明實施例的一種習慣用語的獲取方法的流程示意圖;
[0020]圖2是本發明實施例的另一種習慣用語的獲取方法的流程示意圖;
[0021]圖3是本發明實施例的一種獲取目標語音字節的方法的流程示意圖;
[0022]圖4是本發明實施例的一種習慣用語的獲取方法的交互示意圖;
[0023]圖5是本發明實施例的又一種習慣用語的獲取方法的流程示意圖;
[0024]圖6是本發明實施例的一種習慣用語獲取裝置的結構示意圖;
[0025]圖7是本發明實施例的另一種習慣用語獲取裝置的結構示意圖;
[0026]圖8是本發明實施例的又一種習慣用語獲取裝置的結構示意圖;
[0027]圖9是本發明實施例的一種終端的結構示意圖;
[0028]圖10是本發明實施例的一種伺服器的結構示意圖;
[0029]圖11是本發明實施例的一種習慣用語獲取系統的結構示意圖。
【具體實施方式】
[0030]下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都屬於本發明保護的範圍。
[0031]請參見圖1,是本發明實施例的一種習慣用語的獲取方法的流程示意圖,所述方法可具體應用於手機、平板電腦、可穿戴設備等終端設備中,或者可應用於伺服器中,本發明實施例不做限定。具體的,所述方法包括:
[0032]SlOl:若檢測到用戶發出的語音信號,則獲取所述語音信號對應的語音數據。
[0033]具體實施例中,可通過檢測當前是否存在用戶發出的語音信號,並在檢測到語音信號時,觸發獲取該語音信號對應的語音數據,比如通過錄音獲取得到該語音數據。
[0034]進一步的,在獲取該語音數據之前,還可檢測當前發出語音信號的用戶是否為當前終端的合法用戶,比如通過預設的語音樣本進行匹配檢測,其中,該語音樣本為合法用戶的聲音片段,具體可由合法用戶進行預先錄音得到。
[0035]S102:根據預設的語音字節閾值,從所述語音數據中篩選出所述語音字節閾值對應數目的目標語音字節。
[0036]具體實施例中,可預先設置一個語音字節閾值,並根據該閾值從獲取的語音數據中提取出目標語音字節。一般來說,用戶每說出的一個字即對應一個語音字節,比如用戶說出「你好嗎」,則對應三個語音字節。
[0037]可選地,該獲取的語音數據可以為一句話,並可根據該預設語音字節閾值從該句話的特定位置如開頭和/或結尾處提取該閾值對應數目的語音字節作為目標語音字節。也就是說,可在每獲取得到一句話,比如每錄製得到一句話時,即可進行目標語音字節的篩選操作,從而篩選得到一定數量的目標語音字節。其中,每句話之間可以通過預設的停頓時間間隔進行區分。
[0038]進一步可選地,該獲取的語音數據還可為一段話(即由多句話組成),則可根據預設的停頓時間間隔對該獲取的語音數據進行分段處理,獲得多個語音片段(一個語音片段可對應為一句話)。相應地,若該語音字節閾值設置為5,則可從各語音片段的特定位置提取出5個語音字節作為目標語音字節,比如提取該語音片段的前5個字節和/或後5個字節作為目標語音字節,從而得到多個目標語音字節。
[0039]S103:對所述目標語音字節進行解析,並獲取包含所述用戶的習慣用語的解析結果O
[0040]具體的,若解析到各目標語音字節中存在相同,即某些目標語音字節重複出現,則計算該語音字節的出現次數,即重複次數,並在該重複次數超過預設的數量閾值,比如說5次時,將相應的目標語音字節作為該用戶的習慣用語進行存儲。
[0041]進一步的,還可將解析得到的用戶習慣用語及該習慣用語的重複次數推送給當前終端。
[0042]進一步的,還可在後續檢測到用戶發出語音信號,且該語音信號對應的語音數據與該解析得到的習慣用語相匹配時,發出消息提示,以提醒用戶注意相關言辭。
[0043]實施本發明實施例可在檢測到用戶發出的語音信號時,獲取相應的語音數據,通過對該語音數據中篩選出的目標語音字節進行分析,從而得到當前用戶的習慣用語,可有針對性地獲取相關用戶的習慣用語,靈活性較強。
[0044]請參見圖2,是本發明實施例的另一種習慣用語的獲取方法的流程示意圖,具體的,所述方法包括:
[0045]S201:若檢測到用戶發出的語音信號,則獲取所述語音信號對應的聲音屬性。
[0046]S202:判斷所述語音信號對應的聲音屬性是否與預置的語音樣本對應的聲音屬性相匹配。
[0047]具體實施例中,可預先設置一個語音樣本,該語音樣本為合法用戶的聲音片段,具體可由當前合法用戶錄製得到。
[0048]S203:若匹配,則獲取所述語音信號對應的語音數據。
[0049]具體的,當檢測到用戶發出的語音信號即檢測到有人說話時,可通過將該語音信號的聲音屬性與該語音樣本的聲音屬性進行匹配對比,比如判斷兩者對應的音色及頻率是否相匹配,從而確定當前用戶身份的合法性,並在判斷結果為匹配,即當前用戶身份合法時,觸發獲取該語音信號對應的語音數據。其中,所述聲音屬性可包括語速、語調、音色或頻率等等。
[0050]S204:根據預設的停頓時間間隔對所述語音數據進行分段,獲得語音片段。
[0051]當確定當前發出語音信號的用戶為合法用戶時,則可獲取相應的語音數據如通過對該語音數據進行錄音得到。具體的,該語音數據可為一整段語音,即包含了多個語音片段,則可通過預設的分段方式對該語音數據進行分段處理,比如根據該語音數據中各語音字節之間的預設停頓時間間隔如200ms進行分段,得到語音片段(該一個語音片段可對應為一句話)。進一步的,若當前錄製的語音數據僅為一句話,則可將該句話作為一個語音片段,即每錄製一句話,則可將該句話作為一個語音片段,從而得到預設數量閾值的語音片段。
[0052]S205:根據預設的語音字節閾值,分別從所述語音片段的開頭或結尾處提取出所述語音字節閾值對應數目的語音字節作為目標語音字節。
[0053]具體實施例中,還可預先設置一個語音字節閾值,根據該閾值從劃分的各語音片段的特定位置如開頭和/或結尾處提取出目標語音字節。舉例來說,若該語音字節閾值設置為5,則可同時提取該語音片段的前5個字節和後5個字節作為目標語音字節,從而得到多個目標語音字節。
[0054]進一步的,可設置將所述語音字節閾值依次遞減,比如從5依次遞減到4、3、2、1,並重複執行從各語音片段的開頭和結尾處提取出相應語音字節閾值對應數目的目標語音字節,直至該語音字節閾值變為0,即分別從各語音片段的開頭和結尾提取出5個語音字節、4個語音字節、3個語音字節、2個語音字節以及I個語音字節作為目標語音字節,從而獲取得到不同語音字節數目的目標語音字節。
[0055]S206:計算所述目標語音字節的重複次數,並記錄所述重複次數。
[0056]S207:若檢測得到所述重複次數達到預設的第二數量閾值,則將所述目標語音字節作為所述用戶的習慣用語,並保存所述習慣用語。
[0057]具體的,若解析到各目標語音字節中存在相同的目標語音字節,則計算該語音字節的出現次數,即重複次數,並在該重複次數超過預設的數量閾值,比如說5次時,將相應的目標語音字節作為該用戶的習慣用語進行存儲,以供用戶進行解析結果查詢或直接將該包含用戶習慣用語的解析結果推送給用戶。
[0058]可選地,可以預設一個提醒時間,比如每天晚上九點,並在該提醒時間到達時,將獲取得到的解析結果如用戶習慣用語及其對應的重複次數等結果信息推送給當前終端。
[0059]具體實施例中,還可預先設置一個禁止語音庫,該語音庫中可預置攜帶禁止指示的語音片段,即一些慣用的不文明言辭,如「靠」、「操」、「你妹」等語音字節。可選地,若解析所述習慣用語為需要禁止的語音字節,如某些不文明言辭,則可生成禁止指示,並將攜帶所述禁止指示的習慣用語作為禁止的語音片段加入到所述禁止語音庫中。
[0060]進一步的,若檢測到所述用戶發出的語音信號對應的語音數據與所述禁止語音庫中各語音片段的任一項相匹配,則可發出消息提示,以提醒用戶注意相關言辭。具體的,該消息提示可包括簡訊、鈴聲或振動形式的提示,本發明實施例不作限定。
[0061]實施本發明實施例可在檢測到當前發出語音信號的用戶身份合法時觸發獲取相應的語音數據,通過對該語音數據進行分段處理得到語音片段並從各語音片段的開頭和/或結尾處篩選出較有代表性的言辭,從而分析得到當前用戶的習慣用語,並有針對性地將該習慣用語推送給相關用戶,進一步的,還可設置在後續檢測到用戶說出該口頭禪如不文明言辭時,對用戶進行提醒。
[0062]請參見圖3,是本發明實施例的一種獲取目標語音字節的方法的流程示意圖,具體的,所述方法包括:
[0063]S301:從所述語音片段中篩選出語音字節數目大於或等於預設的語音字節閾值的目標語音片段。
[0064]S302:若篩選出的所述目標語音片段的數量不小於預設的第一數量閾值,則分別從所述目標語音片段的開頭或結尾處提取出所述語音字節閾值對應數目的語音字節作為目標語音字節。
[0065]舉例來說,若該語音字節閾值設置為5,語音片段對應的數量閾值設置為6,則可從該語音片段中篩選出語音字節大於或等於5的語音片段,並可在篩選達到6個語音片段時,觸發提取該6個語音片段的前5個語音字節和/或後5個語音字節作為目標語音字節。
[0066]可選地,對於劃分得到的語音片段中語音字節小於該預設的語音字節閾值的語音片段,可作為猜測不文明言辭的即將出現,將該小於語音字節閾值的語音片段與預置的禁止語音庫中各語音片段進行對比,若檢測到兩者匹配,則可將該小於語音字節閾值的語音片段作為不文明言辭,並保存該不文明言辭及其出現次數,以便於用戶在後續進行查詢或將該出現的不文明言辭及其出現次數推送給當前用戶。
[0067]S303:將所述語音字節閾值依次遞減,並判斷遞減後的語音字節閾值是否為零。
[0068]進一步的,可設置將所述語音字節閾值依次遞減,比如從5依次遞減到4、3、2、1,並重複執行步驟S302,直至該語音字節閾值變為0,即分別從該篩選出的目標語音片段的開頭和/或結尾提取出5、4、3、2以及I個語音字節作為目標語音字節。
[0069]S304:得到目標語首字節。
[0070]若該語音字節閾值變為0,則可表明結束目標語音字節的提取操作,從而獲取得到不同語音字節數目的目標語音字節。
[0071]舉例來說,若篩選得到以下語音片段:
[0072]1.這節課馬上就要開始了哦。
[0073]2.然後同學們迅速回顧一下上節課所講的內容哦。
[0074]3.好了先不看了。
[0075]4.然後打開你們的書翻到第五十五頁。
[0076]5.然後看一下那裡的提示內容哦。
[0077]6.這節課開始了哦。
[0078]其中,該語音片段對應的數量閾值為6,語音字節閾值設置為5,即可將連續累積的6句話作為一個比較單位,且每句話都滿足語音字節大於或等於5。
[0079]對於上述的6句話,根據該語音字節閾值5,可分別從每句話的開頭和結尾處提取出「這節課馬上」和「要開始了哦」、「然後同學們」和「講的內容哦」、「好了先不看」和「了先不看了」、「然後打開你」和「第五十五頁」、「然後看一下」和「提示內容哦」、「這節課開始」和「課開始了哦」對應的語音字節作為目標語音字節,並對提取出的各目標語音字節進行解析。
[0080]具體實施例中,可通過分別比較提取出的每句話開頭的語音字節及結尾處的語音字節來對各目標語音字節進行解析。比如可比較首語句即每句話的開頭,即「這節課馬上」、「然後同學們」、「好了先不看」、「然後打開你」、「然後看一下」、「這節課開始」,發現6個首語句中沒有一個是相同的;進一步的,比較尾語句即每句話的結尾處,即「要開始了哦」、「講的內容哦」、「了先不看了」、「第五十五頁」、「提示內容哦」、「課開始了哦」,發現六個尾語句中沒有一個是相同的,則可設置將該語音字節閾值由5遞減為4。
[0081]根據該語音字節閾值4,則可比較首語句「這節課馬」、「然後同學」、「好了先不」、「然後打開」、「然後看一」、「這節課開」,發現六個首語句中沒有一個是相同的;進一步的,比較尾語句「開始了哦」、「的內容哦」、「先不看了」、「五十五頁」、「示內容哦」、「開始了哦」,發現六個尾語句中沒有一個是相同的,則可設置將該語音字節閾值由4遞減為3,並以此類推。
[0082]直到將該語音字節閾值遞減為2,發現6句話的首語句中「然後」出現三次,此時保存「然後」對應的語音字節,記錄相應的重複次數3,即出現3次。
[0083]最後將該語音字節閾值由2遞減為1,發現首語句中「這」出現兩次,此時保存「這」對應的語音字節,記錄其重複次數2 ;「然」字出現三次,記錄其重複次數3 ;還可發現尾語句中「哦」出現四次,保存「哦」對應的語音字節,記錄重複次數為4。進一步的,該「然」的重複次數與語音字節閾值為2時的「然後」的重複次數相同,均為3,即不高於「然後」的出現次數,且「然後」包含「然」,則可直接捨棄該「然」的相關記錄,否則記錄「然」及其重複次數。
[0084]綜上分析得到,此次解析到的用戶習慣用語即口頭禪有「這」,「然後」和「哦」。進一步的,若將該重複次數對應的數量閾值設置為3,則可將「然後」和「哦」作為該用戶的習慣用語進行存儲。
[0085]進一步的,可對後續的語音字節大於或等於5的6句話進行上述的解析過程,並獲取包含用戶口頭禪的解析結果,若監測到的口頭禪和前面的口頭禪有一致的,則可累計該口頭禪的出現次數,並在預設時間範圍內超過一定次數,比如3個小時內出現超過20次時,標記為嚴重警告,發出消息通知當前用戶。
[0086]實施本發明實施例可通過篩選出超過一定語音字節數的語音片段,並按照預設字節數的降序,從各語音片段的開頭和結尾處分別提取對應字節數的目標語音字節,解析各目標語音字節中是否存在重複的字節,從而分析得到當前用戶的習慣用語,針對性較強。
[0087]請參加圖4,是本發明實施例的一種習慣用語的獲取方法的交互示意圖,所述方法包括:
[0088]S401:若終端檢測到用戶發出的語音信號,則所述終端獲取所述語音信號對應的語音數據。
[0089]具體實施例中,可通過檢測當前是否存在用戶發出的語音信號,並在檢測到語音信號時,觸發獲取該語音信號對應的語音數據,比如通過錄音獲取得到該語音數據。
[0090]可選地,若終端檢測到用戶發出的語音信號,則所述終端獲取所述語音信號對應的語音數據,可具體為:若終端檢測到用戶發出的語音信號,則所述終端獲取所述語音信號對應的聲音屬性;所述終端判斷所述語音信號對應的聲音屬性是否與預置的語音樣本對應的聲音屬性相匹配,所述語音樣本為合法用戶的聲音片段,所述聲音屬性包括語速、語調、音色及頻率中的任一項或多項;若所述終端判斷結果為匹配,即檢測到當前用戶為合法用戶時,所述終端觸發獲取所述語音信號對應的語音數據。
[0091]S402:終端將所述語音數據發送至伺服器。
[0092]S403:伺服器接收所述終端發送的語音數據,並根據預設的語音字節閾值,從所述語音數據中篩選出所述語音字節閾值對應數目的目標語音字節。
[0093]具體實施例中,可預先設置一個語音字節閾值,並根據該閾值從獲取的語音數據中提取出目標語音字節。
[0094]可選地,所述伺服器根據預設的語音字節閾值,從所述語音數據中篩選出所述語音字節閾值對應數目的目標語音字節,可具體為:所述伺服器根據預設的停頓時間間隔對所述語音數據進行分段,獲得語音片段,所述語音數據包括至少一個語音片段;所述伺服器根據預設的語音字節閾值,分別從所述語音片段的開頭或結尾處提取出所述語音字節閾值對應數目的語音字節作為目標語音字節。
[0095]需要說明的是,該S403獲取目標語音字節的步驟也可由終端執行,即可由終端根據預設的語音字節閾值,從所述語音數據中篩選出所述語音字節閾值對應數目的目標語音字節之後,將獲取的目標語音字節發送至伺服器,以使伺服器對所述目標語音字節進行解析。
[0096]S404:伺服器對目標語音字節進行解析,並獲取包含所述用戶的習慣用語的解析結果。
[0097]可選地,所述伺服器對目標語音字節進行解析,並獲取包含所述用戶的習慣用語的解析結果,可具體為:所述伺服器計算所述目標語音字節的重複次數,並記錄所述重複次數;若所述伺服器檢測得到所述重複次數達到預設的數量閾值,則所述伺服器將所述目標語音字節作為所述用戶的習慣用語,並保存所述習慣用語。
[0098]具體的,若解析到各目標語音字節中存在相同,即某些目標語音字節重複出現,則計算該語音字節的出現次數,即重複次數,並在該重複次數超過預設的數量閾值,比如說5次時,將相應的目標語音字節作為該用戶的習慣用語進行存儲。
[0099]S405:伺服器將所述解析結果推送給終端。
[0100]實施本發明實施例可在檢測到用戶發出的語音信號時,獲取相應的語音數據,通過對該語音數據中篩選出的目標語音字節進行分析,從而得到當前用戶的習慣用語,可有針對性地獲取相關用戶的習慣用語,靈活性較強。
[0101]進一步的,所述伺服器還可將解析得到的用戶習慣用語及該習慣用語的重複次數等解析結果推送給當前終端。
[0102]實施本發明實施例可在檢測到用戶發出的語音信號時,獲取相應的語音數據,通過對該語音數據中篩選出的目標語音字節進行分析,從而得到當前用戶的習慣用語,可有針對性地獲取相關用戶的習慣用語,靈活性較強。
[0103]請參見圖5,是本發明實施例的又一種習慣用語的獲取方法的流程示意圖,所述方法可具體應用於伺服器中,具體的,所述方法包括:
[0104]S501:伺服器接收終端發送的語音數據,並根據預設的語音字節閾值,從所述語音數據中篩選出所述語音字節閾值對應數目的目標語音字節。
[0105]其中,所述語音數據為所述終端在檢測到用戶發出的語音信號時所獲取的與所述語音信號對應的語音數據。
[0106]具體實施例中,所述伺服器可根據預設的停頓時間間隔對所述語音數據進行分段,獲得語音片段,並根據預設的語音字節閾值,分別從所述語音片段的開頭或結尾處提取出所述語音字節閾值對應數目的語音字節作為目標語音字節。其中,所述語音數據包括至少一個語音片段;
[0107]具體的,伺服器可預先設置一個語音字節閾值,並根據該閾值從劃分的各語音片段的特定位置如開頭和/或結尾處提取出目標語音字節。舉例來說,若該語音字節閾值設置為5,則可同時提取該語音片段的前5個字節和後5個字節作為目標語音字節,從而得到多個目標語音字節。
[0108]進一步的,可設置將所述語音字節閾值依次遞減,比如從5依次遞減到4、3、2、1,並重複執行從各語音片段的開頭和結尾處提取出相應語音字節閾值對應數目的目標語音字節,直至該語音字節閾值變為0,即分別從各語音片段的開頭和結尾提取出5個語音字節、4個語音字節、3個語音字節、2個語音字節以及I個語音字節作為目標語音字節,從而獲取得到不同語音字節數目的目標語音字節。
[0109]S502:所述伺服器對目標語音字節進行解析,並獲取包含所述用戶的習慣用語的解析結果。
[0110]具體實施例中,所述伺服器可計算所述目標語音字節的重複次數,並記錄所述重複次數;若所述伺服器檢測得到所述重複次數達到預設的數量閾值,則所述伺服器將所述目標語音字節作為所述用戶的習慣用語,並保存所述習慣用語。
[0111]具體的,若解析到各目標語音字節中存在相同的目標語音字節,則計算該語音字節的出現次數,即重複次數,並在該重複次數超過預設的數量閾值,比如說5次時,將相應的目標語音字節作為該用戶的習慣用語進行存儲,以供用戶進行解析結果查詢或直接將該包含用戶習慣用語的解析結果推送給用戶。
[0112]實施本發明實施例伺服器可在接收到終端發送的語音數據時,通過對該語音數據中篩選出的目標語音字節進行分析,從而得到當前用戶的習慣用語,可有針對性地獲取相關用戶的習慣用語,靈活性較強。
[0113]請參見圖6,是本發明實施例的一種習慣用語獲取裝置的結構示意圖,所述裝置可具體設置於手機、平板電腦、可穿戴設備等終端設備中,或者設置於伺服器中,本發明實施例不做限定。具體的,所述裝置包括第一獲取單元11、篩選單元12以及第二獲取單元13。其中,
[0114]第一獲取單元11,用於若檢測到用戶發出的語音信號,則獲取所述語音信號對應的語音數據。
[0115]具體實施例中,第一獲取單元11可通過檢測當前是否存在用戶發出的語音信號,並在檢測到語音信號時,觸發獲取該語音信號對應的語音數據,比如通過錄音獲取得到該語音數據。
[0116]篩選單元12,用於根據預設的語音字節閾值,從所述第一獲取單元11獲取的語音數據中篩選出所述語音字節閾值對應數目的目標語音字節。
[0117]具體實施例中,可預先設置一個語音字節閾值,篩選單元12可根據該閾值從獲取的語音數據中提取出目標語音字節。一般來說,用戶每說出的一個字即對應一個語音字節,比如用戶說出「你好嗎」,則對應三個語音字節。
[0118]可選地,該第一獲取單元11獲取的語音數據可以為一句話,篩選單元12可根據該預設閾值從該句話的特定位置如開頭和/或結尾處提取該閾值對應數目的語音字節作為目標語音字節。也就是說,可在每獲取得到一句話,比如每錄製得到一句話時,即可通過篩選單元12進行目標語音字節的篩選操作,從而篩選得到一定數量的目標語音字節。
[0119]進一步可選地,該第一獲取單元11獲取的語音數據還可為一段話(即由多句話組成),篩選單元12可根據預設的停頓時間間隔對該錄製的語音數據進行分段處理,獲得多個語音片段(即一個語音片段可對應為一句話)。相應地,若該語音字節閾值設置為5,則篩選單元12可從各語音片段的特定位置提取出5個語音字節作為目標語音字節,比如提取該語音片段的前5個字節和/或後5個字節作為目標語音字節,從而得到多個目標語音字節。
[0120]第二獲取單元13,用於對所述篩選單元12篩選出的目標語音字節進行解析,並獲取包含所述用戶的習慣用語的解析結果。
[0121]具體的,若第二獲取單元13解析到各目標語音字節中存在相同,即某些目標語音字節重複出現,則可計算該語音字節的出現次數,即重複次數,並在該重複次數超過預設的數量閾值,比如說5次時,將相應的目標語音字節作為該用戶的習慣用語進行存儲。
[0122]進一步的,該第二獲取單元13還可將解析得到的用戶習慣用語及該習慣用語的重複次數推送給當前終端。
[0123]實施本發明實施例可在檢測到用戶發出的語音信號時,對相應的語音數據進行錄音,通過對從錄製的語音數據篩選出的目標語音字節進行分析,從而得到當前用戶的習慣用語,可有針對性地獲取相關用戶的習慣用語,靈活性較強。
[0124]請參見圖7,是本發明實施例的另一種習慣用語獲取裝置的結構示意圖,所述裝置包括上述習慣用語獲取裝置的第一獲取單元11、篩選單元12以及第二獲取單元13,進一步的,在本發明實施例中,所述第一獲取單元11可包括:
[0125]信息獲取單元111,用於若檢測到用戶發出的語音信號,則獲取所述語音信號對應的聲音屬性;
[0126]判斷單元112,用於判斷所述信息獲取單元111獲取的所述語音信號對應的聲音屬性是否與預置的語音樣本對應的聲音屬性相匹配。
[0127]其中,所述聲音屬性包括語速、語調、音色及頻率中的任一項或多項。
[0128]具體實施例中,可預先設置一個語音樣本,該語音樣本為合法用戶的聲音片段,具體可由當前合法用戶錄製得到。
[0129]數據獲取單元113,用於在所述判斷單元112判斷結果為匹配時,獲取所述語音信號對應的語音數據。
[0130]具體的,當信息獲取單元111檢測到用戶發出的語音信號即檢測到有人說話時,可獲取該語音信號對應的聲音屬性,並通過判斷單元112將該語音信號的聲音屬性與該語音樣本的聲音屬性進行匹配對比,比如判斷兩者對應的音色及頻率是否相匹配,從而確定當前用戶身份的合法性,並在判斷結果為匹配,即當前用戶身份合法時,通過數據獲取單元113獲取該語音信號對應的語音數據。
[0131]進一步的,在本發明實施例中,所述篩選單元12可包括:
[0132]數據分段單元121,用於根據預設的停頓時間間隔對所述語音數據進行分段,獲得語音片段。
[0133]其中,所述語音數據包括至少一個語音片段。
[0134]當判斷單元112判斷結果為匹配,即當前發出語音信號的用戶為合法用戶時,則可通過數據獲取單元113獲取相應的語音數據,比如通過數據獲取單元113對該語音數據進行錄音。具體的,該語音數據可為一整段語音,即包含了多個語音片段,則數據分段單元121可通過預設的分段方式對該語音數據進行分段處理,比如根據該語音數據中各語音字節之間的停頓時間間隔如200ms進行分段,得到語音片段(該一個語音片段可對應為一句話)。進一步的,若通過第一獲取單元11錄製的語音數據僅為一句話,則數據分段單元121可將該句話作為一個語音片段,即第一獲取單元11每錄製一句話,則數據分段單元121可將該句話作為一個語音片段,從而得到預設數量閾值的語音片段。
[0135]數據提取單元122,用於根據預設的語音字節閾值,分別從所述數據分段單元121劃分的語音片段的開頭或結尾處提取出所述語音字節閾值對應數目的語音字節作為目標語音字節。
[0136]具體實施例中,數據提取單元122可根據預設的語音字節閾值從劃分的各語音片段的特定位置如開頭和/或結尾處提取出目標語音字節。舉例來說,若該語音字節閾值設置為5,則數據提取單元122可同時提取該語音片段的前5個字節和後5個字節作為目標語音字節,從而得到多個目標語音字節。
[0137]可選地,所述數據提取單元122可具體用於:
[0138]從所述語音片段中篩選出語音字節數目大於或等於預設的語音字節閾值的目標語音片段;若篩選出的所述目標語音片段的數量不小於預設的第一數量閾值,則分別從所述目標語音片段的開頭或結尾處提取出所述語音字節閾值對應數目的語音字節作為目標語音字節。
[0139]舉例來說,若該語音字節閾值設置為5,語音片段對應的數量閾值設置為6,則數據提取單元122可從該語音片段中篩選出語音字節大於或等於5的語音片段,並可在篩選達到6個語音片段時,通過語音獲取子單元1222提取該6個語音片段的前5個語音字節和/或後5個語音字節作為目標語音字節。
[0140]進一步的,在本發明實施例中,所述裝置還可包括:
[0141]控制單元14,用於控制將所述語音字節閾值依次遞減,並通知數據提取單元122分別從所述目標語音片段的開頭或結尾處提取出所述語音字節閾值對應數目的語音字節作為目標語音字節,直至所述語音字節閾值為零。
[0142]進一步的,控制單元14可設置將所述語音字節閾值依次遞減,比如從5依次遞減到4、3、2、1,並通知數據提取單元122從各語音片段的開頭和結尾處提取出相應語音字節閾值對應數目的目標語音字節,直至該語音字節閾值變為0,即通知數據提取單元122分別從各語音片段的開頭和結尾提取出5個語音字節、4個語音字節、3個語音字節、2個語音字節以及I個語音字節作為目標語音字節,從而獲取得到不同語音字節數目的目標語音字節。
[0143]進一步的,在本發明實施例中,所述第二獲取單元13可包括:
[0144]計算單元131,用於計算所述目標語音字節的重複次數,並記錄所述重複次數;
[0145]信息存儲單元132,用於若檢測得到所述重複次數達到預設的第二數量閾值,則將所述目標語音字節作為所述用戶的習慣用語,並保存所述習慣用語。
[0146]具體的,若解析到各目標語音字節中存在相同的目標語音字節,則可通過計算單元131計算該語音數據的出現次數,即重複次數,並在該重複次數超過預設的數量閾值,比如說5次時,通過信息存儲單元132將相應的目標語音字節作為該用戶的習慣用語進行存儲,以供用戶進行解析結果查詢或直接將該包含用戶習慣用語的解析結果推送給用戶。
[0147]實施本發明實施例可在檢測到當前發出語音信號的用戶身份合法時觸發獲取相應的語音數據,通過對該語音數據進行分段處理得到語音片段並從各語音片段的開頭和結尾處篩選出較有代表性的言辭,從而分析得到當前用戶的習慣用語,並有針對性地將該習慣用語推送給相關用戶。
[0148]請參見圖8,是本發明實施例的又一種習慣用語獲取裝置的結構示意圖,所述裝置可具體設置於伺服器中,具體的,所述裝置包括篩選單元21以及獲取單元22。其中,
[0149]所述篩選單元21,用於根據預設的語音字節閾值,從終端發送的語音數據中篩選出所述語音字節閾值對應數目的目標語音字節。
[0150]其中,所述語音數據為所述終端在檢測到用戶發出的語音信號時所獲取的與所述語音信號對應的語音數據。
[0151]具體實施例中,可預先設置語音字節閾值,篩選單元12可根據該閾值從獲取的語音數據中提取出目標語音字節。
[0152]所述獲取單元22,用於對所述篩選單元21篩選出的目標語音字節進行解析,並獲取包含所述用戶的習慣用語的解析結果。
[0153]進一步的,在本發明實施例中,所述篩選單元21可包括:
[0154]數據分段單元211,用於根據預設的停頓時間間隔對所述語音數據進行分段,獲得語音片段,所述語音數據包括至少一個語音片段;
[0155]數據提取單元212,用於根據預設的語音字節閾值,分別從所述數據分段單元211劃分的語音片段的開頭或結尾處提取出所述語音字節閾值對應數目的語音字節作為目標語音字節。
[0156]具體實施例中,數據提取單元212可根據預設的語音字節閾值從數據分段單元211劃分的各語音片段的特定位置如開頭和/或結尾處提取出目標語音字節。舉例來說,若該語音字節閾值設置為5,則數據提取單元212可同時提取該語音片段的前5個字節和後5個字節作為目標語音字節,從而得到多個目標語音字節。
[0157]可選地,所述數據提取單元212可具體用於:
[0158]從所述語音片段中篩選出語音字節數目大於或等於預設的語音字節閾值的目標語音片段;若篩選出的所述目標語音片段的數量不小於預設的第一數量閾值,則分別從所述目標語音片段的開頭或結尾處提取出所述語音字節閾值對應數目的語音字節作為目標語音字節。
[0159]進一步的,在本發明實施例中,所述獲取單元22可包括:
[0160]計算單元221,用於計算所述目標語音字節的重複次數,並記錄所述重複次數;
[0161]信息存儲單元222,用於若檢測得到所述重複次數達到預設的數量閾值,則將所述目標語音字節作為所述用戶的習慣用語,並保存所述習慣用語。
[0162]具體的,若解析到各目標語音字節中存在相同的目標語音字節,則可通過計算單元221計算該語音數據的出現次數,即重複次數,並在該重複次數超過預設的數量閾值,比如說5次時,通過信息存儲單元222將相應的目標語音字節作為該用戶的習慣用語進行存儲,以供用戶進行解析結果查詢或直接將該包含用戶習慣用語的解析結果推送給用戶。
[0163]實施本發明實施例伺服器可在接收到終端發送的語音數據時,通過對該語音數據中篩選出的目標語音字節進行分析,從而得到當前用戶的習慣用語,可有針對性地獲取相關用戶的習慣用語,靈活性較強。
[0164]進一步的,請參見圖9,是本發明實施例的一種終端的結構示意圖。如圖9所示,該終端包括:至少一個處理器100,例如CPU,至少一個用戶接口 300,存儲器400,至少一個通信總線200。其中,通信總線200用於實現這些組件之間的連接通信。其中,用戶接口 300可以包括顯示屏(Display)、鍵盤(Keyboard),可選用戶接口 300還可以包括標準的有線接口、無線接口。存儲器400可以是高速RAM存儲器,也可以是非不穩定的存儲器(non-volatile memory),例如至少一個磁碟存儲器。存儲器400可選的還可以是至少一個位於遠離前述處理器100的存儲裝置。其中處理器100可以結合圖6和圖7所描述的習慣用語獲取裝置,存儲器400中存儲一組程序代碼,且處理器100調用存儲器400中存儲的程序代碼,用於執行以下操作:
[0165]若檢測到用戶發出的語音信號,則獲取所述語音信號對應的語音數據;
[0166]根據預設的語音字節閾值,從所述語音數據中篩選出所述語音字節閾值對應數目的目標語音字節;
[0167]對所述目標語音字節進行解析,並獲取包含所述用戶的習慣用語的解析結果。
[0168]在可選實施例中,處理器100調用存儲器400中存儲的程序代碼在檢測到用戶發出的語音信號時,獲取所述語音信號對應的語音數據,具體可以為:
[0169]若檢測到用戶發出的語音信號,則獲取所述語音信號對應的聲音屬性;
[0170]判斷所述語音信號對應的聲音屬性是否與預置的語音樣本對應的聲音屬性相匹配,所述語音樣本由合法用戶錄製得到,所述聲音屬性包括語速、語調、音色及頻率中的任一項或多項;
[0171]若匹配,則獲取所述語音信號對應的語音數據。
[0172]進一步可選的,處理器100調用存儲器400中存儲的程序代碼根據預設的語音字節閾值,從所述語音數據中篩選出所述語音字節閾值對應數目的目標語音字節,具體可以為:
[0173]根據預設的停頓時間間隔對所述語音數據進行分段,獲得語音片段,所述語音數據包括至少一個語音片段;
[0174]根據預設的語音字節閾值,分別從所述語音片段的開頭或結尾處提取出所述語音字節閾值對應數目的語音字節作為目標語音字節。
[0175]在可選實施例中,處理器100調用存儲器400中存儲的程序代碼根據預設的語音字節閾值,分別從所述語音片段的開頭或結尾處提取出所述語音字節閾值對應數目的語音字節作為目標語音字節,具體可以為:
[0176]從所述語音片段中篩選出語音字節數目大於或等於預設的語音字節閾值的目標語音片段;
[0177]若篩選出的所述目標語音片段的數量不小於預設的第一數量閾值,則分別從所述目標語音片段的開頭或結尾處提取出所述語音字節閾值對應數目的語音字節作為目標語音字節。
[0178]在可選實施例中,處理器100還可以執行以下步驟:
[0179]將所述語音字節閾值依次遞減;
[0180]重複執行分別從所述目標語音片段的開頭或結尾處提取出所述語音字節閾值對應數目的語音字節作為目標語音字節步驟,直至所述語音字節閾值為零。
[0181]在可選實施例中,處理器100調用存儲器400中存儲的程序代碼對所述目標語音字節進行解析,並獲取包含所述用戶的習慣用語的解析結果,具體可以為:
[0182]計算所述目標語音字節的重複次數,並記錄所述重複次數;
[0183]若檢測得到所述重複次數達到預設的第二數量閾值,則將所述目標語音字節作為所述用戶的習慣用語,並保存所述習慣用語。
[0184]具體的,本實施例中介紹的終端可以用以實施本發明結合圖1至圖4介紹的習慣用語獲取的方法實施例中的部分或全部流程。
[0185]進一步的,請參見圖10,是本發明實施例的一種伺服器的結構示意圖。如圖10所示,該伺服器包括:至少一個處理器500,例如CPU,至少一個用戶接口 700,存儲器800,至少一個通信總線600。其中,通信總線600用於實現這些組件之間的連接通信。其中,用戶接口 700可以包括標準的有線接口、無線接口。存儲器800可以是高速RAM存儲器,也可以是非不穩定的存儲器(non-volatile memory),例如至少一個磁碟存儲器。存儲器800可選的還可以是至少一個位於遠離前述處理器500的存儲裝置。其中處理器500可以結合圖6和圖7所描述的習慣用語獲取裝置,存儲器800中存儲一組程序代碼,且處理器500調用存儲器800中存儲的程序代碼,用於執行以下操作:
[0186]若檢測到用戶發出的語音信號,則獲取所述語音信號對應的語音數據;
[0187]根據預設的語音字節閾值,從所述語音數據中篩選出所述語音字節閾值對應數目的目標語音字節;
[0188]對所述目標語音字節進行解析,並獲取包含所述用戶的習慣用語的解析結果。
[0189]在可選實施例中,處理器500調用存儲器800中存儲的程序代碼在檢測到用戶發出的語音信號時,獲取所述語音信號對應的語音數據,具體可以為:
[0190]若檢測到用戶發出的語音信號,則獲取所述語音信號對應的聲音屬性;
[0191]判斷所述語音信號對應的聲音屬性是否與預置的語音樣本對應的聲音屬性相匹配,所述語音樣本由合法用戶錄製得到,所述聲音屬性包括語速、語調、音色及頻率中的任一項或多項;
[0192]若匹配,則獲取所述語音信號對應的語音數據。
[0193]進一步可選的,處理器500調用存儲器800中存儲的程序代碼根據預設的語音字節閾值,從所述語音數據中篩選出所述語音字節閾值對應數目的目標語音字節,具體可以為:
[0194]根據預設的停頓時間間隔對所述語音數據進行分段,獲得語音片段,所述語音數據包括至少一個語音片段;
[0195]根據預設的語音字節閾值,分別從所述語音片段的開頭或結尾處提取出所述語音字節閾值對應數目的語音字節作為目標語音字節。
[0196]在可選實施例中,處理器500調用存儲器800中存儲的程序代碼根據預設的語音字節閾值,分別從所述語音片段的開頭或結尾處提取出所述語音字節閾值對應數目的語音字節作為目標語音字節,具體可以為:
[0197]從所述語音片段中篩選出語音字節數目大於或等於預設的語音字節閾值的目標語音片段;
[0198]若篩選出的所述目標語音片段的數量不小於預設的第一數量閾值,則分別從所述目標語音片段的開頭或結尾處提取出所述語音字節閾值對應數目的語音字節作為目標語音字節。
[0199]在可選實施例中,處理器500還可以執行以下步驟:
[0200]將所述語音字節閾值依次遞減;
[0201]重複執行分別從所述目標語音片段的開頭或結尾處提取出所述語音字節閾值對應數目的語音字節作為目標語音字節步驟,直至所述語音字節閾值為零。
[0202]在可選實施例中,處理器500調用存儲器800中存儲的程序代碼對所述目標語音字節進行解析,並獲取包含所述用戶的習慣用語的解析結果,具體可以為:
[0203]計算所述目標語音字節的重複次數,並記錄所述重複次數;
[0204]若檢測得到所述重複次數達到預設的第二數量閾值,則將所述目標語音字節作為所述用戶的習慣用語,並保存所述習慣用語。
[0205]具體的,本實施例中介紹的伺服器可以用以實施本發明結合圖1至圖4介紹的習慣用語獲取的方法實施例中的部分或全部流程。
[0206]進一步的,請參見圖11,是本發明實施例的一種習慣用語獲取系統的結構示意圖,所述系統包括:終端I和伺服器2 ;其中,
[0207]所述終端1,用於若檢測到用戶發出的語音信號,則獲取所述語音信號對應的語音數據,並將所述語音數據發送至所述伺服器2 ;
[0208]所述伺服器2,用於接收所述終端I發送的語音數據,並根據預設的語音字節閾值,從所述語音數據中篩選出所述語音字節閾值對應數目的目標語音字節;對所述目標語音字節進行解析,並獲取包含所述用戶的習慣用語的解析結果。
[0209]在可選實施例中,所述終端1,還可用於若檢測到用戶發出的語音信號,則獲取所述語音信號對應的聲音屬性;判斷所述語音信號對應的聲音屬性是否與預置的語音樣本對應的聲音屬性相匹配,所述語音樣本為合法用戶的聲音片段,所述聲音屬性包括語速、語調、音色及頻率中的任一項或多項;若匹配,則獲取所述語音信號對應的語音數據。
[0210]在可選實施例中,所述伺服器2,還可用於根據預設的停頓時間間隔對所述語音數據進行分段,獲得語音片段,所述語音數據包括至少一個語音片段;根據預設的語音字節閾值,分別從所述語音片段的開頭或結尾處提取出所述語音字節閾值對應數目的語音字節作為目標語音字節。
[0211]具體的,伺服器2可從所述語音片段中篩選出語音字節數目大於或等於預設的語音字節閾值的目標語音片段,並在篩選出的所述目標語音片段的數量不小於預設的第一數量閾值,比如6個時,分別從所述目標語音片段的開頭或結尾處提取出所述語音字節閾值對應數目的語音字節作為目標語音字節。
[0212]進一步的,伺服器2可控制將所述語音字節閾值依次遞減,並重複執行分別從所述目標語音片段的開頭或結尾處提取出所述語音字節閾值對應數目的語音字節作為目標語音字節的步驟,直至所述語音字節閾值為零,從而獲取得到多個不同語音字節數目的目標語音字節。
[0213]在可選實施例中,所述伺服器2,還可用於計算所述目標語音字節的重複次數,並記錄所述重複次數;若檢測得到所述重複次數達到預設的第二數量閾值,則所述伺服器2將所述目標語音字節作為所述用戶的習慣用語,並保存所述習慣用語。
[0214]實施本發明實施例可在檢測到用戶發出的語音信號時,獲取相應的語音數據,通過對該語音數據中篩選出的目標語音字節進行分析,從而得到當前用戶的習慣用語,可有針對性地獲取相關用戶的習慣用語,靈活性較強。
[0215]本領域普通技術人員可以理解實現上述實施例方法中的全部或部分流程,是可以通過電腦程式來指令相關的硬體來完成,所述的程序可存儲於一計算機可讀取存儲介質中,該程序在執行時,可包括如上述各方法的實施例的流程。其中,所述的存儲介質可為磁碟、光碟、只讀存儲記憶體(Read-Only Memory, ROM)或隨機存儲記憶體(Random AccessMemory, RAM)等。
[0216]需要說明的是,在上述實施例中,對各個實施例的描述都各有側重,某個實施例中沒有詳細描述的部分,可以參見其他實施例的相關描述。其次,本領域技術人員也應該知悉,說明書中所描述的實施例均屬於優選實施例,所涉及的動作和單元並不一定是本發明所必須的。
[0217]本發明實施例方法中的步驟可以根據實際需要進行順序調整、合併和刪減。
[0218]本發明實施例裝置中的模塊或單元可以根據實際需要進行合併、劃分和刪減。
[0219]本發明實施例中所述模塊或單元,可以通過通用集成電路,例如CPU(CentralProcessing Unit,中央處理器),或通過 ASIC (Applicat1n Specific IntegratedCircuit,專用集成電路)來實現。
[0220]以上對本發明實施例所提供的文本信息顯示方法及終端進行了詳細介紹,本文中應用了具體個例對本發明的原理及實施方式進行了闡述,以上實施例的說明只是用於幫助理解本發明的方法及其核心思想;同時,對於本領域的一般技術人員,依據本發明的思想,在【具體實施方式】及應用範圍上均會有改變之處,綜上所述,本說明書內容不應理解為對本發明的限制。
【權利要求】
1.一種習慣用語獲取方法,其特徵在於,包括: 若終端檢測到用戶發出的語音信號,則所述終端獲取所述語音信號對應的語音數據,並將所述語音數據發送至伺服器; 所述伺服器接收所述終端發送的語音數據,並根據預設的語音字節閾值,從所述語音數據中篩選出所述語音字節閾值對應數目的目標語音字節; 所述伺服器對目標語音字節進行解析,並獲取包含所述用戶的習慣用語的解析結果。
2.如權利要求1所述的方法,其特徵在於,所述若終端檢測到用戶發出的語音信號,則所述終端獲取所述語音信號對應的語音數據,包括: 若終端檢測到用戶發出的語音信號,則所述終端獲取所述語音信號對應的聲音屬性;所述終端判斷所述語音信號對應的聲音屬性是否與預置的語音樣本對應的聲音屬性相匹配,所述語音樣本為合法用戶的聲音片段,所述聲音屬性包括語速、語調、音色及頻率中的任一項或多項; 若所述終端判斷結果為匹配,則所述終端獲取所述語音信號對應的語音數據。
3.如權利要求1所述的方法,其特徵在於,所述伺服器根據預設的語音字節閾值,從所述語音數據中篩選出所述語音字節閾值對應數目的目標語音字節,包括: 所述伺服器根據預設的停頓時間間隔對所述語音數據進行分段,獲得語音片段,所述語音數據包括至少一個語音片段; 所述伺服器根據預設的語音字節閾值,分別從所述語音片段的開頭或結尾處提取出所述語音字節閾值對應數目的語音字節作為目標語音字節。
4.如權利要求1所述的方法,其特徵在於,所述伺服器對目標語音字節進行解析,並獲取包含所述用戶的習慣用語的解析結果,包括: 所述伺服器計算所述目標語音字節的重複次數,並記錄所述重複次數; 若所述伺服器檢測得到所述重複次數達到預設的第二數量閾值,則所述伺服器將所述目標語音字節作為所述用戶的習慣用語,並保存所述習慣用語。
5.一種習慣用語獲取方法,其特徵在於,包括: 伺服器接收終端發送的語音數據,並根據預設的語音字節閾值,從所述語音數據中篩選出所述語音字節閾值對應數目的目標語音字節,所述語音數據為所述終端在檢測到用戶發出的語音信號時所獲取的與所述語音信號對應的語音數據; 所述伺服器對目標語音字節進行解析,並獲取包含所述用戶的習慣用語的解析結果。
6.如權利要求5所述的方法,其特徵在於,所述伺服器根據預設的語音字節閾值,從所述語音數據中篩選出所述語音字節閾值對應數目的目標語音字節,包括: 所述伺服器根據預設的停頓時間間隔對所述語音數據進行分段,獲得語音片段,所述語音數據包括至少一個語音片段; 所述伺服器根據預設的語音字節閾值,分別從所述語音片段的開頭或結尾處提取出所述語音字節閾值對應數目的語音字節作為目標語音字節。
7.如權利要求5所述的方法,其特徵在於,所述伺服器對目標語音字節進行解析,並獲取包含所述用戶的習慣用語的解析結果,包括: 所述伺服器計算所述目標語音字節的重複次數,並記錄所述重複次數; 若所述伺服器檢測得到所述重複次數達到預設的數量閾值,則所述伺服器將所述目標語音字節作為所述用戶的習慣用語,並保存所述習慣用語。
8.一種習慣用語獲取裝置,其特徵在於,包括: 篩選單元,用於根據預設的語音字節閾值,從終端發送的語音數據中篩選出所述語音字節閾值對應數目的目標語音字節,所述語音數據為所述終端在檢測到用戶發出的語音信號時所獲取的與所述語音信號對應的語音數據; 獲取單元,用於對所述篩選單元篩選出的目標語音字節進行解析,並獲取包含所述用戶的習慣用語的解析結果。
9.如權利要求8所述的裝置,其特徵在於,所述篩選單元包括: 數據分段單元,用於根據預設的停頓時間間隔對所述語音數據進行分段,獲得語音片段,所述語音數據包括至少一個語音片段; 數據提取單元,用於根據預設的語音字節閾值,分別從所述數據分段單元劃分的語音片段的開頭或結尾處提取出所述語音字節閾值對應數目的語音字節作為目標語音字節。
10.如權利要求8所述的裝置,其特徵在於,所述獲取單元包括: 計算單元,用於計算所述目標語音字節的重複次數,並記錄所述重複次數; 信息存儲單元,用於若檢測得到所述重複次數達到預設的數量閾值,則將所述目標語音字節作為所述用戶的習慣用語,並保存所述習慣用語。
11.一種習慣用語獲取系統,其特徵在於,包括:終端和伺服器;其中, 所述終端,用於若檢測到用戶發出的語音信號,則獲取所述語音信號對應的語音數據,並將所述語音數據發送至所述伺服器; 所述伺服器,用於接收所述終端發送的語音數據,並根據預設的語音字節閾值,從所述語音數據中篩選出所述語音字節閾值對應數目的目標語音字節;對所述目標語音字節進行解析,並獲取包含所述用戶的習慣用語的解析結果。
【文檔編號】G10L15/00GK104134439SQ201410374995
【公開日】2014年11月5日 申請日期:2014年7月31日 優先權日:2014年7月31日
【發明者】盧存洋 申請人:深圳市金立通信設備有限公司