一種發送消息的播放方法、系統及相關設備的製作方法

2023-05-10 21:02:21 3

一種發送消息的播放方法、系統及相關設備的製作方法
【專利摘要】本發明實施例公開了消息播放方法、系統及設備，應用於通信【技術領域】。本發明實施例中，接收終端在接收到包括用戶標識和文本信息的消息，獲取用戶標識對應的語音標識和圖像標識，並獲取根據語音標識指示的語音特徵參數、圖像標識指示的圖像特徵參數及文本信息生成或獲取語音動畫流並播放該語音動畫流。使得可以將消息中的文本信息根據用戶標識播放成語音動畫流，既可以生動地展示消息中的文本信息，又可以根據用戶標識對應的語音標識和圖像標識對消息進行個性化展示。
【專利說明】一種發送消息的播放方法、系統及相關設備
【技術領域】
[0001]本發明涉及通信【技術領域】，特別涉及發送消息的播放方法、系統及相關設備。
【背景技術】
[0002]在現有的通信過程中，接收消息的一端對發送消息的展示一般採用直接展示，t匕如將發送消息中的文本信息解析後進行顯示，或將發送消息中的媒體流解析後進行播放等，但是這種展示方法比較單一，無法滿足用戶對發送消息展示的需求。

【發明內容】

[0003]本發明實施例提供了發送消息的播放方法、系統及相關設備，對發送消息進行個性化的展示，用於解決現有技術存在著的展示方式單一的問題。
[0004]本發明實施例第一方面提供一種消息播放方法，應用於終端設備，所述方法包括:
[0005]接收消息，所述消息中包括用戶標識和文本信息；
[0006]獲取與所述用戶標識對應的語音標識和圖像標識，所述語音標識用於指示語音特徵參數，所述圖像標識用於指示圖像特徵參數；
[0007]根據所述語音標識指示的語音特徵參數,所述圖像標識指示的圖像特徵參數以及所述文本信息生成或獲取語音動畫流並播放所述語音動畫流。
[0008]本發明實施例第一方面的第一種可能的實現方式中，所述接收消息之前還包括:
[0009]提供設置界面，所述設置界面用於接收所述用戶標識與所述語音標識以及所述圖像標識之間的對應關係；
[0010]從所述設置界面上接收所述用戶標識與所述語音標識以及所述圖像標識之間的對應關係並儲存所述對應關係；
[0011]所述獲取與所述用戶標識對應的語音標識和圖像標識包括:
[0012]根據存儲的對應關係獲取與所述用戶標識對應的所述語音標識和所述圖像標識。
[0013]結合本發明實施例第一方面，或第一方面的第一種可能實現方式，在本發明實施例第一方面的第二種可能的實現方式中，所述根據所述語音標識指示的語音特徵參數，所述圖像標識指示的圖像特徵參數以及所述文本信息生成語音動畫流，具體包括:
[0014]所述終端設備獲取所述語音標識指示的語音特徵參數，及獲取所述圖像標識指示的圖像特徵參數；
[0015]所述終端設備根據所述語音標識指示的語音特徵參數將所述文本信息轉換成音素時間序列和語音流；
[0016]所述終端設備根據所述音素時間序列及所述圖像標識指示的圖像特徵參數生成動畫流；
[0017]所述終端設備將所述語音流及所述動畫流同步合成語音動畫流。
[0018]結合本發明實施例第一方面的第二種可能實現方式，在本發明實施例第一方面的第三種可能的實現方式中，所述接收消息之前還包括:
[0019]獲取圖像樣本和語音樣本；
[0020]提取獲取圖像樣本的圖像特徵參數，按第一對應關係儲存所述圖像特徵參數與圖像標識；
[0021]提取獲取語音樣本的語音特徵參數，按第二對應關係儲存所述語音特徵參數與語音標識；
[0022]所述獲取所述語音標識指示的語音特徵參數,及圖像標識指示的圖像特徵參數包括:根據所述第二對關係獲取所述語音標識指示的語音特徵參數，根據所述第一對應關係獲取所述圖像標識指示的圖像特徵參數。
[0023]結合本發明實施例第一方面，或第一方面第一種可能實現方式，在本發明實施例第一方面的第四種可能的實現方式中，所述根據所述語音標識指示的語音特徵參數，所述圖像標識指示的圖像特徵參數以及所述文本信息獲取語音動畫流包括:
[0024]將所述語音標識和圖像標識發送給伺服器，以指示所述伺服器根據所述語音標識指示的語音特徵參數、所述圖像標識指示的圖像特徵參數及文本信息生成所述文本信息的語音動畫流；
[0025]獲取所述伺服器發送的語音動畫流。
[0026]結合本發明實施例第一方面的第四種可能實現方式，在本發明實施例第一方面的第五種可能的實現方式中，所述接收消息之前還包括:
[0027]獲取圖像樣本和語音樣本；
[0028]將所述圖像樣本發送給伺服器，以指示所述伺服器提取所述圖像樣本的圖像特徵參數，並按第一對應關係儲存所述圖像特徵參數與圖像標識；
[0029]將獲取的語音樣本發送給伺服器，以指示所述伺服器提取所述語音樣本的語音特徵參數，並按第二對應關係儲存所述語音特徵參數與所述語音標識。
[0030]本發明實施例第二方面提供一種消息播放方法，應用於網絡伺服器，所述方法包括:
[0031]接收發送終端發送的消息，所述消息中包括文本信息和所述發送終端對應用戶的用戶標識；
[0032]根據預先存儲的用戶標識與語音標識和圖像標識的對應關係，獲取與所述發送終端發送的用戶標識對應的語音標識以及圖像標識，所述語音標識用於指示語音特徵參數，所述圖像標識用於指示圖像特徵參數；
[0033]根據所述發送終端發送的用戶標識對應的語音標識指示的語音特徵參數、以及圖像標識指示的圖像特徵參數，以及所述文本信息生成語音動畫流；
[0034]將生成的所述語音動畫流發送給接收終端，使得所述接收終端收到後播放所述語音動畫流。
[0035]在本發明實施例第二發明的第一種實現方式中，所述根據所述發送終端發送的用戶標識對應的語音標識指示的語音特徵參數、以及圖像標識指示的圖像特徵參數，以及所述文本信息生成語音動畫流，具體包括:
[0036]獲取所述語音標識指示的語音特徵參數,及獲取所述圖像標識指示的圖像特徵參數；[0037]根據所述語音標識指示的語音特徵參數將所述文本信息轉換成音素時間序列和語音流；
[0038]根據所述音素時間序列及所述圖像標識指示的圖像特徵參數生成動畫流；
[0039]將所述語音流及所述動畫流同步合成語音動畫流。
[0040]結合本發明實施例第二方面的第一種可能實現方式，在本發明實施例第二方面的第二種可能的實現方式中，所述接收終端設備發送的消息之前還包括:
[0041]接收終端設備發送的圖像樣本和語音樣本；
[0042]提取所述圖像樣本的圖像特徵參數，按第一對應關係儲存所述圖像特徵參數與圖像標識；
[0043]提取所述語音樣本的語音特徵參數，按第二對應關係儲存所述語音特徵參數與圖像標識；
[0044]所述獲取所述語音標識指示的語音特徵參數具體包括:根據所述第二對關係獲取所述語音標識指示的語音特徵參數；所述獲取所述圖像標識指示的圖像特徵參數具體包括:根據所述第一對應關係獲取所述圖像標識指示的圖像特徵參數。
[0045]本發明實施例第三方面提供一種終端設備，包括:
[0046]消息接收單元，用於接收消息，所述消息中包括用戶標識和文本信息；
[0047]標識獲取單元，用於獲取與所述消息接收單元接收的發送消息中用戶標識對應的語音標識和圖像標識，所述語音標識用於指示在生成語音動畫流時，用於生成所述語音動畫流中的語音所需的語音特徵參數，所述圖像標識用於指示生成所述語音動畫流時，用於生成所述語音動畫流中的圖像所需的圖像特徵參數；
[0048]媒體流獲取單元，用於根據所述語音標識指示的語音特徵參數、所述圖像標識指示的圖像特徵參數及文本信息生成或獲取語音動畫流；
[0049]播放單元，用於播放所述媒體流獲取單元生成或獲取的語音動畫流。
[0050]結合本發明實施例第三方面第一種可能實現方式中，所述終端設備還包括:
[0051]界面提供單元，用於提供設置界面，所述設置界面用於接收所述用戶標識與所述語音標識以及所述圖像標識之間的對應關係；
[0052]第一對應關係儲存單元，用於從所述設置界面上接收所述用戶標識與所述語音標識以及所述圖像標識之間的對應關係並儲存所述對應關係；
[0053]所述標識獲取單元，具體用於根據所述第一對應關係儲存單元儲存的對應關係獲取所述語音標識和圖像標識。
[0054]結合本發明實施例第三方面，或第三面的第一種可能實現方式，在本發明實施例第三方面的第二種實現方式中，所述媒體流獲取單元具體包括:
[0055]特徵獲取單元，獲取所述標識獲取單元獲取的語音標識指示的語音特徵參數，及獲取所述標識獲取單元獲取的圖像標識指示的圖像特徵參數；
[0056]語音流生成單元，用於根據所述語音標識指示的語音特徵參數將所述文本信息轉換成音素時間序列和語音流；
[0057]動畫流生成單元，用於根據所述語音流生成單元生成的音素時間序列及所述圖像標識指示的圖像特徵參數生成動畫流；
[0058]同步單元,用於將所述語音流及所述動畫流同步合成語音動畫流。[0059]結合本發明實施例第三方面第二種可能實現方式，在本發明實施例第三方面的第三種實現方式中，所述終端設備還包括:
[0060]第二對應關係儲存單元，用於獲取圖像樣本，並提取獲取所述圖像樣本的圖像特徵參數，按第一對應關係儲存所述圖像特徵參數與圖像標識；及用於獲取語音樣本，並提取獲取語音樣本的語音特徵參數，按第二對應關係儲存所述語音特徵參數與語音標識；
[0061]所述特徵獲取單元，具體用於分別根據所述第二對應關係儲存單元儲存的第一對應關係和第二對應關係，獲取所述圖像標識指示的圖像特徵參數和所述語音標識指示的語音特徵參數。
[0062]結合本發明實施例第三方面，或第三面的第一種可能實現方式，在本發明實施例第三方面的第四種實現方式中，所述媒體流獲取單元具體包括:
[0063]標識發送單元，用於將所述語音標識和圖像標識發送給伺服器，以指示所述伺服器根據所述語音標識指示的語音特徵參數、所述圖像標識指示的圖像特徵參數及文本信息生成所述文本信息的語音動畫流；
[0064]發送媒體流獲取單元，用於獲取所述伺服器發送的語音動畫流。
[0065]結合本發明實施例第三方面第四種可能實現方式，在本發明實施例第三方面的第五種實現方式中，所述終端設備還包括:
[0066]樣本發送單元，用於獲取圖像樣本，將獲取的圖像樣本發送給伺服器，以指示所述伺服器提取所述圖像樣本的圖像特徵參數，並按第一對應關係儲存所述圖像特徵參數與圖像標識；及用於獲取語音樣本，並將獲取的語音樣本發送給伺服器，以指示所述伺服器提取所述語音樣本的語音特徵參數，並按第二對應關係儲存所述語音特徵參數與圖像標識。
[0067]本發明實施例第四方面提供一種伺服器，包括:
[0068]發送消息接收單元，用於接收發送終端發送的消息，所述消息中包括文本信息和所述發送終端對應用戶的用戶標識；
[0069]媒體標識獲取單元，用於根據預先存儲的用戶標識與語音標識和圖像標識的對應關係，獲取與所述發送終端發送的用戶標識對應的語音標識以及圖像標識，所述語音標識用於指示語音特徵參數，所述圖像標識用於指示圖像特徵參數；
[0070]媒體流生成單元，用於根據所述發送終端發送的用戶標識對應的語音標識指示語音特徵參數、圖像標識指示的圖像特徵參數，以及所述文本信息生成語音動畫流；
[0071]媒體流發送單元，用於將生成的所述語音動畫流發送給接收終端，使得所述接收終端收到後播放所述語音動畫流。
[0072]在本發明實施例第四方面的第一種可能的實現方式中，所述媒體流生成單元具體包括:
[0073]媒體特徵獲取單元，用於獲取所述語音標識指示的語音特徵參數，及獲取所述圖像標識指示的圖像特徵參數；
[0074]轉換單元,用於根據所述語音標識指示的語音特徵參數將所述文本信息轉換成音素時間序列和語音流；
[0075]生成單元，用於根據所述音素時間序列及所述圖像標識指示的圖像特徵參數生成動畫流；
[0076]合成單元，用於將所述語音流及所述動畫流同步合成語音動畫流。[0077]結合本發明實施例第四方面的第一種可能實現方式，在本發明實施例第四方面的第二種可能的實現方式中，所述伺服器還包括:
[0078]樣本接收單元，用於接收終端設備發送的圖像樣本和語音樣本；
[0079]對應關係儲存單元，用於提取所述圖像樣本的圖像特徵參數，並按第一對應關係儲存所述圖像特徵參數與圖像標識，及提取所述語音樣本的語音特徵參數，並按第二對應關係儲存所述語音特徵參數與圖像標識；
[0080]所述媒體特徵獲取單元，具體用於根據所述第二對關係獲取所述語音標識指示的語音特徵參數；且根據所述第一對應關係獲取所述圖像標識指示的圖像特徵參數。
[0081]本發明實施例第五方面提供一種消息播放系統，包括接收終端和伺服器；
[0082]所述接收終端是如上述本發明實施例第三方面的第四種或第五種實現方式所述的終端設備；
[0083]所述伺服器，用於根據所述語音標識指示的語音特徵參數、所述圖像標識指示的圖像特徵參數及文本信息生成所述文本信息的語音動畫流並發送給所述接收終端。
[0084]本發明實施例第六方面提供一種消息播放系統，包括接收終端和網絡伺服器；
[0085]所述網絡伺服器是如上述權利要求本發明實施例第四方面到第四方面的第二種實現方式的伺服器中任一種方式所述的伺服器；
[0086]所述接收終端，用於接收所述網絡伺服器發送的語音動畫流，並播放所述語音動畫流。
[0087]本發明實施例中，接收終端在接收到包括用戶標識和文本信息的消息，獲取用戶標識對應的語音標識和圖像標識，並根據語音標識指示的語音特徵參數、圖像標識指示的圖像特徵參數及文本信息生成或獲取語音動畫流並播放該語音動畫流。使得可以將消息中的文本信息根據用戶標識播放成語音動畫流，既可以生動地展示消息中的文本信息，又可以根據用戶標識對應的語音標識和圖像標識對消息進行個性化展示。
【專利附圖】

【附圖說明】
[0088]為了更清楚地說明本發明實施例或現有技術中的技術方案，下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹，顯而易見地，下面描述中的附圖僅僅是本發明的一些實施例，對於本領域普通技術人員來講，在不付出創造性勞動性的前提下，還可以根據這些附圖獲得其他的附圖。
[0089]圖1是本發明實施例提供的一種發送消息播放方法的流程圖；
[0090]圖2是本發明實施例中生成語音動畫流的結構示意圖；
[0091]圖3是本發明實施例提供的另一種消息播放方法的流程圖；
[0092]圖4是本發明具體應用實施例中提供的一種發送消息的播放方法結構示意圖；
[0093]圖5是本發明實施例中終端設備提供的設置界面的示意圖；
[0094]圖6是本發明具體應用實施例中提供的另一種發送消息播放方法的結構示意圖；
[0095]圖7是本發明具體應用實施例中提供的另一種發送消息播放方法的結構示意圖；
[0096]圖8是本發明實施例提供的一種終端設備的結構示意圖；
[0097]圖9是本發明實施例提供的另一種終端設備的結構示意圖；
[0098]圖10是本發明實施例提供的另一種終端設備的結構示意圖；[0099]圖11是本發明實施例提供的另一種終端設備的結構示意圖；
[0100]圖12是本發明實施例提供的一種伺服器的結構示意圖；
[0101]圖13是本發明實施例提供的另一種伺服器的結構示意圖；
[0102]圖14是本發明實施例提供的另一種伺服器的結構示意圖。
【具體實施方式】
[0103]下面將結合本發明實施例中的附圖，對本發明實施例中的技術方案進行清楚、完整地描述，顯然，所描述的實施例僅僅是本發明一部分實施例，而不是全部的實施例。基於本發明中的實施例，本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例，都屬於本發明保護的範圍。
[0104]本發明實施例提供一種消息播放方法，主要是對於進行通信的終端設備，當接收終端接收到發送終端發送的發送消息後進行的播放，比如當手機I接收到手機2發送的短消息，對該短消息的播放，本實施例的方法是接收終端即接收消息的終端設備所執行的方法，流程圖如圖1所示，包括:
[0105]步驟101，接收終端接收發送終端發送的消息比如短消息等，在消息中包括發送終端對應用戶的用戶標識和文本信息。
[0106]步驟102，接收終端獲取與用戶標識對應的語音標識和圖像標識，這裡語音標識是用於指示語音特徵參數，而圖像標識用於指示圖像特徵參數。
[0107]可以理解，當接收終端接收到消息後，解析該消息得到能唯一標識一個用戶的用戶標識，比如在發送終端上使用的用戶識別模塊(Subscriber IdentityModel, SIM)的號碼，或用戶註冊帳號等，並可以在接收終端中查找預置的與該用戶標識對應的語音標識和圖像標識，其中在接收終端中可以預先儲存不同用戶標識對應的語音標識和圖像標識，t匕如儲存陌生聯繫人及接收終端中各個聯繫人對應的語音標識和圖像標識等。
[0108]具體地，接收終端可以通過如下的步驟來設置語音標識和圖像標識:
[0109]A:用戶操作該接收終端的按鍵(包括物理按鍵或觸摸按鍵)，使得接收終端提供設置界面，該設置界面用於接收某一用戶標識與語音標識以及圖像標識之間的對應關係，在該設置界面上可以包括該用戶標識，及該用戶標識對應的語音標識和圖像標識的選擇信息，比如選擇接收終端中儲存的哪個圖像標識和語音標識的信息等。
[0110]其中圖像標識為唯一標識資料庫中某一圖像特徵參數的信息，即在資料庫中將圖像標識與圖像特徵參數進行綁定儲存，語音標識為唯一標識資料庫中某一語音特徵參數的信息，即在資料庫中將語音標識與語音特徵參數進行綁定儲存。而圖像特徵是指某一圖像向用戶所表現出的屬性比如顏色、線條和輪廓等屬性，具體可以通過圖像特徵參數來表示比如像素等參數，語音特徵是指某一段語音向用戶所表現出的屬性，比如音色、音調和音量，具體可以通過語音特徵參數來表示，比如基音、梅爾倒譜參數、共振峰參數等參數。
[0111]B:用戶選擇某一圖像標識和語音標識後，當接收終端從設置界面上接收到上述用戶標識對應用戶選擇的語音標識和圖像標識，儲存該用戶標識與選擇的語音標識和圖像標識之間的對應關係。這樣接收終端可以根據步驟B儲存的對應關係中獲取與步驟101中接收的消息中的用戶標識對應的語音標識和圖像標識。
[0112]步驟103，根據上述語音標識指示的語音特徵參數、圖像標識指示的圖像特徵參數及文本信息生成或獲取語音動畫流並播放該語音動畫流。
[0113]需要說明的是，接收終端可以自己根據語音特徵參數和圖像特徵參數生成語音動畫流；也可以將語音特徵參數和圖像特徵參數發送給伺服器，由伺服器來生成語音動畫流並返回給接收終端進行播放，這種情況下，接收終端不用生成語音動畫流，減輕了接收終端的運作負擔。
[0114]接收終端或伺服器在生成語音動畫流時，需要先獲取語音標識指示的語音特徵參數及圖像標識指示的圖像特徵參數；然後再根據語音動畫技術來生成語音動畫流，其中，在獲取圖像特徵參數和語音特徵參數時，可以在接收端終或伺服器端的資料庫中進行查找。
[0115]而接收終端或伺服器根據語音動畫技術生成語音動畫流時，具體可以通過TTS模塊、動畫模塊和同步合成模塊來實現，結構示意圖如圖2所示，主要是將文本轉語音(Textto Speech, TTS)技術和動畫技術結合起來，其中TTS主要是將文字信息實時轉化為標準流暢的語音朗讀出來的技術，動畫技術主要是運用計算機技術合成特定圖像的運動，比如在人臉動畫技術中包括人臉建模和人臉表情動畫生成等。本實施例中，TTS模塊可以根據語音標識指示的語音特徵參數將文本信息轉換成語音流及文本信息對應的音素時間序列比如在語音流中讀文本信息中每個文字的時間順序及每個文字之間間隔等信息；動畫模塊可以根據音素時間序列及與圖像特徵參數生成動畫流，具體地，可以先根據圖像特徵參數進行圖像建模，然後確定語音流中讀文本信息中每個文字時圖像的運動狀態，從而根據因素時間序列形成動畫流；最後同步合成模塊將語音流和動畫流同步合成語音動畫流。
[0116]可見，本發明實施例中，接收終端在接收到包括用戶標識和文本信息的消息，獲取了用戶標識對應的語音標識和圖像標識，並根據語音標識指示的語音特徵參數、圖像標識指示的圖像特徵參數及文本信息生成或獲取語音動畫流並播放該語音動畫流。使得可以將消息中的文本信息根據用戶標識播放成語音動畫流，既可以生動地展示消息中的文本信息，又可以根據用戶標識對應的語音標識和圖像標識對消息進行個性化展示。
[0117]需要說明的是，接收終端在執行上述步驟103時，可以是由接收終端來生成語音動畫流，這樣就需要接收終端確定語音標識指示的語音特徵參數和圖像標識指示的圖像特徵參數，而這些語音特徵參數和圖像特徵參數可以是用戶預置在接收終端中的，具體地，接收終端在預置圖像特徵參數時，可以先獲取一個圖像樣本，比如通過攝像頭或在本地查找一個圖像樣本，並提取該圖像樣本的圖像特徵參數比如用於表示顏色和線條等特徵的參數，將提取的圖像特徵參數通過圖像標識來唯一標識，按第一對應關係儲存圖像特徵參數與圖像標識；接收終端在預置語音特徵參數時，可以先獲取語音樣本比如通過錄音器或在本地查找一個語音樣本，並提取該語音樣本的語音特徵參數比如用於表示音色、音調和音量等特徵的參數，將提取的語音特徵參數通過語音標識來唯一標識，並按第二對應關係儲存語音特徵參數與語音標識。這樣接收終端在獲取語音標識指示的語音特徵參數時，會根據上述儲存的第二對關係獲取步驟102中獲取的語音標識指示的語音特徵參數，在獲取圖像標識指示的圖像特徵參數時，會根據上述儲存的第一對應關係獲取步驟102中獲取的圖像標識指示的圖像特徵參數。
[0118]在另一個具體的實施例中，接收終端在執行上述步驟103時，可以是由接收終端先將步驟102中獲取的語音標識和圖像標識發送給伺服器，由伺服器來生成語音動畫流，這樣伺服器需要確定語音標識指示的語音特徵參數和圖像標識指示的圖像特徵參數，而這些語音特徵參數和圖像特徵參數可以是由接收終端通過網絡在伺服器中預置的，具體地:接收終端可以先獲取圖像樣本，並將圖像樣本發送給伺服器，以指示伺服器提取圖像樣本的圖像特徵參數，並在伺服器中按第一對應關係儲存圖像特徵參數與圖像標識；且接收終端還可以將獲取語音樣本，並將語音樣本發送給伺服器，以指示伺服器提取語音樣本的語音特徵參數，並在伺服器中按第二對應關係儲存語音特徵參數與語音標識。這樣伺服器可以根據語音特徵參數、圖像特徵參數和文本信息生成語音動畫流。
[0119]本發明實施例提供一種消息播放方法，主要是對於進行通信的終端設備，發送終端通過網絡伺服器將消息發送給接收終端進行播放，比如當手機I通過網絡伺服器接收到手機2發送的短消息，對該短消息的播放，本實施例的方法是網絡伺服器所執行的方法，其中該網絡伺服器可以是發送終端到接收終端路徑中的任一網絡設備，流程圖如圖3所示，包括:
[0120]步驟201，網絡伺服器接收發送終端(比如手機)發送的消息比如短消息等，在消息中包括發送終端對應用戶的用戶標識和文本信息。
[0121]步驟202，網絡伺服器根據預先存儲的用戶標識與語音標識和圖像標識的對應關係，獲取與發送終端發送的用戶標識對應的語音標識和圖像標識，這裡語音標識是用於指示語音特徵參數，而圖像標識用於指示圖像特徵參數。
[0122]可以理解，當發送終端在發送消息給接收終端的過程中，該消息經過網絡伺服器後，該網絡伺服器解析該消息得到能唯一標識發送終端對應用戶的用戶標識，比如在發送終端上使用的SM卡號碼即手機號碼等，並可以在網絡伺服器預置的對應關係中查找與發送終端發送的用戶標識對應的語音標識和圖像標識，其中在網絡伺服器中可以預先儲存不同用戶標識對應的語音標識和圖像標識，這些信息可以是接收終端通過網絡預置到網絡伺服器中的，比如接收終端可以將接收終端中儲存的各個聯繫人對應的語音標識和圖像標識同步到網路側。
[0123]步驟203，網絡伺服器根據上述語音標識指示的語音特徵參數、圖像標識指示的圖像特徵參數，以及文本信息生成語音動畫流。其中網絡伺服器具體在生成語音動畫流時，需要先獲取語音標識指示的語音特徵參數和獲取圖像標識指示的圖像特徵參數；然後再根據語音動畫技術來生成語音動畫流，具體地可以通過TTS模塊、動畫模塊和同步合成模塊來實現，具體生成的流程與上述接收終端生成語音動畫流的過程類似，在此不進行贅述。
[0124]其中，網絡伺服器獲取的圖像特徵參數和語音特徵參數可以是分別根據接收終端提供的圖像樣本和語音樣本預置在網絡伺服器中的，具體地，網絡伺服器可以接收上述接收終端發送的圖像樣本，並提取該圖像樣本的圖像特徵參數，將提取的圖像特徵參數通過圖像標識來唯一標識，並按第一對應關係儲存圖像特徵參數與圖像標識；網絡伺服器還可以接收上述接收終端發送的語音樣本，並提取該語音樣本的語音特徵參數，將提取的語音特徵參數通過語音標識來唯一標識，並按第二對應關係儲存語音特徵參數與語音標識。這樣網絡伺服器在獲取語音標識指示的語音特徵參數時，會根據上述儲存的第二對關係獲取步驟202中獲取的語音標識指示的語音特徵參數，在獲取圖像標識指示的圖像特徵參數時，會根據上述儲存的第一對應關係獲取步驟202中獲取的圖像標識指示的圖像特徵參數。
[0125]步驟204，網絡伺服器將生成的語音動畫流發送給接收終端，使得接收終端收到後播放該語音動畫流。
[0126]本發明實施例中，當包括發送終端對應的用戶標識和文本信息的消息從發送終端發送到接收終端的過程中，在經過網絡伺服器時，由網絡伺服器獲取用戶標識對應的語音標識和圖像標識，並生成的語音動畫流後將生成的語音動畫流發送給接收終端播放，其中語音動畫流是伺服器根據語音標識指示的語音特徵參數、圖像標識指示的圖像特徵參數及文本信息生成的。使得可以將消息中的文本信息根據用戶標識播放成語音動畫流，既可以生動地展示消息中的文本信息，又可以根據用戶標識對應的語音標識和圖像標識對消息進行個性化展示；且本實施例中，不用接收終端生成語音動畫流，減輕了終端的負擔。
[0127]以下以一個具體的實施例來說明本發明實施例中所述的消息播放方法，參考圖4所示，本實施例的接收終端中包括簡訊處理模塊、參數配置模塊、模板製作模塊、語音動畫引擎和語音動畫播放器，其中:
[0128]參數配置模塊可以設置通訊錄中每個聯繫人對應的人臉圖像標識和語音標識，具體地，用戶通過操作接收終端使得參數配置模塊提供對通訊錄中聯繫人信息進行設置的設置界面，如圖5所示，用戶可以編輯聯繫人的姓名、電話和郵箱，且還可以通過選擇的方式來選擇發音人的標識即語音標識，和選擇人臉圖像的標識即圖像標識，具體地，用戶可以在一個下拉的菜單中進行選擇，其中下拉菜單中顯示的圖像標識或語音標識都已經是儲存在接收終端的資料庫中的，當資料庫進行更新後，可以同步更新該下拉菜單中顯示的語音標識和圖像標識；當接收終端從設置界面上接收到用戶編輯的信息，則儲存用戶編輯的姓名、電話、郵箱、發首人標識和人臉圖像標識的對應關係。
[0129]模板製作模塊可以通過攝像頭或在本地查找一個人臉圖像樣本，然後提取該人臉圖像樣本的圖像特徵參數比如用於表示人臉的輪廓等特徵的參數，用一個圖像標識比如「張三」來標識該圖像特徵參數，再將該圖像標識和圖像特徵參數的對應關係儲存到資料庫中；同樣，模塊製作模塊可以通過錄音器或在本地查找一段語音樣本，然後提取該語音樣本的語音特徵參數比如用於表示音色和音調等特徵的參數，用一個語音標識比如「唐老鴨」來標識該語音特徵參數，再將該語音標識和語音特徵參數的對應關係儲存到資料庫中。
[0130]當接收終端的簡訊處理模塊接收到其它移動終端發送的短消息，則將短消息中的用戶標識比如對端的SIM卡號通知給參數配置模塊，並將短消息中的文本信息發給語音動畫引擎。這樣參數配置模塊會在通訊錄中查找到該SIM卡號對應的人臉圖像標識和語音標識並傳送到模板製作模塊，而模塊製作模塊在資料庫中找到該人臉圖像標識指示的人臉圖像特徵參數及語音標識指示的語音特徵參數並傳送到語音動畫引擎中。語音動畫引擎中的TTS模塊會根據文本信息和語音特徵參數生成語音流和音素時間序列，而人臉動畫模塊會根據該音素時間序列及人臉圖像特徵參數生成人臉動畫流，最後由同步模塊將語音流和人臉動畫流進行同步合成語音動畫流，並傳送給語音動畫播放器進行播放。
[0131]通過上述接收終端來生成語音動畫流並播放的方式，實現了將短消息進行形象地播放，且可以根據用戶自己的需要來進行播放。
[0132]參考圖6所示，本實施例的接收終端中包括簡訊處理模塊、參數配置模塊、資料庫、語音動畫引擎和語音動畫播放器，其中:
[0133]接收終端可以通過A2接口將獲取的人臉圖像樣本發送給伺服器，通過A3接口將獲取的語音樣本發送伺服器，由伺服器進行圖像特徵參數或語音特徵參數的提取後儲存到伺服器的資料庫中，且伺服器在更新資料庫後可以通過Al接口將更新的信息發送給接收終端進行更新接收終端的資料庫。則在本實施例中，接收終端接收到短消息後，生成語音動畫流的過程與如圖3對應的實施例類似，不同的是，本實施例中接收終端在獲取語音標識指示的語音特徵參數和人臉圖像指示的人臉圖像特徵參數時可以從接收終端的資料庫中獲取，也可以從伺服器的資料庫中獲取，這樣接收終端省去對圖像特徵參數和語音特徵參數的提取。
[0134]參考圖7所示，本實施例中語音動畫流在伺服器端生成，其中接收終端中包括簡訊處理模塊、參數配置模塊和語音動畫播放器，伺服器中包括所述模板製作模塊和語音動畫引擎，其中:
[0135]接收終端可以通過A4接口將獲取的人臉圖像樣本發送給伺服器，通過A5接口將獲取的語音樣本發送伺服器，由伺服器中的模板製作模塊進行圖像特徵參數或語音特徵參數的提取後儲存到伺服器的資料庫中。則在本實施例中，接收終端接收到短消息後，將其中的文本信息通過接口 Al發送給伺服器中的語音動畫引擎；而將用戶標識比如對端的SIM卡號發送給接收終端包括的參數配置模塊，由參數配置模塊在通訊錄中查找到對應的語音標識和圖像標識後，通過接口 A2將語音標識和圖像標識發送給伺服器的模板製作模塊，伺服器中的語音動畫引擎和模板製作模塊配合生成語音動畫流後，通過接口 A3發送給接收終端的語音播放器進行播放，這樣接收端省去對生成語音動畫流的過程，減少功耗。
[0136]本發明實施例還提供一種終端設備即上述圖1對應實施例的方法中的接收終端，結構示意圖如圖8所示,包括:
[0137]消息接收單元10，用於接收消息，所述消息中包括用戶標識和文本信息；
[0138]標識獲取單元11，用於獲取與所述消息接收單元10接收的消息中用戶標識對應的語音標識和圖像標識，所述語音標識用於指示語音特徵參數，所述圖像標識用於指示圖像特徵參數；
[0139]媒體流獲取單元12，用於根據所述標識獲取單元11獲取的語音標識指示的語音特徵參數、所述標識獲取單元11獲取的圖像標識指示的圖像特徵參數及文本信息生成或獲取語音動畫流，具體地，媒體流獲取單元12可以根據語音動畫技術生成，或向伺服器請求獲取語音動畫流。
[0140]播放單元13，用於播放所述媒體流獲取單元12生成或獲取的語音動畫流。
[0141]本發明實施例的終端設備中，消息接收單元10接收到包括用戶標識和文本信息的消息，標識獲取單元11獲取了用戶標識對應的語音標識和圖像標識，並由媒體流獲取單元12根據語音標識指示的語音特徵參數、圖像標識指示的圖像特徵參數及文本信息生成或獲取語音動畫流，最後由播放單元13播放播放該語音動畫流。使得可以將消息中的文本信息根據用戶標識播放成語音動畫流，既可以生動地展示消息中的文本信息，又可以根據用戶標識對應的語音標識和圖像標識對消息進行個性化展示。
[0142]參考圖9所示，在一個具體的實施例中，終端設備除了可以包括如圖8所示的結構夕卜，還可以包括界面提供單元14、第一對應關係儲存單元15和第二對應關係儲存單元16，且其中的媒體流獲取單元12可以通過語音流生成單元120、動畫流生成單元121、同步單元122和特徵獲取單元123來實現，其中:
[0143]界面提供單元14，用於提供設置界面，所述設置界面用於接收所述用戶標識與所述語音標識以及所述圖像標識之間的對應關係。
[0144]第一對應關係儲存單元15，用於從所述設置界面上接收所述用戶標識與所述語音標識以及所述圖像標識之間的對應關係並儲存所述對應關係。
[0145]第二對應關係儲存單元16，用於獲取圖像樣本，並提取獲取圖像樣本的圖像特徵參數，按第一對應關係儲存所述圖像特徵參數與圖像標識；且該第二對應關係儲存單元16還可以獲取語音樣本，並提取獲取語音樣本的語音特徵參數，按第二對應關係儲存所述語音特徵參數與語音標識。
[0146]特徵獲取單元123，用於獲取所述標識獲取單元11獲取的語音標識指示的語音特徵參數，及獲取所述標識獲取單元11獲取的圖像標識指示的圖像特徵參數；
[0147]語音流生成單元120，用於根據特徵獲取單元123獲取的所述語音標識指示的語音特徵參數將所述文本信息轉換成音素時間序列和語音流；
[0148]動畫流生成單元121，用於根據所述語音流生成單元120生成的音素時間序列及所述特徵獲取單元123獲取的圖像標識指示的圖像特徵參數生成動畫流；
[0149]同步單元122,用於將所述語音流及所述動畫流同步合成語音動畫流。
[0150]本發明實施例的終端設備中，當消息接收單元10接收到消息後，標識獲取單元11根據其中的用戶標識獲取對應的語音標識和圖像標識，媒體流獲取單元12中的特徵獲取單元123會獲取語音特徵參數和圖像特徵參數，語音流生成單元120根據消息中的文本信息及特徵獲取單元123獲取的語音標識指示的語音特徵參數生成音素時間序列和語音流，動畫流生成單元121根據該音素時間序列及特徵獲取單元123獲取的圖像標識指示的圖像特徵參數生成動畫流，最後由同步單元122將語音流和動畫流同步合成語音動畫流，並由播放單元13播放同步單元122合成的語音動畫流。
[0151]本實施例中，界面提供單元14可以提供設置界面以供用戶來設置某個用戶標識對應的語音標識和圖像標識，當第一對應關係儲存單元15接收到所述用戶標識對應用戶在該設置界面上編輯的語音標識和圖像標識，儲存用戶標識與該語音標識和圖像標識的對應關係，則標識獲取單元11是根據第一對應關係儲存單元15儲存的對應關係來獲取與所述消息接收單元10接收消息中用戶標識對應的語音標識和圖像標識的。且終端設備可以通過第二對應關係儲存單元16儲存圖像特徵參數和語音特徵參數，這樣媒體流獲取單元12中的特徵獲取單元123就可以根據第二對應關係儲存單元16儲存的對應關係獲取圖像特徵參數和語音特徵參數。
[0152]參考圖10所示，在另一個具體的實施例中，終端設備除了可以包括如圖8所示的結構外，還可以包括界面提供單元14、第一對應關係儲存單元15和樣本發送單元17，且媒體流獲取單元12還可以通過標識發送單元124和發送媒體流獲取單元125來實現，具體地:
[0153]樣本發送單元17，用於獲取圖像樣本，將獲取的圖像樣本發送給伺服器，以指示所述伺服器提取所述圖像樣本的圖像特徵參數，並按第一對應關係儲存所述圖像特徵參數與圖像標識，且該樣本發送單元17還可以獲取語音樣本，並將獲取的語音樣本發送給伺服器，以指示所述伺服器提取所述語音樣本的語音特徵參數，並按第二對應關係儲存所述語音特徵參數與圖像標識。
[0154]標識發送單元124，用於將所述標識獲取單元11獲取的語音標識和圖像標識發送給伺服器，以指示所述伺服器根據所述語音標識指示的語音特徵參數、所述圖像標識指示的圖像特徵參數及文本信息生成所述文本信息的語音動畫流；發送媒體流獲取單元125，用於獲取所述伺服器發送的語音動畫流，並由播放單元13來播放該語音動畫流。
[0155]本實施例中，終端設備可以通過樣本發送單元17將圖像樣本和語音樣本發送給伺服器，由伺服器來按第二對應關係儲存語音特徵參數與語音標識及按第一對應關係儲存圖像標識和圖像特徵參數，從而節省了終端設備的存儲資源。
[0156]本發明實施例還提供一種終端設備即上述圖1對應實施例的方法中的接收終端，結構示意圖如圖11所示，包括分別連接到總線上的存儲器20、處理器21、輸入裝置23和輸出裝置24，其中:
[0157]存儲器20中用來儲存從輸入裝置23輸入的數據，且還可以儲存處理器21處理數據的必要文件等信息；
[0158]輸入裝置23和輸出裝置24是用戶終端與其他設置通信的埠；
[0159]本實施例中輸入裝置23接收消息後傳送給處理器21，該消息中包括用戶標識和文本信息；處理器21可以執行如下的步驟:獲取與用戶標識對應的語音標識和圖像標識；根據語音標識指示的語音特徵參數，圖像標識指示的圖像特徵參數以及文本信息生成或獲取語音動畫流並播放該語音動畫流。
[0160]進一步地，處理器21還可以在獲取語音標識和圖像標識之前，提供設置界面，該設置界面用於接收用戶標識與語音標識以及圖像標識之間的對應關係，並將從設置界面上接收的用戶標識與語音標識以及圖像標識之間的對應關係傳送給存儲器20進行儲存。這樣處理器21在獲取語音標識和圖像標識時，可以根據存儲器20中儲存的對應關係獲取。
[0161]進一步地，在一種情況下，處理器21在獲取生成的語音動畫流時，可以先獲取語音標識指示的語音特徵參數，及獲取圖像標識指示的圖像特徵參數；根據語音標識指示的語音特徵參數將文本信息轉換成音素時間序列和語音流；根據音素時間序列及圖像標識指示的圖像特徵參數生成動畫流；將語音流及所述動畫流同步合成語音動畫流。在這種情況下，處理器21可以通過如下步驟來預置圖像特徵參數和語音特徵參數，具體地，處理器21可以獲取圖像樣本，提取獲取圖像樣本的圖像特徵參數，將圖像標識和圖像特徵參數傳送給存儲器20按第一對應關係儲存圖像特徵參數與圖像標識；處理器21還可以語音樣本，提取獲取語音樣本的語音特徵參數，並將語音特徵參數與語音標識傳送給存儲器20按第二對應關係儲存，處理器21在生成語音動畫流的過程中獲取語音特徵參數和圖像特徵參數時，可以分別根據存儲器20中儲存的第二對應關係和第一對應關係獲取。
[0162]進一步地，在一種情況下，處理器21可以控制輸出裝置24將語音標識和圖像標識發送給伺服器，以指示伺服器根據語音標識指示的語音特徵參數、所述圖像標識指示的圖像特徵參數及文本信息生成文本信息的語音動畫流，當輸入裝置23接收到伺服器發送的語音動畫流，即可傳送給處理器21進行其他處理。在這種情況下，處理器21可以獲取圖像樣本和語音樣本，並控制輸出裝置24將圖像樣本發送給伺服器，以指示伺服器提取圖像樣本的圖像特徵參數，並按第一對應關係儲存圖像特徵參數與圖像標識，且處理器21還可以控制輸出裝置24將獲取的語音樣本發送給伺服器，以指示伺服器提取語音樣本的語音特徵參數，並按第二對應關係儲存語音特徵參數與圖像標識。
[0163]本發明實施例還提供一種伺服器即上述圖3對應實施例的方法中的網絡伺服器，結構示意圖如圖12所示,包括:
[0164]發送消息接收單元30，用於接收發送終端發送的消息，所述消息中包括文本信息和所述發送終端對應用戶的用戶標識；
[0165]媒體標識獲取單元31，用於根據預先存儲的用戶標識與語音標識和圖像標識的對應關係，獲取與所述發送消息接收單元30接收的消息中發送終端發送的用戶標識對應的語音標識以及圖像標識，所述語音標識用於指示在生成語音動畫流時，用於生成所述語音動畫流中的語音所需的語音特徵參數，所述圖像標識用於指示生成所述語音動畫流時，用於生成所述語音動畫流中的圖像所需的圖像特徵參數；
[0166]媒體流生成單元32，用於根據所述媒體標識獲取單元31獲取的發送終端發送的用戶標識對應的語音標識指示的語音特徵參數、圖像標識指示的圖像特徵參數，以及所述文本信息生成語音動畫流；
[0167]媒體流發送單元33，用於將生成的所述語音動畫流發送給接收終端，使得所述接收終端收到後播放所述語音動畫流。
[0168]本發明實施例中，當包括發送終端對應的用戶標識和文本信息的消息從發送終端發送到接收終端的過程中，在經過網絡伺服器時，由網絡伺服器中的發送消息接收單元30接收該消息，媒體標識獲取單元31獲取用戶標識對應的語音標識和圖像標識，並由媒體流生成單元32生成的語音動畫流後，媒體流發送單元33將生成的語音動畫流發送給接收終端進行播放，其中語音動畫流是根據語音標識指示的語音特徵參數、圖像標識指示的圖像特徵參數及文本信息生成的。使得在消息中的文本信息可以根據不同用戶標識播放成不同的語音動畫流，既可以生動地播放消息中的文本信息，又可以根據用戶標識對應的語音標識和圖像標識對消息進行個性化播放；且本實施例中，不用接收終端生成語音動畫流，減輕了終端的負擔。
[0169]參考圖13所示，在一個具體的實施例中，伺服器除了包括如圖12所示的結構外，還可以包括:樣本接收單元34和對應關係儲存單元35，且媒體流生成單元32具體可以通過媒體特徵獲取單元320、轉換單元321、生成單元322和合成單元323來實現，具體地:
[0170]媒體特徵獲取單元320，用於獲取所述媒體標識獲取單元31獲取的語音標識指示的語音特徵參數，及獲取所述媒體標識獲取單元31獲取的圖像標識指示的圖像特徵參數；
[0171]轉換單元321，用於根據媒體特徵獲取單元320獲取的所述語音標識指示的語音特徵參數將所述文本信息轉換成音素時間序列和語音流；
[0172]生成單元322，用於根據所述轉換單元321轉換的音素時間序列，及所述媒體特徵獲取單元320獲取的圖像標識指示的圖像特徵參數生成動畫流；
[0173]合成單元323，用於將所述轉換單元321轉換的語音流及所述生成單元322生成的動畫流同步合成語音動畫流。
[0174]樣本接收單元34，用於接收終端設備發送的圖像樣本和語音樣本；對應關係儲存單元35，用於提取所述樣本接收單元34接收的圖像樣本的圖像特徵參數，並按第一對應關係儲存所述圖像特徵參數與圖像標識，及提取所述樣本接收單元34接收的語音樣本的語音特徵參數，並按第二對應關係儲存所述語音特徵參數與圖像標識。這樣媒體特徵獲取單元320就可以根據所述對應關係儲存單元35中儲存的第二對關係獲取語音特徵參數，可以根據所述對應關係儲存單元35中儲存第一對應關係獲取圖像特徵參數。[0175]本發明實施例還提供一種伺服器即上述圖3對應實施例的方法中的網絡伺服器，結構示意圖如圖14所示，包括分別連接到總線上的存儲器40、處理器41、輸入裝置43和輸出裝置44，其中:
[0176]存儲器40中用來儲存從輸入裝置43輸入的數據，且還可以儲存處理器41處理數據的必要文件等信息；
[0177]輸入裝置43和輸出裝置44是用戶終端與其他設置通信的埠；
[0178]本實施例中輸入裝置43接收到發送終端發送的消息後傳送給處理器41，該消息中包括文本信息和所述發送終端對應用戶的用戶標識；由處理器41根據存儲器40中存儲的用戶標識與語音標識和圖像標識的對應關係，獲取與發送終端發送的用戶標識對應的語音標識以及圖像標識，且根據發送終端發送的用戶標識對應的語音標識指示的語音特徵參數、圖像標識指示的圖像特徵參數，以及文本信息生成語音動畫流；並控制輸出裝置44將生成的語音動畫流發送給接收終端，使得接收終端收到後播放語音動畫流。
[0179]進一步地，本實施例中的處理器41在生成語音動畫流時，可以先獲取語音標識指示的語音特徵參數，及獲取圖像標識指示的圖像特徵參數；然後根據語音標識指示的語音特徵參數將文本信息轉換成音素時間序列和語音流；根據音素時間序列及圖像標識指示的圖像特徵參數生成動畫流；將語音流及動畫流同步合成語音動畫流。
[0180]進一步地，本實施例中可以預先在存儲器40中預置語音特徵和圖像特徵，具體地，當輸入裝置43接收終端設備發送的圖像樣本和語音樣本傳送給處理器41 ;由處理器41提取圖像樣本的圖像特徵參數，並將圖像特徵參數與圖像標識按第一對應關係儲存到存儲器40中，且處理器41還可以提取語音樣本的語音特徵參數，並將語音特徵參數與圖像標識按第二對應關係儲存到存儲器40中。這樣處理器41在生成語音動畫流的過程中，可以根據存儲器40中儲存的第二對關係獲取語音特徵參數，且根據存儲器40中儲存的第一對應關係獲取圖像特徵參數。
[0181]本發明實施例還提供一種消息播放系統，包括接收終端和伺服器，其中:
[0182]接收終端，用於接收消息，所述消息中包括用戶標識和文本信息；獲取所述用戶標識對應的語音標識和圖像標識；根據所述語音標識指示的語音特徵參數、所述圖像標識指示的圖像特徵參數及文本信息獲取語音動畫流並播放該語音動畫流；所述語音標識用於指示語音特徵參數，所述圖像標識用於指示圖像特徵參數；
[0183]伺服器，用於根據所述語音標識指示的語音特徵參數、所述圖像標識指示的圖像特徵參數及文本信息生成所述文本信息的語音動畫流並發送給所述接收終端，具體的生成語音動畫流的方法如上述方法實施例中所述。
[0184]其中接收終端可以是如圖8、10和11中任一個圖所示的終端設備，且終端設備中各個單元之間可以按照上述圖1對應方法實施例中所述的方法進行消息的播放，在此不進行贅述。
[0185]本發明實施例還提供一種消息播放系統，包括接收終端和網絡伺服器，其中:
[0186]所述網絡伺服器，用於接收到發送終端發送的消息後該消息中包括文本信息和所述發送終端對應用戶的用戶標識；根據預先儲存的用戶標識與語音標識和圖像標識的對應關係，獲取與發送終端發送的用戶標識對應的語音標識以及圖像標識，且根據發送終端發送的用戶標識對應的語音標識指示的語音特徵參數、圖像標識指示的圖像特徵參數，以及文本信息生成語音動畫流；並將生成的語音動畫流發送給接收終端；所述語音標識用於指示語音特徵參數，所述圖像標識用於指示圖像特徵參數；
[0187]所述接收終端，用於接收所述網絡伺服器發送的語音動畫流，並播放所述語音動畫流。
[0188]其中網絡伺服器可以是如圖12到14中任一個圖所示的伺服器，網絡伺服器中各個單元之間可以按照上述圖3對應方法實施例中所述的方法進行消息的播放，在此不進行贅述。
[0189]本領域普通技術人員可以理解上述實施例的各種方法中的全部或部分步驟是可以通過程序來指令相關的硬體來完成，該程序可以存儲於一計算機可讀存儲介質中，存儲介質可以包括:只讀存儲器(ROM)、隨機存取存儲器(RAM)、磁碟或光碟等。
[0190]以上對本發明實施例所提供的消息播放方法、系統及相關設備，進行了詳細介紹，本文中應用了具體個例對本發明的原理及實施方式進行了闡述，以上實施例的說明只是用於幫助理解本發明的方法及其核心思想；同時，對於本領域的一般技術人員，依據本發明的思想，在【具體實施方式】及應用範圍上均會有改變之處，綜上所述，本說明書內容不應理解為對本發明的限制。
【權利要求】
1.一種消息播放方法，其特徵在於，應用於終端設備，所述方法包括: 接收消息，所述消息中包括用戶標識和文本信息；獲取與所述用戶標識對應的語音標識和圖像標識，所述語音標識用於指示語音特徵參數，所述圖像標識用於指示圖像特徵參數；根據所述語音標識指示的語音特徵參數、所述圖像標識指示的圖像特徵參數以及所述文本信息生成或獲取語音動畫流並播放所述語音動畫流。
2.如權利要求1所述的方法，其特徵在於，所述接收消息之前，所述方法還包括: 提供設置界面，所述設置界面用於接收所述用戶標識與所述語音標識以及所述圖像標識之間的對應關係；從所述設置界面上接收所述用戶標識與所述語音標識以及所述圖像標識之間的對應關係並存儲所述對應關係；所述獲取與所述用戶標識對應的語音標識和圖像標識包括: 根據存儲的對應關係獲取與所述用戶標識對應的所述語音標識和所述圖像標識。
3.如權利要求1或2所述的方法，其特徵在於，所述根據所述語音標識指示的語音特徵參數、所述圖像標識指示的圖像特徵參數以及所述文本信息生成語音動畫流包括: 所述終端設備獲取所述語音標識指示的語音特徵參數，及獲取所述圖像標識指示的圖像特徵參數；` 所述終端設備根據所述語音標識指示的語音特徵參數將所述文本信息轉換成音素時間序列和語音流；所述終端設備根據所述音素時間序列及所述圖像標識指示的圖像特徵參數生成動畫流；所述終端設備將所述語音流及所述動畫流同步合成語音動畫流。
4.如權利要求3所述的方法，其特徵在於，所述接收消息之前，所述方法還包括: 獲取圖像樣本和語音樣本；提取獲取圖像樣本的圖像特徵參數，按第一對應關係儲存所述圖像特徵參數與圖像標識；提取獲取語音樣本的語音特徵參數，按第二對應關係儲存所述語音特徵參數與語音標識；所述獲取所述語音標識指示的語音特徵參數，及圖像標識指示的圖像特徵參數包括:根據所述第二對關係獲取所述語音標識指示的語音特徵參數，根據所述第一對應關係獲取所述圖像標識指示的圖像特徵參數。
5.如權利要求1或2所述的方法，其特徵在於，所述根據所述語音標識指示的語音特徵參數、所述圖像標識指示的圖像特徵參數以及所述文本信息獲取語音動畫流包括: 將所述語音標識和圖像標識發送給伺服器，以指示所述伺服器根據所述語音標識指示的語音特徵參數、所述圖像標識指示的圖像特徵參數及文本信息生成所述文本信息的語音動畫流；獲取所述伺服器發送的語音動畫流。
6.如權利要求5所述的方法，其特徵在於，所述伺服器根據所述語音標識指示的語音特徵參數、所述圖像標識指示的圖像特徵參數及文本信息生成所述文本信息的語音動畫流，具體包括: 所述伺服器獲取所述語音標識指示的語音特徵參數，及獲取所述圖像標識指示的圖像特徵參數；所述伺服器根據所述語音標識指示的語音特徵參數將所述文本信息轉換成音素時間序列和語音流；所述伺服器根據所述音素時間序列及所述圖像標識指示的圖像特徵參數生成動畫流；所述伺服器將所述語音流及所述動畫流同步合成語音動畫流。
7.如權利要求6所述的方法，其特徵在於，所述接收消息之前還包括: 獲取圖像樣本和語音樣本；將所述圖像樣本發送給伺服器，以指示所述伺服器提取所述圖像樣本的圖像特徵參數，並按第一對應關係儲存所述圖像特徵參數與圖像標識；將獲取的語音樣本發送給伺服器，以指示所述伺服器提取所述語音樣本的語音特徵參數，並按第二對應關係儲存所述語音特徵參數與所述語音標識；所述伺服器獲取所述語音標識指示的`語音特徵參數，及所述圖像標識指示的圖像特徵參數包括:根據所述第二對關係獲取所述語音標識指示的語音特徵參數，根據所述第一對應關係獲取所述圖像標識指示的圖像特徵參數。
8.一種消息播放方法，其特徵在於，應用於網絡伺服器，所述方法包括: 接收發送終端發送的消息，所述消息中包括文本信息和所述發送終端對應用戶的用戶標識；根據預先存儲的用戶標識與語音標識和圖像標識的對應關係，獲取與所述發送終端發送的用戶標識對應的語音標識以及圖像標識，所述語音標識用於指示語音特徵參數，所述圖像標識用於指示圖像特徵參數；根據所述語音標識指示的語音特徵參數、以及圖像標識指示的圖像特徵參數，以及所述文本信息生成語音動畫流；將生成的所述語音動畫流發送給接收終端，使得所述接收終端收到後播放所述語音動畫流。
9.如權利要求8所述的方法，其特徵在於，所述根據所述語音標識指示的語音特徵參數、以及圖像標識指示的圖像特徵參數，以及所述文本信息生成語音動畫流，具體包括: 獲取所述語音標識指示的語音特徵參數，及獲取所述圖像標識指示的圖像特徵參數；根據所述語音標識指示的語音特徵參數將所述文本信息轉換成音素時間序列和語音流；根據所述音素時間序列及所圖像標識指示的圖像特徵參數生成動畫流；將所述語音流及所述動畫流同步合成語音動畫流。
10.如權利要求9所述的方法，其特徵在於，所述接收終端設備發送的消息之前還包括: 接收終端設備發送的圖像樣本和語音樣本；提取所述圖像樣本的圖像特徵參數，按第一對應關係儲存所述圖像特徵參數與圖像標識；提取所述語音樣本的語音特徵參數，按第二對應關係儲存所述語音特徵參數與圖像標識；所述獲取所述語音標識指示的語音特徵參數具體包括:根據所述第二對關係獲取所述語音標識指示的語音特徵參數；所述獲取所述圖像標識指示的圖像特徵參數具體包括:根據所述第一對應關係獲取所述圖像標識指示的圖像特徵參數。
11.如權利要求8到10任一項所述的方法，其特徵在於，所述發送終端為手機，所述發送終端發送的消息為短消息，所述消息中包括的用戶標識為手機號碼。
12.一種終端設備，其特徵在於，包括: 消息接收單元，用於接收消息，所述消息中包括用戶標識和文本信息；標識獲取單元，用於獲取與所述消息接收單元接收的發送消息中用戶標識對應的語音標識和圖像標識，所述語音標識用於指示語音特徵參數，所述圖像標識用於指示圖像特徵參數；媒體流獲取單元，用於根據所述語音標識指示的語音特徵參數、所述圖像標識指示的圖像特徵參數以及所述文本信息生成或獲取語音動畫流；播放單元，用於播放所述媒體流獲取單元生成或獲取的所述語音動畫流。
13.如權利要求12所述的終端設備，其特徵在於，所述終端設備還包括: 界面提供單元，用於提供設置界面，所述設置界面用於接收所述用戶標識與所述語音標識以及所述圖像標識之間的對應關係；第一對應關係儲存單元，用於從所述設置界面上接收所述用戶標識與所述語音標識以及所述圖像標識之間的對應關係並儲`存所述對應關係；所述標識獲取單元，具體用於根據所述第一對應關係儲存單元儲存的對應關係獲取與所述用戶標識對應的所述語音標識和圖像標識。
14.如權利要求12或13所述的終端設備，其特徵在於，所述媒體流獲取單元具體包括: 特徵獲取單元，獲取所述標識獲取單元獲取的語音標識指示的語音特徵參數，及獲取所述標識獲取單元獲取的圖像標識指示的圖像特徵參數；語音流生成單元，用於根據所述語音標識指示的語音特徵參數將所述文本信息轉換成音素時間序列和語音流；動畫流生成單元，用於根據所述語音流生成單元生成的音素時間序列及所述圖像標識指示的圖像特徵參數生成動畫流；同步單元，用於將所述語音流及所述動畫流同步合成語音動畫流。
15.如權利要求14所述的終端設備，其特徵在於，所述終端設備還包括: 第二對應關係儲存單元，用於獲取圖像樣本，並提取獲取所述圖像樣本的圖像特徵參數，按第一對應關係儲存所述圖像特徵參數與圖像標識；及用於獲取語音樣本，並提取獲取語音樣本的語音特徵參數，按第二對應關係儲存所述語音特徵參數與語音標識；所述特徵獲取單元，具體用於分別根據所述第二對應關係儲存單元儲存的第一對應關係和第二對應關係，獲取所述圖像標識指示的圖像特徵參數和所述語音標識指示的語音特徵參數。
16.如權利要求12或13所述的終端設備，其特徵在於，所述媒體流獲取單元具體包括: 標識發送單元，用於將所述語音標識和圖像標識發送給伺服器，以指示所述伺服器根據所述語音標識指示的語音特徵參數、所述圖像標識指示的圖像特徵參數及文本信息生成所述文本信息的語音動畫流；發送媒體流獲取單元，用於獲取所述伺服器發送的語音動畫流。
17.如權利要求16所述的終端設備，其特徵在於，所述終端設備還包括: 樣本發送單元，用於獲取圖像樣本，將獲取的圖像樣本發送給伺服器，以指示所述伺服器提取所述圖像樣本的圖像特徵參數，並按第一對應關係儲存所述圖像特徵參數與圖像標識；及用於獲取語音樣本，並將獲取的語音樣本發送給伺服器，以指示所述伺服器提取所述語音樣本的語音特徵參數，並按第二對應關係儲存所述語音特徵參數與圖像標識。
18.一種伺服器，其特徵在於，包括: 發送消息接收單元，用於接收發送終端發送的消息，所述消息中包括文本信息和所述發送終端對應用戶的用戶標識；媒體標識獲取單元，用於根據預先存儲的用戶標識與語音標識和圖像標識的對應關係，獲取與所述發送終端發送的用戶標識對應的語音標識以及圖像標識，所述語音標識用於指示語音特徵參數，所述圖像標識用於指示圖像特徵參數；媒體流生成單元，用於根據所述語音標識指示語音特徵參數、圖像標識指示的圖像特徵參數，以及所述文本信息生成語音動畫流；媒體流發送單元，用於將生成的所述語音動畫流發送給接收終端，使得所述接收終端收到後播放所述語音動畫流。
19.如權利要求18所述的伺服器，其特徵在於，所述媒體流生成單元具體包括: 媒體特徵獲取單元，用於獲取所述語音標識指示的語音特徵參數，及獲取所述圖像標識指示的圖像特徵參數；轉換單元，用於根據所述語音標識指示的語音特徵參數將所述文本信息轉換成音素時間序列和語音流；生成單元，用於根據所述音素時間序列及所述圖像標識指示的圖像特徵參數生成動畫流；合成單元，用於將所述語音流及所述動畫流同步合成語音動畫流。
20.如權利要求19所述的伺服器，其特徵在於，所述伺服器還包括: 樣本接收單元，用於接收終端設備發送的圖像樣本和語音樣本；對應關係儲存單元，用於提取所述圖像樣本的圖像特徵參數，並按第一對應關係儲存所述圖像特徵參數與圖像標識，及提取所述語音樣本的語音特徵參數，並按第二對應關係儲存所述語音特徵參數與圖像標識；所述媒體特徵獲取單元，具體用於根據所述第二對關係獲取所述語音標識指示的語音特徵參數；且根據所述第一對應關係獲取所述圖像標識指示的圖像特徵參數。
21.一種消息播放系統，其特徵在於，包括接收終端和伺服器；所述接收終端是如上述權利要求16或17所述的終端設備；所述伺服器，用於根據所述語音標識指示的語音特徵參數、所述圖像標識指示的圖像特徵參數及文本信息生成所述文本信息的語音動畫流並發送給所述接收終端。
22.一種消息播放系統，其特徵在於，包括接收終端和網絡伺服器；所述網絡伺服器是如上述權利要求18到20任一項所述的伺服器；所述接收終端，用於接收所述網絡伺服器發送的`語音動畫流，並播放所述語音動畫流。
【文檔編號】H04M1/725GK103796181SQ201210436069
【公開日】2014年5月14日申請日期:2012年11月5日優先權日:2012年11月5日
【發明者】來意哲申請人:華為技術有限公司

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

一種發送消息的播放方法、系統及相關設備的製作方法

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法