一種音頻處理方法和音頻處理設備的製作方法
2023-05-31 00:45:41 4
一種音頻處理方法和音頻處理設備的製作方法
【專利摘要】本發明提供了音頻處理方法和音頻處理裝置,其中,所述音頻處理裝置包括:第一提取單元,用於通過移動終端,從音頻流中提取攜帶待目標內容的音頻數據;識別單元,用於識別出所述音頻數據對應的文字內容;第二提取單元,用於獲取用戶的偏好語言,以作為目標語言;轉換單元,用於將所述文字內容轉成目標語言格式的文字內容,所述目標語言格式的文字內容為採用目標語言描述的文字內容;替代單元,用於將所述目標語言格式的文字內容,轉換為目標語言格式的音頻數據,以替代所述待目標的音頻數據。本發明可根據用戶的喜好來轉換音頻內容,提高了用戶的滿意度。
【專利說明】一種音頻處理方法和音頻處理設備
【技術領域】
[0001]本發明涉及音頻處理【技術領域】,特別是一種音頻處理方法和音頻處理設備。
【背景技術】
[0002]目前,移動終端已成為炙手可熱的通訊工具,方便了人們實時進行移動通訊;第三方應用程式的引入,豐富了移動終端的功能,擴大了移動終端的應用領域。
[0003]當移動終端安裝相應的播放器時,可以下載音樂、視頻,然後收聽、觀看,或在線收聽音樂,或在線觀看視頻;隨著網絡的普及,促進了各國、各地方的文化傳播;若音樂、視頻採用的陌生的語音,用戶很難聽懂或看懂,極大地限制了網絡、音樂、視頻的適用範圍。
【發明內容】
[0004]為此,本發明提出一種音頻處理方法和音頻處理設備,可充分地消除由於現有技術的限制和缺陷導致的一個或多個問題。
[0005]本發明另外的優點、目的和特性,一部分將在下面的說明書中得到闡明,而另一部分對於本領域的普通技術人員通過對下面的說明的考察將是明顯的或從本發明的實施中學到。通過在文字的說明書和權利要求書及附圖中特別地指出的結構可實現和獲得本發明目的和優點。
[0006]本發明提供了一種音頻處理設備,其特徵在於,所述音頻處理設備包括:
[0007]第一提取單元,用於通過移動終端,從音頻流中提取攜帶待目標內容的音頻數據;
[0008]識別單元,用於識別出所述音頻數據對應的文字內容;
[0009]第二提取單元,用於獲取用戶的偏好語言,以作為目標語言;
[0010]轉換單元,用於將所述文字內容轉成目標語言格式的文字內容,所述目標語言格式的文字內容為採用目標語言描述的文字內容;
[0011]替代單元,用於將所述目標語言格式的文字內容,轉換為目標語言格式的音頻數據,以替代所述待目標的音頻數據。
[0012]優選的,所述識別單元利用語音識別技術,來識別出所述音頻數據對應的文字內容。
[0013]優選的,所述音頻處理設備還包括:
[0014]視頻提取單元,用於通過移動終端,從視頻流中提取與字幕相關的視頻數據;
[0015]視頻識別單元,用於根據字幕相關的視頻數據,識別出字幕內容;
[0016]優選的,所述音頻處理設備還包括:
[0017]視頻轉換單元,用於將所述字幕內容,轉換成目標語言格式的字幕內容,所述目標語言格式的字幕內容為採用目標語言描述的字幕內容;
[0018]視頻替代單元,用於將所述目標語言格式的字幕內容,轉換為目標語言格式的視頻數據,以替代所述與字幕相關的視頻數據。[0019]優選的,所述音頻處理設備還包括:
[0020]時間戳單元,用於預先獲取所述音頻數據與所述視頻數據的同步時間戳;
[0021]同步單元,用於通過所述同步時間戳,控制所述翻譯語言格式的音頻數據與和所述翻譯語言格式的視頻數據同步。
[0022]本發明還提供了一種音頻處理方法,其特徵在於,所述方法包括:
[0023]通過移動終端,從音頻流中提取攜帶待翻譯內容的音頻數據;
[0024]識別出所述音頻數據對應的文字內容;
[0025]獲取用戶的偏好語言,以作為目標語言;
[0026]將所述文字內容轉換成目標語言格式的文字內容,所述目標語言格式的文字內容為採用目標語言描述的文字內容;
[0027]將所述目標語言格式的文字內容,轉換為目標語言格式的音頻數據,以替代所述待轉換的音頻數據。
[0028]優選的,利用語音識別技術,來識別出所述音頻數據對應的文字內容。
[0029]優選的,所述方法還包括:
[0030]通過移動終端,從視頻流中提取與字幕相關的視頻數據;
[0031]根據字幕相關的視頻數據,識別出字幕內容;
[0032]將所述字幕內容,轉換成目標語言格式的字幕內容,所述目標語言格式的字幕內容為採用目標語言描述的字幕內容;
[0033]將所述目標語言格式的字幕內容,轉換為目標語言格式的視頻數據,以替換所述與字幕相關的視頻數據。
[0034]本發明實現將陌生語言的音頻流轉換為偏好語言格式的音頻流,以偏好語言呈現內容給用戶,更具人性化,也更具通用性。
【專利附圖】
【附圖說明】
[0035]圖1為根據本發明實施例的、音頻處理方法的流程圖。
[0036]圖2為根據本發明實施例的、音頻處理設備的結構示意圖。
【具體實施方式】
[0037]圖1示出了根據本發明實施例的、音頻處理方法的流程圖,具體步驟詳述如下:
[0038]步驟S101,通過移動終端,從音頻流中提取攜帶待翻譯內容的音頻數據。
[0039]播放軟體播放音頻流,所述音頻流中包含著音頻數據,該音頻數據記載著背景音樂以及錄製的內容。若需要,可以從音頻流中提取攜帶待翻譯內容的音頻數據。例如:當用戶通過移動終端收聽音樂時,為了實現將音樂以用戶指定的語言播放,首先,從音樂播放文件中提取出音頻流,在濾除背景音樂後,從音頻流中提取出與語音相關的音頻數據,例如:濾除背景音樂後,提取出歌曲。
[0040]作為本發明另一實施例,述通過移動終端,從音頻流中提取攜帶待翻譯內容的音頻數據的步驟之前,所述方法還包括:
[0041]獲取用戶的偏好語言,以作為翻譯語言。
[0042]所述偏好語言包括全球各地方言、全球各國母語。[0043]首先,在獲取到用戶設置翻譯語言的指令後,移動終端彈出語言選擇對話框,在該對話框的語音欄中,列出了本地和/或伺服器包括的所有語言種類;用戶可以根據偏好,選取至少一種偏好語言,將所選的偏好語言設置為翻譯語言,並根據用戶的優選選擇設置優選順序,例如:將中文設置為第一翻譯語言,將四川方言設置為第二翻譯語言,將英語設置為第三翻譯語言;當確認翻譯語言設置完成後,將音頻數據對應的文字內容翻譯成第一翻譯語言的文字內容時,若在本地和伺服器中均未查找到第一翻譯語言對應的文字庫,根據翻譯語言的優選順序,查找第二翻譯語言對應的文字庫,若查找成功,則根據第二翻譯語音的文字庫,將音頻數據對應的文字內容翻譯成第二翻譯語言的文字內容,所述文字庫包括待翻譯的文字與翻譯文字的映射關係;以此類推,若未查找成功,根據翻譯語言的優選順序依次查找,當針對所有的翻譯語言,都未查找到對應的文字庫,則保留原音頻流以播放。
[0044]優選的是,在播放視頻和/或音頻時,用戶可以根據自己的偏好,更改翻譯語言。具體地,當獲取到更改指令後,調用語言選擇對話框以實現翻譯語言的更改。
[0045]優選的是,可以通過移動終端自帶的麥克風,獲取用戶錄入的語音,根據語言庫,識別出該錄入的語音的語言種類。將識別出的語言作為翻譯語言,當然,也可以多次錄入不同的語言,然後對獲取到的所有翻譯語言排列優選順序。
[0046]步驟S102,利用語音識別技術,識別出所述音頻數據對應的文字內容。
[0047]將二進位的音頻數據錄入語音識別裝置,該語音識別裝置採用語音識別技術,識別出該音頻數據對應的文字內容。
[0048]步驟S103,將所述文字內容翻譯成翻譯語言格式的文字內容,所述翻譯語言格式的文字內容為採用翻譯語言描述的文字內容。
[0049]採用現有的語言翻譯軟體,將所述文字內容翻譯成翻譯語言格式的文字內容。
[0050]步驟S104,將所述翻譯語言格式的文字內容,轉換為翻譯語言格式的音頻數據,以替換所述待翻譯的音頻數據。
[0051]所述翻譯語言格式的音頻數據為採用翻譯語言錄製、形成的音頻數據。
[0052]根據音頻流中記載的攜帶待翻譯內容的音頻數據對應的時間戳、翻譯語言格式的文字內容,重新錄製翻譯語言的音頻數據;將翻譯語言格式的音頻數據替換所述攜帶待翻譯內容的音頻數據。具體地,在保持攜帶待翻譯內容的音頻數據的同步時間戳不變的情況下,將翻譯語言格式的音頻數據替換攜帶待翻譯內容的音頻數據,保持了音頻流同步播放,實現音頻語音的轉變。
[0053]作為本發明另一實施例,所述方法還包括:
[0054]通過移動終端,從視頻流中提取與字幕相關的視頻數據;
[0055]根據字幕相關的視頻數據,識別出字幕內容;
[0056]將所述字幕內容,翻譯成翻譯語言格式的字幕內容,所述翻譯語言格式的字幕內容為採用翻譯語言描述的字幕內容;
[0057]將所述翻譯語言格式的字幕內容,轉換為翻譯語言格式的視頻數據,以替換所述與字幕相關的視頻數據。
[0058]移動終端通過視頻軟體播放視頻文件,所述視頻文件包括視頻流和/或音頻流;待獲取到視頻流後,從所述視頻流中提取與字幕相關的視頻數據,具體地,與字幕相關的視頻數據為攜帶字幕包括的文字內容的視頻數據,同時,提取該字幕的時間戳;待識別出字幕內容後,將所述字幕內容,翻譯成翻譯語言格式的字幕內容;將所述翻譯語言格式的字幕內容,轉換為翻譯語言格式的視頻數據;然後,根據字幕的時間戳,控制將翻譯語言格式的視頻數據替換所述與字幕相關的視頻數據。重新播放翻譯後的視頻文件時,字幕將以翻譯語言格式顯示字幕內容。
[0059]作為本發明另一實施例,所述方法還包括:
[0060]預先獲取所述音頻數據與所述視頻數據的同步時間戳;
[0061]通過所述同步時間戳,控制所述翻譯語言格式的音頻數據與和所述翻譯語言格式的視頻數據同步。
[0062]在觀看視頻時,為了更好地翻譯及顯示,保持視頻流和音頻流同步,預先獲取音頻數據與視頻數據的同步時間戳,所述音頻數據與視頻數據的同步時間戳包括:音頻數據的時間戳、字幕的時間戳、翻譯語言格式的音頻數據與和翻譯語言格式的視頻數據的同步時間戳;通過上述三個時間戳,同時實現以下同步控制:
[0063]通過音頻數據的時間戳,控制翻譯語言格式的音頻數據替換攜帶待翻譯內容的音頻數據;
[0064]通過字幕的時間戳,控制翻譯語言格式的視頻數據替換原與字幕相關的視頻數據;
[0065]通過翻譯語言格式的音頻數據與和翻譯語言格式的視頻數據的同步時間戳,控制所述翻譯語言格式的音頻數據與和所述翻譯語言格式的視頻數據同步。
[0066]本實施例提供了一種基於移動終端的音頻處理方法,用戶使用移動終端收聽時,預先獲取用戶的偏好語言,以作為翻譯語言,當需要翻譯時,從音頻流中提取攜帶待翻譯內容的音頻數據和攜帶待翻譯內容的音頻數據的時間戳,利用語音識別技術,識別出所述音頻數據對應的文字內容以翻譯成翻譯語言格式的文字內容,將所述翻譯語言格式的文字內容,轉換為翻譯語言格式的音頻數據,以替換所述待翻譯的音頻數據;更優的是,若播放媒體為視頻時,在翻譯語音內容的同時,從視頻流中提取與字幕相關的視頻數據和同步時間戳,將翻譯語言格式的音頻數據替換所述待翻譯的音頻數據,將翻譯語言格式的視頻數據替換所述與字幕相關的視頻數據,更優的是,通過所述同步時間戳,控制所述翻譯語言格式的音頻數據與和所述翻譯語言格式的視頻數據同步;從而,實現將陌生語言的音頻和/或視頻轉換為偏好語言格式呈現給用戶,更具人性化,更具通用性。
[0067]實施例二:
[0068]圖2示出了本發明實施例提供的基於移動終端的音頻處理設備的組成結構,為了便於描述,僅示出了與本發明實施例相關的部分;
[0069]所述基於移動終端的音頻處理設備可以是運行於移動終端設備內的軟體單元、硬體單元或者軟硬體相結合的單元,也可以作為獨立的掛件集成到所述終端設備中或者運行於所述終端設備的應用系統中。
[0070]一種基於移動終端的音頻處理設備,所述基於移動終端的音頻處理設備可以包括提取單元21、識別單元22、翻譯單元23以及替換單元24,各功能單元的具體功能描述如下:
[0071]提取單元21,用於通過移動終端,從音頻流中提取攜帶待翻譯內容的音頻數據。
[0072]播放軟體播放音頻流,所述音頻流中包含著音頻數據,該音頻數據記載著背景音樂以及錄製的內容。若需要,可以通過提取單元21從音頻流中提取攜帶待翻譯內容的音頻數據。例如:當用戶通過移動終端收聽音樂時,為了實現將音樂以用戶指定的語言播放,首先,從音樂播放文件中提取出音頻流,在濾除背景音樂後,提取單元21從音頻流中提取出與語音相關的音頻數據,例如:濾除背景音樂後,提取出歌曲。
[0073]作為本發明另一實施例,所述裝置還包括:
[0074]獲取單元25,用於獲取用戶的偏好語言,以作為翻譯語言。
[0075]所述偏好語言包括全球各地方言、全球各國母語。
[0076]首先,在獲取到用戶設置翻譯語言的指令後,獲取單元25彈出語言選擇對話框,在該對話框的語音欄中,列出了本地和/或伺服器包括的所有語言種類;用戶可以根據偏好,選取至少一種偏好語言,獲取單元25將所選的偏好語言設置為翻譯語言,並根據用戶的優選選擇設置優選順序,例如:獲取單元25將中文設置為第一翻譯語言,將四川方言設置為第二翻譯語言,將英語設置為第三翻譯語言;當確認翻譯語言設置完成後,將音頻數據對應的文字內容翻譯成第一翻譯語言的文字內容時,若在本地和伺服器中均未查找到第一翻譯語言對應的文字庫,根據翻譯語言的優選順序,查找第二翻譯語言對應的文字庫,若查找成功,則根據第二翻譯語音的文字庫,將音頻數據對應的文字內容翻譯成第二翻譯語言的文字內容,所述文字庫包括待翻譯的文字與翻譯文字的映射關係;以此類推,若未查找成功,根據翻譯語言的優選順序依次查找,當針對所有的翻譯語言,都未查找到對應的文字庫,則保留原音頻流以播放。
[0077]優選的是,在播放視頻和/或音頻時,用戶可以根據自己的偏好,更改翻譯語言。具體地,當獲取到更改指令後,獲取單元25調用語言選擇對話框以實現翻譯語言的更改。
[0078]優選的是,可以通過移動終端自帶的麥克風,獲取用戶錄入的語音,根據語言庫,識別出該錄入的語音的語言種類。將識別出的語言作為翻譯語言,當然,也可以多次錄入不同的語言,然後對獲取到的所有翻譯語言排列優選順序。
[0079]識別單元22,用於利用語音識別技術,識別出所述音頻數據對應的文字內容。
[0080]識別單元22將二進位的音頻數據錄入語音識別裝置,該語音識別裝置採用語音識別技術,識別出該音頻數據對應的文字內容。
[0081 ] 翻譯單元(即,轉換單元)23,用於將所述文字內容翻譯成翻譯語言格式的文字內容,所述翻譯語言格式的文字內容為採用翻譯語言描述的文字內容。
[0082]翻譯單元23採用現有的語言翻譯軟體,將所述文字內容翻譯成翻譯語言格式的文字內容。
[0083]替換單元24,用於將所述翻譯語言格式的文字內容,轉換為翻譯語言格式的音頻數據,以替換所述待翻譯的音頻數據。
[0084]所述翻譯語言格式的音頻數據為採用翻譯語言錄製、形成的音頻數據。
[0085]替換單元24根據音頻流中記載的攜帶待翻譯內容的音頻數據對應的時間戳、翻譯語言格式的文字內容,重新錄製翻譯語言的音頻數據;替換單元24將翻譯語言格式的音頻數據替換所述攜帶待翻譯內容的音頻數據。具體地,在保持攜帶待翻譯內容的音頻數據的同步時間戳不變的情況下,替換單元24將翻譯語言格式的音頻數據替換攜帶待翻譯內容的音頻數據,保持了音頻流同步播放,實現音頻語音的轉變。
[0086]作為本發明另一實施例,所述裝置還包括:[0087]視頻提取單元26,用於通過移動終端,從視頻流中提取與字幕相關的視頻數據;
[0088]視頻識別單元27,用於根據字幕相關的視頻數據,識別出字幕內容;
[0089]視頻翻譯單元28,用於將所述字幕內容,翻譯成翻譯語言格式的字幕內容,所述翻譯語言格式的字幕內容為採用翻譯語言描述的字幕內容;
[0090]視頻替換單元29,用於將所述翻譯語言格式的字幕內容,轉換為翻譯語言格式的視頻數據,以替換所述與字幕相關的視頻數據。
[0091]移動終端通過視頻軟體播放視頻文件,所述視頻文件包括視頻流和/或音頻流;待獲取到視頻流後,視頻提取單元26從所述視頻流中提取與字幕相關的視頻數據,具體地,與字幕相關的視頻數據為攜帶字幕包括的文字內容的視頻數據,同時,提取該字幕的時間戳;待視頻識別單元27識別出字幕內容後,視頻翻譯單元28將所述字幕內容,翻譯成翻譯語言格式的字幕內容;視頻替換單元29將所述翻譯語言格式的字幕內容,轉換為翻譯語言格式的視頻數據;然後,根據字幕的時間戳,視頻替換單元29控制將翻譯語言格式的視頻數據替換所述與字幕相關的視頻數據。重新播放翻譯後的視頻文件時,字幕將以翻譯語言格式顯示字幕內容。
[0092]作為本發明另一實施例,所述裝置還包括:
[0093]時間戳單元30,用於預先獲取所述音頻數據與所述視頻數據的同步時間戳;
[0094]同步單元31,用於通過所述同步時間戳,控制所述翻譯語言格式的音頻數據與和所述翻譯語言格式的視頻數據同步。
[0095]在觀看視頻時,為了更好地翻譯及顯示,保持視頻流和音頻流同步,時間戳單元30預先獲取音頻數據與視頻數據的同步時間戳,所述音頻數據與視頻數據的同步時間戳包括:音頻數據的時間戳、字幕的時間戳、翻譯語言格式的音頻數據與和翻譯語言格式的視頻數據的同步時間戳;通過上述三個時間戳,同時實現以下同步控制:
[0096]通過音頻數據的時間戳,替換單元24控制翻譯語言格式的音頻數據替換攜帶待翻譯內容的音頻數據;
[0097]通過字幕的時間戳,視頻替換單元29控制翻譯語言格式的視頻數據替換原與字幕相關的視頻數據;
[0098]通過翻譯語言格式的音頻數據與和翻譯語言格式的視頻數據的同步時間戳,同步單元31控制所述翻譯語言格式的音頻數據與和所述翻譯語言格式的視頻數據同步。
[0099]從而,保持了語音或視頻在語言翻譯前後的播放時間正確。
[0100]本實施例提供了一種基於移動終端的音頻處理設備,用戶使用移動終端收聽時,獲取單元預先獲取用戶的偏好語言,以作為翻譯語言,當需要翻譯時,提取單元從音頻流中提取攜帶待翻譯內容的音頻數據和攜帶待翻譯內容的音頻數據的時間戳,識別單元利用語音識別技術,識別出所述音頻數據對應的文字內容以翻譯成翻譯語言格式的文字內容,翻譯單元將所述翻譯語言格式的文字內容,轉換為翻譯語言格式的音頻數據,以替換單元替換所述待翻譯的音頻數據;更優的是,若播放媒體為視頻時,在翻譯語音內容的同時,時間戳單元從視頻流中提取與字幕相關的視頻數據和同步時間戳,將翻譯語言格式的音頻數據替換所述待翻譯的音頻數據,將翻譯語言格式的視頻數據替換所述與字幕相關的視頻數據,更優的是,通過所述同步時間戳,同步單元控制所述翻譯語言格式的音頻數據與和所述翻譯語言格式的視頻數據同步;從而,實現將陌生語言的音頻和/或視頻轉換為偏好語言格式呈現給用戶,更具人性化,更具通用性。
[0101]作為本發明一實施例,本發明提供了一種移動終端,所述移動終端上述的基於移動終端的音頻處理設備。
[0102]所述移動終端可以為但不局限於智慧型手機和IPAD等。
[0103]本發明實施例提供一種基於移動終端的音頻處理方法及裝置,用戶使用移動終端收聽時,預先獲取用戶的偏好語言,以作為翻譯語言,當需要翻譯時,從音頻流中提取攜帶待翻譯內容的音頻數據和攜帶待翻譯內容的音頻數據的時間戳,利用語音識別技術,識別出所述音頻數據對應的文字內容以翻譯成翻譯語言格式的文字內容,將所述翻譯語言格式的文字內容,轉換為翻譯語言格式的音頻數據,以替換所述待翻譯的音頻數據;更優的是,若播放媒體為視頻時,在翻譯語音內容的同時,從視頻流中提取與字幕相關的視頻數據和同步時間戳,將翻譯語言格式的音頻數據替換所述待翻譯的音頻數據,將翻譯語言格式的視頻數據替換所述與字幕相關的視頻數據,更優的是,通過所述同步時間戳,控制所述翻譯語言格式的音頻數據與和所述翻譯語言格式的視頻數據同步;從而,實現將陌生語言的音頻和/或視頻轉換為偏好語言格式呈現給用戶,更具人性化,更具通用性。
[0104]本領域技術人員可以理解為上述實施例二包括的各個單元只是按照功能邏輯進行劃分的,但並不局限於上述的劃分,只要能夠實現相應的功能即可;另外,各功能單元的具體名稱也只是為了便於相互區分,並不用於限制本發明的保護範圍。
[0105]本領域普通技術人員可以理解實現上述實施例方法中的全部或部分步驟是可以通過程序來指令相關的硬體來完成,所述的程序可以在存儲於一計算機可讀取存儲介質中,所述的存儲介質,如R0M/RAM、磁碟、光碟等。
[0106]以上內容僅為本發明的較佳實施例,對於本領域的普通技術人員,依據本發明的思想,在【具體實施方式】及應用範圍上均會有改變之處,本說明書內容不應理解為對本發明的限制。
【權利要求】
1.一種音頻處理設備,其特徵在於,所述音頻處理設備包括: 第一提取單元,用於通過移動終端,從音頻流中提取攜帶待目標內容的音頻數據; 識別單元,用於識別出所述音頻數據對應的文字內容; 第二提取單元,用於獲取用戶的偏好語言,以作為目標語言; 轉換單元,用於將所述文字內容轉成目標語言格式的文字內容,所述目標語言格式的文字內容為採用目標語言描述的文字內容; 替代單元,用於將所述目標語言格式的文字內容,轉換為目標語言格式的音頻數據,以替代所述待目標的音頻數據。
2.根據權利要求1所述的音頻處理設備,其特徵在於,所述識別單元利用語音識別技術,來識別出所述音頻數據對應的文字內容。
3.根據權利要求1所述的音頻處理設備,其特徵在於,所述音頻處理設備還包括: 視頻提取單元,用於通過移動終端,從視頻流中提取與字幕相關的視頻數據; 視頻識別單元,用於根據字幕相關的視頻數據,識別出字幕內容。
4.根據權利要求3所述的音頻處理設備,其特徵在於,所述音頻處理設備還包括: 視頻轉換單元,用於將所述字幕內容,轉換成目標語言格式的字幕內容,所述目標語言格式的字幕內容為採用目標語言描述的字幕內容; 視頻替代單元,用於將所述目標語言格式的字幕內容,轉換為目標語言格式的視頻數據,以替代所述與字幕相關的視頻數據。
5.根據權利要求1-4中任意一項所述的音頻處理設備,其特徵在於,所述音頻處理設備還包括: 時間戳單元,用於預先獲取所述音頻數據與所述視頻數據的同步時間戳; 同步單元,用於通過所述同步時間戳,控制所述翻譯語言格式的音頻數據與和所述翻譯語言格式的視頻數據同步。
6.一種音頻處理方法,其特徵在於,所述方法包括: 通過移動終端,從音頻流中提取攜帶待翻譯內容的音頻數據; 識別出所述音頻數據對應的文字內容; 獲取用戶的偏好語言,以作為目標語言; 將所述文字內容轉換成目標語言格式的文字內容,所述目標語言格式的文字內容為採用目標語言描述的文字內容; 將所述目標語言格式的文字內容,轉換為目標語言格式的音頻數據,以替代所述待轉換的音頻數據。
7.根據權利要求6所述的音頻處理方法,其特徵在於,利用語音識別技術,來識別出所述音頻數據對應的文字內容。
8.根據權利要求6所述的音頻處理方法,其特徵在於,所述方法還包括: 通過移動終端,從視頻流中提取與字幕相關的視頻數據; 根據字幕相關的視頻數據,識別出字幕內容; 將所述字幕內容,轉換成目標語言格式的字幕內容,所述目標語言格式的字幕內容為採用目標語言描述的字幕內容; 將所述目標語言格式的字幕內容,轉換為目標語言格式的視頻數據,以替換所述與字幕相關的視頻 數據。
【文檔編號】H04N21/8547GK103491429SQ201310397999
【公開日】2014年1月1日 申請日期:2013年9月4日 優先權日:2013年9月4日
【發明者】黃家旺 申請人:張家港保稅區潤桐電子技術研發有限公司