基於人工智慧的語音翻譯方法、裝置、終端設備和雲端伺服器與流程
2023-06-17 21:09:37

本申請涉及語音處理技術領域,尤其涉及一種基於人工智慧的語音翻譯方法、裝置、終端設備和雲端伺服器。
背景技術:
目前在出境遊市場,翻譯軟體基本基於手機端,雖然可以解決一些場景的語言交流難題,但由於在境外使用場景時,語言翻譯準確度低,而且出行時地圖和/或拍照等應用(application;以下簡稱:app)使用的粘性更高,翻譯app由於需要切換app調用,在即時性滿足上有缺陷。同時,越來越多的中老年出遊人群,對於手機軟體使用教育成本較高,對於「傻瓜型」即按即用的翻譯機存在強烈需求。
但是現有的翻譯類硬體產品,基本是電子詞典的變型,多為文字查詢,語音實時翻譯的產品很少,並且準確率較低。另外,現有的翻譯類硬體產品多是解決語言學習需求,對於出境遊場景的翻譯支持度不高,翻譯準確率較低。
技術實現要素:
本申請的目的旨在至少在一定程度上解決相關技術中的技術問題之一。
為此,本申請的第一個目的在於提出一種基於人工智慧的語音翻譯方法。該方法可以實現語音的實時翻譯,滿足出境遊場景的翻譯需求,並且翻譯準確率較高。
本申請的第二個目的在於提出一種基於人工智慧的語音翻譯裝置。
本申請的第三個目的在於提出一種終端設備。
本申請的第四個目的在於提出一種雲端伺服器。
本申請的第五個目的在於提出一種包含計算機可執行指令的存儲介質。
為了實現上述目的,本申請第一方面實施例的基於人工智慧的語音翻譯方法,包括:接收用戶通過終端設備輸入的源語種的語音;將所述源語種的語音發送至雲端伺服器;接收所述雲端伺服器發送的目標語種的音頻文件,所述目標語種的音頻文件是所述雲端伺服器對所述源語種的語音進行語音識別,確定將所述源語種的語音翻譯為至少兩種目標語種中除所述源語種之外的至少一種目標語種之後,將語音識別獲得的文本翻譯成確定的目標語種的文本,以及對翻譯成的目標語種的文本進行語音合成後獲得的;播放所述目標語種的音頻文件。
本申請實施例的基於人工智慧的語音翻譯方法中,接收用戶通過終端設備輸入的源語種的語音之後,將上述源語種的語音發送至雲端伺服器,然後接收上述雲端伺服器發送的目標語種的音頻文件,最後播放上述目標語種的音頻文件,從而可以實現語音的實時翻譯,滿足出境遊場景的翻譯需求,並且翻譯準確率較高。
為了實現上述目的,本申請第二方面實施例的基於人工智慧的語音翻譯方法,包括:接收終端設備發送的源語種的語音;對所述源語種的語音進行語音識別,將所述源語種的語音轉化為源語種的文本;確定將所述源語種的語音翻譯為至少兩種目標語種中除所述源語種之外的至少一種目標語種;將所述源語種的文本翻譯成確定的目標語種的文本,對翻譯成的目標語種的文本進行語音合成,獲得目標語種的音頻文件;將所述目標語種的音頻文件發送給所述終端設備,以供所述終端設備播放。
本申請實施例的基於人工智慧的語音翻譯方法中,接收終端設備發送的源語種的語音之後,對上述源語種的語音進行語音識別,將上述源語種的語音轉化為源語種的文本,在確定將上述源語種的語音翻譯為至少兩種目標語種中除上述源語種之外的至少一種目標語種之後,將上述源語種的文本翻譯成確定的目標語種的文本,並對翻譯成的目標語種的文本進行語音合成,獲得目標語種的音頻文件,最後將上述目標語種的音頻文件發送給上述終端設備,以供上述終端設備播放,從而可以實現語音的實時翻譯,滿足出境遊場景的翻譯需求,並且翻譯準確率較高。
為了實現上述目的,本申請第三方面實施例的基於人工智慧的語音翻譯裝置,設置在終端設備上,所述基於人工智慧的語音翻譯裝置包括:接收模塊,用於接收用戶通過終端設備輸入的源語種的語音;發送模塊,用於將所述源語種的語音發送至雲端伺服器;所述接收模塊,還用於接收所述雲端伺服器發送的目標語種的音頻文件,所述目標語種的音頻文件是所述雲端伺服器對所述源語種的語音進行語音識別,確定將所述源語種的語音翻譯為至少兩種目標語種中除所述源語種之外的至少一種目標語種之後,將語音識別獲得的文本翻譯成確定的目標語種的文本,以及對翻譯成的目標語種的文本進行語音合成後獲得的;播放模塊,用於播放所述目標語種的音頻文件。
本申請實施例的基於人工智慧的語音翻譯裝置中,接收模塊接收用戶通過終端設備輸入的源語種的語音之後,發送模塊將上述源語種的語音發送至雲端伺服器,然後接收模塊接收上述雲端伺服器發送的目標語種的音頻文件,最後播放模塊播放上述目標語種的音頻文件,從而可以實現語音的實時翻譯,滿足出境遊場景的翻譯需求,並且翻譯準確率較高。
為了實現上述目的,本申請第四方面實施例的基於人工智慧的語音翻譯裝置,設置在雲端伺服器上,所述基於人工智慧的語音翻譯裝置包括:接收模塊,用於接收終端設備發送的源語種的語音;語音識別模塊,用於對所述源語種的語音進行語音識別,將所述源語種的語音轉化為源語種的文本;確定模塊,用於確定將所述源語種的語音翻譯為至少兩種目標語種中除所述源語種之外的至少一種目標語種;翻譯模塊,用於將所述源語種的文本翻譯成所述確定模塊確定的目標語種的文本;語音合成模塊,用於對所述翻譯模塊翻譯成的目標語種的文本進行語音合成,獲得目標語種的音頻文件;發送模塊,用於將所述語音合成模塊獲得的目標語種的音頻文件發送給所述終端設備,以供所述終端設備播放。
本申請實施例的基於人工智慧的語音翻譯裝置中,接收模塊接收終端設備發送的源語種的語音之後,語音識別模塊對上述源語種的語音進行語音識別,將上述源語種的語音轉化為源語種的文本,在確定模塊確定將上述源語種的語音翻譯為至少兩種目標語種中除上述源語種之外的至少一種目標語種之後,翻譯模塊將上述源語種的文本翻譯成確定的目標語種的文本,語音合成模塊對翻譯成的目標語種的文本進行語音合成,獲得目標語種的音頻文件,最後發送模塊將上述目標語種的音頻文件發送給上述終端設備,以供上述終端設備播放,從而可以實現語音的實時翻譯,滿足出境遊場景的翻譯需求,並且翻譯準確率較高。
為了實現上述目的,本申請第五方面實施例的終端設備,包括:一個或多個處理器;存儲器,用於存儲一個或多個程序;接收器,用於接收用戶通過終端設備輸入的源語種的語音;以及在發送器將所述源語種的語音發送至雲端伺服器之後,接收所述雲端伺服器發送的目標語種的音頻文件,所述目標語種的音頻文件是所述雲端伺服器對所述源語種的語音進行語音識別,確定將所述源語種的語音翻譯為至少兩種目標語種中除所述源語種之外的至少一種目標語種之後,將語音識別獲得的文本翻譯成確定的目標語種的文本,以及對翻譯成的目標語種的文本進行語音合成後獲得的;所述發送器,用於將所述源語種的語音發送至雲端伺服器;當所述一個或多個程序被所述一個或多個處理器執行,使得所述一個或多個處理器實現如上所述的方法。
為了實現上述目的,本申請第六方面實施例提供一種包含計算機可執行指令的存儲介質,所述計算機可執行指令在由計算機處理器執行時用於執行如上所述的方法。
為了實現上述目的,本申請第七方面實施例的雲端伺服器,包括:一個或多個處理器;存儲器,用於存儲一個或多個程序;接收器,用於接收終端設備發送的源語種的語音;發送器,用於將目標語種的音頻文件發送給所述終端設備,以供所述終端設備播放;當所述一個或多個程序被所述一個或多個處理器執行,使得所述一個或多個處理器實現如上所述的方法。
為了實現上述目的,本申請第八方面實施例提供一種包含計算機可執行指令的存儲介質,所述計算機可執行指令在由計算機處理器執行時用於執行如上所述的方法。
本申請附加的方面和優點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本申請的實踐了解到。
附圖說明
本申請上述的和/或附加的方面和優點從下面結合附圖對實施例的描述中將變得明顯和容易理解,其中:
圖1為本申請基於人工智慧的語音翻譯方法一個實施例的流程圖;
圖2為本申請基於人工智慧的語音翻譯方法另一個實施例的流程圖;
圖3為本申請基於人工智慧的語音翻譯方法中終端設備一個實施例的示意圖;
圖4為本申請基於人工智慧的語音翻譯方法再一個實施例的流程圖;
圖5為本申請基於人工智慧的語音翻譯方法再一個實施例的流程圖;
圖6為本申請基於人工智慧的語音翻譯方法再一個實施例的流程圖;
圖7為本申請基於人工智慧的語音翻譯方法再一個實施例的流程圖;
圖8為本申請基於人工智慧的語音翻譯方法再一個實施例的流程圖;
圖9為本申請基於人工智慧的語音翻譯方法再一個實施例的流程圖;
圖10為本申請基於人工智慧的語音翻譯裝置一個實施例的結構示意圖;
圖11為本申請基於人工智慧的語音翻譯裝置另一個實施例的結構示意圖;
圖12為本申請基於人工智慧的語音翻譯裝置再一個實施例的結構示意圖;
圖13為本申請基於人工智慧的語音翻譯裝置再一個實施例的結構示意圖;
圖14為本申請終端設備一個實施例的結構示意圖;
圖15為本申請雲端伺服器一個實施例的結構示意圖。
具體實施方式
下面詳細描述本申請的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的,僅用於解釋本申請,而不能理解為對本申請的限制。相反,本申請的實施例包括落入所附加權利要求書的精神和內涵範圍內的所有變化、修改和等同物。
人工智慧(artificialintelligence;以下簡稱:ai)是研究、開發用於模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。人工智慧是計算機科學的一個分支,它企圖了解智能的實質,並生產出一種新的能以人類智能相似的方式做出反應的智能機器,該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統等。
圖1為本申請基於人工智慧的語音翻譯方法一個實施例的流程圖,如圖1所示,上述基於人工智慧的語音翻譯方法可以包括:
步驟101,接收用戶通過終端設備輸入的源語種的語音。
步驟102,將上述源語種的語音發送至雲端伺服器。
具體地,終端設備可以通過脈衝編碼調製(pulsecodemodulation;以下簡稱:pcm)格式將上述源語種的語音上傳至雲端伺服器。
步驟103,接收上述雲端伺服器發送的目標語種的音頻文件,上述目標語種的音頻文件是雲端伺服器對上述源語種的語音進行語音識別,確定將上述源語種的語音翻譯為至少兩種目標語種中除上述源語種之外的至少一種目標語種之後,將語音識別獲得的文本翻譯成確定的目標語種的文本,以及對翻譯成的目標語種的文本進行語音合成後獲得的。
具體地,雲端伺服器發送給終端設備的目標語種的音頻文件也是pcm格式的文件。
雲端伺服器對翻譯成的目標語種的文本進行語音合成採用的是從文本到語音(texttospeech;以下簡稱:tts)服務。
步驟104,播放上述目標語種的音頻文件。
上述基於人工智慧的語音翻譯方法中,接收用戶通過終端設備輸入的源語種的語音之後,將上述源語種的語音發送至雲端伺服器,然後接收上述雲端伺服器發送的目標語種的音頻文件,最後播放上述目標語種的音頻文件,從而可以實現語音的實時翻譯,滿足出境遊場景的翻譯需求,並且翻譯準確率較高。
圖2為本申請基於人工智慧的語音翻譯方法另一個實施例的流程圖,如圖2所示,本申請圖1所示實施例中步驟101可以為:
步驟201,接收用戶在觸發上述終端設備的翻譯按鍵之後通過上述終端設備的麥克風輸入的源語種的語音。
本實施例中,上述終端設備的翻譯按鍵可以為上述終端設備上設置的機械按鍵,也可以為上述終端設備上設置的虛擬按鍵,本實施例對上述翻譯案件的形態不作限定,但本實施例以上述翻譯按鍵為上述終端設備上設置的機械按鍵為例進行說明。
其中,觸發上述翻譯按鍵的方式可以為長按,也可以為單次點擊或雙擊等等,本實施例對觸發上述翻譯按鍵的方式不作限定,本實施例以觸發上述翻譯按鍵的方式為長按為例進行說明。
需要說明的是,本實施例中,上述終端設備的翻譯按鍵的數量為1個,如圖3所示,圖3為本申請基於人工智慧的語音翻譯方法中終端設備一個實施例的示意圖。
也就是說,本實施例的終端設備在硬體設計上,語音識別+翻譯可以以一個機械鍵觸發。用戶使用時,只要長按翻譯按鍵,向麥克風說出想要翻譯的語音,例如:「我想去最近的地鐵站」,然後鬆開翻譯按鍵,上述終端設備將播放出「iwanttogotothenearestsubwaystation」的語音結果,從而實現了語音的實時「一鍵」翻譯。
圖4為本申請基於人工智慧的語音翻譯方法再一個實施例的流程圖,如圖4所示,本申請圖1所示實施例中,步驟103之前,還可以包括:
步驟401,獲得上述用戶設置的目標語種,將上述用戶設置的目標語種上傳至上述雲端伺服器,以便上述雲端伺服器對應保存上述終端設備的標識與上述目標語種,上述目標語種包括至少兩種語種,上述至少兩種語種中包括上述源語種。
具體地,用戶在終端設備上設置目標語種之後,終端設備就可以獲得上述用戶設置的目標語種,然後終端設備將上述用戶設置的目標語種上傳至上述雲端伺服器,由雲端伺服器對應保存上述終端設備的標識與上述目標語種,其中,上述終端設備的標識為可以唯一標識上述終端設備的信息,例如:上述終端設備的設備號,本實施例對上述終端設備的標識的形式不作限定。
上述目標語種可以包括至少兩種語種,上述至少兩種語種中包括上述源語種,也就是說,本實施例中,終端設備可以在用戶設置的至少兩種目標語種中實現語音互譯。舉例來說,假設用戶設置的目標語種為「中英」,那麼用戶在按住上述終端設備的唯一的翻譯按鍵之後,向上述終端設備說中文「我想去最近的地鐵站」,然後鬆開翻譯按鍵,通過本申請提供的基於人工智慧的語音翻譯方法,上述終端設備將播放出「iwanttogotothenearestsubwaystation」的語音結果;而如果用戶在按住上述終端設備的唯一的翻譯按鍵之後,向上述終端設備說英文「iwanttogotothenearestsubwaystation」,然後鬆開翻譯按鍵,通過本申請提供的基於人工智慧的語音翻譯方法,上述終端設備將播放出「我想去最近的地鐵站」的語音結果。
同理,上述目標語種也可以為「中英日」,那麼上述終端設備將在中文、英文和日文之間實現語音互譯,用戶如果輸入一句中文,那麼終端設備將依次播放這句中文的日文譯文和英文譯文,如果輸入一句英文,那麼終端設備將依次播放這句英文的中文譯文和日文譯文,以此類推,在此不再贅述。
通過上面的描述可以看出,本實施例中,無論是需要將中文翻譯為英文,還是將英文翻譯為中文,都是通過同一翻譯按鍵觸發源語種的語音的輸入,這提高了本申請中終端設備的易用性,方便用戶的使用。
圖5為本申請基於人工智慧的語音翻譯方法再一個實施例的流程圖,本實施例中,上述用戶包括第一用戶和第二用戶,上述目標語種包括第一語種和第二語種;如圖5所示,上述基於人工智慧的語音翻譯方法可以包括:
步驟501,接收第一用戶通過終端設備輸入的源語種的語音。
步驟502,將上述源語種的語音發送至雲端伺服器。
步驟503,接收上述雲端伺服器發送的第二語種的音頻文件,上述第二語種的音頻文件是雲端伺服器對上述源語種的語音進行語音識別和聲紋識別,確定上述源語種的語音為第一用戶通過上述終端設備輸入的第一語種的語音,以及確定將上述第一語種的語音翻譯為第二語種之後,將語音識別獲得的文本翻譯成第二語種的文本,以及對翻譯成的第二語種的文本進行語音合成後獲得的。
步驟504,播放上述第二語種的音頻文件。
步驟505,接收第二用戶通過上述終端設備輸入的另一源語種的語音。
步驟506,將上述另一源語種的語音發送至雲端伺服器。
步驟507,接收上述雲端伺服器發送的第一語種的音頻文件,上述第一語種的音頻文件是雲端伺服器對上述另一源語種的語音進行語音識別和聲紋識別,確定上述另一源語種的語音為第二用戶通過上述終端設備輸入的第二語種的語音,以及確定將上述第二語種的語音翻譯為第一語種之後,將語音識別獲得的文本翻譯成上述第一語種的文本,以及對翻譯成的第一語種的文本進行語音合成後獲得的。
步驟508,播放上述第一語種的音頻文件。
如上所述,本實施例可以實現多輪語音互譯,仍以目標語種為中文和英文為例,在出入境海關、點餐結帳、購物砍價和/或酒店入住離店等場景,第一用戶可以長按上述終端設備的翻譯按鍵,通過上述終端設備的麥克風向上述終端設備輸入一段中文語音,然後按照本申請提供的基於人工智慧的語音翻譯方法,上述終端設備將獲得上述中文語音對應的英文譯文的語音,並播放出來,第二用戶聽了這段英文譯文的語音之後,仍然可以長按上述終端設備的翻譯按鍵,通過上述終端設備的麥克風向上述終端設備輸入一段英文語音,然後按照本申請提供的基於人工智慧的語音翻譯方法,上述終端設備將獲得上述英文語音對應的中文譯文的語音,並播放出來,這樣,第一用戶與第二用戶通過上述終端設備就可以實現順暢溝通,可充分滿足出境遊等場景的翻譯需求。
進一步地,本申請提供的基於人工智慧的語音翻譯方法中,還可以將上述終端設備的無線通信信號提供給另一終端設備,以供上述另一終端設備連接到網際網路。具體地,上述終端設備的無線通信信號可以為無線保真(wirelessfidelity;以下簡稱:wifi)信號,也就是說,本實施例中,上述終端設備還具備wifi功能,用戶可以通過無線網絡查找並連接到上述終端設備提供的wifi,滿足手機和/或電腦等至少一臺電子設備的上網需求,並且與手機蜂窩網絡境外漫遊相比價格更便宜,信號更穩定。
上述實施例中的終端設備將實時語音翻譯功能與原有的隨身wifi功能相結合,既能暢享網絡,又可以在需要時一鍵調用26國語種的語音實時翻譯。在商務交流、多語言學習、出入境旅遊和/或景點導覽等場景可以高效滿足用戶的上網及翻譯需求,提高了用戶體驗。
圖6為本申請基於人工智慧的語音翻譯方法再一個實施例的流程圖,如圖6所示,上述基於人工智慧的語音翻譯方法可以包括:
步驟601,接收終端設備發送的源語種的語音。
具體地,上述源語種的語音為pcm格式。
步驟602,對上述源語種的語音進行語音識別,將上述源語種的語音轉化為源語種的文本。
步驟603,確定將上述源語種的語音翻譯為至少兩種目標語種中除上述源語種之外的至少一種目標語種。
步驟604,將上述源語種的文本翻譯成確定的目標語種的文本,對翻譯成的目標語種的文本進行語音合成,獲得目標語種的音頻文件。
具體地,可以通過tts服務對翻譯成的目標語種的文本進行語音合成,獲得目標語種的音頻文件。
步驟605,將上述目標語種的音頻文件發送給上述終端設備,以供上述終端設備播放。
上述基於人工智慧的語音翻譯方法中,接收終端設備發送的源語種的語音之後,對上述源語種的語音進行語音識別,將上述源語種的語音轉化為源語種的文本,在確定將上述源語種的語音翻譯為至少兩種目標語種中除上述源語種之外的至少一種目標語種之後,將上述源語種的文本翻譯成確定的目標語種的文本,並對翻譯成的目標語種的文本進行語音合成,獲得目標語種的音頻文件,最後將上述目標語種的音頻文件發送給上述終端設備,以供上述終端設備播放,從而可以實現語音的實時翻譯,滿足出境遊場景的翻譯需求,並且翻譯準確率較高。
圖7為本申請基於人工智慧的語音翻譯方法再一個實施例的流程圖,本實施例中,上述目標語種可以包括第一語種和第二語種;如圖7所示,本申請圖6所示實施例中,步驟603可以包括:
步驟701,對上述源語種的語音進行聲紋識別,確定上述源語種的語音為第一用戶通過上述終端設備輸入的第一語種的語音。
步驟702,根據預先保存的上述終端設備的標識對應的目標語種,確定將上述第一語種的語音翻譯為第二語種的音頻文件。
也就是說,本實施例中,雲端伺服器通過聲紋識別,確定上述源語種的語音為第一用戶輸入的第一語種的語音之後,根據上述終端設備的標識查找到上述終端設備的標識對應的目標語種包括第一語種和第二語種,由於源語種是第一語種,因此雲端伺服器可以確定需要將上述第一語種的語音翻譯為第二語種的音頻文件。
圖8為本申請基於人工智慧的語音翻譯方法再一個實施例的流程圖,如圖8所示,可以包括:
步驟801,接收終端設備發送的源語種的語音。
步驟802,對上述源語種的語音進行語音識別,將上述源語種的語音轉化為源語種的文本。
步驟803,對上述源語種的語音進行聲紋識別,確定上述源語種的語音為第一用戶通過上述終端設備輸入的第一語種的語音。
步驟804,根據預先保存的上述終端設備的標識對應的目標語種,確定將上述第一語種的語音翻譯為第二語種的音頻文件。
步驟805,將上述源語種的文本翻譯成第二語種的文本,對翻譯成的第二語種的文本進行語音合成,獲得第二語種的音頻文件。
步驟806,將上述第二語種的音頻文件發送給上述終端設備,以供上述終端設備播放。
步驟807,接收終端設備發送的另一源語種的語音。
步驟808,對上述另一源語種的語音進行聲紋識別,確定上述另一源語種的語音為第二用戶通過上述終端設備輸入的第二語種的語音。
步驟809,對上述第二語種的語音進行語音識別,將上述第二語種的語音轉化為第二語種的文本。
步驟810,根據預先保存的上述終端設備的標識對應的目標語種,確定將上述第二語種的語音翻譯為第一語種的音頻文件。
步驟811,將上述第二語種的文本翻譯成第一語種的文本,對上述第一語種的文本進行語音合成,獲得第一語種的音頻文件。
步驟812,將上述第一語種的音頻文件發送給上述終端設備,以供上述終端設備播放。
如上所述,本實施例可以實現多輪語音互譯,仍以目標語種為中文和英文為例,在出入境海關、點餐結帳、購物砍價和/或酒店入住離店等場景,第一用戶可以長按上述終端設備的翻譯按鍵,通過上述終端設備的麥克風向上述終端設備輸入一段中文語音,然後上述終端設備將這段中文語音發送給雲端伺服器,雲端伺服器按照本申請提供的基於人工智慧的語音翻譯方法將上述中文語音翻譯為英文的音頻文件,再將翻譯好的英文的音頻文件發送給終端設備,並由終端設備播放出來,第二用戶聽了這段英文語音之後,仍然可以長按上述終端設備的翻譯按鍵,通過上述終端設備的麥克風向上述終端設備輸入一段英文語音,然後上述終端設備將這段英文語音發送給雲端伺服器,雲端伺服器按照本申請提供的基於人工智慧的語音翻譯方法將上述英文語音翻譯為中文的音頻文件,再將翻譯好的中文的音頻文件發送給終端設備,並由終端設備播放出來,這樣,第一用戶與第二用戶通過上述終端設備就可以實現順暢溝通,可充分滿足出境遊等場景的翻譯需求。
圖9為本申請基於人工智慧的語音翻譯方法再一個實施例的流程圖,如圖9所示,本申請圖6所示實施例中,步驟604之前,還可以包括:
步驟901,接收上述終端設備上傳的目標語種,對應保存上述終端設備的標識與上述目標語種,上述目標語種包括至少兩種語種,上述至少兩種語種中包括上述源語種。
這樣,步驟604可以為:
步驟902,根據上述終端設備的標識,調用上述終端設備的標識對應的目標語種的語料庫,將上述源語種的文本翻譯成確定的目標語種的文本,對翻譯成的目標語種的文本進行語音合成,獲得目標語種的音頻文件。
本實施例中,終端設備獲得上述用戶設置的目標語種之後,可以將上述用戶設置的目標語種上傳至上述雲端伺服器,由雲端伺服器對應保存上述終端設備的標識與上述目標語種,其中,上述終端設備的標識為可以唯一標識上述終端設備的信息,例如:上述終端設備的設備號,本實施例對上述終端設備的標識的形式不作限定。
上述目標語種可以包括至少兩種語種,上述至少兩種語種中包括上述源語種,也就是說,本實施例可以在用戶設置的至少兩種目標語種中實現語音互譯。舉例來說,假設用戶設置的目標語種為「中英」,那麼用戶在按住上述終端設備的唯一的翻譯按鍵之後,向上述終端設備說中文「我想去最近的地鐵站」,然後鬆開翻譯按鍵,通過本申請提供的基於人工智慧的語音翻譯方法,上述終端設備將播放出「iwanttogotothenearestsubwaystation」的語音結果;而如果用戶在按住上述終端設備的唯一的翻譯按鍵之後,向上述終端設備說英文「iwanttogotothenearestsubwaystation」,然後鬆開翻譯按鍵,通過本申請提供的基於人工智慧的語音翻譯方法,上述終端設備將播放出「我想去最近的地鐵站」的語音結果。
同理,上述目標語種也可以為「中英日」,那麼本實施例將在中文、英文和日文之間實現語音互譯,用戶如果輸入一句中文,那麼通過本申請提供的基於人工智慧的語音翻譯方法,終端設備將依次播放這句中文的日文譯文和英文譯文,如果輸入一句英文,那麼通過本申請提供的基於人工智慧的語音翻譯方法,終端設備將依次播放這句英文的中文譯文和日文譯文,以此類推,在此不再贅述。
通過上面的描述可以看出,本實施例中,無論是需要將中文翻譯為英文,還是將英文翻譯為中文,都是通過同一翻譯按鍵觸發源語種的語音的輸入,這提高了本申請中終端設備的易用性,方便用戶的使用。
圖10為本申請基於人工智慧的語音翻譯裝置一個實施例的結構示意圖,本實施例中的基於人工智慧的語音翻譯裝置可以設置在終端設備上實現本申請圖1~圖5所示實施例提供的方法。上述終端設備可以為集成了wifi功能的翻譯設備,本實施例對上述終端設備的形態不作限定。
如圖10所示,上述基於人工智慧的語音翻譯裝置可以包括:接收模塊1001、發送模塊1002和播放模塊1003;
其中,接收模塊1001,用於接收用戶通過終端設備輸入的源語種的語音;
發送模塊1002,用於將上述源語種的語音發送至雲端伺服器;具體地,發送模塊1002可以通過pcm格式將上述源語種的語音上傳至雲端伺服器。
接收模塊1001,還用於接收上述雲端伺服器發送的目標語種的音頻文件,上述目標語種的音頻文件是雲端伺服器對上述源語種的語音進行語音識別,確定將上述源語種的語音翻譯為至少兩種目標語種中除上述源語種之外的至少一種目標語種之後,將語音識別獲得的文本翻譯成確定的目標語種的文本,以及對翻譯成的目標語種的文本進行語音合成後獲得的;具體地,雲端伺服器發送給終端設備的目標語種的音頻文件也是pcm格式的文件。
雲端伺服器對翻譯成的目標語種的文本進行語音合成採用的是tts服務。
播放模塊1003,用於播放上述目標語種的音頻文件。
上述基於人工智慧的語音翻譯裝置中,接收模塊1001接收用戶通過終端設備輸入的源語種的語音之後,發送模塊1002將上述源語種的語音發送至雲端伺服器,然後接收模塊1001接收上述雲端伺服器發送的目標語種的音頻文件,最後播放模塊1003播放上述目標語種的音頻文件,從而可以實現語音的實時翻譯,滿足出境遊場景的翻譯需求,並且翻譯準確率較高。
圖11為本申請基於人工智慧的語音翻譯裝置另一個實施例的結構示意圖,本實施例中,接收模塊1001,具體用於接收用戶在觸發上述終端設備的翻譯按鍵之後通過上述終端設備的麥克風輸入的源語種的語音。本實施例中,上述終端設備的翻譯按鍵可以為上述終端設備上設置的機械按鍵,也可以為上述終端設備上設置的虛擬按鍵,本實施例對上述翻譯案件的形態不作限定,但本實施例以上述翻譯按鍵為上述終端設備上設置的機械按鍵為例進行說明。
其中,觸發上述翻譯按鍵的方式可以為長按,也可以為單次點擊或雙擊等等,本實施例對觸發上述翻譯按鍵的方式不作限定,本實施例以觸發上述翻譯按鍵的方式為長按為例進行說明。
需要說明的是,本實施例中,上述終端設備的翻譯按鍵的數量為1個,如圖3所示。
也就是說,本實施例的終端設備在硬體設計上,語音識別+翻譯可以以一個機械鍵觸發。用戶使用時,只要長按翻譯按鍵,向麥克風說出想要翻譯的語音,例如:「我想去最近的地鐵站」,然後鬆開翻譯按鍵,上述終端設備將播放出「iwanttogotothenearestsubwaystation」的語音結果,從而實現了語音的實時「一鍵」翻譯。
進一步地,上述基於人工智慧的語音翻譯裝置還可以包括:獲得模塊1004;
獲得模塊1004,用於在接收模塊1001接收上述雲端伺服器發送的目標語種的音頻文件之前,獲得上述用戶設置的目標語種;
發送模塊1002,還用於將上述用戶設置的目標語種上傳至上述雲端伺服器,以便上述雲端伺服器對應保存上述終端設備的標識與上述目標語種,上述目標語種包括至少兩種語種,上述至少兩種語種中包括上述源語種。
具體地,用戶在終端設備上設置目標語種之後,獲得模塊1004就可以獲得上述用戶設置的目標語種,然後發送模塊1002將上述用戶設置的目標語種上傳至上述雲端伺服器,由雲端伺服器對應保存上述終端設備的標識與上述目標語種,其中,上述終端設備的標識為可以唯一標識上述終端設備的信息,例如:上述終端設備的設備號,本實施例對上述終端設備的標識的形式不作限定。
上述目標語種可以包括至少兩種語種,上述至少兩種語種中包括上述源語種,也就是說,本實施例可以在用戶設置的至少兩種目標語種中實現語音互譯。舉例來說,假設用戶設置的目標語種為「中英」,那麼用戶在按住上述終端設備的唯一的翻譯按鍵之後,向上述終端設備說中文「我想去最近的地鐵站」,然後鬆開翻譯按鍵,播放模塊1003將播放出「iwanttogotothenearestsubwaystation」的語音結果;而如果用戶在按住上述終端設備的唯一的翻譯按鍵之後,向上述終端設備說英文「iwanttogotothenearestsubwaystation」,然後鬆開翻譯按鍵,播放模塊1003將播放出「我想去最近的地鐵站」的語音結果。
同理,上述目標語種也可以為「中英日」,那麼上述終端設備將在中文、英文和日文之間實現語音互譯,用戶如果輸入一句中文,那麼播放模塊1003將依次播放這句中文的日文譯文和英文譯文,如果輸入一句英文,那麼播放模塊1003將依次播放這句英文的中文譯文和日文譯文,以此類推,在此不再贅述。
通過上面的描述可以看出,本實施例中,無論是需要將中文翻譯為英文,還是將英文翻譯為中文,都是通過同一翻譯按鍵觸發源語種的語音的輸入,這提高了本申請中終端設備的易用性,方便用戶的使用。
本實施例中,上述用戶包括第一用戶和第二用戶,上述目標語種包括第一語種和第二語種;
上述目標語種的音頻文件包括上述第二語種的音頻文件,上述第二語種的音頻文件是雲端伺服器對上述源語種的語音進行語音識別和聲紋識別,確定上述源語種的語音為第一用戶通過上述終端設備輸入的第一語種的語音,以及確定將上述第一語種的語音翻譯為第二語種之後,將語音識別獲得的文本翻譯成第二語種的文本,以及對翻譯成的第二語種的文本進行語音合成後獲得的;
接收模塊1001,還用於在播放模塊1003播放上述目標語種的音頻文件之後,接收第二用戶通過上述終端設備輸入的另一源語種的語音;
發送模塊1002,還用於將上述另一源語種的語音發送至雲端伺服器;
接收模塊1001,還用於接收上述雲端伺服器發送的第一語種的音頻文件,上述第一語種的音頻文件是雲端伺服器對上述另一源語種的語音進行語音識別和聲紋識別,確定上述另一源語種的語音為第二用戶通過上述終端設備輸入的第二語種的語音,以及確定將上述第二語種的語音翻譯為第一語種之後,將語音識別獲得的文本翻譯成上述第一語種的文本,以及對翻譯成的第一語種的文本進行語音合成後獲得的;
播放模塊1003,還用於播放上述第一語種的音頻文件。
如上所述,本實施例的基於人工智慧的語音翻譯裝置可以實現多輪語音互譯,仍以目標語種為中文和英文為例,在出入境海關、點餐結帳、購物砍價和/或酒店入住離店等場景,第一用戶可以長按上述終端設備的翻譯按鍵,通過上述終端設備的麥克風向上述終端設備輸入一段中文語音,然後上述基於人工智慧的語音翻譯裝置獲得上述中文語音對應的英文譯文的語音,並播放出來,第二用戶聽了這段英文譯文的語音之後,仍然可以長按上述終端設備的翻譯按鍵,通過上述終端設備的麥克風向上述終端設備輸入一段英文語音,然後上述基於人工智慧的語音翻譯裝置獲得上述英文語音對應的中文譯文的語音,並播放出來,這樣,第一用戶與第二用戶通過上述基於人工智慧的語音翻譯裝置就可以實現順暢溝通,可充分滿足出境遊等場景的翻譯需求。
進一步地,上述基於人工智慧的語音翻譯裝置還可以包括:
無線信號提供模塊1005,用於將上述終端設備的無線通信信號提供給另一終端設備,以供上述另一終端設備連接到網際網路。
具體地,上述終端設備的無線通信信號可以為wifi信號,也就是說,本實施例中,上述基於人工智慧的語音翻譯裝置還具備wifi功能,用戶可以通過無線網絡查找並連接到上述基於人工智慧的語音翻譯裝置提供的wifi,滿足手機和/或電腦等至少一臺電子設備的上網需求,並且與手機蜂窩網絡境外漫遊相比價格更便宜,信號更穩定。
上述實施例中的基於人工智慧的語音翻譯裝置將實時語音翻譯功能與原有的隨身wifi功能相結合,既能暢享網絡,又可以在需要時一鍵調用26國語種的語音實時翻譯。在商務交流、多語言學習、出入境旅遊和/或景點導覽等場景可以高效滿足用戶的上網及翻譯需求,提高了用戶體驗。
圖12為本申請基於人工智慧的語音翻譯裝置再一個實施例的結構示意圖,本實施例中的基於人工智慧的語音翻譯裝置可以作為雲端伺服器,或者雲端伺服器的一部分實現本申請圖6~圖9實施例所示的基於人工智慧的語音翻譯方法。
如圖12所示,上述基於人工智慧的語音翻譯裝置可以包括:接收模塊1201、語音識別模塊1202、確定模塊1203、翻譯模塊1204、語音合成模塊1205和發送模塊1206;
其中,接收模塊1201,用於接收終端設備發送的源語種的語音;具體地,上述源語種的語音為pcm格式。
語音識別模塊1202,用於對接收模塊1201接收的源語種的語音進行語音識別,將上述源語種的語音轉化為源語種的文本;
確定模塊1203,用於確定將上述源語種的語音翻譯為至少兩種目標語種中除上述源語種之外的至少一種目標語種;
翻譯模塊1204,用於將上述源語種的文本翻譯成確定模塊1203確定的目標語種的文本;
語音合成模塊1205,用於對翻譯模塊1204翻譯成的目標語種的文本進行語音合成,獲得目標語種的音頻文件;具體地,語音合成模塊1205可以通過tts服務對翻譯成的目標語種的文本進行語音合成,獲得目標語種的音頻文件。
發送模塊1206,用於將語音合成模塊1205獲得的目標語種的音頻文件發送給上述終端設備,以供上述終端設備播放。
上述基於人工智慧的語音翻譯裝置中,接收模塊1201接收終端設備發送的源語種的語音之後,語音識別模塊1202對上述源語種的語音進行語音識別,將上述源語種的語音轉化為源語種的文本,在確定模塊1203確定將上述源語種的語音翻譯為至少兩種目標語種中除上述源語種之外的至少一種目標語種之後,翻譯模塊1204將上述源語種的文本翻譯成確定的目標語種的文本,並由語音合成模塊1205對翻譯成的目標語種的文本進行語音合成,獲得目標語種的音頻文件,最後發送模塊1206將上述目標語種的音頻文件發送給上述終端設備,以供上述終端設備播放,從而可以實現語音的實時翻譯,滿足出境遊場景的翻譯需求,並且翻譯準確率較高。
圖13為本申請基於人工智慧的語音翻譯裝置再一個實施例的結構示意圖,本實施例中,上述目標語種包括第一語種和第二語種;
確定模塊1203,具體用於對上述源語種的語音進行聲紋識別,確定上述源語種的語音為第一用戶通過上述終端設備輸入的第一語種的語音;以及根據預先保存的上述終端設備的標識對應的目標語種,確定將上述第一語種的語音翻譯為上述第二語種的音頻文件。
也就是說,本實施例中,確定模塊1203通過聲紋識別,確定上述源語種的語音為第一用戶輸入的第一語種的語音之後,根據上述終端設備的標識查找到上述終端設備的標識對應的目標語種包括第一語種和第二語種,由於源語種是第一語種,因此確定模塊1203可以確定需要將上述第一語種的語音翻譯為第二語種的音頻文件。
本實施例中,上述目標語種的音頻文件包括第二語種的音頻文件;
接收模塊1201,還用於在發送模塊1206將上述目標語種的音頻文件發送給上述終端設備,以供上述終端設備播放之後,接收終端設備發送的另一源語種的語音;
確定模塊1203,還用於對上述另一源語種的語音進行聲紋識別,確定上述另一源語種的語音為第二用戶通過上述終端設備輸入的第二語種的語音;
語音識別模塊1202,還用於對上述第二語種的語音進行語音識別,將上述第二語種的語音轉化為第二語種的文本;
確定模塊1203,還用於根據預先保存的上述終端設備的標識對應的目標語種,確定將上述第二語種的語音翻譯為第一語種的音頻文件;
翻譯模塊1204,還用於將第二語種的文本翻譯成第一語種的文本;
語音合成模塊1205,還用於對上述第一語種的文本進行語音合成,獲得第一語種的音頻文件;
發送模塊1206,還用於將上述第一語種的音頻文件發送給上述終端設備,以供上述終端設備播放。
如上所述,本實施例可以實現多輪語音互譯,仍以目標語種為中文和英文為例,在出入境海關、點餐結帳、購物砍價和/或酒店入住離店等場景,第一用戶可以長按上述終端設備的翻譯按鍵,通過上述終端設備的麥克風向上述終端設備輸入一段中文語音,然後上述終端設備將這段中文語音發送給基於人工智慧的語音翻譯裝置,上述基於人工智慧的語音翻譯裝置按照本申請提供的基於人工智慧的語音翻譯方法將上述中文語音翻譯為英文的音頻文件,再將翻譯好的英文的音頻文件發送給終端設備,並由終端設備播放出來,第二用戶聽了這段英文語音之後,仍然可以長按上述終端設備的翻譯按鍵,通過上述終端設備的麥克風向上述終端設備輸入一段英文語音,然後上述終端設備將這段英文語音發送給基於人工智慧的語音翻譯裝置,上述基於人工智慧的語音翻譯裝置按照本申請提供的基於人工智慧的語音翻譯方法將上述英文語音翻譯為中文的音頻文件,再將翻譯好的中文的音頻文件發送給終端設備,並由終端設備播放出來,這樣,第一用戶與第二用戶通過上述終端設備就可以實現順暢溝通,可充分滿足出境遊等場景的翻譯需求。
進一步地,上述基於人工智慧的語音翻譯裝置還可以包括:保存模塊1207;
接收模塊1201,還用於在翻譯模塊1204將上述源語種的文本翻譯成確定的目標語種的文本之前,接收上述終端設備上傳的目標語種;
保存模塊1207,用於對應保存上述終端設備的標識與上述目標語種,上述目標語種包括至少兩種語種,上述至少兩種語種中包括上述源語種。
本實施例中,翻譯模塊1204,具體用於根據上述終端設備的標識,調用上述終端設備的標識對應的目標語種的語料庫,將上述源語種的文本翻譯成確定的目標語種的文本。
本實施例中,終端設備獲得上述用戶設置的目標語種之後,可以將上述用戶設置的目標語種上傳至上述基於人工智慧的語音翻譯裝置,由保存模塊1207對應保存上述終端設備的標識與上述目標語種,其中,上述終端設備的標識為可以唯一標識上述終端設備的信息,例如:上述終端設備的設備號,本實施例對上述終端設備的標識的形式不作限定。
上述目標語種可以包括至少兩種語種,上述至少兩種語種中包括上述源語種,也就是說,本實施例可以在用戶設置的至少兩種目標語種中實現語音互譯。舉例來說,假設用戶設置的目標語種為「中英」,那麼用戶在按住上述終端設備的唯一的翻譯按鍵之後,向上述終端設備說中文「我想去最近的地鐵站」,然後鬆開翻譯按鍵,上述終端設備將播放出「iwanttogotothenearestsubwaystation」的語音結果;而如果用戶在按住上述終端設備的唯一的翻譯按鍵之後,向上述終端設備說英文「iwanttogotothenearestsubwaystation」,然後鬆開翻譯按鍵,上述終端設備將播放出「我想去最近的地鐵站」的語音結果。
同理,上述目標語種也可以為「中英日」,那麼本實施例將在中文、英文和日文之間實現語音互譯,用戶如果輸入一句中文,那麼本申請提供的基於人工智慧的語音翻譯裝置將依次將這句中文翻譯為日文和英文,然後由終端設備依次播放這句中文的日文譯文和英文譯文,如果輸入一句英文,那麼本申請提供的基於人工智慧的語音翻譯裝置將依次將這句英文翻譯為中文和日文,然後由終端設備依次播放這句英文的中文譯文和日文譯文,以此類推,在此不再贅述。
圖14為本申請終端設備一個實施例的結構示意圖,本實施例中的終端設備可以實現本申請圖1~圖5所示實施例提供的方法,上述終端設備可以包括:一個或多個處理器;存儲器,用於存儲一個或多個程序;接收器,用於接收用戶通過終端設備輸入的源語種的語音;以及在發送器將上述源語種的語音發送至雲端伺服器之後,接收上述雲端伺服器發送的目標語種的音頻文件,上述目標語種的音頻文件是雲端伺服器對上述源語種的語音進行語音識別,確定將上述源語種的語音翻譯為至少兩種目標語種中除上述源語種之外的至少一種目標語種之後,將語音識別獲得的文本翻譯成確定的目標語種的文本,以及對翻譯成的目標語種的文本進行語音合成後獲得的;發送器,用於將上述源語種的語音發送至雲端伺服器;當上述一個或多個程序被上述一個或多個處理器執行,使得上述一個或多個處理器實現本申請圖1~圖5所示實施例提供的方法。
圖14示出了適於用來實現本申請實施方式的示例性終端設備12的框圖。圖14顯示的終端設備12僅僅是一個示例,不應對本申請實施例的功能和使用範圍帶來任何限制。
如圖14所示,終端設備12以通用計算設備的形式表現。終端設備12的組件可以包括但不限於:一個或者多個處理器或者處理單元16,系統存儲器28,連接不同系統組件(包括系統存儲器28和處理單元16)的總線18。
總線18表示幾類總線結構中的一種或多種,包括存儲器總線或者存儲器控制器,外圍總線,圖形加速埠,處理器或者使用多種總線結構中的任意總線結構的局域總線。舉例來說,這些體系結構包括但不限於工業標準體系結構(industrystandardarchitecture;以下簡稱:isa)總線,微通道體系結構(microchannelarchitecture;以下簡稱:mac)總線,增強型isa總線、視頻電子標準協會(videoelectronicsstandardsassociation;以下簡稱:vesa)局域總線以及外圍組件互連(peripheralcomponentinterconnection;以下簡稱:pci)總線。
終端設備12典型地包括多種計算機系統可讀介質。這些介質可以是任何能夠被終端設備12訪問的可用介質,包括易失性和非易失性介質,可移動的和不可移動的介質。
系統存儲器28可以包括易失性存儲器形式的計算機系統可讀介質,例如隨機存取存儲器(randomaccessmemory;以下簡稱:ram)30和/或高速緩存存儲器32。終端設備12可以進一步包括其它可移動/不可移動的、易失性/非易失性計算機系統存儲介質。僅作為舉例,存儲系統34可以用於讀寫不可移動的、非易失性磁介質(圖14未顯示,通常稱為「硬碟驅動器」)。儘管圖14中未示出,可以提供用於對可移動非易失性磁碟(例如「軟盤」)讀寫的磁碟驅動器,以及對可移動非易失性光碟(例如:光碟只讀存儲器(compactdiscreadonlymemory;以下簡稱:cd-rom)、數字多功能只讀光碟(digitalvideodiscreadonlymemory;以下簡稱:dvd-rom)或者其它光介質)讀寫的光碟驅動器。在這些情況下,每個驅動器可以通過一個或者多個數據介質接口與總線18相連。存儲器28可以包括至少一個程序產品,該程序產品具有一組(例如至少一個)程序模塊,這些程序模塊被配置以執行本申請各實施例的功能。
具有一組(至少一個)程序模塊42的程序/實用工具40,可以存儲在例如存儲器28中,這樣的程序模塊42包括——但不限於——作業系統、一個或者多個應用程式、其它程序模塊以及程序數據,這些示例中的每一個或某種組合中可能包括網絡環境的實現。程序模塊42通常執行本申請所描述的實施例中的功能和/或方法。
終端設備12也可以與一個或多個外部設備14(例如鍵盤、指向設備、顯示器24等)通信,還可與一個或者多個使得用戶能與該終端設備12交互的設備通信,和/或與使得該終端設備12能與一個或多個其它計算設備進行通信的任何設備(例如網卡,數據機等等)通信。這種通信可以通過輸入/輸出(i/o)接口22進行。並且,終端設備12還可以通過網絡適配器20與一個或者多個網絡(例如區域網(localareanetwork;以下簡稱:lan),廣域網(wideareanetwork;以下簡稱:wan)和/或公共網絡,例如網際網路)通信。如圖14所示,網絡適配器20通過總線18與終端設備12的其它模塊通信。應當明白,儘管圖14中未示出,可以結合終端設備12使用其它硬體和/或軟體模塊,包括但不限於:微代碼、設備驅動器、冗餘處理單元、外部磁碟驅動陣列、raid系統、磁帶驅動器以及數據備份存儲系統等。
處理單元16通過運行存儲在系統存儲器28中的程序,從而執行各種功能應用以及數據處理,例如實現本申請圖1~圖5所示實施例提供的基於人工智慧的語音翻譯方法。
本申請還提供一種包含計算機可執行指令的存儲介質,上述計算機可執行指令在由計算機處理器執行時用於執行本申請圖1~圖5所示實施例提供的基於人工智慧的語音翻譯方法。
上述包含計算機可執行指令的存儲介質可以採用一個或多個計算機可讀的介質的任意組合。計算機可讀介質可以是計算機可讀信號介質或者計算機可讀存儲介質。計算機可讀存儲介質例如可以是——但不限於——電、磁、光、電磁、紅外線、或半導體的系統、裝置或器件,或者任意以上的組合。計算機可讀存儲介質的更具體的例子(非窮舉的列表)包括:具有一個或多個導線的電連接、可攜式計算機磁碟、硬碟、隨機存取存儲器(ram)、只讀存儲器(readonlymemory;以下簡稱:rom)、可擦式可編程只讀存儲器(erasableprogrammablereadonlymemory;以下簡稱:eprom)或快閃記憶體、光纖、可攜式緊湊磁碟只讀存儲器(cd-rom)、光存儲器件、磁存儲器件、或者上述的任意合適的組合。在本文件中,計算機可讀存儲介質可以是任何包含或存儲程序的有形介質,該程序可以被指令執行系統、裝置或者器件使用或者與其結合使用。
計算機可讀的信號介質可以包括在基帶中或者作為載波一部分傳播的數據信號,其中承載了計算機可讀的程序代碼。這種傳播的數據信號可以採用多種形式,包括——但不限於——電磁信號、光信號或上述的任意合適的組合。計算機可讀的信號介質還可以是計算機可讀存儲介質以外的任何計算機可讀介質,該計算機可讀介質可以發送、傳播或者傳輸用於由指令執行系統、裝置或者器件使用或者與其結合使用的程序。
計算機可讀介質上包含的程序代碼可以用任何適當的介質傳輸,包括——但不限於——無線、電線、光纜、rf等等,或者上述的任意合適的組合。
可以以一種或多種程序設計語言或其組合來編寫用於執行本申請操作的電腦程式代碼,所述程序設計語言包括面向對象的程序設計語言—諸如java、smalltalk、c++,還包括常規的過程式程序設計語言—諸如「c」語言或類似的程序設計語言。程序代碼可以完全地在用戶計算機上執行、部分地在用戶計算機上執行、作為一個獨立的軟體包執行、部分在用戶計算機上部分在遠程計算機上執行、或者完全在遠程計算機或伺服器上執行。在涉及遠程計算機的情形中,遠程計算機可以通過任意種類的網絡——包括區域網(localareanetwork;以下簡稱:lan)或廣域網(wideareanetwork;以下簡稱:wan)連接到用戶計算機,或者,可以連接到外部計算機(例如利用網際網路服務提供商來通過網際網路連接)。
圖15為本申請雲端伺服器一個實施例的結構示意圖,本實施例中的雲端伺服器可以實現本申請圖6~圖9所示實施例的流程,上述雲端伺服器可以包括:一個或多個處理器;存儲器,用於存儲一個或多個程序;接收器,用於接收終端設備發送的源語種的語音;發送器,用於將目標語種的音頻文件發送給上述終端設備,以供上述終端設備播放;當上述一個或多個程序被上述一個或多個處理器執行,使得上述一個或多個處理器實現本申請圖6~圖9所示實施例提供的基於人工智慧的語音翻譯方法。
圖15示出了適於用來實現本申請實施方式的示例性雲端伺服器10的框圖。圖15顯示的雲端伺服器10僅僅是一個示例,不應對本申請實施例的功能和使用範圍帶來任何限制。
如圖15所示,雲端伺服器10以通用計算設備的形式表現。雲端伺服器10的組件可以包括但不限於:一個或者多個處理器或者處理單元160,系統存儲器280,連接不同系統組件(包括系統存儲器280和處理單元160)的總線180。
總線180表示幾類總線結構中的一種或多種,包括存儲器總線或者存儲器控制器,外圍總線,圖形加速埠,處理器或者使用多種總線結構中的任意總線結構的局域總線。舉例來說,這些體系結構包括但不限於工業標準體系結構(industrystandardarchitecture;以下簡稱:isa)總線,微通道體系結構(microchannelarchitecture;以下簡稱:mac)總線,增強型isa總線、視頻電子標準協會(videoelectronicsstandardsassociation;以下簡稱:vesa)局域總線以及外圍組件互連(peripheralcomponentinterconnection;以下簡稱:pci)總線。
雲端伺服器10典型地包括多種計算機系統可讀介質。這些介質可以是任何能夠被雲端伺服器10訪問的可用介質,包括易失性和非易失性介質,可移動的和不可移動的介質。
系統存儲器280可以包括易失性存儲器形式的計算機系統可讀介質,例如隨機存取存儲器(randomaccessmemory;以下簡稱:ram)300和/或高速緩存存儲器320。雲端伺服器10可以進一步包括其它可移動/不可移動的、易失性/非易失性計算機系統存儲介質。僅作為舉例,存儲系統340可以用於讀寫不可移動的、非易失性磁介質(圖15未顯示,通常稱為「硬碟驅動器」)。儘管圖15中未示出,可以提供用於對可移動非易失性磁碟(例如「軟盤」)讀寫的磁碟驅動器,以及對可移動非易失性光碟(例如:光碟只讀存儲器(compactdiscreadonlymemory;以下簡稱:cd-rom)、數字多功能只讀光碟(digitalvideodiscreadonlymemory;以下簡稱:dvd-rom)或者其它光介質)讀寫的光碟驅動器。在這些情況下,每個驅動器可以通過一個或者多個數據介質接口與總線180相連。存儲器280可以包括至少一個程序產品,該程序產品具有一組(例如至少一個)程序模塊,這些程序模塊被配置以執行本申請各實施例的功能。
具有一組(至少一個)程序模塊420的程序/實用工具400,可以存儲在例如存儲器280中,這樣的程序模塊420包括——但不限於——作業系統、一個或者多個應用程式、其它程序模塊以及程序數據,這些示例中的每一個或某種組合中可能包括網絡環境的實現。程序模塊420通常執行本申請所描述的實施例中的功能和/或方法。
雲端伺服器10也可以與一個或多個外部設備140(例如鍵盤、指向設備、顯示器240等)通信,還可與一個或者多個使得用戶能與該雲端伺服器10交互的設備通信,和/或與使得該雲端伺服器10能與一個或多個其它計算設備進行通信的任何設備(例如網卡,數據機等等)通信。這種通信可以通過輸入/輸出(i/o)接口220進行。並且,雲端伺服器10還可以通過網絡適配器200與一個或者多個網絡(例如區域網(localareanetwork;以下簡稱:lan),廣域網(wideareanetwork;以下簡稱:wan)和/或公共網絡,例如網際網路)通信。如圖15所示,網絡適配器200通過總線180與雲端伺服器10的其它模塊通信。應當明白,儘管圖15中未示出,可以結合雲端伺服器10使用其它硬體和/或軟體模塊,包括但不限於:微代碼、設備驅動器、冗餘處理單元、外部磁碟驅動陣列、raid系統、磁帶驅動器以及數據備份存儲系統等。
處理單元160通過運行存儲在系統存儲器280中的程序,從而執行各種功能應用以及數據處理,例如實現本申請圖6~圖9所示實施例提供的基於人工智慧的語音翻譯方法。
本申請還提供一種包含計算機可執行指令的存儲介質,上述計算機可執行指令在由計算機處理器執行時用於執行本申請圖6~圖9所示實施例提供的基於人工智慧的語音翻譯方法。
上述包含計算機可執行指令的存儲介質可以採用一個或多個計算機可讀的介質的任意組合。計算機可讀介質可以是計算機可讀信號介質或者計算機可讀存儲介質。計算機可讀存儲介質例如可以是——但不限於——電、磁、光、電磁、紅外線、或半導體的系統、裝置或器件,或者任意以上的組合。計算機可讀存儲介質的更具體的例子(非窮舉的列表)包括:具有一個或多個導線的電連接、可攜式計算機磁碟、硬碟、隨機存取存儲器(ram)、只讀存儲器(readonlymemory;以下簡稱:rom)、可擦式可編程只讀存儲器(erasableprogrammablereadonlymemory;以下簡稱:eprom)或快閃記憶體、光纖、可攜式緊湊磁碟只讀存儲器(cd-rom)、光存儲器件、磁存儲器件、或者上述的任意合適的組合。在本文件中,計算機可讀存儲介質可以是任何包含或存儲程序的有形介質,該程序可以被指令執行系統、裝置或者器件使用或者與其結合使用。
計算機可讀的信號介質可以包括在基帶中或者作為載波一部分傳播的數據信號,其中承載了計算機可讀的程序代碼。這種傳播的數據信號可以採用多種形式,包括——但不限於——電磁信號、光信號或上述的任意合適的組合。計算機可讀的信號介質還可以是計算機可讀存儲介質以外的任何計算機可讀介質,該計算機可讀介質可以發送、傳播或者傳輸用於由指令執行系統、裝置或者器件使用或者與其結合使用的程序。
計算機可讀介質上包含的程序代碼可以用任何適當的介質傳輸,包括——但不限於——無線、電線、光纜、rf等等,或者上述的任意合適的組合。
可以以一種或多種程序設計語言或其組合來編寫用於執行本申請操作的電腦程式代碼,所述程序設計語言包括面向對象的程序設計語言—諸如java、smalltalk、c++,還包括常規的過程式程序設計語言—諸如「c」語言或類似的程序設計語言。程序代碼可以完全地在用戶計算機上執行、部分地在用戶計算機上執行、作為一個獨立的軟體包執行、部分在用戶計算機上部分在遠程計算機上執行、或者完全在遠程計算機或伺服器上執行。在涉及遠程計算機的情形中,遠程計算機可以通過任意種類的網絡——包括區域網(localareanetwork;以下簡稱:lan)或廣域網(wideareanetwork;以下簡稱:wan)連接到用戶計算機,或者,可以連接到外部計算機(例如利用網際網路服務提供商來通過網際網路連接)。
需要說明的是,在本申請的描述中,術語「第一」、「第二」等僅用於描述目的,而不能理解為指示或暗示相對重要性。此外,在本申請的描述中,除非另有說明,「多個」的含義是兩個或兩個以上。
流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括一個或更多個用於實現特定邏輯功能或過程的步驟的可執行指令的代碼的模塊、片段或部分,並且本申請的優選實施方式的範圍包括另外的實現,其中可以不按所示出或討論的順序,包括根據所涉及的功能按基本同時的方式或按相反的順序,來執行功能,這應被本申請的實施例所屬技術領域的技術人員所理解。
應當理解,本申請的各部分可以用硬體、軟體、固件或它們的組合來實現。在上述實施方式中,多個步驟或方法可以用存儲在存儲器中且由合適的指令執行系統執行的軟體或固件來實現。例如,如果用硬體來實現,和在另一實施方式中一樣,可用本領域公知的下列技術中的任一項或他們的組合來實現:具有用於對數據信號實現邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(programmablegatearray;以下簡稱:pga),現場可編程門陣列(fieldprogrammablegatearray;以下簡稱:fpga)等。
本技術領域的普通技術人員可以理解實現上述實施例方法攜帶的全部或部分步驟是可以通過程序來指令相關的硬體完成,所述的程序可以存儲於一種計算機可讀存儲介質中,該程序在執行時,包括方法實施例的步驟之一或其組合。
此外,本申請各個實施例中的各功能模塊可以集成在一個處理模塊中,也可以是各個模塊單獨物理存在,也可以兩個或兩個以上模塊集成在一個模塊中。上述集成的模塊既可以採用硬體的形式實現,也可以採用軟體功能模塊的形式實現。所述集成的模塊如果以軟體功能模塊的形式實現並作為獨立的產品銷售或使用時,也可以存儲在一個計算機可讀取存儲介質中。
上述提到的存儲介質可以是只讀存儲器,磁碟或光碟等。
在本說明書的描述中,參考術語「一個實施例」、「一些實施例」、「示例」、「具體示例」、或「一些示例」等的描述意指結合該實施例或示例描述的具體特徵、結構、材料或者特點包含於本申請的至少一個實施例或示例中。在本說明書中,對上述術語的示意性表述不一定指的是相同的實施例或示例。而且,描述的具體特徵、結構、材料或者特點可以在任何的一個或多個實施例或示例中以合適的方式結合。
儘管上面已經示出和描述了本申請的實施例,可以理解的是,上述實施例是示例性的,不能理解為對本申請的限制,本領域的普通技術人員在本申請的範圍內可以對上述實施例進行變化、修改、替換和變型。