基於移動通訊終端語音交互的玩具控制方法及系統的製作方法

2023-06-11 14:43:41 3

專利名稱：基於移動通訊終端語音交互的玩具控制方法及系統的製作方法
技術領域：
本發明涉及一種玩具語音控制方法及系統，尤其涉及一種基於移動通訊終端語音交互的玩具控制方法及系統。
背景技術：
隨著社會的發展及語音技術的提高，語音玩具越來越來廣泛應用。現有語音玩具大多在玩具上設置語音識別晶片，存儲簡單的語音指令及內容，通過語音識別後調用存儲的指令和內容，從而運行語音玩具。就目前而言，現有技術存在以下缺陷1、通常玩具需要控制成本，低成本的玩具所具有的指令及內容存儲容量有限，內容少；2、每個玩具本身需要具備一套語音輸入、語音識別晶片及存儲組件，這樣導致成本高，3、現有語音識別轉換，需要以標準語音信息才能進行準確的轉換，這大大限制了自然語音控制玩具的使用。

發明內容
本發明解決的技術問題是構建一種基於移動通訊終端語音交互的玩具控制方法及系統，克服現有技術語音玩具存儲容量有限導致內容少、成本高以及不能以自然語音進行控制的技術問題。本發明技術方案受益於移動通訊終端遠遠強於玩具終端的運算處理能力以及網絡通訊能力，使得用戶可以藉助目前已經在市場上廣泛應用發展的移動通訊終端，在其終端平臺上，採用智能交互能力更強、識別準度更高的語音識別和自然語言理解系統來最終實現與實體玩具的互動交互，帶來遠超傳統玩具方案的交互體驗的用戶體驗。本發明的技術方案是提供一種基於移動通訊終端語音交互的玩具控制方法，包括具有無線通訊連接的玩具、具有語音輸入及語音識別轉換的移動通訊終端，基於移動通訊終端語音交互的玩具控制方法包括如下步驟
輸入語音由所述移動通訊終端輸入語音；
語音轉換所述移動通訊終端將接收的語音進行識別轉換，該語音識別轉換結果為指令或指令和參數的形式；
執行識別轉換結果由所述移動通訊終端或所述玩具共同執行該語音識別轉換結果或由所述移動通訊終端或所述玩具中任意一個執行該語音識別轉換結果。本發明的進一步技術方案是還包括根據識別場景構建語義知識庫，所述語義知識庫包括字詞的語義屬性，在語音識別轉換步驟中，還包括進行語義識別轉換，具體包括如下步驟
分詞及語義消歧根據知識庫字詞的語義屬性對語音識別結果進行分詞並進行語義消
歧；
意圖分類及參數提取對分詞及語義消歧的結果進行意圖分類，並進行參數提取。本發明的進一步技術方案是在語音識別轉換步驟中，包括所述玩具對輸入的語音進行識別轉換，所述玩具執行該語音識別轉換結果。本發明的進一步技術方案是還包括進行語音識別的網絡伺服器，所述移動通訊終端通過網際網路連接所述網絡伺服器並上傳語音信息，所述網絡伺服器與所述移動通訊終端並行對語音信息進行識別轉換。本發明的進一步技術方案是在輸入不能識別的語音信息或不能執行的語音信息時，通過所述移動通訊終端或玩具輸入語音進行交互語音，以獲取能執行的語音信息。本發明的進一步技術方案是所述玩具與所述移動通訊終端通過紅外通訊組件、高頻調製通訊組件、藍牙通訊組件、2. 4G無線通訊組件、RFID射頻通訊組件中任一種連接。本發明的進一步技術方案是還包括對所述移動通訊終端喚醒進行接收輸入語音狀態的喚醒步驟。本發明的技術方案是構建一種基於移動通訊終端語音交互的玩具控制系統，包括具有通訊連接的玩具、具有語音輸入及語音識別轉換的移動通訊終端，所述移動通訊終端包括輸入語音的語音輸入單元、與所述玩具進行無線通訊連接的第一無線通訊模塊、將語音識別轉換為指令或指令和參數的第一語音轉換單元，所述玩具包括連接所述移動通訊終端的第二無線通訊模塊，所述語音輸入單元輸入語音，所述移動通訊終端將輸入的語音進行識別轉換，該語音識別轉換結果為指令或指令和參數的形式，由所述移動通訊終端或所述玩具共同執行該語音識別轉換結果或由所述移動通訊終端或所述玩具中任意一個執行該語音識別轉換結果。本發明的進一步技術方案是所述第一語音轉換單元包括進行語音識別轉換的語音識別模塊、語義識別模塊，所述語義識別模塊根據所述語音識別模塊識別的語音判斷出所述語音輸入單元輸入語音的語義。本發明的進一步技術方案是還包括進行語音識別轉換的網絡伺服器，所述移動通訊終端通過網際網路連接所述網絡伺服器並上傳語音信息，所述網絡伺服器與所述移動通訊終端並行對語音信息進行識別轉換。本發明的進一步技術方案是所述移動通訊終端和所述網絡伺服器的語音識別轉換結果均包括語音識別轉換的置信度，所述移動通訊終端設置語音識別轉換結果的置信度閾值，當所述移動通訊終端語音識別轉換結果的置信度大於等於該置信度閾值時，取該語音識別轉換結果，若所述移動通訊終端語音識別轉換結果的置信度小於該置信度閾值時，取所述移動通訊終端語音識別轉換結果的置信度和所述網絡伺服器語音識別轉換結果的置信度中較大值的語音識別轉換結果。本發明的進一步技術方案是所述移動通訊終端的第一無線通訊模塊為紅外信號發射器、藍牙通訊組件、RFID射頻通訊組件及2. 4G無線通訊組件中任一種或多種，所述玩具的第二無線通訊模塊為紅外信號接收器、藍牙通訊組件、RFID射頻通訊組件及2. 4G無線通訊組件中一種或多種。本發明的進一步技術方案是所述玩具包括進行語音識別轉換的第二語音轉換單元，所述玩具的第二語音轉換單元對語音進行識別轉換。本發明的技術效果是通過構建一種基於移動通訊終端語音交互的玩具控制方法及系統，包括具有通訊連接的玩具、具有語音輸入及語音識別轉換的移動通訊終端，所述移動通訊終端包括輸入語音的語音輸入單元、與所述玩具無線通訊連接的第一無線通訊模塊、將語音識別轉換為指令或指令和參數的第一語音轉換單元，所述玩具包括連接所述移動通訊終端的第二無線通訊模塊，所述語音輸入單元輸入語音，所述移動通訊終端將輸入的語音進行識別轉換，該語音識別轉換結果為指令或指令和參數的形式，由所述移動通訊終端或所述玩具共同執行該語音識別轉換結果或由所述移動通訊終端或所述玩具中任意一個執行該語音識別轉換結果。本發明一種基於移動通訊終端語音交互的玩具控制方法及系統，受益於移動通訊終端遠遠強於玩具終端的運算處理能力以及網絡通訊能力，使得用戶可以藉助目前已經在市場上廣泛應用發展的移動通訊終端，在其終端平臺上，採用智能交互能力更強、識別準度更高的語音識別和自然語言理解系統來最終實現與實體玩具的互動交互，帶來遠超傳統玩具方案的交互體驗的用戶體驗。本發明使玩具的內容更加豐富，功能更加強大，同時，大大節約了成本。

圖I為本發明的流程圖。圖2為本發明的結構示意圖。
具體實施例方式下面結合具體實施例，對本發明技術方案進一步說明。如圖I、圖2所示，本發明的具體實施方式
是提供一種基於移動通訊終端語音交互的玩具控制方法，包括具有通訊連接的玩具2、具有語音輸入及語音識別轉換的移動通訊終端1，基於移動通訊終端語音交互的玩具控制方法包括如下步驟
步驟100 :輸入語音，即由所述移動通訊終端I輸入語音；
步驟200 :語音轉換，即所述移動通訊終端I將接收的語音進行識別轉換，該語音識別轉換結果為指令或指令和參數的形式；
步驟300 :執行處理結果，即由移動通訊終端I或玩具2共同執行該語音識別轉換結果或由所述玩具2執行該語音識別轉換結果。如圖I、圖2所示，本發明的具體實施過程是由移動通訊終端I輸入語音，移動通訊終端I將輸入的語音識別轉換為指令或指令和參數。若由所述移動通訊終端I將語音識別轉換結果發送到所述玩具2，由所述玩具2執行。若語音識別轉換結果包括控制玩具2的指令，則所述移動通訊終端I與所述玩具2建立無線通訊連接，所述移動通訊終端I將語音識別轉換結果中控制玩具2的指令或指令和參數傳送到玩具2並由所述玩具2執行該語音轉換結果，比如播放音樂、講故事、起飛、旋轉等。所述玩具2根據接收的所述移動通訊終端I傳輸的指令或指令和參數，執行該指令或指令和參數，具體實施例中，所述移動通訊終端I具有存儲語音指令及與語音指令相配合的內容的存儲單元13，所述內容包括音頻內容、文字內容中的一種或多種。比如，播放「小燕子」，則播放為指令，「小燕子」音頻內容為內容作為參數。所述移動通訊終端I包括手機、移動平板電腦、移動通訊娛樂設備。若語音識別轉換結果包括由所述移動通訊終端I執行的指令或含有交互信息。若由所述移動通訊終端I執行所述語音識別轉換結果，然後將執行結果的交互信息發送到所述玩具2，由所述玩具2播放。比如，若語音識別結果包括交互信息，則調用相應的交互信息。該相應的交互信息包括存儲在所述移動通訊終端I的交互信息，比如，將一些問題的答案預先存儲在所述移動通訊終端1，在問到相應的語音信息時，調用預先存儲對應的信息進行交互。也包括通過所述移動通訊終端I獲取的交互信息，比如，要通過交互語音「有沒有王菲的歌」，則所述移動通訊終端I通過查詢，得到查詢結果為「有」或「無」，該查詢結果「有」或「無」則為相應的交互信息。在輸入不能識別語音信息或不能執行的語音信息時，通過與所述移動通訊終端進行交互語音，以獲取能執行的語音信息。比如，在輸入「開機」語音信息時，若可能由於語音不清楚或者與標準語音差別過大，導致不能識別時，可以調用交互語音信息庫進行提示再輸入語音。再比如，在輸入「現在打開故事吧」，此時，若移動通訊終端不能將該語音指令轉換為控制指令，此時，需要補充輸入語音信息，比如，調用交互信息庫「您是想聽故事嗎？」這樣語音交互提示，完成語音指令信息的補充，實現以自然語音即可控制玩具2。具體實施例中，還包括喚醒所述移動通訊終端I進行語音輸入狀態的喚醒步驟，所述喚醒步驟喚醒所述移動通訊終端1，使所述移動通訊終端I進入接收語音的狀態。如圖2所示，本發明的優選實施方式是包括所述玩具2對輸入的語音進行識別轉換，所述玩具2執行該語音識別轉換結果。所述玩具2包括進行語音識別轉換的第二語音轉換單元23，所述玩具2的第二語音轉換單元23對語音進行識別轉換。同時，所述玩具2設置指令和內容庫，對於簡單的語音，通過玩具本身進行識別轉換，然後由玩具2執行。在移動通訊終端I不能進行語音輸入和識別時，由所述玩具2輸入語音或者接收移動通訊終端I傳送的語音並進行識別轉換，該語音識別轉換結果由所述玩具2執行。這樣就使玩具 2具體一定的單獨工作能力，克服了玩具2對移動通訊終端的依賴，方便了玩具2的使用。如圖2所示，本發明的優選實施方式是還包括進行語音識別轉換的網絡伺服器3，所述移動通訊終端I通過網際網路連接所述網絡伺服器3並上傳語音信息，所述網絡伺服器3與所述移動通訊終端I並行對語音信息進行識別轉換。所述移動通訊終端和所述網絡伺服器的語音識別轉換結果均包括語音識別轉換的置信度。所謂置信度，也叫置信水平。它是指特定個體對待特定命題真實性相信的程度，也就是概率是對個人信念合理性的量度.概率的置信度解釋表明，事件本身並沒有什麼概率，事件之所以指派有概率只是指派概率的人頭腦中所具有的信念證據。置信水平是指總體參數值落在樣本統計值某一區內的概率；而置信區間是指在某一置信水平下，樣本統計值與總體參數值間誤差範圍。置信區間越大，置信水平越高。語音識別轉換的置信度即對語音識別轉換結果真實性的相信程度。所述網絡伺服器3與所述移動通訊終端I並行對語音信息進行識別轉換時，所述移動通訊終端I設置語音識別轉換結果的置信度閾值，當所述移動通訊終端I語音識別轉換結果的置信度大於等於該置信度閾值時，取該語音識別轉換結果，若所述網絡伺服器語音識別轉換結果的置信度小於該置信度閾值時，取所述移動通訊終端I語音識別轉換結果的置信度和所述網絡伺服器3語音識別轉換結果的置信度中較大值的語音識別轉換結果。如圖2所示，本發明的優選實施方式是由所述網絡伺服器3、所述移動通訊終端I、所述玩具2共同執行該語音識別轉換結果，或者由所述網絡伺服器3、所述移動通訊終端I、所述玩具2中任意兩個執行該語音識別轉換結果，由所述玩具2和所述移動通訊終端I任意一個執行該語音識別轉換結果。所述移動通訊終端I將輸入的語音上傳到所述網絡伺服器3，所述網絡伺服器3和所述移動通訊終端I並行對輸入語音信息進行識別轉換。若所述網絡伺服器3執行語音識別轉換結果，則由所述網絡伺服器3將執行結果傳送到所述移動通訊終端1，然後由所述移動通訊終端I傳送到所述玩具2執行。若所述網絡伺服器3將語音識別轉換結果傳送到所述移動通訊終端1，由所述移動通訊終端I執行所述語音識別轉換結果，然後將執行結果傳送到所述玩具2。若所述網絡伺服器將語音識別轉換結果傳送到所述移動通訊終端1，由所述移動通訊終端I再將語音識別轉換結果傳送到所述玩具2，由所述玩具2執行該語音識別轉換結果。如圖I、圖2所示，本發明的優選實施方式是還包括根據識別場景構建語義知識庫，所述語義知識庫包括字詞的語義屬性。比如根據實際過程，設定各種場景，例如，娛樂、天氣、體育、人物等，根據識別場景構建相應的語義知識庫，構建語義知識庫為語義識別的基本條件，對一些字詞構建其知識庫，定義其語義屬性。比如「劉德華」，其知識庫包括男、香港人、歌手、演員，其語義屬性為「娛樂人物」。「下雨」，則為一種天氣情況，天氣預報，其語義屬性為「天氣」。在語音轉換步驟中，還包括根據語音轉換結果進行語義轉換。具體包括步驟10:分詞及語義消歧，即根據知識庫字詞的語義屬性對語音識別結果進行分詞並進行語義消歧。具體過程如下根據字詞在知識庫中的語義屬性，對語音識別結果進行分詞或消除歧義，比如語音識別結果為「明天北京會下雨嗎？」根據知識庫字詞的語義屬性分詞為「明天」、「北京」、「會」、「下雨」、「嗎」，「明天」為時間屬性，「北京」為地點屬性，「會」為動詞，「下雨」為天氣屬性，「嗎」為提問。在某些情況下，需要消除歧義，比如「劉德華的歌」，可能識別為「瀏得滑」，但經過知識庫對「劉德華」的定義，分析判斷為「劉德華」。這屬於根據知識庫字詞的語義屬性消除歧義。步驟20:意圖分類及參數提取，即對分詞及語義消歧的結果進行意圖分類，並進行參數提取。比如語音識別結果為「明天北京會下雨嗎？」根據分詞及語義消歧的結果進行意圖分類，其意圖類為「查詢天氣」，提取參數為地點是北京，時間是明天。這樣對「明天北京會下雨嗎？」進行了語義轉換。具體過程如下輸入語音為「今天天氣好嗎？」，首先，進行語音識別，輸出識別結果為「今天天氣好嗎？」然後根據語音識別結果，進行語義判斷，根據語義判斷為播出今天該地的天氣情況。再比如語音輸入為「我想聽王菲的音樂」，最終語義識別分析得到用戶的意圖為「播放歌曲」，參數是「王菲」，然後根據分析結果，調用歌曲播放功能並直接播放王菲的歌曲。因為採用有語義識別，用戶並不需要記住固定的語音控制命令，而是可以採用用戶自己最習慣的語言表達來與玩具互動。所以對上一條意圖，用戶也可以說「請幫我找王菲的歌」、「有沒有王菲最新的專輯？」、「王菲的執迷不悟」，也就是說，用戶可自由表達自己的命令和意圖，移動終端上強大的語音識別和語義理解引擎，都可以非常好的識別出用戶的真正意圖播放王菲的歌曲，或播放王菲的某一首歌曲。如此，讓智能玩具和用戶的交互更佳自由、有趣，而且也沒有增加原來玩具終端的直接硬體成本，讓玩具廠商可以用比較低的成本，卻實現了高性能的人機互動效果。本發明的優選實施方式是所述移動通訊終端I具有存儲語音指令及與語音指令相配合的內容的存儲單元13。在對玩具2進行操作時，包括操作指令或指令和指令指示的內容，比如，播放「小燕子」，則「播放」為指令，而「小燕子」音頻內容為內容作為參數。由於移動通訊終端I具有更大的存儲能力，因此，其內容庫可以更大，可以在移動通訊終端I中存儲更多的語音指令及與語音指令相配合的內容。如圖I、圖2所示，本發明的優選實施方式是在語音識別轉換步驟中，
如圖I、圖2所示，本發明的優選實施方式是所述玩具2與所述移動通訊終端I通過紅外信號、高頻調製通訊信號、藍牙信號、2. 4G無線通訊信號、RFID射頻信號連接。所述玩具2上設置無線通訊接收器，本專利技術方案中，無線通訊方式包括紅外信號、高頻調製通訊信號、藍牙信號、2. 4G無線通訊信號、RFID射頻信號中一種或多種，所述玩具2上相應設置紅外信號接收器、高頻調製通訊信號接收器、藍牙信號接收器、2. 4G無線通訊信號接收器、RFID射頻信號接收組件中一種或多種，所述移動通訊終端I則具有紅外信號發射器、高頻調製通訊信號發射器、藍牙信號發射器、2. 4G無線通訊信號發射器、RFID射頻信號發射組件中一種或多種，所述移動通訊終端I通過無線通訊信號將轉換後的指令或指令和參數發送到玩具2，由所述玩具2執行該指令或指令和參數。如圖2所示，本發明的具體實施方式
是構建一種基於移動通訊終端語音交互的玩具控制系統，包括具有通訊連接的玩具2、具有語音輸入及語音識別轉換的移動通訊終端1，所述移動通訊終端I包括輸入語音的語音輸入單元15、與所述玩具2進行無線通訊連接的第一無線通訊模塊11、將語音識別轉換為指令或指令和參數的第一語音轉換單元12，所述玩具2包括連接所述移動通訊終端I的第二無線通訊模塊21，所述語音輸入單元15輸入語音，所述移動通訊終端I將輸入的語音進行識別轉換，該語音識別轉換結果為指令或指令和參數的形式，由移動通訊終端I或玩具2共同執行該語音識別轉換結果或由所述玩具2執行該語音識別轉換結果。如圖2所示，本發明的具體實施過程是由移動通訊終端I輸入語音，移動通訊終端I具有語音輸入單元15，通過第一語音轉換單元12中的語音識別模塊121將輸入的語音識別轉換為指令或指令和參數；所述移動通訊終端I的語音識別模塊121識別該語音，所述移動通訊終端I的第二無線通訊模塊21與所述玩具2的第一無線通訊模塊21建立無線通訊連接，若由所述移動通訊終端I將所述語音識別轉換結果發送到所述玩具2，由所述玩具2執行。比如播放音樂、講故事、起飛、旋轉等。所述玩具2根據接收的所述移動通訊終端I傳輸的指令或指令和參數，執行該指令或指令和參數，具體實施例中，所述移動通訊終端I具有存儲語音指令及與語音指令相配合的內容的存儲單元13,所述內容包括音頻內容、文字內容中的一種或多種。比如，播放「小燕子」，則播放為指令，「小燕子」音頻內容為內容作為參數。所述移動通訊終端I包括手機、移動平板電腦、移動通訊娛樂設備。若語音識別轉換結果包括由所述移動通訊終端I執行的指令或含有交互信息。若由所述移動通訊終端I執行所述語音識別轉換結果，然後將執行結果的交互信息發送到所述玩具2，由所述玩具2播放。比如，若語音識別結果包括交互信息，則調用相應的交互信息。該相應的交互信息包括存儲在所述移動通訊終端I的交互信息，比如，將一些問題的答案預先存儲在所述移動通訊終端1，在問到相應的語音信息時，調用預先存儲對應的信息進行交互。也包括通過所述移動通訊終端I獲取的交互信息，比如，要通過交互語音「有沒有王菲的歌」，則所述移動通訊終端I通過查詢，得到查詢結果為「有」或「無」，該查詢結果「有」或「無」則為相應的交互信息，然後將該交互信息傳送到所述玩具2，由所述玩具3播放。在輸入不能識別語音信息或不能執行的語音信息時，通過與所述移動通訊終端進行交互語音，以獲取能執行的語音信息。比如，在輸入「開機」語音信息時，若可能由於語音不清楚或者與標準語音差別過大，導致不能識別時，可以調用交互語音信息庫進行提示再輸入語音。再比如，在輸入「現在打開故事吧」，此時，若移動通訊終端不能將該語音指令轉換為控制指令，此時，需要補充輸入語音信息，比如，調用交互信息庫「您是想聽故事嗎？」這樣語音交互提示，完成語音指令信息的補充，實現以自然語音即可控制玩具。具體實施例中，還包括喚醒所述移動通訊終端I進行語音輸入狀態的喚醒模塊14，所述喚醒模塊14喚醒所述移動通訊終端1，使所述移動通訊終端進入接收語音的狀態。如圖2所示，本發明的優選實施方式是還包括進行語音識別轉換的網絡伺服器3，所述移動通訊終端I通過網際網路連接所述網絡伺服器3並上傳語音信息，所述網絡伺服器3與所述移動通訊終端I並行對語音信息進行識別轉換。所述移動通訊終端和所述網絡伺服器的語音識別轉換結果均包括語音識別轉換的置信度。所謂置信度，也叫置信水平。它是指特定個體對待特定命題真實性相信的程度，也就是概率是對個人信念合理性的量度.概率的置信度解釋表明，事件本身並沒有什麼概率，事件之所以指派有概率只是指派概率的人頭腦中所具有的信念證據。置信水平是指總體參數值落在樣本統計值某一區內的概率；而置信區間是指在某一置信水平下，樣本統計值與總體參數值間誤差範圍。置信區間越大，置信水平越高。語音識別轉換的置信度即對語音識別轉換結果真實性的相信程度。所述網絡伺服器3與所述移動通訊終端I並行對語音信息進行識別轉換時，所述移動通訊終端I設置語音識別轉換結果的置信度閾值，當所述移動通訊終端I語音識別轉換結果的置信度大於等於該置信度閾值時，取該語音識別轉換結果，若所述網絡伺服器3語音識別轉換結果的置信度小於該置信度閾值時，取所述移動通訊終端I語音識別轉換結果的置信度和所述網絡伺服器3語音識別轉換結果的置信度中較大值的語音識別轉換結果。如圖2所示，本發明的優選實施方式是由所述網絡伺服器3、所述移動通訊終端I、所述玩具2共同執行該語音識別轉換結果，或者由所述網絡伺服器3、所述移動通訊終端
I、所述玩具2中任意兩個執行該語音識別轉換結果，由所述玩具2和所述移動通訊終端I任意一個執行該語音識別轉換結果。所述移動通訊終端I將輸入的語音上傳到所述網絡伺服器3，所述網絡伺服器3和所述移動通訊終端I並行對輸入語音信息進行識別轉換。若所述網絡伺服器3執行語音識別轉換結果，則由所述網絡伺服器3將執行結果傳送到所述移動通訊終端1，然後由所述移動通訊終端I傳送到所述玩具2執行。若所述網絡伺服器3將語音識別轉換結果傳送到所述移動通訊終端1，由所述移動通訊終端I執行所述語音識別轉換結果，然後將執行結果傳送到所述玩具2。若所述網絡伺服器將語音識別轉換結果傳送到所述移動通訊終端1，由所述移動通訊終端I再將語音識別轉換結果傳送到所述玩具2，由所述玩具2執行該語音識別轉換結果。如圖2所示，本發明的優選實施方式是所述第一語音轉換單元12還包括語義識別模塊122，所述語義識別模塊122根據所述語音識別模塊121識別的語音判斷出所述語音輸入單元15輸入語音的語義。比如，所述語音輸入單元15輸入語音為「今天天氣好嗎？」，首先，進行語音識別，輸出識別結果為「今天天氣好嗎？」然後根據語音識別結果，進行語義判斷，所述語義識別模塊122根據語義判斷為播出今天該地的天氣情況。再比如比如，所述語音輸入單元15輸入語音為「今天天氣好嗎？」，首先，進行語音識別，輸出識別結果為「今天天氣好嗎？」然後所述語義識別模塊122根據語音識別結果，進行語義判斷，根據語義判斷為播出今天該地的天氣情況。再比如語音輸入為「我想聽王菲的音樂」，所述語義識別模塊122語義識別分析得到用戶的意圖為「播放歌曲」，參數是「王菲」，然後根據分析結果，調用歌曲播放功能並直接播放王菲的歌曲。因為採用有語義識別，用戶並不需要記住固定的語音控制命令，而是可以採用用戶自己最習慣的語言表達來與玩具互動。所以對上一條意圖，用戶也可以說「請幫我找王菲的歌」、「有沒有王菲最新的專輯？」、「王菲的執迷不悟」，也就是說，用戶可自由表達自己的命令和意圖，移動終端上強大的語音識別和語義理解引擎，都可以非常好的識別出用戶的真正意圖播放王菲的歌曲，或播放王菲的某一首歌曲。如此，讓智能玩具和用戶的交互更佳自由、有趣，而且也沒有增加原來玩具終端的直接硬體成本，讓玩具廠商可以用比較低的成本，卻實現了高性能的人機互動效果。如圖2所示，本發明的優選實施方式是所述玩具2包括進行語音識別的第二語音轉換單元23及與語音指令相配合的內容的存儲模塊。所述玩具的第二語音轉換單元23對輸入的語音進行轉換。具體實施例中，玩具2本身也設置進行語音識別轉換的第二語音轉換單元23，同時，設置指令和內容庫，對於簡單的語音，先通過玩具2本身進行識別，若不能識別或識別後不具有該指令和內容庫，則再通過進行識別處理。具體實施例中，所述與語音指令相配合的內容包括音頻內容、文字內容中的一種或多種。本發明的優選實施方式是所述移動通訊終端具有存儲語音指令及與語音指令相配合的內容的存儲單元。在對玩具2進行操作時，包括操作指令或指令和指令指示的內容，比如，播放「小燕子」，則播放為指令，「小燕子」音頻內容為內容作為參數。由於移動通訊終端I具有更大的存儲能力，因此，其內容庫可以更大，可以在移動通訊終端I中存儲更多的語音指令及與語音指令相配合的內容。如圖2所示，本發明的優選實施方式是所述移動通訊終端I的第一無線通訊模塊11為紅外信號發射器、藍牙信號發送組件、RFID射頻信號發生器及2. 4G無線通訊信號發射組件中任一種或多種，玩具2上的第二無線通訊模塊21為紅外信號接收器、藍牙信號接收組件、RFID射頻信號閱讀器及2. 4G無線通訊信號接收組件中一種或多種。本專利技術方案中，無線通訊方式包括紅外信號、高頻調製通訊信號、藍牙信號、2. 4G無線通訊信號、RFID射頻信號通訊中一種或多種，所述玩具2上的第二無線通訊模塊21相應設置紅外信號接收器、RFID射頻信號閱讀器及2. 4G無線通訊信號接收組件中一種或多種，所述移動通訊終端I第一無線通訊模塊12則為紅外信號發射器、RFID射頻信號發生器及2. 4G無線通訊信號發射組件中一種或多種，所述移動通訊終端I通過無線通訊信號將轉換後的指令或指令和參數發送到玩具2,由所述玩具2執行該指令或指令和參數。如圖2所示，本發明的優選實施方式是包括所述玩具2對輸入的語音進行識別轉換，所述玩具2執行該語音識別轉換結果。所述玩具2包括進行語音識別轉換的第二語音轉換單元23，所述玩具2的第二語音轉換單元23對語音進行識別轉換。同時，所述玩具2設置指令和內容庫，對於簡單的語音，通過玩具本身進行識別轉換，然後由玩具2執行。在移動通訊終端I不能進行語音輸入和識別時，由所述玩具2輸入語音或者接收移動通訊終端I傳送的語音並進行識別轉換，該語音識別轉換結果由所述玩具2執行。這樣就使玩具2具體一定的單獨工作能力，克服了玩具2對移動通訊終端的依賴，方便了玩具2的使用。本發明的技術效果是通過構建一種基於移動通訊終端語音交互的玩具控制方法及系統，包括具有通訊連接的玩具2、具有語音輸入及語音識別轉換的移動通訊終端1，所述移動通訊終端I包括輸入語音的語音輸入單元15、與所述玩具2進行無線通訊連接的第一無線通訊模塊11、將語音識別轉換為指令或指令和參數的第一語音轉換單元12，所述玩具2包括連接所述移動通訊終端I的第二無線通訊模塊21，所述語音輸入單元15輸入語音，所述移動通訊終端I將輸入的語音進行識別轉換，該語音識別轉換結果為指令或指令和參數的形式，由移動通訊終端I或玩具2共同執行該語音識別轉換結果或由所述玩具2執行該語音識別轉換結果。本發明一種基於移動通訊終端I的玩具語音控制方法及系統，利用現在移動通訊終端I較強的數據處理能力，對玩具2進行語音控制。本發明一種基於移動通訊終端I的玩具語音控制方法及系統，受益於移動通訊終端遠遠強於玩具終端的運算處理能力以及網絡通訊能力，使得用戶可以藉助目前已經在市場上廣泛應用發展的移動通訊終端1，在其終端平臺上，採用智能交互能力更強、識別準度更高的語音識別和自然語言理解系統來最終實現與實體玩具的互動交互，帶來遠超傳統玩具方案的交互體驗的用戶體驗，使玩具2的內容更加豐富，功能更加強大，同時，大大節約了成本。以上內容是結合具體的優選實施方式對本發明所作的進一步詳細說明，不能認定本發明的具體實施只局限於這些說明。對於本發明所屬技術領域的普通技術人員來說，在不脫離本發明構思的前提下，還可以做出若干簡單推演或替換，都應當視為屬於本發明的保護範圍。
權利要求
1.一種基於移動通訊終端語音交互的玩具控制方法，其特徵在於，包括具有無線通訊連接的玩具、具有語音輸入及語音識別轉換的移動通訊終端，基於移動通訊終端語音交互的玩具控制方法包括如下步驟輸入語音由所述移動通訊終端輸入語音；語音轉換所述移動通訊終端將接收的語音進行識別轉換，該語音識別轉換結果為指令或指令和參數的形式；執行識別轉換結果由移動通訊終端或所述玩具共同執行該語音識別轉換結果或由移動通訊終端或玩具中任意一個執行該語音識別轉換結果。
2.根據權利要求I所述基於移動通訊終端語音交互的玩具控制方法，其特徵在於，還包括根據識別場景構建語義知識庫，所述語義知識庫包括字詞的語義屬性，在語音識別轉換步驟中，還包括進行語義識別轉換，具體包括如下步驟分詞及語義消歧根據知識庫字詞的語義屬性對語音識別結果進行分詞並進行語義消歧；意圖分類及參數提取對分詞及語義消歧的結果進行意圖分類，並進行參數提取。
3.根據權利要求I所述基於移動通訊終端語音交互的玩具控制方法，其特徵在於，在語音識別轉換步驟中，包括所述玩具對輸入的語音進行識別轉換，所述玩具執行該語音識別轉換結果。
4.根據權利要求I所述基於移動通訊終端語音交互的玩具控制方法，其特徵在於，還包括進行語音識別的網絡伺服器，所述移動通訊終端通過網際網路連接所述網絡伺服器並上傳語音信息，所述網絡伺服器與所述移動通訊終端並行對語音信息進行識別轉換。
5.根據權利要求4所述基於移動通訊終端語音交互的玩具控制方法，其特徵在於，所述移動通訊終端和所述網絡伺服器的語音識別轉換結果均包括語音識別轉換的置信度，所述移動通訊終端設置語音識別轉換結果的置信度閾值，當所述移動通訊終端語音識別轉換結果的置信度大於等於該置信度閾值時，取該語音識別轉換結果，若所述移動通訊終端語音識別轉換結果的置信度小於該置信度閾值時，取所述移動通訊終端語音識別轉換結果的置信度和所述網絡伺服器語音識別轉換結果的置信度中較大值的語音識別轉換結果。
6.根據權利要求I所述基於移動通訊終端語音交互的玩具控制方法，其特徵在於，在輸入不能識別的語音信息或不能執行的語音信息時，通過所述移動通訊終端或玩具輸入語音進行交互語音，以獲取能執行的語音信息。
7.根據權利要求I所述基於移動通訊終端語音交互的玩具控制方法，其特徵在於，還包括對所述移動通訊終端喚醒進行接收輸入語音狀態的喚醒步驟。
8.一種基於移動通訊終端語音交互的玩具控制系統，其特徵在於，包括具有通訊連接的玩具、具有語音輸入及語音識別轉換的移動通訊終端，所述移動通訊終端包括輸入語音的語音輸入單元、與所述玩具進行無線通訊連接的第一無線通訊模塊、將語音識別轉換為指令或指令和參數的第一語音轉換單元，所述玩具包括連接所述移動通訊終端的第二無線通訊模塊，所述語音輸入單元輸入語音，所述移動通訊終端將輸入的語音進行識別轉換，該語音識別轉換結果為指令或指令和參數的形式，由所述移動通訊終端或所述玩具共同執行該語音識別轉換結果或由所述移動通訊終端或所述玩具中任意一個執行該語音識別轉換結果。
9.根據權利要求8所述基於移動通訊終端語音交互的玩具控制系統，其特徵在於，所述第一語音轉換單元包括進行語音識別轉換的語音識別模塊、語義識別模塊，所述語義識別模塊根據所述語音識別模塊識別的語音判斷出所述語音輸入單元輸入語音的語義。
10.根據權利要求8所述基於移動通訊終端語音交互的玩具控制系統，其特徵在於，還包括進行語音識別轉換的網絡伺服器，所述移動通訊終端通過網際網路連接所述網絡伺服器並上傳語音信息，所述網絡伺服器與所述移動通訊終端並行對語音信息進行識別轉換。
11.根據權利要求10所述基於移動通訊終端語音交互的玩具控制系統，其特徵在於，所述移動通訊終端和所述網絡伺服器的語音識別轉換結果均包括語音識別轉換的置信度，所述移動通訊終端設置語音識別轉換結果的置信度閾值，當所述移動通訊終端語音識別轉換結果的置信度大於等於該置信度閾值時，取該語音識別轉換結果，若所述移動通訊終端語音識別轉換結果的置信度小於該置信度閾值時，取所述移動通訊終端語音識別轉換結果的置信度和所述網絡伺服器語音識別轉換結果的置信度中較大值的語音識別轉換結果。
12.根據權利要求8所述基於移動通訊終端語音交互的玩具控制系統，其特徵在於，所述移動通訊終端的第一無線通訊模塊為紅外信號發射器、藍牙通訊組件、RFID射頻通訊組件及2. 4G無線通訊組件中任一種或多種，所述玩具的第二無線通訊模塊為紅外信號接收器、藍牙通訊組件、RFID射頻通訊組件及2. 4G無線通訊組件中一種或多種。
13.根據權利要求8所述基於移動通訊終端語音交互的玩具控制系統，其特徵在於，所述玩具包括進行語音識別轉換的第二語音轉換單元，所述玩具的第二語音轉換單元對語音進行識別轉換。
全文摘要
本發明涉及一種基於移動通訊終端語音交互的玩具控制方法及系統，包括具有通訊連接的玩具、具有語音輸入及語音識別轉換的移動通訊終端，由所述移動通訊終端輸入語音；所述移動通訊終端將輸入的語音識別轉換為指令或指令和參數；所述移動通訊終端與所述玩具建立無線通訊連接，所述移動通訊終端將識別轉換的指令或指令和參數傳送到的所述玩具，由所述移動通訊終端或所述玩具共同執行該語音識別轉換結果或由所述移動通訊終端或所述玩具中任意一個執行該語音識別轉換結果。本發明一種基於移動通訊終端語音交互的玩具控制方法及系統，利用現在移動通訊終端較強的數據處理能力，對玩具進行語音控制。本發明一種基於移動通訊終端語音交互的玩具控制方法及系統，使玩具的內容更加豐富，功能更加強大，同時，大大節約了成本。
文檔編號G08C17/00GK102847325SQ20121032976
公開日2013年1月2日申請日期2012年9月7日優先權日2012年9月7日
發明者吳玉勝, 李新崗申請人:深圳市信利康電子有限公司

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

基於移動通訊終端語音交互的玩具控制方法及系統的製作方法

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法