使用有線無線通信網的語音對話方法及裝置製造方法

2023-08-01 00:06:16 3

使用有線無線通信網的語音對話方法及裝置製造方法
【專利摘要】本發明公開一種使用有線無線通信網的語音對話方法及裝置。本發明的使用有線無線通信網的語音對話方法包括步驟：a）語音對話裝置的語音輸入部接收用戶輸入的語音；b）語音對話裝置的有線無線通信部接收通過語音輸入部輸入並被傳遞的語音並傳送給可攜式終端；c）有線無線通信部接收可攜式終端傳送的答覆語音；和d）語音對話裝置的語音輸出部接收從有線無線通信部傳遞的語音並予以輸出。
【專利說明】使用有線無線通信網的語音對話方法及裝置

【技術領域】
[0001] 本發明提供一種使用有線無線通信網的語音對話方法及裝置。

【背景技術】
[0002] 一般來說，問答系統（question and answering system)是用戶為了獲得所需要的知識而向系統提問，系統對用戶提問進行分析並輸出對提問的答覆的系統。迄今由各種方法實現問答系統。然而，提問和答覆以文本形式存儲並表現的問答系統不便於使用。
[0003] 韓國公開專利2009-0034203公開一種裝拆式開關裝置（attachable and removable switch apparatus)。

【發明內容】

[0004] 本發明的一實施例的目的是讓用戶能夠通過有線或無線通信方式與帶有語音對話裝置的玩具(洋娃娃）進行對話。
[0005] 本發明的一實施例的使用有線無線通信網的語音對話方法，包括步驟：a)當有觸摸、對視或用戶語音輸入時，語音對話裝置的語音輸入部接收用戶輸入的語音；b)所述語音對話裝置的有線無線通信部接收通過所述語音輸入部輸入並被傳遞的語音並傳送給便攜式終端；c)所述有線無線通信部接收從所述可攜式終端傳送的答覆語音；和d)所述語音對話裝置的語音輸出部接收從所述有線無線通信部傳遞的語音並予以輸出。
[0006] 步驟a)可包括步驟：al)語音對話裝置的觸摸識別部或圖像輸出部識別用戶觸摸；a2)當觸摸識別部或圖像輸出部識別到用戶觸摸時或者當在用戶進行觸摸的期間內用戶輸入語音時，語音對話裝置的語音輸入部接收用戶輸入的語音；和a3)當在所述觸摸識別部或所述圖像輸出部沒有識別用戶觸摸的情況下有語音輸入時，語音對話裝置的語音輸入部判斷該語音是否為用戶語音後接收所輸入的語音。
[0007] 步驟a)可包括步驟：al)語音對話裝置的圖像輸入部識別用戶對視（eye contact) ;a2)當圖像輸入部識別到用戶對視時或者當在用戶對視的期間內用戶輸入語音時，語音對話裝置的語音輸入部接收用戶輸入的語音；和a3)當在圖像輸入部沒有識別用戶對視的情況下有語音輸入時，語音對話裝置的語音輸入部判斷該語音是否為用戶語音後接收所輸入的語音。
[0008] 在所述步驟d)中，在語音對話裝置的語音輸出部接收從有線無線通信部傳遞的語音並予以輸出的期間內，可根據對語音確定的感情，語音對話裝置的發光部以特定的顏色發光顯示。
[0009] 發光部的發光顏色及顯示周期可按照可攜式終端根據對語音確定的感情確定的顏色及顯示周期顯示。
[0010] 感情可為將語音轉換為文本後從自然語言文本中識別的感情。
[0011] 在步驟d)中，在接收從有線無線通信部傳遞的語音並予以輸出的期間內，語音對話裝置的圖像輸出部可輸出基於對語音確定的感情的面部表情圖像。
[0012] 在步驟d)中，在接收從有線無線通信部傳遞的語音並予以輸出的期間內，語音對話裝置的圖像輸出部可輸出基於對語音確定的感情的情感符號。
[0013] 本發明的一實施例的使用有線無線通信網的語音對話裝置，包括：
[0014] 語音輸入部，當有觸摸、對視或用戶語音輸入時，接收用戶輸入的語音；
[0015] 有線無線通信部，接收通過語音輸入部輸入並被傳遞的的語音並傳送給可攜式終端，並且接收從可攜式終端傳送的語音；和語音輸出部，接收從有線無線通信部傳遞的語音並予以輸出。
[0016] 語音對話裝置可進一步包括識別用戶觸摸的觸摸識別部，當觸摸識別部識別到用戶觸摸時或者當在用戶進行觸摸的期間內用戶輸入語音時，接收用戶輸入的語音。
[0017] 語音對話裝置可進一步包括接收用戶圖像的圖像輸入部，當通過圖像輸入部識別到用戶對視（eye contact)時或者當在用戶進行對視的期間內所述語音輸入部接收用戶輸入的語音。
[0018] 可進一步包括發光部，在語音輸出部接收從有線無線通信部傳遞的語音並予以輸出的期間內，發光部基於對語音確定的感情，以特定的顏色發光顯示。
[0019] 語音對話裝置可進一步包括用於輸出圖像的圖像輸出部。
[0020] 在語音輸出部接收從有線無線通信部傳遞的語音並予以輸出的期間內，圖像輸出部可輸出基於對語音確定的感情的面部表情圖像。
[0021] 在語音輸出部接收從有線無線通信部傳遞的語音並予以輸出的期間內，圖像輸出部可輸出基於對語音確定的感情的情感符號。
[0022] 根據本發明的一實施例，用戶通過有線或無線通信方式與帶有語音對話裝置的玩具(洋娃娃）進行對話，從而能夠迅速且明確地傳遞對用戶提問的答覆。

【專利附圖】

【附圖說明】
[0023] 圖1為表示本發明的一實施例的語音對話系統結構的圖。
[0024] 圖2為在本發明的一實施例的語音對話系統中語音對話裝置和可攜式終端之間的報文發送/接收流程圖。
[0025] 圖3為在本發明的一實施例的語音對話系統中語音對話裝置和可攜式終端之間的報文發送/接收流程圖。
[0026] 圖4為表示通過觸摸向應用程式傳遞感情信息時的一個示例的圖。
[0027] 圖5為表示本發明的一實施例的語音對話裝置的音量控制的一個示例的圖。
[0028] 圖6為表示用戶通過語音輸入與對話玩具(洋娃娃）進行對話的一個示例的圖。
[0029] 圖7為表示在可攜式終端應用程式中生成語音對話並進行對話時的一個示例的圖。
[0030] 圖8為表示本發明的一實施例的語音對話裝置的電源接通一個示例的圖。
[0031] 圖9為表不本發明的一實施例的配對功能一個不例的圖。
[0032] 圖10為表示本發明的一實施例的語音對話裝置的電池放電警告的一個示例的圖。
[0033] 圖11至圖21為表示對話玩具(洋娃娃）的面部表情種類的一個示例的圖。

【具體實施方式】
[0034] 下面，參照附圖詳細說明本發明的優選實施例，使得本發明所屬【技術領域】的技術人員能夠易於實施。本發明可實現為各種不同的形式，並不局限於在此說明的實施例。為了清楚地說明本發明，在附圖中省略了與說明無關的部分，在整個說明書中對相同或相似的結構要素使用相同的附圖標記。另外若為眾所周知的公知技術，則省略了詳細說明。
[0035] 在整個說明書中，當說明到某一部分"包括"某個結構要素時，在沒有特別相反的記載的情況下就指並不排除其他結構要素，而可以進一步包括其他結構要素。此外，在說明書中記載的"……部"、"……裝置"、"……模塊"等術語表示處理至少一個功能或動作的單位，這些單位可通過硬體、軟體或者硬體及軟體的結合來實現。
[0036] 圖1為表示本發明的一實施例的語音對話系統（phonetic conversation system) 結構的圖。
[0037] 參照圖1，語音對話系統可包括用戶（user) 10、語音對話裝置（phonetic conversation device) 30 和可攜式終端（mobile terminal) 50。
[0038] 為了與用戶10進行語音識別（voice recognition)問答，語音對話裝置30可通過內置在玩具(洋娃娃）或者能夠裝拆的形式或者通過皮帶固定在玩具(洋娃娃）的形式使用。語音對話裝置30包括語音輸入部（voice input unit)31、語音輸出部（voice output unit)32、觸摸識別部（touch recognition unit)33、發光部（light emitting unit)34 和有線無線通信部（wired and wireless communication unit) 35。語音對話裝置30可進一步包括圖像輸出部（image output unit) 36和圖像輸入部（image input unit) 37等。
[0039] 當用戶10為了輸入語音而觸碰觸摸識別部33時，觸摸識別部33工作。當觸摸識別部33工作時，用戶10可輸入語音。
[0040] 用戶10觸碰觸摸識別部來輸入語音的情況是在使用如谷歌語音識別器等用於接收所輸入的語音的特殊用戶界面（user interface)的情況。當能夠在原始碼（source code)上輸入語音而無需使用如細微差別語音識別器（nuance vocal recognition device)等特殊用戶界面時，無需操作觸摸識別部也能輸入語音。
[0041] 當觸摸識別部33工作，從而成為用戶10能夠輸入語音的狀態時，語音輸入部31 接收用戶10輸入的語音，並將其傳遞給有線無線通信部35。
[0042] 此外，即使觸摸識別部33不工作，語音輸入部31也可自行使用語音檢測引擎 (voice detection engine)或算法（algorithm),此時當所輸入的聲音判斷為人的語音時，語音輸入部31可接收語音並將其傳遞給有線無線通信部35。
[0043] 當用戶10為了輸入語音而快速觸摸一次或者持續觸摸約一?二秒鐘後輸入語音時，可通過語音檢測算法自動檢測語音輸入的結束，也可由另行配置的語音識別器（vocal recognition device)判斷是否已結束語音輸入之後向語音輸入部31告知語音輸入的結束。
[0044] 此外，可預先設定快速觸摸一次或者持續觸摸約一?二秒鐘後，可在預先設定的 (predetermined)時間內，例如在幾秒鐘內輸入語音的規則。此時，預先設定的時間內輸入的語音可被傳遞至語音識別器。
[0045] 語音輸入部31可以僅在用戶10觸摸的期間內接收所輸入的語音，此時當用戶10 解除觸摸時，被存儲在臨時存儲器的語音可被傳遞至有線無線通信部35。
[0046] 有線無線通信部35當接收通過語音輸入部31接收並傳遞的語音後，使用編解碼器壓縮該語音，並將通過有線通信或無線通信壓縮的語音傳送給可攜式終端50。
[0047] 有線無線通信部35在接收由可攜式終端50的有線無線通信部51傳送的壓縮語音並將其解碼後傳遞給語音輸出部32。
[0048] 語音輸出部32輸出經解碼的語音，由此，用戶能夠聽到所輸出的語音。例如，語音輸出部32可包括揚聲器。
[0049] 當數據傳送容量和傳送速度快時，有線無線通信部35可以無需壓縮由語音輸入部31輸入的語音，而通過有線通信或無線通信傳送給可攜式終端50,由可攜式終端50的有線無線通信部51傳送的語音也可無需進行解碼，而被傳遞至語音輸出部32。
[0050] 當觸摸識別部33識別到用戶10的觸摸，且觸摸識別信號被傳遞至發光部34時，發光部34可按照預先設定的周期顯示預設種類的光。此外，當由可攜式終端50傳送的語音通過語音輸出部32輸出時，發光部34可按預先設定的周期顯示預設種類的光。光的種類、光的顯示周期等發光條件信息可由可攜式終端50的感情判斷部53確定，經確定的發光條件信息可被傳送到語音對話裝置30。例如，發光部34可包括LED。
[0051] 圖像輸出部36用於輸出圖像，可包括觸控螢幕。輸出圖像可包括觸摸按鈕。觸摸按鈕可為用於告知開始語音識別的按鈕、用於調節音量的按鈕或用於接通/斷開電源的按鈕等。例如，用戶10觸摸輸出圖像的時間點可成為語音識別的起始點。語音輸入的完成可通過語音輸入部31的語音檢測算法自動檢測，也可通過另行配置的語音識別器識別。經識別的語音通過有線無線通信部35傳送到可攜式終端50。圖像輸出部36可包括IXD或0LED 等顯示器。
[0052] 此外，如圖11至圖21所示，圖像輸出部36可根據從對用戶10的提問的答覆中提取的感情，輸出各種面部表情。面部表情可包括情感符號。圖像輸出部36的面部表情和語音輸出部32的語音輸出可以如同實際說話那樣同時輸出。由此，用戶10能夠通過固定有語音對話裝置30的玩具(洋娃娃）的面部表情變化並且聽語音來感受到真實感。
[0053] 圖像輸入部37用於接收所輸入的圖像，可包括攝像機或圖像傳感器等。通過圖像輸入部37輸入的圖像通過有線無線通信部35傳送到可攜式終端50。可攜式終端50確認用戶10的瞳孔是否朝向圖像輸入部37。例如，用戶10的瞳孔朝向圖像輸入部37的時間點可成為語音識別的起始點。語音輸入的完成可通過語音輸入部31的語音檢測算法自動檢測，也可通過另行配置的語音識別器識別，經識別的語音通過有線無線通信部35傳送到便攜式終端50。當無用戶對視的情況下向語音輸入部31輸入語音時，可先判斷所輸入的語音是否為用戶10的語音之後，當判斷為用戶10的語音時接收所輸入的語音。
[0054] 圖像輸入部37可以僅在用戶10對視的期間內接收所輸入的語音，此時，若用戶10 不再對視，則被存儲在臨時存儲器中的語音可被傳遞至有線無線通信部35。
[0055] 可攜式終端50為用於通過有線或無線方式與語音對話裝置30進行通信的終端，將對語音對話裝置30以有線或無線方式傳送的提問的答覆生成為語音合成數據，或者表現各種面部表情。
[0056] 例如，可攜式終端50為個人電腦（PC)、可攜式電腦（PDA)、筆記本電腦、平板電腦、手機（iPhone、安卓手機、谷歌手機等）和能夠進行雙向語音及數據通信的媒體的總稱，可使用包含能夠進行有線無線網際網路或者有線無線電話(移動）通信的設備的各種終端。
[0057] 當可攜式終端50與語音對話裝置30進行有線通信時，可攜式終端50在設置在玩具(洋娃娃）的面部的狀態下，以有線通信方式與語音對話裝置30相連，並且將對語音對話裝置30傳送的用戶提問的答覆生成為語音合成數據後傳送給語音對話裝置30。此時，玩具 (洋娃娃）的表情如圖11至圖21所示，可根據通過設置在玩具(洋娃娃）面部的可攜式終端 50從對所述用戶提問的答覆中提取的感情形成各種面部表情。
[0058] 圖11至圖21為表示對話玩具(洋娃娃)的面部表情種類的一個示例的圖，圖11表示平靜的感情，圖12表示憂慮的感情，圖13表示高興的感情，圖14表示懷疑的感情，圖15 表示厭倦的感情，圖16表示期待的感情，圖17表示惱怒的感情，圖18表示對觸摸動作的感情，圖19表示睡覺動作，圖20表示說話動作，圖21表示聆聽動作。
[0059] 當可攜式終端50與語音對話裝置30進行無線通信時，可攜式終端50可以不被設置在玩具(洋娃娃)的面部，而位於能夠與語音對話裝置30進行無線通信的距離內。可攜式終端50將對從語音對話裝置30以無線通信方式傳送的用戶提問的答覆生成為語音合成數據，並將其傳送給語音對話裝置30。
[0060] 可攜式終端50包括有線無線通信部51、問答部（question and answer unit)52、感情判斷部（emotion determination unit) 53、語音合成部（voice synthesis unit) 54 和語音識別部（voice recognition unit) 55。
[0061] 有線無線通信部51接收並解碼從語音對話裝置30的有線無線通信部35以有線通信或無線通信方式傳送的壓縮語音，並將經過解碼的語音變更為用於語音識別的格式後傳送給語音識別部55。
[0062] 語音識別部55識別從有線無線通信部51接收的語音，並將語音識別結果即提問文本（text)傳遞給問答部52。
[0063] 問答部52當接到從語音識別部55傳遞的提問文本時，生成對提問文本的答覆文本並傳遞給語音合成部54。
[0064] 語音合成部54當接到從問答部52傳遞的答覆文本時，將答覆文本合成為語音以生成語音合成數據後傳遞給有線無線通信部51。
[0065] 感情判斷部53從答覆文本提取感情，並對所提取的感情，確定用於由語音對話裝置30的發光部34顯示特定光的光的種類和光的顯示周期等發光條件信息，並將此信息傳遞給無線通信部51。此外，感情判斷部53對所提取的感情，如圖11至圖21所示那樣確定各種面部表情並傳遞給有線無線通信部51。傳遞至有線無線通信部51的發光條件信息和各種面部表情可通過語音對話裝置30的有線無線通信部35分別傳送到發光部34及圖像輸出部36。
[0066] 例如，為了從答覆文本提取感情，可通過自然語言處理(詞素分析、語法分析、語義分析等）方式分析答覆文本，從而分類包含在答覆文本中的感情。
[0067] 當從語音合成部54傳遞語音合成數據時，有線無線通信部51壓縮經過語音合成而形成的語音合成數據，並將壓縮的語音合成數據、由感情判斷部53確定的光的種類和光的顯示周期等發光條件信息以及各種面部表情傳送給語音對話裝置30。
[0068] 當數據的傳送容量和傳送速度快時，有線無線通信部51可接收從語音對話裝置 30的有線無線通信部35以有線通信或無線通信方式傳送的語音，且在不進行解碼的情況下傳遞給語音識別部55。此時，語音識別部55識別從有線無線通信部51傳遞的語音，並將作為語音識別結果的提問文本傳遞給問答部52。
[0069] 圖2為在本發明的一實施例的語音對話系統中語音對話裝置和可攜式終端之間的報文發送/接收流程圖。
[0070] 參照圖2,語音對話裝置30判斷用戶是否觸摸一次或者與語音對話裝置30的圖像輸入部37對視（eye contact)-次（S1)，當用戶10觸摸一次或者對視一次時，判斷觸摸時間或者對視時間是否為一秒鐘（S2)。
[0071] 當用戶10觸摸一秒鐘或者與語音對話裝置30的圖像輸入部37對視一秒鐘時，語音對話裝置30接收用戶10輸入的語音(提問）（S3)，並在壓縮語音後傳送給可攜式終端50 (S4)。
[0072] 可攜式終端50解碼從語音對話裝置30壓縮傳送的語音，進行語音識別（S5)後，生成對提問的答覆（S6 )，並對答覆進行感情分析（S7 )。
[0073] 可攜式終端50將對答覆文本進行語音合成而形成的語音合成數據及感情分析結果信息傳送給語音對話裝置（S8)。例如，感情分析結果信息可為用於由語音對話裝置30的發光部34顯示特定光的光的種類和光的顯示周期等發光條件信息、或者如圖11至圖21所示的針對通過感情判斷部53提取的感情的各種面部表情。
[0074] 語音對話裝置30解碼從可攜式終端50傳送的語音並予以輸出（S9)，在輸出語音時，根據從可攜式終端傳送的感情分析結果即感情數據控制LED光，並輸出面部表情 (510) 。
[0075] 另一方面，語音對話裝置30在判斷用戶10是否觸摸一次或者與語音對話裝置 30的圖像輸入部37對視一次的步驟S1中，當用戶10未觸摸一次或者未與語音對話裝置 30的圖像輸入部37對視一次時，確認觸摸/對視次數及時間間隔並傳送給可攜式終端50 (511) 。
[0076] 可攜式終端50的問答部52生成根據從語音對話裝置30傳送的觸摸次數及時間間隔的答覆（S12)，可攜式終端50向語音對話裝置30傳送將答覆文本語音合成而形成的數據（S13)。
[0077] 語音對話裝置30解碼從可攜式終端50傳送的語音合成數據並予以輸出（S14)，語音對話裝置30在輸出語音時，控制LED光並且輸出面部表情（S15)。
[0078] 圖3為在本發明的一實施例的語音對話系統中語音對話裝置和可攜式終端之間的報文發送/接收流程圖。
[0079] 參照圖3,語音對話裝置30判斷用戶10是否觸摸一次或者與語音對話裝置30的圖像輸入部37對視一次（S1 )，當用戶10觸摸一次或者與語音對話裝置30的圖像輸入部37 對視一次時，判斷觸摸時間或對視時間是否為一秒鐘（S2)。
[0080] 當用戶10觸摸一秒鐘或者與語音對話裝置30的圖像輸入部37對視一秒鐘時，語音對話裝置30接收用戶10輸入的語音(提問）（S3)，且在壓縮語音後傳送給可攜式終端50 (S4)。
[0081] 可攜式終端50解碼從語音對話裝置30壓縮傳送的語音，並進行語音識別（S5)後，生成對提問的答覆（S6 )，並對答覆進行感情分析（S7 )。
[0082] 可攜式終端50將對答覆文本進行語音合成而形成的語音合成數據及感情分析結果信息傳送給語音對話裝置（S8 )。例如，感情分析結果信息可為用於由語音對話裝置30的發光部34顯示特定光的光的種類和光的顯示周期等發光條件信息、或者如圖11至圖21所示的對通過感情判斷部53提取的感情的各種面部表情。
[0083] 語音對話裝置30解碼從可攜式終端50傳送的語音並予以輸出（S9)，在輸出語音時，根據從可攜式終端傳送的感情分析結果即感情數據控制LED光，並輸出面部表情 (S10)。
[0084] 另一方面，語音對話裝置30在判斷用戶10是否觸摸一次或者與語音對話裝置30 的圖像輸入部37對視一次的步驟S1中，當用戶10未觸摸一次或者未與語音對話裝置30 的圖像輸入部37對視一次時，確認觸摸/對視次數及時間間隔並將其結果傳送給可攜式終端 50 (S11)。
[0085] 可攜式終端50的問答部52生成根據從語音對話裝置30傳送的觸摸次數及時間間隔的答覆（S12)，可攜式終端50向語音對話裝置30傳送將答覆文本語音合成而形成的數據（S13)。
[0086] 語音對話裝置30解碼從可攜式終端50傳送的語音合成數據並予以輸出（S14)，語音對話裝置30在輸出語音時，控制LED光並且輸出面部表情（S15)。
[0087] 接下來，語音對話裝置30在用戶10觸摸一次或者與語音對話裝置30的圖像輸入部37對視一次時判斷觸摸/對視時間是否為一秒鐘的步驟S2中，當觸摸或對視時間不是一秒鐘時，判斷觸摸時間是否為五秒鐘或者電源按鈕是否被觸摸（S16)。
[0088] 當用戶10觸摸五秒鐘或者電源按鈕被觸摸時，語音對話裝置30在接通電源（S17) 後，將電源接通（0N)信息傳送給可攜式終端50 (S18)。
[0089] 可攜式終端50的問答部52當接到語音對話裝置30的電源接通（0N)信息時，生成答覆（S19)，並向語音對話裝置30傳送將所生成的答覆文本語音合成而形成的數據（S20)。
[0090] 語音對話裝置30解碼從可攜式終端50傳送的語音合成數據並予以輸出（S21 )，語音對話裝置30在輸出語音時，控制LED光並且輸出面部表情（S22)。
[0091] 另一方面，語音對話裝置30在判斷用戶10的觸摸時間是否為五秒鐘或者電源按鈕是否被觸摸的步驟S16中，當觸摸時間不是五秒鐘，或者電源按鈕未被觸摸時，判斷觸摸時間是否為十秒鐘（S23)，當用戶10觸摸十秒鐘時，以配對（pairing)模式工作（S24)。配對可通過藍牙或WIFI等近距離無線通信連接。
[0092] 當語音對話裝置30以配對模式工作時，可攜式終端50試圖配對連接（S25)，語音對話裝置30在與可攜式終端50配對連接後，將配對連接成功信息傳送給可攜式終端50 (S26)。
[0093] 可攜式終端50的問答部52當從語音對話裝置30接收配對連接成功信息時生成答覆（S27)，並向語音對話裝置傳送將所生成的答覆文本語音合成而形成的數據傳送 (S28)。
[0094] 語音對話裝置30解碼從可攜式終端50傳送的語音合成數據並予以輸出（S29)，語音對話裝置30在輸出語音時，控制光並且輸出面部表情（S30)。
[0095] 圖4為表示通過觸摸來向應用程式傳遞感情信息的一個示例的圖。
[0096] 參照圖4,當用戶10僅觸摸一次語音對話裝置30的DIP開關、撥動開關、後備電源觸摸式開關等按鈕或觸摸識別部33等，或者與語音對話裝置30的圖像輸入部37對視一次（S1)時，語音對話裝置30的發光二極體（LED)以預先設定的顏色例如以紅色閃爍一次 (52) 。
[0097] 語音對話裝置30將觸摸一次或對視一次的信息傳送給可攜式終端(應用程式）50 (53) ，並且接收答覆對話（S4)並輸出語音及圖像（S5)。其中，語音對話裝置30從可攜式終端50接收的答覆對話為語音合成數據，例如可為"早上好！願您今天有個好心情，我們談什麼呢"等內容。在這種答覆對話及與此相關的面部表情圖像通過語音對話裝置30的語音輸出部32及圖像輸出部36輸出的期間內，語音對話裝置30的發光二極體（LED)以預先設定的顏色例如以黃色發光顯示（S6)後，當結束輸出時重新以基本顏色即以藍色發光顯示 (S7)。
[0098] 當用戶10將語音對話裝置30的DIP開關、撥動開關、後備電源觸摸式開關等按鈕或觸摸識別部33等連續快速觸摸兩次以上，或者連續快速眨眼兩次以上時（S8)，語音對話裝置30的發光二極體（LED)以預先設定的顏色例如以紅色閃爍一次（S9)。
[0099] 語音對話裝置30將連續兩次以上的快速觸摸或眨眼信息傳送給可攜式終端(應用程序）50 (S10)以告知有緊急情況，並接收所反饋的答覆對話（S11)後輸出語音及圖像。其中，語音對話裝置30從可攜式終端50接收的答覆對話為語音合成數據，例如可為"您怎麼啦？發生什麼事"等內容。在這種答覆對話及與此相關的面部表情圖像通過語音對話裝置30的語音輸出部32及圖像輸出部36輸出的期間內，語音對話裝置30的發光二極體 (LED)以預先設定的顏色，例如以黃色發光顯示（S13)後，當結束輸出時重新以基本顏色即以藍色發光顯示（S14)。
[0100] 圖5為表示本發明的語音對話裝置的音量控制的一個示例的圖。
[0101] 參照圖5,當用戶10僅按下一次語音對話裝置30的音量調高/調低按鈕時（S1)，語音對話裝置30的發光二極體（LED)以預先設定的顏色，例如以紅色閃爍一次（S2)，並適用音量調高/調低功能（S3)。
[0102] 語音對話裝置30將音量調高/調低觸摸信息傳送給可攜式終端(應用程式）50 (54) ，並且接收答覆對話（S5)後輸出語音及圖像（S6)。其中，語音對話裝置30從可攜式終端50接收的答覆對話為語音合成數據，例如可為"您已經把音量調高/調低了 "等內容。在這種答覆對話及與此相關的面部表情圖像通過語音對話裝置30的語音輸出部32及圖像輸出部36輸出的期間內，語音對話裝置30的發光二極體（LED)以預先設定的顏色，例如以黃色發光顯示（S7)後，當結束輸出時重新以基本顏色即以藍色發光顯示（S8)。
[0103] 圖6為表示用戶通過語音輸入與對話玩具(洋娃娃）進行對話的一個示例的圖。
[0104] 參照圖6,當用戶10觸摸語音對話裝置30的中央觸摸部分一秒鐘，或者與圖像輸入部37對視一秒鐘時（S1)，語音對話裝置30的發光二極體（LED)以預先設定的顏色，例如以藍綠色顯示五秒鐘（S2)，從而語音對話裝置30成為語音輸入待機狀態(五秒鐘)。
[0105] 語音對話裝置30接收用戶10的語音（S3)。此時，用戶向語音對話裝置30的麥克風輸入語音。所輸入的語音例如可為"你是誰？ "等內容。
[0106] 語音對話裝置30即使不啟動觸摸，也可自行使用語音檢測引擎判斷所輸入的聲音是否為人的語音。語音檢測引擎可使用各種語音檢測算法。
[0107] 語音對話裝置30將所輸入的用戶10的語音數據傳送給可攜式終端(應用程式)50 (S4)，語音對話裝置30的發光二極體（LED)重新以基本顏色即以藍色發光顯示（S5)。
[0108] 語音對話裝置30從可攜式終端(應用程式)50接收答覆對話及與此相關的面部表情圖像（S6)，並將其通過語音輸出部32及圖像輸出部36輸出（S7)。其中，語音對話裝置 30從終端50接收的答覆對話為語音合成數據，例如可為"我是對話玩具(洋娃娃）雅麗"等內容。在這種答覆對話及與此相關的面部表情圖像通過語音對話裝置30的語音輸出部32 及圖像輸出部36輸出的期間內，語音對話裝置30的發光二極體（LED)以預先設定的顏色，例如以黃色發光顯示（S8)後，當結束輸出時重新以基本顏色即以藍色發光顯示（S9)。
[0109] 圖7為表示在可攜式終端應用程式中生成語音對話並進行對話的一個示例的圖。
[0110] 參照圖7,即使不通過語音對話裝置30傳送語音，可攜式終端(應用程式）50也會生成答覆對話並將其轉換成語音合成（TTS)數據後以聲響形式將語音合成數據傳送給語音對話裝置30 (S1)。
[0111] 語音對話裝置30接收從可攜式終端(應用程式)50傳送的答覆對話及與此相關的面部表情圖像並通過語音輸出部32及圖像輸出部36輸出（S2)。其中，語音對話裝置30從可攜式終端50接收的答覆對話為語音合成數據，例如可為"今天是星期一"等內容。在這種答覆對話及與此相關的面部表情圖像通過語音對話裝置30的語音輸出部32及圖像輸出部36輸出的期間內，語音對話裝置30的發光二極體（LED)以預先設定的顏色，例如以黃色發光顯示（S3)後，當結束輸出時重新以基本顏色即以藍色發光顯示（S4)。
[0112] 圖8為表示本發明的語音對話裝置的電源接通一個示例的圖。
[0113] 參照圖8,當用戶10將語音對話裝置30的電源按鈕或觸摸識別部33等觸摸五秒鍾時（S1)，語音對話裝置30的發光二極體（LED)在從可攜式終端(應用程式）50接收語音合成數據之前以基本顏色即以藍色發光顯示（S2 )。
[0114] 當語音對話裝置30與可攜式終端(應用程式）50之間自動配對連接時，語音對話裝置30將接通（on)信息傳送給可攜式終端(應用程式）50 (S3)，並從可攜式終端(應用程序)50接收答覆對話(答覆數據）或者與此相關的面部表情圖像（S4)，並通過語音輸出部32 及圖像輸出部36輸出（S5)。其中，可攜式終端(應用程式)50通過語音合成（TTS)功能將答複數據轉換成語音，並將該語音數據（Sound)壓縮後用無線方式傳送給語音對話裝置30，語音對話裝置30解碼從可攜式終端(應用程式)50傳送的壓縮語音數據並通過語音輸出部 32輸出，並且解碼經過壓縮的面部表情圖像後通過圖像輸出部36輸出。語音對話裝置30 從可攜式終端(應用程式）50接收的答覆對話為語音合成（TTS)數據，例如可為"您好，很高興見到您〃等內容。在這種答覆對話及與此相關的面部表情圖像通過語音對話裝置30的語音輸出部32及圖像輸出部36輸出的期間內，語音對話裝置30的發光二極體（LED)以預先設定的顏色，例如以黃色發光顯示（S6)後，當結束輸出時重新以基本顏色即以藍色發光顯示（S7)。
[0115] 圖9為表示本發明的配對功能一個示例的圖。
[0116] 參照圖9,當用戶10將語音對話裝置30觸摸十秒鐘時（S1)，語音對話裝置30以配對模式工作，發光二極體（LED)以白色發光顯示（S2)。
[0117] 可攜式終端(應用程式）50試圖與語音對話裝置30配對連接（S3)，當語音對話裝置30與可攜式終端(應用程式）50之間的配對連接成功時，發光二極體（LED)以藍色和白色閃爍（S4)。接下來將配對成功信息傳送給可攜式終端(應用程式）50 (S5)。
[0118] 可攜式終端(應用程式）50向語音對話裝置30傳送語音合成數據（S6)，語音對話裝置30從可攜式終端(應用程式）50接收語音合成數據及與此相關的面部表情圖像，並通過語音輸出部32及圖像輸出部36輸出（S7)。其中，語音對話裝置30從可攜式終端(應用程序）50接收的答覆對話為語音合成數據，例如可為"配對連接成功"等內容。在這種答覆對話及與此相關的面部表情圖像通過語音對話裝置30的語音輸出部32及圖像輸出部36 輸出的期間內，語音對話裝置30的發光二極體（LED)以預先設定的顏色，例如以黃色發光顯示（S8 )後，當結束輸出時重新以基本顏色即以藍色發光顯示（S9 )。
[0119] 圖10為表示本發明的語音對話裝置的電池放電警告一個示例的圖。
[0120] 參照圖10,語音對話裝置30判斷電池餘量是否為20%以下，當電池餘量為20%以下時，使發光二極體（LED)以紅色閃爍以顯示電池放電警告（S2)。
[0121] 接下來，語音對話裝置30將電池放電信息傳送給可攜式終端(應用程式)50( S3 )。
[0122] 可攜式終端(應用程式）50向語音對話裝置30傳送語音合成數據（S4)，語音對話裝置30從可攜式終端(應用程式)50接收語音合成數據及與此相關的面部表情圖像並通過語音輸出部32及圖像輸出部36輸出（S5)。其中，語音對話裝置30從可攜式終端(應用程序）50接收的答覆對話為語音合成數據，例如可為"電池餘量為20%，請充電"等內容。在這種答覆對話及與此相關的面部表情圖像通過語音對話裝置30的語音輸出部32及圖像輸出部36輸出的期間內，語音對話裝置30的發光二極體（LED)以預先設定的顏色，例如以黃色發光顯示（S6)，並且周期性地反覆使發光二極體（LED)以紅色閃爍顯示（S7)，直至給電池充電為止。
[0123] 以上對本發明的優選實施例進行詳細的說明，但本發明的權利範圍並不限於上述內容，利用所附的權利要求書所定義的本發明的基本概念所進行的本領域技術人員的各種變形及改良形式也屬於本發明的權利範圍。
[0124] 附圖標記說明：
[0125] 30 :語音對話裝置
[0126] 50 :可攜式終端。
【權利要求】
1. 一種使用有線無線通信網的語音對話方法，包括步驟： a) 當有觸摸、對視或用戶語音輸入時，語音對話裝置的語音輸入部接收用戶輸入的語音； b) 所述語音對話裝置的有線無線通信部接收通過所述語音輸入部輸入並被傳遞的語音並傳送給可攜式終端； c) 所述有線無線通信部接收從所述可攜式終端傳送的答覆語音；和 d) 所述語音對話裝置的語音輸出部接收從所述有線無線通信部傳遞的語音並予以輸出。
2. 根據權利要求1所述的使用有線無線通信網的語音對話方法，其中，所述步驟a)包括步驟： al)所述語音對話裝置的觸摸識別部或圖像輸出部識別用戶觸摸； a2)當所述觸摸識別部或所述圖像輸出部識別到用戶觸摸時或者當在用戶進行觸摸的期間內用戶輸入語音時，所述語音對話裝置的語音輸入部接收用戶輸入的語音；和 a3)當在所述觸摸識別部或所述圖像輸出部沒有識別用戶觸摸的情況下有語音輸入時，所述語音對話裝置的語音輸入部判斷該語音是否為用戶語音後接收所輸入的語音。
3. 根據權利要求1所述的使用有線無線通信網的語音對話方法，其中，所述步驟a)包括步驟： al)所述語音對話裝置的圖像輸入部識別用戶對視； a2)當所述圖像輸入部識別到用戶對視時或者當在用戶對視的期間內用戶輸入語音時，所述語音對話裝置的語音輸入部接收用戶輸入的語音；和 a3)當在所述圖像輸入部沒有識別用戶對視的情況下有語音輸入時，所述語音對話裝置的語音輸入部判斷該語音是否為用戶語音後接收所輸入的語音。
4. 根據權利要求1所述的使用有線無線通信網的語音對話方法，其中，在所述步驟d)中，在所述語音對話裝置的語音輸出部接收從所述有線無線通信部傳遞的語音並予以輸出的期間內，根據對所述語音確定的感情，所述語音對話裝置的發光部以特定顏色發光顯示。
5. 根據權利要求4所述的使用有線無線通信網的語音對話方法，其中，所述發光部的發光顏色及顯示周期是按照所述可攜式終端根據對所述語音確定的感情確定的顏色及顯示周期顯示的。
6. 根據權利要求5所述的使用有線無線通信網的語音對話方法，其中，所述感情為將所述語音轉換為文本後從自然語言文本中識別的感情。
7. 根據權利要求1所述的使用有線無線通信網的語音對話方法，其中，在所述步驟d)中，在接收從所述有線無線通信部傳遞的語音並予以輸出的期間內，所述語音對話裝置的圖像輸出部輸出基於對所述語音確定的感情的面部表情圖像。
8. 根據權利要求1所述的使用有線無線通信網的語音對話方法，其中，在所述步驟d)中，在接收從所述有線無線通信部傳遞的語音並予以輸出的期間內，所述語音對話裝置的圖像輸出部輸出基於對所述語音確定的感情的情感符號。
9. 一種使用有線無線通信網的語音對話裝置，包括：語音輸入部，當有觸摸、對視或用戶語音輸入時，接收用戶輸入的語音；有線無線通信部，接收通過所述語音輸入部輸入並被傳遞的語音並傳送給可攜式終端,並且接收從所述可攜式終端傳送的語音；和語音輸出部，接收從所述有線無線通信部傳遞的語音並予以輸出。
10. 根據權利要求9所述的使用有線無線通信網的語音對話裝置，其中，進一步包括用於識別用戶觸摸的觸摸識別部，當所述觸摸識別部識別到用戶觸摸時或者當在用戶進行觸摸的期間內用戶輸入語音時，接收用戶輸入的語音。
11. 根據權利要求9所述的使用有線無線通信網的語音對話裝置，其中，進一步包括用於接收用戶圖像的圖像輸入部，當通過所述圖像輸入部識別到用戶對視時或者當在用戶進行對視的期間內所述語音輸入部接收用戶輸入的語音。
12. 根據權利要求9所述的使用有線無線通信網的語音對話裝置，其中，進一步包括發光部，在所述語音輸出部接收從所述有線無線通信部傳遞的語音並予以輸出的期間內，所述發光部基於對所述語音確定的感情，以特定的顏色發光顯示。
13. 根據權利要求12所述的使用有線無線通信網的語音對話裝置，其中，所述發光部的發光顏色和顯示周期是按照所述可攜式終端基於對所述語音確定的感情確定的顏色及顯示周期顯示的。
14. 根據權利要求13所述的使用有線無線通信網的語音對話裝置，其中，所述感情為將所述語音轉換為文本後從自然語言文本中識別的感情。
15. 根據權利要求9所述的使用有線無線通信網的語音對話裝置，其中，進一步包括用於輸出圖像的圖像輸出部，在所述語音輸出部接收從所述有線無線通信部傳遞的語音並予以輸出的期間內，所述圖像輸出部輸出基於對所述語音確定的感情的面部表情圖像。
16. 根據權利要求9所述的使用有線無線通信網的語音對話裝置，其中，進一步包括用於輸出圖像的圖像輸出部，在所述語音輸出部接收從所述有線無線通信部傳遞的語音並予以輸出的期間內，所述圖像輸出部輸出基於對所述語音確定的感情的情感符號。
【文檔編號】H04W76/02GK104105223SQ201410012267
【公開日】2014年10月15日申請日期:2014年1月10日優先權日:2013年4月9日
【發明者】尹在敏申請人:雅力株式會社

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

使用有線無線通信網的語音對話方法及裝置製造方法

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法