新四季網

使用有線無線通信網的語音對話方法及裝置製造方法

2023-08-01 00:06:16 2

使用有線無線通信網的語音對話方法及裝置製造方法
【專利摘要】本發明公開一種使用有線無線通信網的語音對話方法及裝置。本發明的使用有線無線通信網的語音對話方法包括步驟:a)語音對話裝置的語音輸入部接收用戶輸入的語音;b)語音對話裝置的有線無線通信部接收通過語音輸入部輸入並被傳遞的語音並傳送給可攜式終端;c)有線無線通信部接收可攜式終端傳送的答覆語音;和d)語音對話裝置的語音輸出部接收從有線無線通信部傳遞的語音並予以輸出。
【專利說明】使用有線無線通信網的語音對話方法及裝置

【技術領域】
[0001] 本發明提供一種使用有線無線通信網的語音對話方法及裝置。

【背景技術】
[0002] 一般來說,問答系統(question and answering system)是用戶為了獲得所需要 的知識而向系統提問,系統對用戶提問進行分析並輸出對提問的答覆的系統。迄今由各種 方法實現問答系統。然而,提問和答覆以文本形式存儲並表現的問答系統不便於使用。
[0003] 韓國公開專利2009-0034203公開一種裝拆式開關裝置(attachable and removable switch apparatus)。


【發明內容】

[0004] 本發明的一實施例的目的是讓用戶能夠通過有線或無線通信方式與帶有語音對 話裝置的玩具(洋娃娃)進行對話。
[0005] 本發明的一實施例的使用有線無線通信網的語音對話方法,包括步驟:a)當有觸 摸、對視或用戶語音輸入時,語音對話裝置的語音輸入部接收用戶輸入的語音;b)所述語音 對話裝置的有線無線通信部接收通過所述語音輸入部輸入並被傳遞的語音並傳送給便攜 式終端;c)所述有線無線通信部接收從所述可攜式終端傳送的答覆語音;和d)所述語音對 話裝置的語音輸出部接收從所述有線無線通信部傳遞的語音並予以輸出。
[0006] 步驟a)可包括步驟:al)語音對話裝置的觸摸識別部或圖像輸出部識別用戶觸 摸;a2)當觸摸識別部或圖像輸出部識別到用戶觸摸時或者當在用戶進行觸摸的期間內用 戶輸入語音時,語音對話裝置的語音輸入部接收用戶輸入的語音;和a3)當在所述觸摸識 別部或所述圖像輸出部沒有識別用戶觸摸的情況下有語音輸入時,語音對話裝置的語音輸 入部判斷該語音是否為用戶語音後接收所輸入的語音。
[0007] 步驟a)可包括步驟:al)語音對話裝置的圖像輸入部識別用戶對視(eye contact) ;a2)當圖像輸入部識別到用戶對視時或者當在用戶對視的期間內用戶輸入語音 時,語音對話裝置的語音輸入部接收用戶輸入的語音;和a3)當在圖像輸入部沒有識別用 戶對視的情況下有語音輸入時,語音對話裝置的語音輸入部判斷該語音是否為用戶語音 後接收所輸入的語音。
[0008] 在所述步驟d)中,在語音對話裝置的語音輸出部接收從有線無線通信部傳遞的語 音並予以輸出的期間內,可根據對語音確定的感情,語音對話裝置的發光部以特定的顏色 發光顯示。
[0009] 發光部的發光顏色及顯示周期可按照可攜式終端根據對語音確定的感情確定的 顏色及顯示周期顯示。
[0010] 感情可為將語音轉換為文本後從自然語言文本中識別的感情。
[0011] 在步驟d)中,在接收從有線無線通信部傳遞的語音並予以輸出的期間內,語音對 話裝置的圖像輸出部可輸出基於對語音確定的感情的面部表情圖像。
[0012] 在步驟d)中,在接收從有線無線通信部傳遞的語音並予以輸出的期間內,語音對 話裝置的圖像輸出部可輸出基於對語音確定的感情的情感符號。
[0013] 本發明的一實施例的使用有線無線通信網的語音對話裝置,包括:
[0014] 語音輸入部,當有觸摸、對視或用戶語音輸入時,接收用戶輸入的語音;
[0015] 有線無線通信部,接收通過語音輸入部輸入並被傳遞的的語音並傳送給可攜式終 端,並且接收從可攜式終端傳送的語音;和語音輸出部,接收從有線無線通信部傳遞的語音 並予以輸出。
[0016] 語音對話裝置可進一步包括識別用戶觸摸的觸摸識別部,當觸摸識別部識別到用 戶觸摸時或者當在用戶進行觸摸的期間內用戶輸入語音時,接收用戶輸入的語音。
[0017] 語音對話裝置可進一步包括接收用戶圖像的圖像輸入部,當通過圖像輸入部識別 到用戶對視(eye contact)時或者當在用戶進行對視的期間內所述語音輸入部接收用戶輸 入的語音。
[0018] 可進一步包括發光部,在語音輸出部接收從有線無線通信部傳遞的語音並予以輸 出的期間內,發光部基於對語音確定的感情,以特定的顏色發光顯示。
[0019] 語音對話裝置可進一步包括用於輸出圖像的圖像輸出部。
[0020] 在語音輸出部接收從有線無線通信部傳遞的語音並予以輸出的期間內,圖像輸出 部可輸出基於對語音確定的感情的面部表情圖像。
[0021] 在語音輸出部接收從有線無線通信部傳遞的語音並予以輸出的期間內,圖像輸出 部可輸出基於對語音確定的感情的情感符號。
[0022] 根據本發明的一實施例,用戶通過有線或無線通信方式與帶有語音對話裝置的玩 具(洋娃娃)進行對話,從而能夠迅速且明確地傳遞對用戶提問的答覆。

【專利附圖】

【附圖說明】
[0023] 圖1為表示本發明的一實施例的語音對話系統結構的圖。
[0024] 圖2為在本發明的一實施例的語音對話系統中語音對話裝置和可攜式終端之間 的報文發送/接收流程圖。
[0025] 圖3為在本發明的一實施例的語音對話系統中語音對話裝置和可攜式終端之間 的報文發送/接收流程圖。
[0026] 圖4為表示通過觸摸向應用程式傳遞感情信息時的一個示例的圖。
[0027] 圖5為表示本發明的一實施例的語音對話裝置的音量控制的一個示例的圖。
[0028] 圖6為表示用戶通過語音輸入與對話玩具(洋娃娃)進行對話的一個示例的圖。
[0029] 圖7為表示在可攜式終端應用程式中生成語音對話並進行對話時的一個示例的 圖。
[0030] 圖8為表示本發明的一實施例的語音對話裝置的電源接通一個示例的圖。
[0031] 圖9為表不本發明的一實施例的配對功能一個不例的圖。
[0032] 圖10為表示本發明的一實施例的語音對話裝置的電池放電警告的一個示例的 圖。
[0033] 圖11至圖21為表示對話玩具(洋娃娃)的面部表情種類的一個示例的圖。

【具體實施方式】
[0034] 下面,參照附圖詳細說明本發明的優選實施例,使得本發明所屬【技術領域】的技術 人員能夠易於實施。本發明可實現為各種不同的形式,並不局限於在此說明的實施例。為 了清楚地說明本發明,在附圖中省略了與說明無關的部分,在整個說明書中對相同或相似 的結構要素使用相同的附圖標記。另外若為眾所周知的公知技術,則省略了詳細說明。
[0035] 在整個說明書中,當說明到某一部分"包括"某個結構要素時,在沒有特別相反的 記載的情況下就指並不排除其他結構要素,而可以進一步包括其他結構要素。此外,在說明 書中記載的"……部"、"……裝置"、"……模塊"等術語表示處理至少一個功能或動作的單 位,這些單位可通過硬體、軟體或者硬體及軟體的結合來實現。
[0036] 圖1為表示本發明的一實施例的語音對話系統(phonetic conversation system) 結構的圖。
[0037] 參照圖1,語音對話系統可包括用戶(user) 10、語音對話裝置(phonetic conversation device) 30 和可攜式終端(mobile terminal) 50。
[0038] 為了與用戶10進行語音識別(voice recognition)問答,語音對話裝置30可通 過內置在玩具(洋娃娃)或者能夠裝拆的形式或者通過皮帶固定在玩具(洋娃娃)的形式使 用。語音對話裝置30包括語音輸入部(voice input unit)31、語音輸出部(voice output unit)32、觸摸識別部(touch recognition unit)33、發光部(light emitting unit)34 和 有線無線通信部(wired and wireless communication unit) 35。語音對話裝置30可進 一步包括圖像輸出部(image output unit) 36和圖像輸入部(image input unit) 37等。
[0039] 當用戶10為了輸入語音而觸碰觸摸識別部33時,觸摸識別部33工作。當觸摸識 別部33工作時,用戶10可輸入語音。
[0040] 用戶10觸碰觸摸識別部來輸入語音的情況是在使用如谷歌語音識別器等用於 接收所輸入的語音的特殊用戶界面(user interface)的情況。當能夠在原始碼(source code)上輸入語音而無需使用如細微差別語音識別器(nuance vocal recognition device)等特殊用戶界面時,無需操作觸摸識別部也能輸入語音。
[0041] 當觸摸識別部33工作,從而成為用戶10能夠輸入語音的狀態時,語音輸入部31 接收用戶10輸入的語音,並將其傳遞給有線無線通信部35。
[0042] 此外,即使觸摸識別部33不工作,語音輸入部31也可自行使用語音檢測引擎 (voice detection engine)或算法(algorithm),此時當所輸入的聲音判斷為人的語音時, 語音輸入部31可接收語音並將其傳遞給有線無線通信部35。
[0043] 當用戶10為了輸入語音而快速觸摸一次或者持續觸摸約一?二秒鐘後輸入語音 時,可通過語音檢測算法自動檢測語音輸入的結束,也可由另行配置的語音識別器(vocal recognition device)判斷是否已結束語音輸入之後向語音輸入部31告知語音輸入的結 束。
[0044] 此外,可預先設定快速觸摸一次或者持續觸摸約一?二秒鐘後,可在預先設定的 (predetermined)時間內,例如在幾秒鐘內輸入語音的規則。此時,預先設定的時間內輸入 的語音可被傳遞至語音識別器。
[0045] 語音輸入部31可以僅在用戶10觸摸的期間內接收所輸入的語音,此時當用戶10 解除觸摸時,被存儲在臨時存儲器的語音可被傳遞至有線無線通信部35。
[0046] 有線無線通信部35當接收通過語音輸入部31接收並傳遞的語音後,使用編解碼 器壓縮該語音,並將通過有線通信或無線通信壓縮的語音傳送給可攜式終端50。
[0047] 有線無線通信部35在接收由可攜式終端50的有線無線通信部51傳送的壓縮語 音並將其解碼後傳遞給語音輸出部32。
[0048] 語音輸出部32輸出經解碼的語音,由此,用戶能夠聽到所輸出的語音。例如,語音 輸出部32可包括揚聲器。
[0049] 當數據傳送容量和傳送速度快時,有線無線通信部35可以無需壓縮由語音輸入 部31輸入的語音,而通過有線通信或無線通信傳送給可攜式終端50,由可攜式終端50的有 線無線通信部51傳送的語音也可無需進行解碼,而被傳遞至語音輸出部32。
[0050] 當觸摸識別部33識別到用戶10的觸摸,且觸摸識別信號被傳遞至發光部34時, 發光部34可按照預先設定的周期顯示預設種類的光。此外,當由可攜式終端50傳送的語 音通過語音輸出部32輸出時,發光部34可按預先設定的周期顯示預設種類的光。光的種 類、光的顯示周期等發光條件信息可由可攜式終端50的感情判斷部53確定,經確定的發光 條件信息可被傳送到語音對話裝置30。例如,發光部34可包括LED。
[0051] 圖像輸出部36用於輸出圖像,可包括觸控螢幕。輸出圖像可包括觸摸按鈕。觸摸按 鈕可為用於告知開始語音識別的按鈕、用於調節音量的按鈕或用於接通/斷開電源的按鈕 等。例如,用戶10觸摸輸出圖像的時間點可成為語音識別的起始點。語音輸入的完成可通 過語音輸入部31的語音檢測算法自動檢測,也可通過另行配置的語音識別器識別。經識別 的語音通過有線無線通信部35傳送到可攜式終端50。圖像輸出部36可包括IXD或0LED 等顯示器。
[0052] 此外,如圖11至圖21所示,圖像輸出部36可根據從對用戶10的提問的答覆中提 取的感情,輸出各種面部表情。面部表情可包括情感符號。圖像輸出部36的面部表情和語 音輸出部32的語音輸出可以如同實際說話那樣同時輸出。由此,用戶10能夠通過固定有 語音對話裝置30的玩具(洋娃娃)的面部表情變化並且聽語音來感受到真實感。
[0053] 圖像輸入部37用於接收所輸入的圖像,可包括攝像機或圖像傳感器等。通過圖像 輸入部37輸入的圖像通過有線無線通信部35傳送到可攜式終端50。可攜式終端50確認 用戶10的瞳孔是否朝向圖像輸入部37。例如,用戶10的瞳孔朝向圖像輸入部37的時間點 可成為語音識別的起始點。語音輸入的完成可通過語音輸入部31的語音檢測算法自動檢 測,也可通過另行配置的語音識別器識別,經識別的語音通過有線無線通信部35傳送到便 攜式終端50。當無用戶對視的情況下向語音輸入部31輸入語音時,可先判斷所輸入的語音 是否為用戶10的語音之後,當判斷為用戶10的語音時接收所輸入的語音。
[0054] 圖像輸入部37可以僅在用戶10對視的期間內接收所輸入的語音,此時,若用戶10 不再對視,則被存儲在臨時存儲器中的語音可被傳遞至有線無線通信部35。
[0055] 可攜式終端50為用於通過有線或無線方式與語音對話裝置30進行通信的終端, 將對語音對話裝置30以有線或無線方式傳送的提問的答覆生成為語音合成數據,或者表 現各種面部表情。
[0056] 例如,可攜式終端50為個人電腦(PC)、可攜式電腦(PDA)、筆記本電腦、平板電腦、 手機(iPhone、安卓手機、谷歌手機等)和能夠進行雙向語音及數據通信的媒體的總稱,可使 用包含能夠進行有線無線網際網路或者有線無線電話(移動)通信的設備的各種終端。
[0057] 當可攜式終端50與語音對話裝置30進行有線通信時,可攜式終端50在設置在玩 具(洋娃娃)的面部的狀態下,以有線通信方式與語音對話裝置30相連,並且將對語音對話 裝置30傳送的用戶提問的答覆生成為語音合成數據後傳送給語音對話裝置30。此時,玩具 (洋娃娃)的表情如圖11至圖21所示,可根據通過設置在玩具(洋娃娃)面部的可攜式終端 50從對所述用戶提問的答覆中提取的感情形成各種面部表情。
[0058] 圖11至圖21為表示對話玩具(洋娃娃)的面部表情種類的一個示例的圖,圖11表 示平靜的感情,圖12表示憂慮的感情,圖13表示高興的感情,圖14表示懷疑的感情,圖15 表示厭倦的感情,圖16表示期待的感情,圖17表示惱怒的感情,圖18表示對觸摸動作的感 情,圖19表示睡覺動作,圖20表示說話動作,圖21表示聆聽動作。
[0059] 當可攜式終端50與語音對話裝置30進行無線通信時,可攜式終端50可以不被設 置在玩具(洋娃娃)的面部,而位於能夠與語音對話裝置30進行無線通信的距離內。可攜式 終端50將對從語音對話裝置30以無線通信方式傳送的用戶提問的答覆生成為語音合成數 據,並將其傳送給語音對話裝置30。
[0060] 可攜式終端50包括有線無線通信部51、問答部(question and answer unit)52、 感情判斷部(emotion determination unit) 53、語音合成部(voice synthesis unit) 54 和語音識別部(voice recognition unit) 55。
[0061] 有線無線通信部51接收並解碼從語音對話裝置30的有線無線通信部35以有線 通信或無線通信方式傳送的壓縮語音,並將經過解碼的語音變更為用於語音識別的格式後 傳送給語音識別部55。
[0062] 語音識別部55識別從有線無線通信部51接收的語音,並將語音識別結果即提問 文本(text)傳遞給問答部52。
[0063] 問答部52當接到從語音識別部55傳遞的提問文本時,生成對提問文本的答覆文 本並傳遞給語音合成部54。
[0064] 語音合成部54當接到從問答部52傳遞的答覆文本時,將答覆文本合成為語音以 生成語音合成數據後傳遞給有線無線通信部51。
[0065] 感情判斷部53從答覆文本提取感情,並對所提取的感情,確定用於由語音對話 裝置30的發光部34顯示特定光的光的種類和光的顯示周期等發光條件信息,並將此信息 傳遞給無線通信部51。此外,感情判斷部53對所提取的感情,如圖11至圖21所示那樣確 定各種面部表情並傳遞給有線無線通信部51。傳遞至有線無線通信部51的發光條件信息 和各種面部表情可通過語音對話裝置30的有線無線通信部35分別傳送到發光部34及圖 像輸出部36。
[0066] 例如,為了從答覆文本提取感情,可通過自然語言處理(詞素分析、語法分析、語義 分析等)方式分析答覆文本,從而分類包含在答覆文本中的感情。
[0067] 當從語音合成部54傳遞語音合成數據時,有線無線通信部51壓縮經過語音合成 而形成的語音合成數據,並將壓縮的語音合成數據、由感情判斷部53確定的光的種類和光 的顯示周期等發光條件信息以及各種面部表情傳送給語音對話裝置30。
[0068] 當數據的傳送容量和傳送速度快時,有線無線通信部51可接收從語音對話裝置 30的有線無線通信部35以有線通信或無線通信方式傳送的語音,且在不進行解碼的情況 下傳遞給語音識別部55。此時,語音識別部55識別從有線無線通信部51傳遞的語音,並將 作為語音識別結果的提問文本傳遞給問答部52。
[0069] 圖2為在本發明的一實施例的語音對話系統中語音對話裝置和可攜式終端之間 的報文發送/接收流程圖。
[0070] 參照圖2,語音對話裝置30判斷用戶是否觸摸一次或者與語音對話裝置30的圖像 輸入部37對視(eye contact)-次(S1),當用戶10觸摸一次或者對視一次時,判斷觸摸時 間或者對視時間是否為一秒鐘(S2)。
[0071] 當用戶10觸摸一秒鐘或者與語音對話裝置30的圖像輸入部37對視一秒鐘時,語 音對話裝置30接收用戶10輸入的語音(提問)(S3),並在壓縮語音後傳送給可攜式終端50 (S4)。
[0072] 可攜式終端50解碼從語音對話裝置30壓縮傳送的語音,進行語音識別(S5)後, 生成對提問的答覆(S6 ),並對答覆進行感情分析(S7 )。
[0073] 可攜式終端50將對答覆文本進行語音合成而形成的語音合成數據及感情分析結 果信息傳送給語音對話裝置(S8)。例如,感情分析結果信息可為用於由語音對話裝置30的 發光部34顯示特定光的光的種類和光的顯示周期等發光條件信息、或者如圖11至圖21所 示的針對通過感情判斷部53提取的感情的各種面部表情。
[0074] 語音對話裝置30解碼從可攜式終端50傳送的語音並予以輸出(S9),在輸出語 音時,根據從可攜式終端傳送的感情分析結果即感情數據控制LED光,並輸出面部表情 (510) 。
[0075] 另一方面,語音對話裝置30在判斷用戶10是否觸摸一次或者與語音對話裝置 30的圖像輸入部37對視一次的步驟S1中,當用戶10未觸摸一次或者未與語音對話裝置 30的圖像輸入部37對視一次時,確認觸摸/對視次數及時間間隔並傳送給可攜式終端50 (511) 。
[0076] 可攜式終端50的問答部52生成根據從語音對話裝置30傳送的觸摸次數及時間 間隔的答覆(S12),可攜式終端50向語音對話裝置30傳送將答覆文本語音合成而形成的數 據(S13)。
[0077] 語音對話裝置30解碼從可攜式終端50傳送的語音合成數據並予以輸出(S14),語 音對話裝置30在輸出語音時,控制LED光並且輸出面部表情(S15)。
[0078] 圖3為在本發明的一實施例的語音對話系統中語音對話裝置和可攜式終端之間 的報文發送/接收流程圖。
[0079] 參照圖3,語音對話裝置30判斷用戶10是否觸摸一次或者與語音對話裝置30的 圖像輸入部37對視一次(S1 ),當用戶10觸摸一次或者與語音對話裝置30的圖像輸入部37 對視一次時,判斷觸摸時間或對視時間是否為一秒鐘(S2)。
[0080] 當用戶10觸摸一秒鐘或者與語音對話裝置30的圖像輸入部37對視一秒鐘時,語 音對話裝置30接收用戶10輸入的語音(提問)(S3),且在壓縮語音後傳送給可攜式終端50 (S4)。
[0081] 可攜式終端50解碼從語音對話裝置30壓縮傳送的語音,並進行語音識別(S5)後, 生成對提問的答覆(S6 ),並對答覆進行感情分析(S7 )。
[0082] 可攜式終端50將對答覆文本進行語音合成而形成的語音合成數據及感情分析結 果信息傳送給語音對話裝置(S8 )。例如,感情分析結果信息可為用於由語音對話裝置30的 發光部34顯示特定光的光的種類和光的顯示周期等發光條件信息、或者如圖11至圖21所 示的對通過感情判斷部53提取的感情的各種面部表情。
[0083] 語音對話裝置30解碼從可攜式終端50傳送的語音並予以輸出(S9),在輸出語 音時,根據從可攜式終端傳送的感情分析結果即感情數據控制LED光,並輸出面部表情 (S10)。
[0084] 另一方面,語音對話裝置30在判斷用戶10是否觸摸一次或者與語音對話裝置30 的圖像輸入部37對視一次的步驟S1中,當用戶10未觸摸一次或者未與語音對話裝置30 的圖像輸入部37對視一次時,確認觸摸/對視次數及時間間隔並將其結果傳送給可攜式終 端 50 (S11)。
[0085] 可攜式終端50的問答部52生成根據從語音對話裝置30傳送的觸摸次數及時間 間隔的答覆(S12),可攜式終端50向語音對話裝置30傳送將答覆文本語音合成而形成的數 據(S13)。
[0086] 語音對話裝置30解碼從可攜式終端50傳送的語音合成數據並予以輸出(S14), 語音對話裝置30在輸出語音時,控制LED光並且輸出面部表情(S15)。
[0087] 接下來,語音對話裝置30在用戶10觸摸一次或者與語音對話裝置30的圖像輸入 部37對視一次時判斷觸摸/對視時間是否為一秒鐘的步驟S2中,當觸摸或對視時間不是 一秒鐘時,判斷觸摸時間是否為五秒鐘或者電源按鈕是否被觸摸(S16)。
[0088] 當用戶10觸摸五秒鐘或者電源按鈕被觸摸時,語音對話裝置30在接通電源(S17) 後,將電源接通(0N)信息傳送給可攜式終端50 (S18)。
[0089] 可攜式終端50的問答部52當接到語音對話裝置30的電源接通(0N)信息時,生成 答覆(S19),並向語音對話裝置30傳送將所生成的答覆文本語音合成而形成的數據(S20)。
[0090] 語音對話裝置30解碼從可攜式終端50傳送的語音合成數據並予以輸出(S21 ),語 音對話裝置30在輸出語音時,控制LED光並且輸出面部表情(S22)。
[0091] 另一方面,語音對話裝置30在判斷用戶10的觸摸時間是否為五秒鐘或者電源按 鈕是否被觸摸的步驟S16中,當觸摸時間不是五秒鐘,或者電源按鈕未被觸摸時,判斷觸摸 時間是否為十秒鐘(S23),當用戶10觸摸十秒鐘時,以配對(pairing)模式工作(S24)。配 對可通過藍牙或WIFI等近距離無線通信連接。
[0092] 當語音對話裝置30以配對模式工作時,可攜式終端50試圖配對連接(S25),語音 對話裝置30在與可攜式終端50配對連接後,將配對連接成功信息傳送給可攜式終端50 (S26)。
[0093] 可攜式終端50的問答部52當從語音對話裝置30接收配對連接成功信息時生 成答覆(S27),並向語音對話裝置傳送將所生成的答覆文本語音合成而形成的數據傳送 (S28)。
[0094] 語音對話裝置30解碼從可攜式終端50傳送的語音合成數據並予以輸出(S29),語 音對話裝置30在輸出語音時,控制光並且輸出面部表情(S30)。
[0095] 圖4為表示通過觸摸來向應用程式傳遞感情信息的一個示例的圖。
[0096] 參照圖4,當用戶10僅觸摸一次語音對話裝置30的DIP開關、撥動開關、後備電 源觸摸式開關等按鈕或觸摸識別部33等,或者與語音對話裝置30的圖像輸入部37對視一 次(S1)時,語音對話裝置30的發光二極體(LED)以預先設定的顏色例如以紅色閃爍一次 (52) 。
[0097] 語音對話裝置30將觸摸一次或對視一次的信息傳送給可攜式終端(應用程式)50 (53) ,並且接收答覆對話(S4)並輸出語音及圖像(S5)。其中,語音對話裝置30從可攜式終 端50接收的答覆對話為語音合成數據,例如可為"早上好!願您今天有個好心情,我們談 什麼呢"等內容。在這種答覆對話及與此相關的面部表情圖像通過語音對話裝置30的語 音輸出部32及圖像輸出部36輸出的期間內,語音對話裝置30的發光二極體(LED)以預先 設定的顏色例如以黃色發光顯示(S6)後,當結束輸出時重新以基本顏色即以藍色發光顯示 (S7)。
[0098] 當用戶10將語音對話裝置30的DIP開關、撥動開關、後備電源觸摸式開關等按鈕 或觸摸識別部33等連續快速觸摸兩次以上,或者連續快速眨眼兩次以上時(S8),語音對話 裝置30的發光二極體(LED)以預先設定的顏色例如以紅色閃爍一次(S9)。
[0099] 語音對話裝置30將連續兩次以上的快速觸摸或眨眼信息傳送給可攜式終端(應 用程序)50 (S10)以告知有緊急情況,並接收所反饋的答覆對話(S11)後輸出語音及圖像。 其中,語音對話裝置30從可攜式終端50接收的答覆對話為語音合成數據,例如可為"您 怎麼啦?發生什麼事"等內容。在這種答覆對話及與此相關的面部表情圖像通過語音對話 裝置30的語音輸出部32及圖像輸出部36輸出的期間內,語音對話裝置30的發光二極體 (LED)以預先設定的顏色,例如以黃色發光顯示(S13)後,當結束輸出時重新以基本顏色即 以藍色發光顯示(S14)。
[0100] 圖5為表示本發明的語音對話裝置的音量控制的一個示例的圖。
[0101] 參照圖5,當用戶10僅按下一次語音對話裝置30的音量調高/調低按鈕時(S1), 語音對話裝置30的發光二極體(LED)以預先設定的顏色,例如以紅色閃爍一次(S2),並適 用音量調高/調低功能(S3)。
[0102] 語音對話裝置30將音量調高/調低觸摸信息傳送給可攜式終端(應用程式)50 (54) ,並且接收答覆對話(S5)後輸出語音及圖像(S6)。其中,語音對話裝置30從可攜式終 端50接收的答覆對話為語音合成數據,例如可為"您已經把音量調高/調低了 "等內容。 在這種答覆對話及與此相關的面部表情圖像通過語音對話裝置30的語音輸出部32及圖像 輸出部36輸出的期間內,語音對話裝置30的發光二極體(LED)以預先設定的顏色,例如以 黃色發光顯示(S7)後,當結束輸出時重新以基本顏色即以藍色發光顯示(S8)。
[0103] 圖6為表示用戶通過語音輸入與對話玩具(洋娃娃)進行對話的一個示例的圖。
[0104] 參照圖6,當用戶10觸摸語音對話裝置30的中央觸摸部分一秒鐘,或者與圖像輸 入部37對視一秒鐘時(S1),語音對話裝置30的發光二極體(LED)以預先設定的顏色,例如 以藍綠色顯示五秒鐘(S2),從而語音對話裝置30成為語音輸入待機狀態(五秒鐘)。
[0105] 語音對話裝置30接收用戶10的語音(S3)。此時,用戶向語音對話裝置30的麥克 風輸入語音。所輸入的語音例如可為"你是誰? "等內容。
[0106] 語音對話裝置30即使不啟動觸摸,也可自行使用語音檢測引擎判斷所輸入的聲 音是否為人的語音。語音檢測引擎可使用各種語音檢測算法。
[0107] 語音對話裝置30將所輸入的用戶10的語音數據傳送給可攜式終端(應用程式)50 (S4),語音對話裝置30的發光二極體(LED)重新以基本顏色即以藍色發光顯示(S5)。
[0108] 語音對話裝置30從可攜式終端(應用程式)50接收答覆對話及與此相關的面部表 情圖像(S6),並將其通過語音輸出部32及圖像輸出部36輸出(S7)。其中,語音對話裝置 30從終端50接收的答覆對話為語音合成數據,例如可為"我是對話玩具(洋娃娃)雅麗"等 內容。在這種答覆對話及與此相關的面部表情圖像通過語音對話裝置30的語音輸出部32 及圖像輸出部36輸出的期間內,語音對話裝置30的發光二極體(LED)以預先設定的顏色, 例如以黃色發光顯示(S8)後,當結束輸出時重新以基本顏色即以藍色發光顯示(S9)。
[0109] 圖7為表示在可攜式終端應用程式中生成語音對話並進行對話的一個示例的圖。
[0110] 參照圖7,即使不通過語音對話裝置30傳送語音,可攜式終端(應用程式)50也會 生成答覆對話並將其轉換成語音合成(TTS)數據後以聲響形式將語音合成數據傳送給語音 對話裝置30 (S1)。
[0111] 語音對話裝置30接收從可攜式終端(應用程式)50傳送的答覆對話及與此相關的 面部表情圖像並通過語音輸出部32及圖像輸出部36輸出(S2)。其中,語音對話裝置30從 可攜式終端50接收的答覆對話為語音合成數據,例如可為"今天是星期一"等內容。在這 種答覆對話及與此相關的面部表情圖像通過語音對話裝置30的語音輸出部32及圖像輸出 部36輸出的期間內,語音對話裝置30的發光二極體(LED)以預先設定的顏色,例如以黃色 發光顯示(S3)後,當結束輸出時重新以基本顏色即以藍色發光顯示(S4)。
[0112] 圖8為表示本發明的語音對話裝置的電源接通一個示例的圖。
[0113] 參照圖8,當用戶10將語音對話裝置30的電源按鈕或觸摸識別部33等觸摸五秒 鍾時(S1),語音對話裝置30的發光二極體(LED)在從可攜式終端(應用程式)50接收語音 合成數據之前以基本顏色即以藍色發光顯示(S2 )。
[0114] 當語音對話裝置30與可攜式終端(應用程式)50之間自動配對連接時,語音對話 裝置30將接通(on)信息傳送給可攜式終端(應用程式)50 (S3),並從可攜式終端(應用程 序)50接收答覆對話(答覆數據)或者與此相關的面部表情圖像(S4),並通過語音輸出部32 及圖像輸出部36輸出(S5)。其中,可攜式終端(應用程式)50通過語音合成(TTS)功能將答 複數據轉換成語音,並將該語音數據(Sound)壓縮後用無線方式傳送給語音對話裝置30, 語音對話裝置30解碼從可攜式終端(應用程式)50傳送的壓縮語音數據並通過語音輸出部 32輸出,並且解碼經過壓縮的面部表情圖像後通過圖像輸出部36輸出。語音對話裝置30 從可攜式終端(應用程式)50接收的答覆對話為語音合成(TTS)數據,例如可為"您好,很高 興見到您〃等內容。在這種答覆對話及與此相關的面部表情圖像通過語音對話裝置30的 語音輸出部32及圖像輸出部36輸出的期間內,語音對話裝置30的發光二極體(LED)以預 先設定的顏色,例如以黃色發光顯示(S6)後,當結束輸出時重新以基本顏色即以藍色發光 顯示(S7)。
[0115] 圖9為表示本發明的配對功能一個示例的圖。
[0116] 參照圖9,當用戶10將語音對話裝置30觸摸十秒鐘時(S1),語音對話裝置30以 配對模式工作,發光二極體(LED)以白色發光顯示(S2)。
[0117] 可攜式終端(應用程式)50試圖與語音對話裝置30配對連接(S3),當語音對話裝 置30與可攜式終端(應用程式)50之間的配對連接成功時,發光二極體(LED)以藍色和白 色閃爍(S4)。接下來將配對成功信息傳送給可攜式終端(應用程式)50 (S5)。
[0118] 可攜式終端(應用程式)50向語音對話裝置30傳送語音合成數據(S6),語音對話 裝置30從可攜式終端(應用程式)50接收語音合成數據及與此相關的面部表情圖像,並通 過語音輸出部32及圖像輸出部36輸出(S7)。其中,語音對話裝置30從可攜式終端(應用 程序)50接收的答覆對話為語音合成數據,例如可為"配對連接成功"等內容。在這種答覆 對話及與此相關的面部表情圖像通過語音對話裝置30的語音輸出部32及圖像輸出部36 輸出的期間內,語音對話裝置30的發光二極體(LED)以預先設定的顏色,例如以黃色發光 顯示(S8 )後,當結束輸出時重新以基本顏色即以藍色發光顯示(S9 )。
[0119] 圖10為表示本發明的語音對話裝置的電池放電警告一個示例的圖。
[0120] 參照圖10,語音對話裝置30判斷電池餘量是否為20%以下,當電池餘量為20%以 下時,使發光二極體(LED)以紅色閃爍以顯示電池放電警告(S2)。
[0121] 接下來,語音對話裝置30將電池放電信息傳送給可攜式終端(應用程式)50( S3 )。
[0122] 可攜式終端(應用程式)50向語音對話裝置30傳送語音合成數據(S4),語音對話 裝置30從可攜式終端(應用程式)50接收語音合成數據及與此相關的面部表情圖像並通過 語音輸出部32及圖像輸出部36輸出(S5)。其中,語音對話裝置30從可攜式終端(應用程 序)50接收的答覆對話為語音合成數據,例如可為"電池餘量為20%,請充電"等內容。在這 種答覆對話及與此相關的面部表情圖像通過語音對話裝置30的語音輸出部32及圖像輸 出部36輸出的期間內,語音對話裝置30的發光二極體(LED)以預先設定的顏色,例如以黃 色發光顯示(S6),並且周期性地反覆使發光二極體(LED)以紅色閃爍顯示(S7),直至給電 池充電為止。
[0123] 以上對本發明的優選實施例進行詳細的說明,但本發明的權利範圍並不限於上述 內容,利用所附的權利要求書所定義的本發明的基本概念所進行的本領域技術人員的各種 變形及改良形式也屬於本發明的權利範圍。
[0124] 附圖標記說明:
[0125] 30 :語音對話裝置
[0126] 50 :可攜式終端。
【權利要求】
1. 一種使用有線無線通信網的語音對話方法,包括步驟: a) 當有觸摸、對視或用戶語音輸入時,語音對話裝置的語音輸入部接收用戶輸入的語 音; b) 所述語音對話裝置的有線無線通信部接收通過所述語音輸入部輸入並被傳遞的語 音並傳送給可攜式終端; c) 所述有線無線通信部接收從所述可攜式終端傳送的答覆語音;和 d) 所述語音對話裝置的語音輸出部接收從所述有線無線通信部傳遞的語音並予以輸 出。
2. 根據權利要求1所述的使用有線無線通信網的語音對話方法,其中,所述步驟a)包 括步驟: al)所述語音對話裝置的觸摸識別部或圖像輸出部識別用戶觸摸; a2)當所述觸摸識別部或所述圖像輸出部識別到用戶觸摸時或者當在用戶進行觸摸的 期間內用戶輸入語音時,所述語音對話裝置的語音輸入部接收用戶輸入的語音;和 a3)當在所述觸摸識別部或所述圖像輸出部沒有識別用戶觸摸的情況下有語音輸入 時,所述語音對話裝置的語音輸入部判斷該語音是否為用戶語音後接收所輸入的語音。
3. 根據權利要求1所述的使用有線無線通信網的語音對話方法,其中, 所述步驟a)包括步驟: al)所述語音對話裝置的圖像輸入部識別用戶對視; a2)當所述圖像輸入部識別到用戶對視時或者當在用戶對視的期間內用戶輸入語音 時,所述語音對話裝置的語音輸入部接收用戶輸入的語音;和 a3)當在所述圖像輸入部沒有識別用戶對視的情況下有語音輸入時,所述語音對話裝 置的語音輸入部判斷該語音是否為用戶語音後接收所輸入的語音。
4. 根據權利要求1所述的使用有線無線通信網的語音對話方法,其中, 在所述步驟d)中,在所述語音對話裝置的語音輸出部接收從所述有線無線通信部傳遞 的語音並予以輸出的期間內,根據對所述語音確定的感情,所述語音對話裝置的發光部以 特定顏色發光顯示。
5. 根據權利要求4所述的使用有線無線通信網的語音對話方法,其中, 所述發光部的發光顏色及顯示周期是按照所述可攜式終端根據對所述語音確定的感 情確定的顏色及顯示周期顯示的。
6. 根據權利要求5所述的使用有線無線通信網的語音對話方法,其中, 所述感情為將所述語音轉換為文本後從自然語言文本中識別的感情。
7. 根據權利要求1所述的使用有線無線通信網的語音對話方法,其中, 在所述步驟d)中,在接收從所述有線無線通信部傳遞的語音並予以輸出的期間內,所 述語音對話裝置的圖像輸出部輸出基於對所述語音確定的感情的面部表情圖像。
8. 根據權利要求1所述的使用有線無線通信網的語音對話方法,其中, 在所述步驟d)中,在接收從所述有線無線通信部傳遞的語音並予以輸出的期間內,所 述語音對話裝置的圖像輸出部輸出基於對所述語音確定的感情的情感符號。
9. 一種使用有線無線通信網的語音對話裝置,包括: 語音輸入部,當有觸摸、對視或用戶語音輸入時,接收用戶輸入的語音; 有線無線通信部,接收通過所述語音輸入部輸入並被傳遞的語音並傳送給可攜式終 端,並且接收從所述可攜式終端傳送的語音;和 語音輸出部,接收從所述有線無線通信部傳遞的語音並予以輸出。
10. 根據權利要求9所述的使用有線無線通信網的語音對話裝置,其中, 進一步包括用於識別用戶觸摸的觸摸識別部,當所述觸摸識別部識別到用戶觸摸時或 者當在用戶進行觸摸的期間內用戶輸入語音時,接收用戶輸入的語音。
11. 根據權利要求9所述的使用有線無線通信網的語音對話裝置,其中, 進一步包括用於接收用戶圖像的圖像輸入部,當通過所述圖像輸入部識別到用戶對視 時或者當在用戶進行對視的期間內所述語音輸入部接收用戶輸入的語音。
12. 根據權利要求9所述的使用有線無線通信網的語音對話裝置,其中, 進一步包括發光部,在所述語音輸出部接收從所述有線無線通信部傳遞的語音並予以 輸出的期間內,所述發光部基於對所述語音確定的感情,以特定的顏色發光顯示。
13. 根據權利要求12所述的使用有線無線通信網的語音對話裝置,其中, 所述發光部的發光顏色和顯示周期是按照所述可攜式終端基於對所述語音確定的感 情確定的顏色及顯示周期顯示的。
14. 根據權利要求13所述的使用有線無線通信網的語音對話裝置,其中, 所述感情為將所述語音轉換為文本後從自然語言文本中識別的感情。
15. 根據權利要求9所述的使用有線無線通信網的語音對話裝置,其中, 進一步包括用於輸出圖像的圖像輸出部,在所述語音輸出部接收從所述有線無線通信 部傳遞的語音並予以輸出的期間內,所述圖像輸出部輸出基於對所述語音確定的感情的面 部表情圖像。
16. 根據權利要求9所述的使用有線無線通信網的語音對話裝置,其中, 進一步包括用於輸出圖像的圖像輸出部,在所述語音輸出部接收從所述有線無線通信 部傳遞的語音並予以輸出的期間內,所述圖像輸出部輸出基於對所述語音確定的感情的情 感符號。
【文檔編號】H04W76/02GK104105223SQ201410012267
【公開日】2014年10月15日 申請日期:2014年1月10日 優先權日:2013年4月9日
【發明者】尹在敏 申請人:雅力株式會社

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀