具有自包含的語音反饋和語音命令的佩戴型頭戴式耳機的製作方法
2023-12-03 11:52:41 1
專利名稱:具有自包含的語音反饋和語音命令的佩戴型頭戴式耳機的製作方法
技術領域:
本發明涉及佩戴型頭戴式耳機,並且更具體地,涉及具有自包含的語音反饋和語 音命令的佩戴型立體聲頭戴式耳機。
背景技術:
頭戴式耳機或頭戴式受話器通常用於通信和多媒體設備以收聽由這些設備產生 或傳遞的音頻信號。這些通信和多媒體設備的示例包括行動電話、無線接收機、諸如⑶播 放器和MP3播放器的可攜式音樂播放器。
發明內容
本發明涉及佩戴型無線頭戴式耳機,並且更具體地,涉及具有佩戴該設備的用戶 的集中的語音反饋和語音命令的佩戴型立體聲無線頭戴式耳機。因此本發明針對關於用戶 的語音頻譜的麥克風進行設計,並向用戶清楚地提供實時(零時間延遲)的可聽反饋,從而 他可以調整他自己的語音音量、音高、音調和周圍環境噪聲等等。本發明還包括語音命令按 鈕,用於無線地捕捉語音流數據和向通信/多媒體設備傳遞語音流數據、用於語音到文本 的識別、語音應用控制和語音驗證。通過位於通信/多媒體設備上或位於遠程伺服器上的 語音命令應用來執行語音流數據,該設備經由有線或無線連接與所述遠程伺服器連接。本 發明可用於控制各種行動裝置功能並與之交互,這些功能包括控制電話呼叫和音樂播放器 以及具有藍牙的其他設備或藍牙適配器。本發明提供用戶的有用的語音反饋以增強他/她 在與人或計算機語音識別系統進行電話呼叫時更加清晰和準確的會話體驗。本發明還可通 過向演唱者或者希望卡拉OK演唱他/她正聆聽的歌曲的休閒的人們提供準確語音反饋用 於娛樂或音樂培訓。本發明還可用於語言學習以在音頻訓練材料的練習中通過語音反饋幫 助學習者。本發明僅針對語音,並且除掉了環境噪聲,因此可以結合其他行動裝置、PC、視頻 遊戲和其他交互設備廣泛地用於更準確的語音聽寫和語音命令。本發明可以通過諸如藍牙 的同步無線傳輸而連接到任何設備。本發明還可以通過標準立體聲插孔或立體聲插孔直接 與支持許多行動電話的麥克風連接。大多數應用可以與藍牙使能設備或經由藍牙適配設備 連接。通常,本發明一方面的特徵在於一種頭戴式耳機,所述頭戴式耳機包括佩戴型機 體;從佩戴型機體延伸的第一和第二受話器;用於無線控制外部通信/多媒體設備的控制 器;用於從頭戴式耳機系統的用戶拾取語音數據的麥克風;以及信號處理單元。該信號處 理單元包括用於將所述語音數據處理成清楚可聽的語音反饋信號的電路;用於增強所述 語音反饋信號從而產生增強的語音反饋信號的電路;以及用於將所述增強的語音反饋信號 與源自所述外部通信/多媒體設備的語音信號進行混合從而產生混合的輸出信號並接著 將所述混合的輸出信號經由所述受話器發送到所述用戶的電路。本發明該方面的實施可以包括下列的一個或多個特徵。所述外部通信/多媒體設 備包括語音命令應用,以及所述頭戴式耳機還包括語音命令控制器,用於向所述外部通信/多媒體設備和所述語音命令應用發送語音命令。所述佩戴型機體被成形為環繞佩戴在所述 用戶頸部的後面,並且所述佩戴型機體包括可折彎的柔性材料。所述佩戴型機體包括U形 框架,所述U形框架與所述用戶頸部的後面吻合併包括第一和第二端,並且其中所述麥克 風從所述U形框架的各端之一延伸。所述U形框架是可摺疊的,並且包括可調整長度。所 述第一和第二受話器分別包含和隱藏於所述U形框架的所述第一和第二端中的第一和第 二開口內。當使用時所述受話器從所述開口抽出,不使用時,所述受話器縮回至所述開口。 所述外部通信/多媒體設備可以是行動電話、MP3播放器、可攜式音樂播放器、個人數字助 理、可攜式計算機或電視機。所述信號處理單元包含於所述U形框架內,並且包括接口、信 號處理器、濾波器、混合器、電池和記錄器。在操作期間,所述頭戴式耳機與所述外部通信/ 多媒體設備經由所述接口進行通信,並向所述外部通信/多媒體設備發送數據和從外部通 信/多媒體設備接收數據。所述接口包括無線接口。所述無線接口可以是藍牙接口。所述 增強電路包括濾波器,用於增強所述用戶的語音頻率;濾波器,用於減小周圍環境噪音; 控制器,用於相對於源自所述通信/多媒體設備的音頻信號的音量調整所述增強的語音反 饋信號的音量。激活所述語音命令控制器並保持使得從所述頭戴式耳機向所述外部通信/ 多媒體設備發送語音命令激活信號,喚醒所述語音命令應用,經由所述接口向所述語音命 令應用發送所述語音數據。所述語音命令應用包括用於經由伺服器本地地或遠程地將所述 語音數據轉換成文本或圖案的裝置。所述語音命令應用進一步將所述文本或圖案翻譯成命 令,該命令通過在所述外部通信/多媒體設備上的所述語音命令應用和其他應用執行一個 或多個功能。所述信號處理單元還包括記錄器,以及其中當喚醒語音命令應用時,發送第一 提示音到所述受話器,用於指示記錄器中的語音數據記錄已經開始。所述語音命令控制器 的釋放使得停止所述記錄並接著發送第二提示音到所述受話器,用於指示記錄停止。通常,本發明另一方面的特徵在於一種系統。該系統包括頭戴式耳機和通信/多 媒體設備。所述頭戴式耳機和所述通信/多媒體設備無線地進行通信,並且所述頭戴式耳 機包括佩戴型機體;從所述佩戴型機體延伸的第一和第二受話器;用於無線控制外部通 信/多媒體設備的控制器;用於從頭戴式耳機的用戶拾取語音數據的麥克風;信號處理單 元和語音命令控制器。所述外部通信/多媒體設備包括語音命令應用,以及所述語音命令 控制器向所述外部通信/多媒體設備和所述語音命令應用發送語音命令。本發明該方面的實施可以包括下列的一個或多個特徵。所述信號處理單元包括 用於將所述語音數據處理成語音反饋信號的電路;用於增強所述語音反饋信號從而產生增 強的語音反饋信號的電路;以及用於將所述增強的語音反饋信號與源自所述外部通信/多 媒體設備的語音信號進行混合從而產生混合的輸出信號並接著將所述混合的輸出信號經 由所述受話器發送到所述用戶的電路。所述系統還包括遠程伺服器,並且所述通信/多媒 體設備包括用於經由網絡與所述遠程伺服器進行通信並向所述遠程伺服器發送語音命令 語音數據的裝置,以及所述伺服器包括用於將所述語音命令中包含的語音數據轉換成文本 或圖案並接著將所述文本或圖案返回到所述語音命令應用的裝置,用於執行從所述文本或 圖案翻譯的命令。所述外部通信/多媒體設備還包括語音識別應用,並且所述語音識別應 用從所述頭戴式耳機接收語音數據,並將它們轉換成文本或圖案。所述語音命令應用將所 述文本或圖案翻譯成命令,該命令通過在所述外部通信/多媒體設備上的所述語音命令應 用和其他應用執行一個或多個功能。所述遠程伺服器包括驗證應用,用於從所述語音數據識別和驗證所述用戶。所述語音命令可以是「呼叫某人」、「向某人發電子郵件」、「搜索內 容」、「向某人發文本」或基於全球定位系統(GPS) 「去某處」。通常,本發明另一方面的特徵在於一種經由頭戴式耳機向通信/多媒體設備發布 語音命令的方法。該方法包括下列步驟首先,提供頭戴式耳機,所述頭戴式耳機包括佩 戴型機體、從所述佩戴型機體延伸的第一和第二受話器、用於無線控制外部通信/多媒體 設備的控制器、用於從頭戴式耳機的用戶拾取語音數據的麥克風、信號處理單元、和用於向 所述通信/多媒體設備發送所述語音數據的語音命令控制器;接著,通過啟動並保持所述 語音命令控制器激活所述通信/多媒體設備的語音命令模式;接著,經由所述頭戴式耳機 的接口向所述外部通信/多媒體設備發送喚醒信號,用於喚醒語音命令應用(VCA),並開 始記錄所述語音命令數據;在開始記錄語音命令時,發送第一提示音到所述受話器,用於指 示語音數據記錄已經開始;接著向所述麥克風發布語音命令並記錄所捕獲的語音數據;接 著,釋放所述語音命令控制器從而停止對捕獲的語音數據的記錄;並發送第二提示音到所 述受話器,用於指示語音數據記錄已經停止;語音數據可以被發送到VCA作為記錄持續時 的流或作為記錄停止後的數據塊;最後發送所述記錄的語音數據到所述通信/多媒體設備 和VCA,用於處理。可選地,所述記錄的數據由VCA經由通信/多媒體設備發送到遠程服務 器,用於進一步處理。VCA或遠程伺服器對所述記錄的語音數據的處理包括應用語音識別 軟體並將語音數據轉換成文本或圖案並由VCA執行語音數據中包含的命令。所述信號處理 單元可以包括用於將所述語音數據處理成語音反饋信號的電路;用於增強所述語音反饋 信號從而產生增強的語音反饋信號的電路;以及用於將所述增強的語音反饋信號與源自所 述外部通信/多媒體設備的語音信號進行混合從而產生混合的輸出信號並接著將所述混 合的輸出信號經由所述受話器發送到所述用戶的電路。
圖1描述了用戶佩戴的根據本發明的頭戴式耳機;圖2是圖1的頭戴式耳機的示意圖;圖3描述了圖2的頭戴式耳機的電路原理圖;圖4描述了語音命令處理圖。
具體實施例方式準確地聽到一個人自己的語音的能力對於出色表演的音樂家來說是關鍵的。這就 是通過音樂家面前的揚聲器或經由頭戴式耳機或聽筒針對音樂家建立反饋的原因。通過反 饋系統局部化和放大歌唱者的語音的麥克風使得音樂家能準確進行音高控制、音量控制和 音調控制。儘管專業音樂家非常注意建立這樣的系統為接收他們「輸入」的他們的觀眾增 強他們的語音「輸出」,但是在他們的行動電話的另一端,對於一般的消費者沒有反饋控制 來向他們的「觀眾」增強他們的語音輸出。行動電話用戶遭受下列情況不知道他們自己的 麥克風位置是好還是壞、他們的音量或環境噪聲正影響他們與另一線路上的通信方(人或 機器,例如電話呼叫或IVR系統、來自多個消費者服務解決方案的語音識別系統,以及語音 命令,以及語音到文本的聽寫等等)的通信質量,這最多會引起煩惱以及最壞無法進行通 信。沒有合適的語音反饋,很難調整個人的麥克風、音高和音量,進而無法提供準確和清楚的語音信號。語音和話音的下一代技術要求清楚和準確的語音命令,並因此要求有關標準 頭戴式耳機的語音反饋。對於語言教育來說,準確發音和音調控制的最重要的一件事就是具有一個人語音 的實時反饋能力。本發明能夠提供準確反饋,這有助於學習者控制其音高並更好地學習。對於休閒娛樂來說,我們都認識到卡拉OK已經非常流行。本發明的附加的益處在 於為每個人提供了具有個人卡拉OK設備的可攜式音樂播放器。傳統的頭戴式耳機或頭戴式受話器通常用於通信和多媒體設備,以收聽由這些設 備產生或傳遞的音頻信號。這些通信和多媒體設備的示例包括行動電話、無線接收機、諸如 CD播放器和MP3播放器的可攜式音樂播放器。現有技術中沒有能提供實時語音反饋或語音 命令的頭戴式耳機。存在具有麥克風的頭戴式耳機,其在播放音樂時能夠開啟收聽環境噪聲的功能, 但是他們都沒有打算為用戶提供語音反饋。甚至還有噪聲消除的頭戴式受話器,具有拾 取和消除環境噪聲的麥克風,但是均不拾取語音和增強語音聲。針對語音反饋,存在專業 音樂家的無線反饋系統,但是均不是能和行動電話一起使用的、自包含單板的頭戴式耳機 (self-contained single board headset)。他們不控制行動電話和MP3播放器進行播放、 快進和快退、應答電話呼叫、掛機或向行動電話發送語音命令。這些系統建立在分離的電 路板上,並與分離的收發器進行組合,到達混合板或可替換的源,然後經由收發器返回到聽 筒。因此它們不是為了本發明的目的而設計的。本發明獨特之處還在於其外形,它完全可環繞佩戴於頸後部而作為支持結構,具 有延伸至耳朵的耳麥。其他的無線頭戴式耳機通常環繞耳朵放置、或者佩戴於頭上、或者環 繞頭後部。目前的無線頭戴式耳機均不佩戴在頸部,而頸部提供了穩定舒適的支持,對於職 業運動員或許多鍛鍊形式(諸如慢跑、滑雪、自行車和運動課指令等等)而言是理想的。參照圖1和圖2,無線頭戴式耳機100被設計為由用戶環繞頸後部50佩戴。頭戴 式耳機100包括吻合用戶頸部的U形框架104、數位訊號處理單元180、語音命令開關190 以及從U形框架104的一端10 延伸的麥克風130,如圖2所示。框架104是可折彎的、 柔性的,並且針對各種頸部尺寸可調整。框架104也是在兩個位置104a、104b可摺疊的, 如圖2所示。U形框架104的端部10加、102b成形為分別包容兩個耳麥140a、140b。耳麥 140a、140b通過導線106a、106b (未示出)分別從端部102a、10 延伸,從而它們到達用戶 耳朵並插入用戶耳朵,如圖1所示。當不使用時,導線106a、106b(未示出)分別縮回到端 部l(^a、102b以使得耳麥被收納。在一些實施例中,僅存在從框架的一個端部102b延伸的 一個耳麥,並且麥克風130從框架的另一個端部10 延伸。用戶也可以延伸、縮回和定位 麥克風130以更好地拾取語音。在其他實施例中,麥克風130從兩個耳麥140a、140b之一 延伸。語音命令開關190的導通/關斷用於啟動頭戴式耳機的語音命令模式。參照圖3,信號處理單元180包括接口 110、信號處理器120、電池150、和混合器 160。混合器160可以與信號處理器120分離或者結合到信號處理器120中,如圖3所示。 在操作中,頭戴式耳機100經由接口 110與通信/多媒體設備90建立無線通信鏈路80。在 頭戴式耳機100和通信/多媒體設備90之間也可以存在使用標準插孔的有線通信鏈路85。 從通信/多媒體設備90發送的數據被接口 110接收並進一步被處理器120處理以生成音 頻輸出信號112,音頻輸出信號112接著被傳送到耳麥140a、140b。在一個示例中,接口 110是藍牙接口,並且處理器120是數位訊號處理器(DSP)。而且,麥克風130獲得的語音信號 132被處理器120作為音頻信號處理並接著被轉發到接口 110。處理器120的信號處理包 括特定的濾波以增強用戶的語音頻率。這些語音頻率通常在200Hz到5KHz之間的範圍內。 該信號增強顯著地降低非語音的環境噪聲,包括風聲、與用戶語音無關的低頻和高頻。接口 110向通信/多媒體設備90無線地發送增強的音頻信號132。以此方式,建立雙向通信,即 耳麥110的用戶能夠聽到從通信/多媒體設備90接收的音頻信號並且能夠向通信/多媒體 設備90轉發音頻信號。音頻信號132還被轉發到混合器160,在混合器160,音頻信號132 與來自通信/多媒體設備90的音頻信號112進行混合。混合信號165接著被轉發到耳麥 140a、140b。以此方式,用戶同時直接接收來自麥克風130的音頻反饋信號132和來自通信 設備90的音頻信號112。這允許頭戴式耳機100用作語音反饋系統,以更準確地通過移動 計算和通信設備與人或機器進行通信;以及允許頭戴式耳機100用作卡拉OK系統,從而當 用戶隨著來自通信/多媒體設備90的音樂信號歌唱時聽到他自己的語音。在另一個示例 中,當用戶為外語訓練或改善發音而念單詞時,用戶使用頭戴式耳機100來收聽他自己的 聲音。電池150為頭戴式耳機100的無線操作提供電源。在一個示例中,電池150是長壽 命可充電電池,並且頭戴式耳機包括用於連接外部電源的輸入端155,以對頭戴式耳機電池 充電。參照圖4,利用頭戴式耳機100向通信設備90發布語音命令的處理過程300包括 以下步驟。首先,用戶按下語音命令按鈕190來激活頭戴式耳機100的語音命令模式(301)。 同時,經由藍牙接口 110將信號發送到通信/多媒體設備90用於喚醒特定語音命令應用 (VCA) 200 (302)。應用200喚醒並準備好接收語音數據。第一提示音在耳麥140a和140b響 起以提示用戶正在記錄(303)。用戶講出命令(或指示),並且命令/指示經由麥克風130 被捕獲並被DSP 180記錄為語音數據流(304)。接著,釋放語音命令按鈕,並且記錄停止。 第二(不同的)提示音在耳麥中響起以提示記錄停止(305)。所記錄的語音數據流經由藍 牙接口 110被無線發送到通信/多媒體設備90 (306)。通信/多媒體設備90接收語音數據 流,並將它定向到特定VCA 200,VCA 200用於實現所發布的語音命令。應用200接受語音 數據並處理該數據(308)。在一個實施例中,在通信/多媒體設備90中經由本地語音識別 應用對數據進行本地處理,本地語音識別應用將語音轉換成文本或圖案並將其返回到應用 200(310)。在另一個實施例中,數據經由網絡連接60被發送到遠程伺服器50並被伺服器 遠程處理(312),如圖3所示。在另一個實施例中,應用200包含在頭戴式耳機100中。在另一個實施例中,語音流數據被傳遞到驗證伺服器,驗證伺服器識別和匹配用 戶的語音圖案,以進行驗證,並且因此允許用戶使用應用或數據,或者允許交易的處理。在另一個實施例中,用戶通過按壓通信/多媒體設備90上的按鈕92啟動語音命 令模式,其產生上述的相同事件序列。按鈕92可以是物理按鈕或應用中觸控螢幕上的軟按 鈕。當按壓按鈕92時,提示音被發送到耳麥並且記錄開始。所捕獲的語音數據被流化或作 為文件發送到應用200。當完成記錄時,釋放按鈕92,提示音被發送到耳麥並且記錄停止。如上描述的,按壓語音命令按鈕190使得一信號被發送到行動電話90,並激活應 用200,從而準備好接收語音命令。信號被返回頭戴式耳機設備100以提示「準備好收聽」。 用戶講出語音命令,並且語音命令被捕獲成音頻文件,音頻文件接著被發送到應用200。應 用200接著將音頻文件發送到伺服器50進行語音識別。所識別的命令返回到應用200,在應用200中解釋該命令。接下來該應用執行動作。語音命令的示例以及隨後的動作包括下 列1) 「呼叫約翰.史密斯」-所述應用撥打電話聯繫表中約翰.史密斯的號碼;2) 「向約翰.史密斯發電子郵件或文本,主題明天開會」-所述應用啟動電子郵件 應用,填寫電子郵件聯繫地址和主題報頭,並接著等待在電子郵件剩餘部分中進行「語音到 文本」的轉換;3) 「搜索波士頓城區蘇西餐館」-所述應用啟動雅虎的一個搜索或其它瀏覽器並 搜索結果。用戶可以經由位於行動裝置90上的附加控制按鈕93或者經由頭戴式耳機100上 集成的控制按鈕170來控制行動裝置,如圖1所示。控制170包括音量、語音反饋的開/關、 頭戴式耳機的開/關、行動裝置的開/關、設備(藍牙)的配對(pairing)、播放、暫停、停 止、前進、快進以及翻轉音樂播放器上的歌曲、軌道搜索、跳軌、應答電話呼叫、掛起電話呼 叫等等。控制信號被發送到信號處理器120並接著經由172發送到接口 110,並經由有線鏈 路85或無線鏈路80輸出到行動裝置90。該設備還可以包括電源和操作指示燈174。頭戴式耳機的其他實施例包括下列中的一個或多個。U形框架104可以在一個或 多於兩個位置上是可摺疊的。該框架可以還包括允許各種尺寸調節的電子電路。框架104 可以具有人體功學設計,並且可以被支撐在用戶頭部50的頂部、環繞其頭部後面、環繞耳 朵和/或支撐在耳朵頂部。頭戴式耳機可以包括用於存儲音樂或其它信息的存儲器。信號 混合器160還可以是DSP 120的一部分。通信/多媒體設備90可以是MP3播放器、蘋果手 機、蘋果隨身聽、PDA、行動電話、個人電腦、電視機或任何其他有線或無線的多媒體設備。麥 克風130可以是高質量麥克風,並且頭戴式耳機可以是立體聲或單聲道頭戴式耳機。在一 個示例中,麥克風是具有前置放大器的4毫米麥克風。無線接口可以是藍牙免持類型、藍牙 A2DP (立體聲音樂)、藍牙AVRCP (立體聲遊戲)、紅外線的或者是任何其他無線形式。在一 個示例中,無線接口是英國劍橋的Cambridge Silicon Radio (CSR)公司提供的BlueCore7。 頭戴式耳機可以包括用於安全會話的數字加密。通信/多媒體設備可以合併在頭戴式耳機 內部。麥克風可以是伸縮的、可旋轉的和/或可拆卸的。已經描述了本發明的幾個實施例。不用說,可以理解的是在不背離本發明的精神 和範圍的前提下可以做多種修改。因此,其他實施例都落入下述權利要求書的範圍之內。
權利要求
1.一種頭戴式耳機,包括佩戴型機體;從所述佩戴型機體延伸的第一和第二受話器;用於無線控制外部通信/多媒體設備的控制器;用於從頭戴式耳機的用戶拾取語音數據的麥克風;信號處理單元,包括用於將所述語音數據處理成清楚可聽的語音反饋信號的電路;用於增強所述語音反饋信號從而產生增強的語音反饋信號的電路;以及用於將所述增強的語音反饋信號與源自所述外部通信/多媒體設備的語音信號進行 混合從而產生混合的輸出信號並接著將所述混合的輸出信號經由所述受話器發送到所述 用戶的電路。
2.根據權利要求1所述的頭戴式耳機,其中所述外部通信/多媒體設備包括語音命令 應用,以及其中所述頭戴式耳機還包括語音命令控制器,用於向所述外部通信/多媒體設 備和所述語音命令應用發送語音命令。
3.根據權利要求1所述的頭戴式耳機,其中所述佩戴型機體被成形為環繞佩戴在所述 用戶頸部的後面,並且所述佩戴型機體包括可折彎的柔性材料。
4.根據權利要求3所述的頭戴式耳機,其中所述佩戴型機體包括U形框架,所述U形框 架與所述用戶頸部的後面吻合併包括第一和第二端,並且其中所述麥克風從所述U形框架 的各端之一延伸。
5.根據權利要求4所述的頭戴式耳機,其中所述U形框架是可摺疊的,並且包括可調整 長度。
6.根據權利要求4所述的頭戴式耳機,其中所述第一和第二受話器分別包含和隱藏於 所述U形框架的所述第一和第二端中的第一和第二開口內,並且其中當使用時所述受話器 從所述開口抽出,當不使用時,所述受話器縮回至所述開口。
7.根據權利要求1所述的頭戴式耳機,其中所述外部通信/多媒體設備包括下列之一 行動電話、MP3播放器、可攜式音樂播放器、個人數字助理、個人電腦或電視機。
8.根據權利要求4所述的頭戴式耳機,其中所述信號處理單元包含於所述U形框架內, 並且包括接口、信號處理器、濾波器、混合器、電池和記錄器,並且其中在操作期間,所述頭 戴式耳機與所述外部通信/多媒體設備經由所述接口進行通信,並向所述外部通信/多媒 體設備發送數據和從外部通信/多媒體設備接收數據。
9.根據權利要求8所述的頭戴式耳機,其中所述接口包括無線接口。
10.根據權利要求9所述的頭戴式耳機,其中所述無線接口包括藍牙接口。
11.根據權利要求1所述的頭戴式耳機,其中所述增強電路包括濾波器,用於增強所 述用戶的語音頻率;以及控制器,用於相對於源自所述通信/多媒體設備的音頻信號的音 量調整所述增強的語音反饋信號的音量。
12.根據權利要求2所述的頭戴式耳機,其中激活所述語音命令控制器並保持使得從 所述頭戴式耳機向所述外部通信/多媒體設備發送語音命令激活信號,喚醒所述語音命令 應用,記錄所述語音數據和經由所述接口向所述語音命令應用發送所述語音數據,並且其 中所述語音命令應用包括用於經由伺服器本地地或遠程地將所述語音數據轉換成文本或圖案的裝置,以及其中所述語音命令應用進一步將所述文本或圖案翻譯成命令,該命令通 過在所述外部通信/多媒體設備上的所述語音命令應用和其他應用執行一個或多個功能。
13.根據權利要求12所述的頭戴式耳機,其中所述信號處理單元還包括用於記錄語音 數據的記錄器,以及其中當開始記錄時,發送第一提示音到所述受話器,用於指示語音數據 記錄已經開始,並且其中釋放所述語音命令控制器,停止所述記錄並接著發送第二提示音 到所述受話器,用於指示語音數據記錄停止。
14.一種系統,包括頭戴式耳機和通信/多媒體設備,其中所述頭戴式耳機和所述通信 /多媒體設備無線地進行通信,並且所述頭戴式耳機包括佩戴型機體;從所述佩戴型機體延伸的第一和第二受話器;用於無線控制外部通信/多媒體設備的控制器;用於從頭戴式耳機的用戶拾取語音數據的麥克風;信號處理單元,用於處理所述語音數據;語音命令控制器;以及其中所述外部通信/多媒體設備包括語音命令應用,以及其中所述語音命令控制器向 所述外部通信/多媒體設備和所述語音命令應用發送語音命令。
15.根據權利要求14所述的系統,其中所述信號處理單元包括用於將所述語音數據處理成清楚可聽的語音反饋信號的電路;用於增強所述語音反饋信號從而產生增強的語音反饋信號的電路;以及用於將所述增強的語音反饋信號與源自所述外部通信/多媒體設備的語音信號進行 混合從而產生混合的輸出信號並接著將所述混合的輸出信號經由所述受話器發送到所述 用戶的電路。
16.根據權利要求14所述的系統,還包括遠程伺服器,其中所述通信/多媒體設備包括 用於經由網絡與所述遠程伺服器進行通信並向所述遠程伺服器發送語音命令語音數據的 裝置,以及其中所述伺服器包括用於將所述語音命令中包含的語音數據轉換成文本或圖案 並接著將所述文本或圖案返回到所述語音命令應用的裝置,用於執行從所述文本或圖案翻 譯的命令。
17.根據權利要求14所述的系統,其中所述外部通信/多媒體設備還包括語音識別應 用,並且所述語音識別應用從所述頭戴式耳機接收語音數據,並將它們轉換成文本或圖案, 並且其中所述語音命令應用將所述文本或圖案翻譯成命令,該命令通過在所述外部通信/ 多媒體設備上的所述語音命令應用和其他應用執行一個或多個功能。
18.根據權利要求16所述的系統,其中所述遠程伺服器包括驗證應用,用於從所述語 音數據識別和驗證所述用戶。
19.根據權利要求14所述的系統,其中所述語音命令包括下列之一「呼叫某人」、「向 某人發電子郵件」、「搜索內容」、「向某人發文本」或基於GPS 「去某處」。
20.一種經由頭戴式耳機向通信/多媒體設備發布語音命令的方法,包括提供頭戴式耳機,所述頭戴式耳機包括佩戴型機體;從所述佩戴型機體延伸的第一 和第二受話器;用於無線控制外部通信/多媒體設備的控制器;用於從頭戴式耳機的用戶 拾取語音數據的麥克風;信號處理單元,用於處理所述語音數據;和語音命令控制器,用於向所述通信/多媒體設備發送所述語音數據;通過啟動所述語音命令控制器激活所述通信/多媒體設備的語音命令模式; 經由所述頭戴式耳機的接口向所述通信/多媒體設備發送喚醒信號,用於喚醒語音命 令應用,並且開始記錄所述語音命令語音數據;發送第一提示音到所述受話器,用於指示語音數據記錄已經開始; 向所述麥克風發布語音命令並記錄所捕獲的語音數據; 釋放所述語音命令控制器從而停止對捕獲的語音數據的記錄; 發送第二提示音到所述受話器,用於指示語音數據記錄已經停止; 發送所述記錄的語音數據到所述通信/多媒體設備和語音命令應用; 經由伺服器本地地或遠程地將所述語音數據轉換成文本或圖案; 將所述文本或圖案翻譯成命令,其通過在所述外部通信/多媒體設備上的語音命令應 用和其他應用執行一個或多個功能。
21.根據權利要求20所述的方法,其中所述信號處理單元包括 用於將所述語音數據處理成語音反饋信號的電路; 用於增強所述語音反饋信號從而產生增強的語音反饋信號的電路; 用於將所述增強的語音反饋信號與源自所述外部通信/多媒體設備的語音信號進行 混合從而產生混合的輸出信號並接著將所述混合的輸出信號經由所述受話器發送到所述 用戶的電路;以及用於記錄語音數據的記錄器。
全文摘要
頭戴式耳機(100)包括佩戴型機體(104);從所述佩戴型機體延伸的第一和第二耳麥(140a,140b);用於無線控制外部通信/多媒體設備(90)的控制器(170);用於從頭戴式耳機的用戶(50)拾取語音數據的麥克風(130);以及信號處理單元(180)。信號處理單元(180)包括用於將所述語音數據(132)處理成清楚可聽的語音反饋信號的電路(120);用於增強所述語音反饋信號從而產生增強的語音反饋信號的電路(120);以及用於將所述增強的語音反饋信號與源自所述外部通信/多媒體設備(90)的語音信號(112)進行混合從而產生混合的輸出信號(165)並接著將所述混合的輸出信號(165)經由耳麥(140a,140b)發送到所述用戶的電路(160)。外部通信/多媒體設備(90)包括語音命令應用(200),並且頭戴式耳機(100)還包括向所述外部通信/多媒體設備(90)和所述語音命令應用(200)發送語音命令的語音命令控制器(190)。
文檔編號H04R3/00GK102138337SQ200980131482
公開日2011年7月27日 申請日期2009年8月12日 優先權日2008年8月13日
發明者W·W·格雷林 申請人:W·W·格雷林