藉助至少兩個電聲轉換器向數據終端設備用戶輸出可聽信息的虛擬助理和提供虛擬助理...的製作方法
2023-05-13 22:47:11
專利名稱:藉助至少兩個電聲轉換器向數據終端設備用戶輸出可聽信息的虛擬助理和提供虛擬助理 ...的製作方法
技術領域:
本發明涉及一種藉助至少兩個電聲轉換器向數據終端設備的用戶輸出可聽見信息的虛擬助理,以及一種為數據終端設備的用戶提供虛擬助理的可聽見信息的方法。
背景技術:
對於PC應用程式的使用,一般公知用戶可以訪問虛擬助理、即基於計算機的幫助(程序),該虛擬助理在為了完成任務而實施必需的步驟時、或者當用戶希望進一步了解PC應用程式的功能時支持用戶。另一方面,在輸入錯誤時提醒用戶注意這些錯誤輸入,並由虛擬助理向用戶講解輸入建議。為用戶光學地、即藉助顯示單元顯示通過虛擬助理提供的信息。
虛擬助理的這些對用戶有益的功能原理上也可以用於移動數據終端設備,例如行動電話或以個人數字助理PDA為人所熟悉的設備。但是在此對用戶來說存在缺點,即由虛擬助理提供的豐富信息必須顯示在移動數據終端設備的小顯示單元上。
此外,如果用戶必須同時將注意力集中在周圍其它光學顯示的信息或談話對象的聲音信息上,則虛擬助理提供的光學的豐富信息對於數據終端設備的用戶來說是難以處理的。在此提供了,藉助聲學顯示方式實現由數據終端設備的虛擬助理為數據終端設備的用戶提供信息。通過這種方式,數據終端設備的用戶可以更好地同時處理聲學提供的信息和其它光學提供的信息。
另一方面,公知有這樣的數據終端設備或方法,其中為數據終端設備的用戶或該方法聲學顯示附加信息。例如助理在售票窗口通過售票窗口的相應服務程序,藉助聲學信息來引導售票窗口的用戶。
由於售票窗口經常處於較吵鬧的環境中,因此對售票窗口的用戶來說,難以聽清由售票窗口助理輸出的聲音信息。還難以跟蹤由兩個不同的信號源同時作用在一個用戶身上的聲音信息。
一段時間以來對所謂的立體聲技術進行了研究。該立體聲技術的介紹例如在J.Blauert(1996)標題為「An introduction to binaural technology」,Binaural and Spatial Hearing in Real and Virtual Enviroments,R.Gilkey T.Anderson編輯,593-609頁,Lawrence Erlbaum,USA-Hill-dale NJ中進行了描述。
在對聲頻信息採用信號技術處理的條件下,聽眾藉助立體聲技術可以將產生聲波的源對應到周圍空間的任意位置。其中,在該空間中固定設置聽眾或輸出聲音信息的電聲轉換器。然後,聽眾例如可以通過對音頻信息的相應信號技術處理形成這樣一種主觀印象,即產生聲波的源在其周圍或者面向他或者遠離他。也就是說,藉助音頻信息的信號技術處理可以將產生聲波的源定位在空間的任意位置。
發明內容
因此,本發明要解決的技術問題在於,為數據終端設備的用戶開發一種技術手段,其中對於用戶的感覺來說,可以將由數據終端設備的虛擬助理輸出的聲音信息更好地與其它同樣對數據終端設備的用戶有影響的聲源分離開來。
該技術問題是從權利要求1的上位概念中定義的虛擬助理出發,通過在權利要求1的特徵部分給出的特徵,以及從權利要求9的上位概念中定義的方法出發,通過在權利要求9的特徵部分給出的特徵解決的。本發明的優選實施方式在從屬權利要求中給出。
根據本發明,藉助至少兩個電聲轉換器向數據終端設備的用戶輸出可聽見信息的虛擬助理,可以由用戶在空間中定位,從而在藉助電聲轉換器輸出的信息和其它由至少另一個聲源輸出的信息之間實現更好的立體聲分離。
本發明的一個優點是,藉助對數據終端設備的虛擬助理的音頻信息進行信號技術處理或其本地化,該數據終端設備的用戶可利用聲源的空間定位。對數據終端設備的用戶來說,可以與環境噪聲更好分離地收聽到虛擬助理的音頻信息。
此外,可以在用戶與空間中的另一位談話對象談話的同時,有目的地將虛擬助理的音頻信息從一個方向輸送給數據終端設備的用戶。在此,也可以將來自虛擬助理的影響用戶的音頻信息和來自談話對象的影響用戶的音頻信息進行較好的空間聲音分離。由此,用戶既可以接收和處理來自虛擬助理也可以接收和處理來自談話對象的信息。但至少,使用戶容易對來自虛擬助理和談話對象的信息同時接收和處理。
如果除了來自虛擬助理的音頻信息和來自存在於用戶周圍的其它聲源的環境噪聲之外,還同時顯示光學信息影響數據終端設備的用戶,則具有另一優點。在這種情況下,數據終端設備的用戶也可以更好地接收和處理來自不同聲源的信息。
具體實施例方式
本發明的其它優點由下面的描述給出,其藉助兩個實施例解釋了本發明。
在第一實施例中,一位行人位於大街上。這位行人提著很重的購物袋。他想用他的構造為行動電話的數據終端設備進行一次電話交談。該行動電話開機,但是放在他的一個購物袋中,因此不太容易找到。但是這位行人戴著具有受話器的輕便耳機。在該具有受話器的耳機中,集成了兩個用於輸出音頻信息的電聲轉換器。具有受話器的耳機與行動電話一樣配備了無線模塊(例如藍牙功能模塊),用於在具有受話器的耳機和行動電話之間進行短作用距離的數據交換。
行人,即該具有受話器的耳機或行動電話的用戶,激活該具有受話器的耳機,並由此實現了具有受話器的耳機和行動電話之間的數據交換。該用戶對具有受話器的耳機說「撥號」,對此行動電話的虛擬助理通知他「請說出姓名」。用戶說出受話者的姓名。由於用戶在具有高噪聲電平的環境中移動,因此行動電話不能以足夠的精度識別該受話者的姓名。行動電話處理用戶輸入的姓名,並將該姓名與行動電話的內置電話簿中存儲的姓名進行比較。行動電話將輸入的姓名識別為「Schmitzer」或「Schnitzler」。對用戶來說,在行動電話的顯示單元上輸出這兩個姓名、並接著要求該用戶在這兩個姓名之間做出選擇是毫無用處的。這是因為,如已提到的,用戶的行動電話埋藏在他的一個購物袋中而難以拿到。另一方面,行動電話由用戶通過具有受話器的耳機識別該行動電話的運行,從而行動電話指示其虛擬助理,藉助具有受話器的耳機,通過虛擬助理向用戶輸出所有聽起來相似的姓名。例如,用戶通過具有受話器的耳機聽到其虛擬助理下面的這番話「沒有唯一識別的名字」,「請從下面的選項中選擇」,「Schmitzer」或在短暫停頓之後接著說「Schnitzler」。
儘管環境噪聲很大,用戶還是識別出由虛擬助理提供的兩個選項,因為在行動電話的虛擬助理輸出音頻信息時,藉助電聲轉換器使立體聲技術得到了應用。立體聲技術實現了對行動電話中的音頻信息進行針對性的信號技術處理。在通過虛擬助理藉助具有受話器的耳機再現該音頻信息時,行動電話的用戶可以判斷由虛擬助理輸出的音頻信息的清楚位置。在行動電話中,根據由用戶進行的預調,對音頻信息進行這樣的信號技術處理,即行動電話的用戶將由虛擬助理提供的音頻信息定位為來自頭部附近的信息。該音頻信息從後面越過用戶的肩膀而在其耳畔「低語」。
行動電話的用戶例如可以藉助公知的機電輸入裝置任意改變虛擬助理的位置,從該位置收聽到由虛擬助理輸出的音頻信息。
機電輸入裝置例如是底座中的圓球。由傳感器探測用戶引起的球體轉動。另一方面,虛擬助理的定位按照本身公知的方式,藉助語音命令或藉助在行動電話接觸靈敏的顯示單元上的輸入來進行。
此外,當行動電話具有通過例如旋轉速率傳感器或磁場傳感器來檢測行動電話用戶的頭部運動的頭部位置傳感器時,如果在對音頻信息進行信號技術處理時考慮該頭部運動,則也可以保持所選擇的虛擬助理的位置。
通過虛擬助理的預調定位或由用戶任意改變其位置的可能性,用戶既可以按照簡單方式藉助用於建立呼叫連接的語音命令操作行動電話,也可以留意到環境噪聲,例如大聲喊叫或喇叭聲等等。
為了根據該呼叫連接的建立選擇由虛擬助理提供的姓名「Schmitzer」或「Schnitzler」,用戶通過向具有受話器的耳機說出「不是」來回答姓名「Schmitzer」,而通過說出「是」來回答姓名「Schnitzler」。行動電話識別姓名「Schnitzler」,並建立呼叫。
在第二實施例中描述了遠程電信會議的情況。有多人參加該遠程電信會議,這些人大部分能說或理解不同的語言。這些人分別坐在分布在整個遠程電信會議室內的各個桌子旁,每個人都有自己的顯示屏。一位參與者發言,則構造為遠程電信會議系統的數據終端設備將該參與者投影到掛在遠程電信會議室牆上的銀幕上,從而使得其他參與者也可以看見該參與者的表情和姿勢。
另一方面,該參與者的講話通過與遠程電信會議系統連接的、並構造為電聲轉換器的揚聲器傳出。
同時,將發言的參與者的講話實時翻譯為其他參與者的語言,並且參與者可以通過具有受話器的耳機收聽到該音頻信息形式的翻譯,其中在耳機中集成了兩個用於輸出音頻信息的電聲轉換器。為了向參與者提供同時專注於以發言的參與者的語言作出的講話以及以同聲翻譯後的語言作出的講話的可能性,由遠程電信會議系統通過虛擬助理為其他參與者輸出可聽見的同聲翻譯。遠程電信會議的每個參與者可以通過在遠程電信會議系統中輸入相應的鍵組合來在空間中任意定位虛擬助理。
在此,也由各參與者藉助對音頻信息的信號技術處理實現在遠程電信會議系統中對虛擬助理的定位以及對由虛擬助理輸出的音頻信息的空間聲音的感覺。參與者這樣定位虛擬助理,使得參與者通過虛擬助理收聽到音頻信息的輸出,就象從後面越過肩膀發送的和來自頭部附近的一樣。通過虛擬助理的定位,很好地實現了將通過揚聲器發出的講話和該講話的同聲翻譯之間的立體聲分離,從而參與者可以很好地理解通過揚聲器發出的講話和同聲翻譯,並專注於發言的參與者的表情和姿勢。也就是說,參與者可以注意力集中地同時聽取多條信息。
如果一參與者已經知道他自己的代表團的講話,則該參與者可以將遠程電信會議系統用於通過虛擬助理獲得其它信息,例如關於會議日程安排的信息、關於其他參與者的背景信息或關於參與者下榻酒店的信息。
所述例子並非窮舉。將通過虛擬助理向數據終端設備的用戶輸出的音頻信息與其它對用戶來說重要的、可同時聽見或可看見的信息進行空間聲音分離的概念,可以延伸到其他例子中,尤其是在用戶採用移動通信發送設備時。在此,例如可提到導遊,其中該導遊向觀光者解釋博物館中以該國語言確定的展品,觀光者通過其UMTS行動電話聽見由虛擬助理以很好的空間聲音分離出的該導遊解釋的同聲翻譯,必要時還能同時留意在其UMTS行動電話的顯示單元上的展品的其它光學顯示的信息。
權利要求
1.一種虛擬助理,藉助至少兩個電聲轉換器向數據終端設備的用戶輸出可聽見的信息,其特徵在於,該虛擬助理可以由數據終端設備的用戶在空間中定位,從而可實現在藉助電聲轉換器輸出的信息和其它由至少另一個聲源輸出的信息之間的更好的空間聲音分離。
2.根據權利要求1所述的虛擬助理,其特徵在於,所述虛擬助理在空間中的定位可以通過在數據終端設備中對音頻信息進行有針對性的信號技術處理來實現。
3.根據權利要求1或2所述的虛擬助理,其特徵在於,可以這樣定位所述虛擬助理,即為數據終端設備的用戶將所述虛擬助理定位在頭部附近和該用戶的一個肩膀後面。
4.根據上述權利要求中任一項所述的虛擬助理,其特徵在於,所述虛擬助理在空間中的定位可以預調。
5.根據上述權利要求中任一項所述的虛擬助理,其特徵在於,所述虛擬助理的定位可以藉助一個機電輸入裝置來調整。
6.根據權利要求1至4中任一項所述的虛擬助理,其特徵在於,所述虛擬助理的定位可以藉助語音命令來調整。
7.根據權利要求1至4中任一項所述的虛擬助理,其特徵在於,所述虛擬助理的定位可以藉助在接觸靈敏的顯示單元上的輸入來調整。
8.根據上述權利要求中任一項所述的虛擬助理,其特徵在於,所述虛擬助理可以用在移動數據終端設備中。
9.一種用於向數據終端設備的用戶提供虛擬助理的可聽見信息的方法,其中,該虛擬助理的可聽見信息通過至少兩個電聲轉換器輸出,其特徵在於,為了改善在由虛擬助理通過電聲轉換器輸出的信息和其它由至少另一個聲源輸出的信息之間的空間聲音分離,在空間中定位所述數據終端設備的虛擬助理。
10.根據權利要求9所述的方法,其特徵在於,所述數據終端設備另外配備有接收數據終端設備用戶的頭部運動的頭部位置傳感器,其中,在對音頻信息進行信號技術處理時這樣考慮該頭部運動,即所選擇的虛擬助理在空間中的位置在頭部運動時也保持不變。
全文摘要
本發明涉及一種虛擬助理,其藉助至少兩個電聲轉換器向數據終端設備的用戶輸出可聽見的信息,以及一種用於向數據終端設備的用戶提供虛擬助理的可聽見信息的方法。為了在藉助電聲轉換器輸出的信息和其它由至少另一個聲源輸出的信息之間實現更好的立體聲分離,可以由數據終端設備的用戶在空間中定位虛擬助理。由此用戶接收和處理來自虛擬助理和其它聲源的信息。但至少,使簡化了用戶對來自虛擬助理和其它聲源的信息的同時接收和處理。
文檔編號H04M1/27GK1615671SQ03802220
公開日2005年5月11日 申請日期2003年1月13日 優先權日2002年1月14日
發明者羅蘭·奧鮑爾, 克里斯多福·普爾施曼, 弗蘭克·洛倫茨, 斯蒂法諾·A·克林克, 麥可·許爾斯肯珀, 克里斯多福·尤謝爾 申請人:西門子公司