未知的說話者識別系統的製作方法

2023-06-12 22:00:51 1

未知的說話者識別系統的製作方法
【專利摘要】本發明包括用於在說話者（30）與至少一個收聽者（30）之間的語言通信中使用的設備，其中該說話者和該至少一個收聽者形成多個參與者中的全部或部分，其中該說話者和該至少一個收聽者在空間上彼此分開，該設備能操作成向收聽者提供與說話者的身份關聯的感知輸出。該設備包括識別裝置（40），該識別裝置包括振動傳感器（46），用於檢測與說話者的講話關聯的振動。該識別裝置（40）配置成存儲代表說話者和識別裝置中的任一個或兩個的識別數據，由此識別裝置能與說話者的身份關聯。該識別裝置（40）能操作使得響應于振動傳感器檢測與所述說話者的講話（S）關聯的振動（V），傳送器傳送識別信號（50），其包括存儲的識別數據或從存儲的識別數據生成。設備進一步包括用於由收聽者使用的顯示裝置（70）。
【專利說明】未知的說話者識別系統

【技術領域】
[0001] 本發明涉及用於在多個參與者的說話者與收聽者之間的語言通信中使用的設備、部件的套件和有關的方法，其中該收聽者不能容易地看到誰正講話，該設備能操作成向收聽者提供指示說話者的身份的感知輸出。

【背景技術】
[0002] 存在需要多個參與者的說話者與收聽者之間的語言通信的許多環境，其中該說話者和該收聽者的分開使得一個或多個收聽者可能難以確定誰在說話。
[0003] 困難可能在說話者和一個或多個收聽者定位在直接視線外時出現。一個這樣的示例是定位在不同地理位置處的多個參與者之間的電信網絡上舉行的音頻會議電話的使用。這作為實施商業通信的部件而是眾所周知的。然而，當會話中的參與者的數量超過兩個時，參與者可能難以解答他們中是誰在任何給定時間講話。該問題是參與者未處於彼此的直接視線內並且因此必須僅依靠音頻信號來識別在會話的另一端是誰在講話的後果。問題在通過常規的普通老式電話服務（POTS)網絡實施會議會話時加劇，因為在POTS網絡上能使用的語音頻帶局限於近似300Hz至3400Hz，即代表人類聽力範圍的頻帶(大約20Hz至 20000Hz)的小部分。因此，除收聽參與者必須僅依靠它們的聽覺來識別誰在講話外，那些相同的參與者必須使識別基於被壓縮的音頻信號。說話者識別可以進一步被說話參與者的講話中的任何失真(其可由通過POTS網絡的傳送引入）所阻礙。
[0004] -個或多個收聽者識別誰在講話的相同困難也可以在具有定位在單個房間(例如擁擠的演講劇場）中的多個參與者的會議或演講中出現。在單個房間中有大量的參與者的情況下，收聽的那些人可能難以確定這些參與者之中是誰在講話，即使說話者與收聽的那些人在直接視線內也如此。
[0005] 能夠基於從他們的語音籤名認出給定人的語音而識別誰在講話的語音識別系統的使用是已知的。然而，這樣的系統將需要訓練來建立足以識別給定人的語音簡檔，以及包含給定會話上的所有人的語音簡檔的資料庫。這樣的系統因此在時間和基礎設施兩方面將是昂貴的。
[0006] 因此，存在對於在收聽者與說話者之間的語言通信場景(其中該收聽者不能容易地看到誰在講話）中識別誰在講話的改進的部件的需要。

【發明內容】

[0007] 因此，本發明的第一方面提供用於在說話者與至少一個收聽者之間的語言通信中使用的設備，該說話者和該至少一個收聽者形成多個參與者中的全部或部分，其中說話者和至少一個收聽者在空間上彼此分開，該設備能操作成向收聽者提供與說話者的身份關聯的感知輸出；該設備包括：識別裝置，其中該識別裝置可被說話者穿戴或攜帶，識別裝置包括振動傳感器，用於檢測與說話者的講話關聯的振動，其中識別裝置配置成存儲代表說話者和識別裝置中的任一個或兩個的識別數據，由此識別裝置能與說話者的身份關聯，其中識別裝置能操作使得響應于振動傳感器檢測與說話者的講話關聯的振動，傳送器傳送識別信號，其包括存儲的識別數據或從存儲的識別數據生成；設備進一步包括用於由收聽者使用的顯示裝置，該顯示裝置能操作成接收這樣的識別信號並且從接收的識別信號生成感知輸出，其指示說話者和識別裝置中的任一個或兩個的身份。
[0008] 為了本發明的目的，就"多個"參與者而言意指兩個或以上的參與者。此外，"說話者"和"收聽者"還可在該文本中分別稱為"說話參與者"和"收聽參與者"，其中術語能互換地使用。
[0009] 本發明在說話者與收聽者之間的任何語言通信場景中（其中收聽者不能容易地看到誰在說話）獲得應用，由此妨礙收聽者確認說話者的身份的能力。應用可包括但不限於：籲在具有多個參與者的會議或演講中使用來幫助在任何給定時間確認在說話的人的身份。在單個房間(例如擁擠的演講劇場）中有大量參與者的情況下，收聽的那些人(即"收聽者"）可能難以確定這些參與者之中是誰在講話，即使說話者與收聽的那些人在直接視線內也如此。本發明的設備提供容易使收聽者能夠在擁擠的空間確定誰在說話的身份的部件。
[0010] ?在其中說話者和收聽者不在彼此的直接視線內的電信或無線電應用中的使用。本發明的設備將在定位在不同地理位置(其對應於網絡的不同節點）處的多個參與者之間的電信或無線電網絡上所承擔的音頻通信會議中特別有用。本發明的設備可與之一起使用的電信網絡的非限制性示例包括普通老式電話服務（POTS)、蜂窩電話網絡和/或網際網路語音協議（V0IP)。本發明對於在飛機上的飛行員與空中交通控制器和/或其他飛機之間的無線電通信中的使用也將是有益的。備選地，本發明在用作對於基於地面的運輸的無線電通信系統的部分一例如用於計程車公司或卡車運輸公司使用時將是有益的。
[0011] 在考慮本發明在任何這樣的具有多個參與者的"語言通信"場景中的使用時，值得注意的是每個參與者可在不同的時間說話或收聽。因此，"說話者"和"收聽者"的角色不一定是固定的。這在考慮本發明在多個不同參與者之間的電信或無線電網絡上的音頻通信會議期間的使用時可以更清楚地理解一給定參與者在會議中的一個情形中可以是"說話者" 並且在會議中的另一個情形處是"收聽者"。因此，在描述本發明的識別裝置和顯示裝置的使用時，如本文使用的術語"說話者"和"收聽者"可以適用於一個人和相同的人(根據該人在語言通信期間的給定時間點處是碰巧在說話或收聽)。
[0012] 使識別裝置配置成存儲代表說話者和識別裝置中的任一個或兩個的身份的識別數據可以採用各種不同的方式來實現。非限制性示例可包括採用僱員ID標籤的形式提供的識別裝置，其中該標籤包含用代表給定僱員的身份的識別數據而編碼的晶片。識別數據可採取僱員的名字和僱員編號的形式。備選地，識別數據可包括與給定識別裝置關聯的顏色和形狀中的一個或兩個。取網絡的不同節點處的多個參與者之間的電信或無線電網絡上實施的音頻通信會議的非限制性示例，會議的參與者中的每個可提供有他們自己的識別裝置，其配置有代表與該識別裝置唯一聯繫起來的可見標記的識別數據。該唯一聯繫可採取每個識別裝置具有採用顏色、形狀或其組合的形式的唯一可見標記的形式，其中在每個識別裝置上提供不同的顏色和/或形狀，並且其中識別裝置包括用代表顏色和/或形狀的識別數據編碼的晶片或其他存儲部件。這樣的顏色和/或形狀的使用提供其中存儲的識別數據將代表識別裝置自身的身份並且將提供避免存儲在識別裝置上的數據包含參與者中的任一個的任何個人信息(例如，名字、生日和/或地址）的需要的益處的示例。
[0013] 感知輸出優選地包括視覺輸出、觸覺輸出和可聽輸出中的一個或多個。可聽輸出可採用提供說話者的名字的聽覺畫外音的形式，儘管承認這可潛在地阻礙一個或多個收聽者聽到說話者正在說什麼的能力。由於那些原因，視覺輸出是優選的。視覺輸出採取對於收聽者足以確認說話者和說話者的識別裝置中的任一個或兩個的身份(基於在識別信號中包含的信息）的任何視覺表示的形式。例如，視覺輸出可簡單地是說話者的名字的文本表示，或代表說話者和識別裝置中的任一個或兩個的任何字母數字標識符。備選地，視覺輸出可採取顏色和/或形狀的形式。例如，在每個識別裝置提供有它自己的唯一可見標記(採用顏色、形狀或其組合的形式)並且識別數據代表顏色和/或形狀(如在前面的段落中概述的）的情況下，在顯示裝置上提供的感知輸出可以是顏色和/或形狀的視覺表示。備選地，觸覺輸出可採取Braille (適合於盲人參與者）或振動(例如對應於從不同識別裝置傳送的不同識別信號的不同振動信號的輸出）的形式。
[0014] 識別裝置包括對於說話者能操作成用識別數據來預先配置識別裝置的輸入部件，這是優選的。用於預先配置識別裝置的這樣的輸入部件的提供將允許說話者用代表他們自己的身份的識別數據來預先配置給定的識別裝置。在使用中，這樣的預先配置將在"語言通信"開始之前出現，這是優選的。進一步解釋起來，當考慮在飛機中的飛行員與空中交通控制器之間的空中ο地面通信中使用時，飛行員將優選地在起飛之前預先配置他們的識別裝置；當考慮多個參與者之間的電信或無線電網絡上的音頻通信會議的示例時，每個參與者將優選地在開始會議之前配置他們的識別裝置。便利地，輸入部件包括小鍵盤和音頻記錄裝置中的一個或兩個。說話者將因此能夠通過鍵盤輸入和/或音頻輸入的方式用例如他們的名字(或任何其他個人標識符）等識別數據來預先配置識別裝置。
[0015] 識別裝置配置成與另一個人的身份能重新關聯，這是特別優選的。本發明的該特徵將確保識別裝置不限於與給定的人永久關聯，由此確保識別裝置可以在將來時間被另一個人使用。當考慮本發明的設備在具有大量僱員的組織內使用時，"能重新關聯性"的特徵避免必須向每個僱員提供他們自己的識別裝置，其中所有僱員將同時參與相同的"語言通信"，這是不可能的。此外，能重新關聯性的特徵還提供在一段時間內與任何數量的人一起重新使用給定的識別裝置的能力。
[0016] 設想在"語言通信"場景期間的使用中，參與者中的全部將提供有他們自己的可穿戴或可攜帶識別裝置。這由此將確保每個參與者擁有適合於在他們說話時生成與他們唯一關聯的識別信號的部件。必需的顯示裝置的數量將取決於特定語言通信場景。考慮本發明在單個房間中具有多個參與者的會議或演講期間的使用，存在可以被參與者中的全部所觀看的僅單個共同顯示裝置，這可是足夠的。然而，考慮到本發明在定位在不同地理位置(其對應於網絡的多個不同節點）處的多個參與者之間的電信(或無線電）網絡上承擔的音頻通信會議期間的使用，設想至少一個顯示裝置將在網絡的每個節點處提供。這由此將基於通過網絡從在說話的參與者的識別裝置接收的識別信號而對在網絡的每個節點處存在並且收聽的那些一個或多個參與者提供被給予在不同節點處誰在說話的實時感知指示的能力。
[0017] 優選地，配置識別裝置使得傳送器在來自說話者的持續講話的最小持續時間後僅傳送識別信號。本發明的該特徵具有避免顯示裝置基於說話者咳嗽或打噴嚏而觸發由此有助於避免在設備使用期間參與者說話的錯誤指示的有益效果。便利地，最小持續時間在0. 5 與2秒之間。具有太大的最小持續時間將在a)說話者的講話首先被一個或多個收聽者聽見與b)顯示裝置(對於一個或多個收聽者）接收識別信號來生成在說話的人的身份的感知輸出之間有不可接受的時滯的風險。
[0018] 優選地，識別裝置能定位在說話者的頸部或胸部附近。本發明的該特徵幫助更好地確保振動傳感器能夠從說話者的聲帶的使用檢測振動。識別裝置可便利地附連到項鍊用於戴在說話者的頸部周圍。便利地，識別裝置可被手持、能貼附於說話者所穿的一件衣服，或直接能貼附於說話者的身體(例如，通過使用帶子或膠帶）一這些全部落在是"可穿戴或可攜帶"的識別裝置的範圍內。
[0019] 具有識別裝置使得它在使用中被參與者使用中穿戴或攜帶提供了識別傳感器到該參與者的接近性。這提供能夠更易於校準振動傳感器使得它僅檢測來自正穿戴或攜帶識別裝置的參與者的講話的優勢。該優勢在其他人出現在與特定參與者相同的房間中的情況下尤其相關，因為它避免識別裝置被來自除正穿戴或攜帶特定識別裝置的參與者以外的人的講話所觸發。
[0020] 識別裝置的傳送器可配置成將識別信號作為具有在20Hz與20000Hz之間的頻率的音頻信號來傳送。這樣的頻率範圍對應於人類聽力可聽到的頻率的通常接受範圍。便利地，傳送器配置成將識別信號作為具有在300Hz與3400Hz之間的較窄頻帶內的頻率的音頻信號來傳送。該較窄頻帶特別適合於識別信號採用普通老式電話服務（POTS)的形式在電信網絡上的直接傳送，對於其可傳送音頻頻率範圍僅代表與人類聽力的範圍（20Hz至 20000Hz)普遍關聯的頻率範圍的一部分。
[0021] 備選地，傳送器可配置成在20000Hz以上的頻率無線傳送識別信號，設備進一步包括通信地能耦合於識別裝置與電信或無線電網絡之間的第一編碼器，該第一編碼器能操作成接收傳送的識別信號並且將其轉換成以下中的一個： a)具有在20Hz至20000Hz範圍內（或備選地，在300Hz至3400Hz範圍內）的頻率的音頻信號；或 b )加密數位訊號，其中對於b )顯示裝置包括用於對加密數位訊號解碼的解碼器或通信地與之能耦合。
[0022] 識別信號在20000Hz以上的頻率從識別裝置的傳送具有確保它不被說話者聽見並且因此不幹擾他們的注意力和影響他們講話的有益效果。隨後由第一編碼器轉換成在 20Hz至20000Hz範圍內的音頻頻率在設備的識別裝置與能夠傳送對應於人類聽力的全範圍的音頻信號的電信或無線電網絡一起使用時是有益的；而轉換成具有在300Hz至3400Hz 範圍內的頻率的音頻信號在設備與採用POTS形式的電信網絡一起使用時是特別有益的。 [0023] 除使用如上文概述的第一編碼器外，識別裝置還可能操作成對識別信號編碼以作為無線藍牙信號由傳送器傳送，其中識別裝置和第一編碼器彼此是能藍牙配對的。藍牙協議的使用提供在識別裝置與第一編碼器之間無線連接和交換信息的安全方式。
[0024] 便利地，第一編碼器集成在能連接到電信或無線電網絡的節點的終端內，該終端能操作成用於到和/或來自網絡的音頻通信。在一個示例中，終端可以是通過POTS而能連接的電話，該電話具有用於檢測接近於其而定位的一個或多個參與者的講話的麥克風和用於將通過POTS接收的音頻信號輸送到收聽的任何人的揚聲器。
[0025] 優選地，設備進一步包括集成在顯示裝置內或通信地能連接到顯示裝置的濾波器，其中該濾波器能操作成接收組合信號(其包括識別信號和說話者的講話的音頻信號兩者)，並且進一步能操作成對該組合信號濾波以在濾波信號向收聽者的音頻輸出之前從組合信號提取識別信號。這樣的濾波器的使用有助於確保一個或多個收聽者聽見在網絡的另一個節點處說話的參與者所講的詞而沒有來自識別信號的幹擾或失真。
[0026] 優選地，顯示裝置集成在能連接到電信或無線電網絡的節點的終端內，該終端能操作成用於到和/或來自網絡的音頻通信。本發明的該特徵提供這樣的優勢：提供可以用於提供到/來自電信或無線電網絡的音頻輸入和音頻輸出同時還起到提供在網絡的另一個節點處誰在說話的視覺指示的作用的單個集成終端。備選地或另外，識別裝置集成在能連接到電信或無線電網絡的節點的終端內，該終端能操作成用於到和/或來自網絡的音頻通信；例如，終端可以是蜂窩電話，其可充當識別裝置和顯示裝置兩者。
[0027] 在本發明的另一個方面中，提供有終端，其能操作成用於到和/或來自電信或無線電網絡的音頻通信，其中該終端包括本發明的識別裝置和顯示裝置中的一個或兩個。在本發明的一個形式中，終端可以是蜂窩電話。
[0028] 在本發明的另一個方面中，提供有部件的套件，其包括本發明的識別裝置和顯示裝置。這樣的套件因為它將向人提供以下兩者而有價值： a) 生成與他們的身份關聯的識別信號所必需的部件（即"識別裝置"）一適合於在語言通信期間在那個人是說話者時被他使用；以及 b) 在那個人在語言通信期間是收聽者時提供指示在說話的人的身份的視覺輸出所必需的部件（即"顯示裝置")。
[0029] 在本發明的另一個方面中，提供有在說話者與至少一個收聽者之間的語言通信中識別誰在說話的方法，該說話者和該至少一個收聽者形成多個參與者中的全部或部分，其中該說話者和該至少一個收聽者在空間上彼此分開，該方法向至少一個收聽者提供與說話者的身份關聯的感知輸出，該方法包括：提供識別裝置，其中該識別裝置可被說話者穿戴或攜帶，識別裝置包括振動傳感器，用於檢測與說話者的講話關聯的振動，其中識別裝置存儲代表說話者和識別裝置中的任一個或兩個的身份的識別數據，由此識別裝置與說話者的身份關聯；用振動傳感器檢測與說話者的講話關聯的振動，在說話者正穿戴或攜帶識別裝置時執行檢測；響應于振動的檢測，從識別裝置傳送識別信號，其包括存儲的識別數據或從存儲的識別數據生成；以及提供顯示裝置用於由至少一個收聽者使用，其中該顯示裝置接收這樣的識別信號並且從接收的識別信號生成指示說話者和識別裝置中的任一個或兩個的身份的感知輸出。
[0030] 本發明的方法還可包含對應於由上文概述的設備的各種可能特徵所提供的功能性的步驟。
[0031] 提供一種用於在說話者與至少一個收聽者之間的語言通信中使用的設備，其中所述說話者和所述至少一個收聽者形成多個參與者中的全部或部分，其中所述說話者和所述至少一個收聽者在空間上彼此分開，所述設備能操作成向所述收聽者提供與所述說話者的身份關聯的感知輸出；所述設備包括：識別裝置，其中所述識別裝置可被說話者穿戴或攜帶，所述識別裝置包括振動傳感器，用於檢測與所述說話者的講話關聯的振動，其中所述識別裝置配置成存儲代表所述說話者和所述識別裝置中的任一個或兩個的的身份的識別數據，由此所述識別裝置能與所述說話者的身份關聯，其中所述識別裝置能操作使得響應於所述振動傳感器檢測與所述說話者的講話關聯的振動，傳送器傳送識別信號，其包括存儲的識別數據或從所述存儲的識別數據生成；所述設備進一步包括用於由收聽者使用的顯示裝置，所述顯示裝置能操作成接收這樣的識別信號並且從接收的識別信號生成感知輸出，其指示所述說話者和所述識別裝置中的任一個或兩個的身份。
[0032] 優選的，所述識別裝置包括輸入部件，其對於所述說話者能操作成用代表所述說話者的身份的識別數據來預先配置所述識別裝置。
[0033] 優選的，所述輸入部件包括小鍵盤和音頻記錄裝置中的一個或兩個。
[0034] 優選的，所述識別裝置配置成與另一個人的身份能重新關聯。
[0035] 優選的，所述感知輸出包括視覺輸出、觸覺輸出和可聽輸出中的一個或多個。
[0036] 優選的，所述識別裝置提供有可見標記，其中所述存儲的識別數據代表所述可見記。
[0037] 優選的，所述可見標記包括顏色和形狀中的一個或兩個。
[0038] 優選的，所述顯示裝置能操作成生成所述感知輸出，其包括所述可見標記的視覺表不。
[0039] 優選的，配置所述識別裝置使得所述傳送器在來自所述說話者的連續講話的最小持續時間後僅傳送所述識別信號。
[0040] 優選的，所述最小持續時間是在0. 5與2秒之間。
[0041] 優選的，所述識別裝置能定位在所述說話者的頸部或胸部附近。
[0042] 優選的，所述識別裝置的傳送器配置成將所述識別信號作為具有在20Hz與 20000Hz之間的頻率的音頻信號來傳送。
[0043] 優選的，所述傳送器配置成將所述識別信號作為具有在300Hz與3400Hz之間的頻率的音頻信號來傳送以採用普通老式電話服務POTS形式通過電信網絡傳送。
[0044] 優選的，所述傳送器配置成在20000Hz以上的頻率無線傳送識別信號，所述設備進一步包括通信地能耦合於所述識別裝置與電信或無線電網絡之間的第一編碼器，所述第一編碼器能操作成接收傳送的識別信號並且將其轉換成以下中的一個： a)具有在20Hz至20000Hz範圍內的頻率的音頻信號；或 b )加密數位訊號，其中對於b )所述顯示裝置包括用於對所述數位訊號解碼的解碼器或通信地與之能耦合。
[0045] 優選的，所述第一編碼器能操作成接收傳送的識別信號並且將其轉換成具有在 300Hz至3400Hz範圍內的頻率的音頻信號。
[0046] 優選的，所述識別裝置能操作成對所述識別信號編碼以作為藍牙信號由所述傳送器無線傳送，其中所述識別裝置和所述第一編碼器彼此是能藍牙配對的。
[0047] 優選的，所述第一編碼器集成在能連接到電信或無線電網絡的節點的終端內，所述終端能操作用於到和/或來自所述網絡的音頻通信。
[0048] 優選的，所述設備進一步包括集成在所述顯示裝置內或通信地能連接到所述顯示裝置的濾波器，其中所述濾波器能操作成接收組合信號並且進一步能操作成對所述組合信號濾波以在濾波信號向所述收聽者的音頻輸出之前從所述組合信號提取所述識別信號，所述組合信號包括所述識別信號和所述說話者的講話的音頻信號兩者。
[0049] 優選的，所述顯示裝置在能連接到電信或無線電網絡的節點的終端內，所述終端能操作用於到和/或來自所述網絡的音頻通信。
[0050] 優選的，所述識別裝置集成在能連接到電信或無線電網絡的節點的終端內，所述終端能操作用於到和/或來自所述網絡的音頻通信。
[0051 ] 優選的，所述終端是蜂窩電話。
[0052] 提供一種能連接到電信或無線電網絡的節點的終端，所述終端能操作用於到和/ 或來自所述網絡的音頻通信，其中所述終端包括如權利要求1至18中任一項所述的識別裝置和顯示裝置中的一個或兩個。
[0053] 優選的，所述終端是蜂窩電話。
[0054] 提供一種部件的套件，所述套件包括如權利要求1至18中任一項所述的識別裝置和顯示裝置。
[0055] 提供一種在說話者與至少一個收聽者之間的語言通信中識別誰在說話的方法，其中所述說話者和所述至少一個收聽者形成多個參與者中的全部或部分，其中所述說話者和所述至少一個收聽者在空間上彼此分開，所述方法向所述至少一個收聽者提供與所述說話者的身份關聯的感知輸出，所述方法包括：提供識別裝置，其中所述識別裝置可被說話者穿戴或攜帶，所述識別裝置包括振動傳感器，用於檢測與所述說話者的講話關聯的振動，其中所述識別裝置存儲代表所述說話者和所述識別裝置中的任一個或兩個的身份的識別數據，由此所述識別裝置與所述說話者的身份關聯；用所述振動傳感器檢測與所述說話者的講話關聯的振動，在所述說話者正穿戴或攜帶識別裝置時執行檢測；響應於所述振動的檢測，從所述識別裝置傳送識別信號，其包括存儲的識別數據或從所述存儲的識別數據生成；以及提供顯示裝置用於由所述至少一個收聽者使用，其中所述顯示裝置接收這樣的識別信號並且從接收的識別信號生成指示所述說話者和所述識別裝置中的任一個或兩個的身份的感知輸出。
[0056] 優選的，所述識別裝置提供有對於所述說話者的輸入部件，用於用所述識別數據來預先配置所述識別裝置，所述方法進一步包括所述說話者用所述識別數據中的一些或全部來預先配置所述識別裝置的步驟，其中預先配置的識別數據代表所述說話者的身份。 [0057] 優選的，所述識別裝置提供有用於所述識別裝置的預先配置的小鍵盤和音頻記錄裝置中的一個或兩個。
[0058] 優選的，所述識別裝置配置成與另一個人的身份能重新關聯。
[0059] 優選的，所述感知輸出包括視覺輸出、觸覺輸出和可聽輸出中的一個或多個。
[0060] 優選的，所述識別裝置提供有可見標記，其中所述存儲的識別數據代表所述可見記。
[0061] 優選的，所述可見標記包括顏色和形狀中的一個或兩個。
[0062] 優選的，所述顯示裝置能操作成生成所述感知輸出，其包括所述可見標記的視覺表不。
[0063] 優選的，所述識別信號的傳送僅在來自所述說話者的連續講話的最小持續時間後出現。
[0064] 優選的，所述最小持續時間是在0. 5與2秒之間。
[0065] 優選的，所述識別裝置由所述說話者的穿戴或攜帶包括使所述識別裝置定位在所述說話者的頸部或胸部附近。
[0066] 優選的，所述識別信號的傳送包括將所述識別信號作為具有在20Hz與20000Hz之間的頻率的音頻信號來傳送。
[0067] 優選的，所述音頻信號具有在300Hz與3400Hz之間的頻率。
[0068] 優選的，所述識別信號的傳送包括在20000Hz以上的頻率無線傳送所述識別信號，所述方法進一步包括提供通信地能耦合於所述識別裝置與電信或無線電網絡之間的第一編碼器，所述第一編碼器接收傳送的識別信號並且將其轉換成以下中的一個： a)具有在20Hz至20000Hz範圍內的頻率的音頻信號；或 b )加密數位訊號，其中對於b )所述顯示裝置包括用於對所述數位訊號解碼的解碼器或與之通信地耦合。
[0069] 優選的，所述第一編碼器接收傳送的識別信號並且將其轉換成具有在300Hz至 3400Hz範圍內的頻率的音頻信號。
[0070] 優選的，所述方法進一步包括對所述識別信號編碼使得它作為藍牙信號從所述識別裝置無線傳送。
[0071 ] 優選的，所述方法進一步包括提供集成在所述顯示裝置內或通信地連接到所述顯示裝置的濾波器，其中所述濾波器接收組合信號，其包括所述識別信號和所述說話者的講話的音頻信號兩者，所述濾波器對所述組合信號濾波以在濾波信號向所述收聽者的音頻輸出之前從所述組合信號提取所述識別信號。
[0072] 提供一種大致上如在本文參考描述和圖限定的設備。
[0073] 提供一種大致上如在本文參考描述和圖限定的終端。
[0074] 提供一種大致上如在本文參考描述和圖限定的套件。
[0075] 提供一種大致上如在本文參考描述和圖限定的方法。

【專利附圖】

【附圖說明】
[0076] 本發明的實施例參考下列附圖描述：圖1示出具有多個不同節點的電信網絡的表示。
[0077] 圖2示出在與在圖1中示出的電信網絡一起使用時的本發明的第一實施例。
[0078] 圖3示出在與在圖1中示出的電信網絡一起使用時的本發明的第二實施例。
[0079] 圖4示出在與在圖1中示出的電信網絡一起使用時的本發明的第三實施例。
[0080] 圖5示出其中三個不同的識別裝置的殼體每個提供有它們自己的唯一可見標記的本發明的實施例。
[0081] 請注意圖未按比例繪製，並且規定為本發明的各種可能實施例的非限制性示例。

【具體實施方式】
[0082] 圖1示出用於在音頻通信會議期間使用的電信網絡10的簡化表示，該網絡具有多個不同的節點11。這些節點11中的每個對應於不同的地理位置。在圖1中示出的實施例中，終端20在每個相應的節點11處連接到電信網絡10,其中該終端提供到和來自電信網絡10的音頻通信。本發明的示例在圖2、3和4中描述，這時電信網絡是普通老式電話服務（P0TS)，其中POTS系統仍然廣泛用於音頻會議。然而，如可以通過描述的較早部分所理解的，本發明能適用於與其他形式的電信網絡(例如，蜂窩電話網絡和/或網際網路語音協議 (V0IP))-起使用。
[0083] 在未在圖中示出的備選實施例中，網絡10將是無線電通信網絡。一個這樣的無線電通信網絡10是形成飛機與地面站之間的無線電系統的部分的無線電網絡，其中該飛機和地面站對應於網絡的不同節點11。
[0084] 在多個參與者30之間的音頻通信會議期間，這些參與者中的一個或多個定位在每個節點位置11處(如在圖1中圖示的)。
[0085] 圖2、3和4示出從在音頻通信會議期間的一個時間點處在說話的參與者（S卩，充當 "說話者"）和在另一個時間點在收聽的參與者（即，充當"收聽者"）的角度來看的本發明的示範性表示。設備具有識別裝置40和顯示裝置70。
[0086] 在未試圖限制如在權利要求中概述的本發明的範圍的情況下，識別裝置40和顯示裝置70的形式和功能在下文概述。
[0087] 圖2的實施例示出在項鍊41上提供的識別裝置40。在使用中，該項鍊41將戴在參與者30中的給定一個的頸部周圍，使得識別裝置靠近頸部並且由此靠近該參與者的聲帶而定位。音頻通信會議的每個參與者30提供有要被他們穿戴或攜帶的他們自己的識別裝置40。識別裝置40包括殼體，其包含振動傳感器42、輸入部件43、存儲器44、處理器45 和傳送器46。
[0088] 圖2還示出採用連接到電信網絡10的會議使能的電話形式的終端20,該網絡具有普通老式電話服務（POTS)的形式。該終端20具有麥克風21和揚聲器22,用於實現到和來自網絡10的音頻通信。
[0089] 在音頻通信會議開始之前，每個參與者30將使用輸入部件43來將識別數據輸入他們自己的相應識別裝置40的存儲器44內。該識別數據將代表該參與者的身份。未示出輸入部件43的形式，但如在描述的較早部分中概述的那樣，它可包括小鍵盤和/或音頻記錄器。識別數據可採取參與者的名字或與參與者的身份唯一關聯的另一個標識符(例如，僱員員工編號）的形式。預先配置的行為確保識別裝置40與給定參與者30的身份成對（即，關聯）直到預先配置有另一個人的識別數據。
[0090] 在參與者30開始說話時(在該點處他們為了本發明的目的而變成"說話者")，振動傳感器42檢測與說話者30的講話S關聯的振動'V'（參見圖2)。識別裝置40到說話者30的聲帶的接近性幫助振動傳感器42檢測來自說話者的講話S的開始，然而，在未在圖中示出的備選實施例中，識別裝置40被參與者30手持，或附連到參與者所穿的一件衣服。
[0091] 響應于振動傳感器42檢測說話者30的講話S，處理器45和存儲器44與傳送器46 協作來促使傳送器無線傳送識別信號50。該識別信號50從在上文概述的預先配置步驟期間輸入的識別數據生成或包括它。在圖2中示出的實施例中，處理器45執行存儲在存儲器 44中的計算機代碼，該計算機代碼作用於識別數據以從其生成識別信號50。計算機例如確保傳送器46在振動傳感器42已檢測來自說話者的連續講話S的最小持續時間後僅傳送識別信號50。對於圖2的實施例，識別信號50是採用具有在300Hz至3400Hz範圍中的頻率的"線性調頻脈衝"形式的音頻信號，其中該線性調頻脈衝代表識別數據的壓縮形式。
[0092] "線性調頻脈衝" 50 (即"識別信號"）被終端20的麥克風21檢測，其中麥克風21 還檢測說話者30的講話S。終端20然後跨網絡10將組合信號550發送到定位在網絡的其他節點11處的其他參與者30的對應終端20,該組合信號550包含i)線性調頻脈衝50 和ii)代表說話者30的講話S的音頻信號500兩者。接收組合信號550的這些其他參與者30中的每個為了本發明的目的而變成"收聽者"。
[0093] 為了方便起見，圖2還用於從這樣的"收聽者"的角度描述本發明。
[0094] 圖2示出集成到終端20內的顯示裝置70,其中該顯示裝置包括顯示屏71。濾波器80也集成到終端20內。在接收組合信號550的終端上，信號首先經過濾波器80,其對組合信號550濾波來從組合信號550提取識別信號50。在濾波後，提取的識別信號50然後輸送到顯示裝置70。如在圖2中示出的，顯示裝置70包括存儲器72和處理器73,其中該處理器73執行存儲在存儲器72中的計算機代碼。該計算機代碼作用於提取的識別信號 50來生成採用說話者身份的視覺表示的形式的感知輸出，該視覺表示輸出到顯示屏71。在圖2中示出的實施例中，視覺表示是說話者的名字。講話信號500然後能夠輸送到終端20 的揚聲器22來使收聽者能夠聽見說話者在說什麼。
[0095] 本發明的備選形式在圖3中示出，其中與圖2的實施例共同的那些特徵具有相同的標號。在圖3的實施例中，顯示裝置700作為在結構上與終端20截然不同並且在網絡10 與終端20之間串聯連接的獨立模塊而提供。示出集成到顯示裝置700內的濾波器800。濾波器800採用與圖2的實施例中的濾波器80相似的方式起作用，由此使僅包含說話者的講話的乾淨音頻信號能夠輸送到終端20以經由揚聲器22輸出到收聽者。此外，從組合信號 550提取的識別信號50將在顯示裝置70內處理來生成在顯示屏710上的說話者身份的視覺表示。顯示裝置700的該備選形式將具有優於圖2的實施例的不一定需要修改終端20 由此允許常規會議使能的電話用作終端的優勢。
[0096] 對於圖3的實施例，每個參與者將提供有部件的套件，該套件包含識別裝置40和顯示裝置700,其中識別裝置和顯示裝置能與終端20 -起使用但在結構上與終端20截然不同。
[0097] 本發明的另外的備選形式在圖4中示出。該實施例是圖3的實施例的變化形式。與圖2和3的實施例相比之下，圖4的實施例包括編碼器60,其中該編碼器60在空間上與識別裝置60和終端20截然不同並且分開，並且通過有線連接而連接到終端20。在未在圖中示出的備選實施例中，編碼器60集成在終端20本身內。圖4的實施例還與圖2和3不同之處在於由傳送器46無線傳送的識別信號50是20000Hz以上的非可聽信號。非可聽識別信號50被編碼器60接收，其中編碼器60起到將識別信號50轉換成具有在範圍300Hz至 3400Hz內的頻率的音頻信號的作用，其中轉換的識別信號50然後經由有線連接輸送到終端20。終端20然後跨網絡10發送轉換的識別信號50連同說話者30的講話500的音頻信號。圖4的實施例優於圖2和3的優勢在於識別信號50作為非可聽信號（S卩，具有20000Hz 以上的頻率)從識別裝置40到編碼器60的無線傳送避免識別信號幹擾說話者30的注意力和講話。在圖中未示出的實施例中，識別信號50可作為藍牙信號無線傳送，其中識別裝置 40和編碼器60是能藍牙配對的。
[0098] 圖5示出三個不同識別裝置40a、40b、40c的殼體的外部視圖的視圖。識別裝置 40a、40b、40c中的每個在殼體的外表面上提供有它自己的唯一可見標記90a、90b、90c。在圖5中示出的實施例示出這些可見標記90a、90b、90c，其採用具有特定紋理的形狀或顏色的形式。識別裝置40a、40b、40c中的每個使它的存儲器44用代表它相應的可見標記90a、 90b、90c的識別數據來編碼。在使用中，從每個識別裝置40a、40b、40c傳送的識別信號50 將對應於每個裝置的標記90a、90b、90c。儘管在圖中的任一個未明確示出，顯示裝置70、 700將顯示對應於識別裝置(其屬於說話的任一個參與者30)的視覺標記的視覺表示。 [〇〇99] 該描述使用示例來公開本發明並且還使本領域內技術人員能夠製作和使用本發明。為了避免有疑慮，如在權利要求中限定的本發明可在它的範圍內包括本領域內技術人員所想起的其他示例，其可與在該文獻的圖中指示的那些示例不同。
【權利要求】
1. 一種用於在說話者與至少一個收聽者之間的語言通信中使用的設備，其中所述說話者和所述至少一個收聽者形成多個參與者中的全部或部分，其中所述說話者和所述至少一個收聽者在空間上彼此分開，所述設備能操作成向所述收聽者提供與所述說話者的身份關聯的感知輸出；所述設備包括：識別裝置，其中所述識別裝置可被說話者穿戴或攜帶，所述識別裝置包括振動傳感器，用於檢測與所述說話者的講話關聯的振動，其中所述識別裝置配置成存儲代表所述說話者和所述識別裝置中的任一個或兩個的身份的識別數據，由此所述識別裝置能與所述說話者的身份關聯，其中所述識別裝置能操作使得響應於所述振動傳感器檢測與所述說話者的講話關聯的振動，傳送器傳送識別信號，其包括存儲的識別數據或從所述存儲的識別數據生成；所述設備進一步包括用於由收聽者使用的顯示裝置，所述顯示裝置能操作成接收這樣的識別信號並且從接收的識別信號生成感知輸出，其指示所述說話者和所述識別裝置中的任一個或兩個的身份。
2. 如權利要求1所述的設備，其中所述識別裝置包括輸入部件，其對於所述說話者能操作成用代表所述說話者的身份的識別數據來預先配置所述識別裝置。
3. 如權利要求2所述的設備，其中所述輸入部件包括小鍵盤和音頻記錄裝置中的一個或兩個。
4. 如前述權利要求中任一項所述的設備，其中所述識別裝置配置成與另一個人的身份能重新關聯。
5. 如前述權利要求中任一項所述的設備，其中所述感知輸出包括視覺輸出、觸覺輸出和可聽輸出中的一個或多個。
6. 如前述權利要求中任一項所述的設備，其中所述識別裝置提供有可見標記，其中所述存儲的識別數據代表所述可見標記。
7. 如權利要求6所述的設備，其中所述可見標記包括顏色和形狀中的一個或兩個。
8. 如權利要求6或7中任一項所述的設備，其中所述顯示裝置能操作成生成所述感知輸出，其包括所述可見標記的視覺表示。
9. 如前述權利要求中任一項所述的設備，其中配置所述識別裝置使得所述傳送器在來自所述說話者的連續講話的最小持續時間後僅傳送所述識別信號。
10. 如權利要求9所述的設備，其中所述最小持續時間是在0. 5與2秒之間。
【文檔編號】G10L17/26GK104112449SQ201410162182
【公開日】2014年10月22日申請日期:2014年4月22日優先權日:2013年4月22日
【發明者】L.W.帕特裡奇, J.D.彭伯西申請人:通用電氣航空系統有限公司

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

未知的說話者識別系統的製作方法

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法