用於自動攝像機控制的方法和系統的製作方法

2023-08-08 10:33:36 7

專利名稱：用於自動攝像機控制的方法和系統的製作方法
技術領域：
本發明涉及視頻會議以及攝像機朝向和變焦的自動調整。
背景技術：
在大多數的高端視頻會議系統中，使用具有平擺(pan)、俯仰(tilt)和變焦 (zoom)能力的高質量攝像機來取景(frame)會議中的會議室和參會者的視圖。這類攝像機通常具寬視野(field of view，F0V)和高機械變焦能力。這樣就得到會議室的良好概圖以及捕捉參會者的特寫(close-up)圖像的能力。來自攝像機的視頻流被壓縮並且被發送到視頻會議中的一個或多個接收站點。會議中的所有站點都從會議中的其他站點接收直播視頻和音頻，因此使得能夠實時地進行具有視覺和聽覺信息的通信。當談及用途、參會者的數目、會議室的布局等，各視頻會議差異很大。每個會議配置通常需要攝像機的獨立調整，使得呈現最佳視圖。在視頻會議之前和期間都可能需要對攝像機的調整。例如，當視頻會議室落座了高達16個人時，視頻攝像機很自然地被預設成取景所有的16個可用座椅位置。然而，如果只有2或3個參會者出席，則攝像機設置的寬視野會給接收端非常差的視覺表現。通常通過手動地控制攝像機平擺、俯仰和變焦，或者通過在一組預定義的攝像機位置之間進行選擇，經由遠程控制來完成對攝像機的調整。這些預定義的位置要手工地編制。經常地，在視頻會議之前或期間，用戶不希望專注於攝像機的手動控制，或者缺少經驗的用戶甚至可能沒有意識到能夠(或如何)改變攝像機視野。因此，在視頻會議中，攝像機經常沒有被最優地調整，而導致視頻體驗的降級。因此，為了確保用於視頻會議室中每個情況的良好攝像機朝向，需要一種自動視野調整系統。存在一些具有攝像機跟蹤能力的視頻會議系統。然而，這些系統的目的是使攝像機自動地集中於活動的發言者。這些系統通常基於通過利用麥克風陣列的音頻信號處理和 /或結合圖像處理的發言者定位。 —些數字視頻攝像機(例如，web-cams)使用視頻分析在數字平擺、俯仰和變焦的有限範圍內檢測、集中於並且跟隨一個人的人臉。然而，這些系統僅適合於一個人，要求在初始正確布置攝像機，並且系統具有非常有限的數字工作範圍。因此，以上提到的現有技術沒有描述一種用於在視頻會議設置中的攝像機的自動化配置的系統。

發明內容
本發明的目的在於提供一種解決上述現有技術中的問題的至少一個的方法和系統。包括的獨立權利要求所定義的特徵描述了該方法和系統的特徵。

為了使更容易地理解本發明，下面的討論將參考附圖。其中圖1圖示了典型的視頻會議室，圖2示意性地示出了根據本發明的"最佳視圖"定位器的組件，圖3是"最佳視圖"定位器的操作的流程圖，圖4示意性地示出了典型的會議情況以及圖像拾取設備的示例性初始朝向，圖5圖示了包含兩個參會者的圖像中的人臉檢測，圖6圖示了一個示例性定義的關注區域("最佳視圖")，圖7圖示了另一個示例性定義的關注區域("最佳視圖")，圖8圖示了圖6中所述定義的區域的攝像機取景，圖9圖示了在當前取景的圖像外檢測到的音頻源，圖10圖示了包括表示圖9中所述音頻源的參會者的攝像機取景，圖11圖示了離開攝像機視野的參會者，其中圖11a圖示了人離開會議；圖lib圖示了人在畫面的邊緣附近；圖11c圖示了剩下的兩個人；以及圖lid圖示了對於剩下的人的最佳視圖。
具體實施例方式
在下文中，將通過描述優選實施例並且通過參考附圖來討論本發明。然而，本領域的技術人員將認識到，其它應用和修改也落在獨立權利要求所定義的本發明的範圍內。
圖1圖示了典型的視頻會議室10以及示例性視頻會議系統20。視頻會議系統20 通常由下面的組件組成編解碼器11(用於編碼和解碼音頻和視頻信息)、用戶輸入設備 8 (即，遙控器或鍵盤)、圖像捕捉設備6 (攝像機)、音頻捕捉設備4、7 (麥克風)、視頻顯示器9(屏幕)以及音頻再現設備5(揚聲器)。經常地，高端視頻會議系統(VCS)使用具有電動的平擺、俯仰和變焦能力的高質量攝像機6。本發明使用視頻檢測技術來檢測由攝像機6所捕捉到的視頻畫面中的參會者及其各自的位置，並且基於所檢測到的參會者的位置和大小來自動地確定和使用最佳攝像機朝向和變焦，從而捕捉所有參會者的最佳視圖。可能存在關於何為視頻會議中的一組參會者的"最佳視圖"的很多觀點。然而，在下文中，"最佳視圖"是指一組參會者的特寫(close-up)，其中，視頻畫面的中心基本上與該組的中心一致，並且其中變焦的程度在所述組的周圍給出非常適合的圖像。然而，圖像必須不能太緊密，至少顯示參會者的上身，並且給予參會者在不退出視頻畫面的情況下稍稍移動的空間。圖2示意性地示出了根據本發明的"最佳視圖"定位器52中的模塊。視頻檢測單元30被配置成連續地檢測捕捉到的視頻信號的畫面中的對象，例如人臉和/或人頭。在預定義的事件時(例如，當接通VCS時、當通過用戶輸入設備8來發起時等)，攝像機推遠 (zoom out)到其最大視野，並且移動到預定義的平擺和俯仰朝向(方位角和仰角)，儘可能地捕捉系統所位於的房間10。視頻檢測單元30分析視頻信號中的畫面，並且檢測視頻畫面
5中的所有的人臉/人頭以及其相對於預定的和不變的參考點(例如，畫面的中心)的位置。視頻圖像中的人臉/人頭的位置和大小(或區域)被變換成攝像機坐標(方位角和仰角以及變焦係數)。將關於每個檢測到的人臉/人頭的信息(例如，位置、大小等)經由人臉跟蹤單元35發送到圖像處理單元50。基於所述人臉/人頭信息，圖像處理單元定義至少包括所有檢測到的人臉/人頭的矩形區域。預定義的一組規則規定應當如何定義這種區域，並且該區域表示畫面(或視頻會議室10)中的人的最佳視圖。用於所定義區域的攝像機坐標 (方位角和仰角以及變焦係數)及其位置被發送到控制單元45。控制單元指示攝像機控制單元12將攝像機移動到所述攝像機坐標，並且調整攝像機6的平擺、俯仰和變焦來取景與所定義區域相對應的圖像。圖像拾取設備(或攝像機)6包括用於布置該圖像拾取設備的攝像機控制單元12。攝像機控制單元12是包括馬達的操縱機構，用於控制圖像拾取設備6的平擺和俯仰朝向以及變焦的程度。攝像機控制單元12還可按要求報告其當前方位角和仰角以及變焦係數。圖像處理單元50和控制單元45可以將控制信號提供給攝像機控制單元12。攝像機控制單元 12使用攝像機坐標系，攝像機坐標系基於描述捕捉到的畫面相對於攝像機6的方向和變焦程度的方位角和仰角以及變焦係數來指示位置。配置視頻檢測單元30，使得當攝像機6捕捉到畫面時，使用攝像機6的方位角和仰角以及變焦係數把用視頻(或圖像)坐標系表達的坐標度量轉換成用攝像機坐標系表達的坐標度量。圖3是"最佳視圖"定位器52的操作的流程圖。攝像機6輸出包括一些列畫面 (圖像)的視頻信號。視頻檢測單元30分析該畫面。在預定義的事件時，攝像機控制單元 12被指示將攝像機移動到初始朝向(步驟60)。初始朝向的目的在於確保攝像機可以"看到"會議室中的所有人。已存在若干確定這樣的初始朝向的方法。參考圖4，根據本發明的一個示例性實施例，攝像機推遠到其最大視野，並且移動到預定義的平擺和俯仰朝向13，儘可能地捕捉房間10a和/或捕捉房間的一部分，最大可能地找到會議參會者。預定義的平擺和俯仰朝向(或初始朝向)通常通過配置功能被手動輸入到系統中(例如，將攝像機手動地移動到最佳初始位置，並且然後保存位置)，或者它是默認出廠值。根據本發明的另一示例性實施例，攝像機被配置成通過檢查具有最大視野的一組初始朝向(14、15)以及該組的視野重疊的位置來捕捉整個房間。在多數情況下，2個朝向構成的組就足夠了。然而，朝向的數目將取決於攝像機最大視野，並且可以是3、4、5、6等。對於每個朝向(14、 15)來說，視頻檢測單元30分析一個或多個視頻畫面，以檢測人臉和/或人頭及其各自的位置。在分析所有的朝向之後，圖像處理單元50計算包括所有檢測到的參會者的平擺和俯仰朝向，並且將所述計算的朝向定義為初始朝向。視頻檢測單元30分析來自攝像機6的視頻信號25，以檢測和定位視頻畫面中的人臉和/或人頭(步驟70)。視頻檢測單元30測量檢測到的人臉/人頭的位置與一些預定和靜態參考點(例如，視頻圖像的中心)之間的偏移。不同的算法可以用於對象檢測。給定任意視頻畫面，人臉檢測算法的目標在於確定圖像中是否存在任何人臉，並且如果存在，則返回每個人臉圖像的圖像位置和區域(大小)。參考圖5，根據本發明的一個示例性實施例，在圖像上移動(或掃描)分析窗33。對
6於分析窗33的每個位置來說，至少關於典型人臉特徵的存在來分析在分析窗33內的圖像信息。然而，應當理解，本發明不限於使用這種類型的人臉檢測。另外，還可以使用人頭檢測算法來檢測那些人頭沒有朝向攝像機的參會者。當檢測人臉/人頭的圖像時，視頻檢測單元30定義所述人臉/人頭的圖像周圍的矩形部分(或框)。根據本發明的一個實施例，所述矩形部分是所述分析窗33。相對於基於視頻畫面的視頻坐標系來測量包含人臉/人頭的圖像的所述部分的位置。將視頻坐標系應用於攝像機6所捕捉到的每個畫面。視頻坐標系具有水平或x軸以及垂直或y軸。當確定像素或圖像的位置時，視頻檢測單元30確定該像素的或圖像的視頻畫面的相對於x軸和y軸的位置。在本發明的一個示例性實施例中，分析窗33中心點31(窗口中間的像素)是位置參考點，並且在所述視頻坐標系中由坐標x和y來定義其位置。當視頻檢測單元30已經計算了畫面中的所有人臉/人頭的位置(x，y)和大小(例如，dx二20，dy二24像素)時，視頻檢測單元30使用視頻畫面、光學和機械學的知識來針對人臉/人頭的每個圖像計算攝像機坐標系中的方位角和仰角中的對應位置(a ，<P)以及大小(A a ，A(p)(步驟80)。然後，將每個人臉/人頭的攝像機坐標發送到人臉跟蹤單元35。人臉跟蹤單元35把從當前視頻畫面檢測到的人臉與在先前視頻畫面中檢測到的人臉關聯起來，並且因此跟蹤一系列畫面中檢測到的人臉。只要在一系列畫面中在基本上相同的位置處檢測到了人臉/人頭，該檢測就被驗證為肯定性檢測。首先，這防止了錯誤的人臉檢測，除非在若干連續視頻畫面中出現相同的檢測。而且，如果人臉檢測單元沒有檢測到在與先前檢測到的人臉基本上相同的坐標中的人臉，圖像跟蹤單元不認為該人臉不存在於該圖像，除非這種檢測在若干連續畫面中都是未檢測到。這防止了錯誤的否定性檢測。另外，這樣的跟蹤允許獲得可能在視頻畫面中移動的參會者的適當位置。為了執行這樣的跟蹤，人臉跟蹤單元35創建並且保存用於每個檢測到的人臉的跟蹤文件。例如，跟蹤文件可以被保存在存儲器設備中。在步驟90中，圖像處理單元50定義關注區域34(最佳視圖)。在圖6中示出了該
關注區域34，其中，所述區域34至少包括在該畫面中的所有檢測到的人臉圖像。根據本發明的一個實施例，基於每個人臉的位置(a ，(p)及其對應的大小(A a ，
ACP)，圖像處理單元50可以計算由一組邊界(MpM^M3和M》約束的第一區域，其中所述邊
界是從最左邊人臉部分的左側(M》、最上邊人臉部分的上側(M》、最右邊人臉部分的右側
(M2)以及最下邊人臉部分的下側(M4)得到的。現在可以基於所述邊界以攝像機坐標計算
所述第一區域的中心的位置(afa，<Pfa)。所述第一區域的位置是相對於參考點(a。，<P0)，
即，通常當方位角和仰角為0時的攝像機的方向的。另外，將第一區域的寬度和高度變換成變焦係數(Zfa)。該第一區域非常接近參會者的人臉，並且可能不表示參會者的最舒適的視圖(最佳視圖)，尤其當如該示例性實施例中所示只有兩個參會者出席時。因此，當已經計算了所述邊界(Mp M2、 M3和M4)時，通過將所述邊界擴展一組補償值a、 b、 c和d來定義第二區域(最佳視圖畫面34)。這些補償值可能是相等的，或者它們可能是不同的，使得除了參會者的人頭還捕捉在參會者前面的桌子。該補償值可以是預設的和靜態的，或者它們可能是計算出的以適合每個狀態。根據另一個示例性實施例，通過僅從計算的變焦係數Zfa中減去補償值Z。、使攝像機推遠額外的距離來定義最佳視圖畫面34。補償值Z。可以是不變的，或者根據第一區域變焦係數Zfa的大小來線性變化。圖7示意性地示出了從初始攝像機朝向拍攝的示例性視頻畫面。在視頻畫面中檢測到了 3個人臉，並且圖像處理單元50已經定義了最佳視圖畫面34，並且計算了最佳視圖畫面的位置(afa，<Pfa)。用於視頻會議系統的大多數圖像拾取設備6以標準電視圖像寬高比(例如
4 : 3(1.33 : i)或ie : 9(1.78 : i))來操作。由於如上所述的大多數計算的最佳視圖
畫面34具有不同於例如4 : 3或16 : 9這樣的標準寬高比，所以當確定變焦坐標時必須做出一些考慮。由於A，是區域34的最短邊緣，如果攝像機拉近以捕捉精確的高度A,，則由於攝像機的寬高比與定義的區域不同，所以大部分的區域將錯過攝像機中的光敏區域(例如，圖像傳感器)。如果攝像機拉近以捕捉定義的區域34的精確的寬度Aa ，則不會丟失信息。因此，根據本發明的一個示例性實施例，比較最佳視圖畫面34的兩側A一P Aa 。兩
側的每一個分別在水平和垂直方向中定義配合圖像畫面中的關注區域所需要的變焦係數。因此，由兩個計算的變焦係數中的最小一個來定義變焦程度，確保當變焦到關注區域時不會裁剪該關注區域。在步驟100中，圖像處理單元50經由控制單元45來為攝像機控制單元12提供在步驟90中所得到的攝像機布置指令(afa，cpfa,Z)。一旦接收到攝像機布置指令，攝像機就移動並且變焦到指定的坐標，以獲得視頻會議中的參會者的最佳視圖。圖8示出了來自圖6中的會議室10a的參會者1和2的最佳視圖。當攝像機已經移動到新的朝向時，它將保持該朝向，直至檢測到事件(步驟110)。如前所述，僅在某些預定義的事件時才指示攝像機將攝像機移動到初始朝向(步驟60)。這樣的預定義的事件可以包括，當啟動視頻會議系統時、當從休眠模式喚醒時、當接收和發送會議呼叫發起請求時、當經由例如遙控器或鍵盤由用戶發起時等。通常當已經找到參會者的最佳視圖時，通常不太需要改變攝像機的朝向。然而，在視頻會議期間可能產生如下的情況，即，創建重新配置朝向的需要，例如，參會者的一個可能離開、新的參會者可能到達、參會者的一個改變他的/她的座位等。在這樣的情況下，用戶的一個當然可以通過按下遙控器上的按鈕來發起重新布置(步驟60)。然而，優選的是對這樣的事件的自動檢測。
因此，根據本發明的一個實施例，將音頻源定位用作在步驟110中的事件觸發器。如上所示，圖8示出了在大會議室10a中的參會者1和2的最佳視圖。如可以在圖8中看到的，在該視圖中，攝像機已經被非常極端地拉近(zoom in)，並且如果人要晚些進入會議，並且在座椅12的一個中坐下，則他/她將不會被攝像機所捕捉到。當進入會議時，很自然地自己致歉和/或介紹自己。這是禮貌的問題，並且提醒其他參會者(可能僅在音頻上加入)新的參會者已經進入會議。通過使用公知的音頻源定位裝置7、40，視頻會議系統可以檢測音頻源(參會者)200已經被定位在攝像機的當前視野的外部。音頻源定位器40用攝像機坐標來操作。當檢測到音頻源並且由音頻源定位器40來定位該音頻源時，其將音頻源坐標發送到控制單元45。如果音頻源坐標在攝像機的當前視野內，則什麼都不做。然而，如果音頻源在當前視野外，則指示當前視野沒有捕捉所有的參會者，並且重複根據步驟60-100的檢測過程。可以在圖IO中看到該結果。因此，根據本發明的一個實施例，攝像機的當前視野外的至少一個音頻源的這樣的檢測被視作在步驟110中觸發步驟60-100的重複的事件。
音頻源定位裝置是公知的，並且這裡將不詳細討論。它們通常是多個空間上分隔的麥克風7，並且經常基於麥克風的輸出處的信號之間的延遲差的確定。如果麥克風的位置和源與不同麥克風之間的傳播路徑之間的延遲差是已知的，則可以計算源的位置。在美國專利號5， 778， 082中示出了音頻源定位器的一個示例。根據本發明的另一個實施例，另一個預定義的事件是當檢測到參會者離開房間(或者視野)時。這樣的檢測取決於前述的跟蹤功能。如圖lla中所示，當參會者離開房間時，跟蹤文件或跟蹤歷史將示出檢測到的人臉的位置/定位(a ，(P)在一系列畫面(圖lla-llb)上從位置(a3，(p3)改變到接近畫面邊緣的位置(a4，q>4)。如果相同的人臉檢測突然消失(不再檢測人臉)並且在某個時間畫面內沒有返回(圖llc)，則該人臉檢測被視作參會者離開會議。當檢測這樣的事件時，重複步驟60-100以將攝像機的視野調整到如圖lld中所示的新的最佳視圖。根據本發明的又一實施例，另一個預定義的事件是當在視頻畫面的邊緣附近檢測到移動時。並不是每個進入視頻會議的人都將立即開始講話。這將取決於參會者的狀態、職位等。因此，在系統檢測到該新來的人並且相應地進行動作之前可能需要一些時間。返回參考圖9，即使大多數人都在攝像機的視野外，但是也可以在視頻畫面中捕捉到參會者的一部分38。由於相對於靜止的家具，人幾乎不可能完全靜止地坐著，所以視頻檢測單元35可以容易地將該部分38檢測為圖像中的移動。當檢測這樣的事件(在圖像/畫面邊緣附近檢測到移動)時，重複步驟60-100以將攝像機的視野調整到新的最佳視圖。
根據本發明的系統提供了一種自動地獲得視頻會議室中的所有參會者的最佳視覺表示的新穎方法。另外，該系統自動地適應於新的情況，諸如參會者離開或進入會議室，並且相應地改變視覺表示。本發明為高質量視覺體驗提供了一種更加用戶友好的方法。
權利要求
一種用於自動操縱與視頻會議系統相關聯的圖像拾取設備的朝向和變焦的方法，其中，所述方法包括下述步驟在所述圖像拾取設備生成圖像信號，該圖像信號表示所述圖像拾取設備所取景的圖像，以及處理所述圖像信號以識別所述圖像中的對象，並且，當預定的事件發生，則將所述圖像拾取設備操縱成初始朝向；確定所有被識別對象相對於參考點的位置以及它們各自的大小；定義所述圖像中的關注區域，其中所述關注區域至少包括所有被識別對象；以及操縱所述圖像拾取設備來取景所定義的所述關注區域。
2. 根據權利要求1所述的方法，其中，操縱所述圖像拾取設備的所述步驟包括下述子步驟改變所述圖像拾取設備的方位角和仰角，以及改變所述圖像拾取設備的變焦。
3. 根據權利要求1所述的方法，其中，將所述圖像拾取設備操縱成初始朝向的所述步驟進一步包括下述子步驟將所述圖像拾取設備推遠到最大視野，並且根據預定義的平擺和俯仰順序來移動所述圖像拾取設備，儘可能地取景其所在的房間。
4. 根據權利要求1所述的方法，其中，所述圖像信號表示視頻圖像的畫面，並且識別對象的所述步驟進一步包括下述子步驟檢測所述視頻的畫面中的人臉和/或人頭的圖像；在一系列畫面中跟蹤所檢測到的人臉/人頭；只有當檢測發生在全部預定義數目的相繼畫面中時，將該檢測識別為人臉/人頭。
5. 根據權利要求4所述的方法，其中，所述的定義關注區域的步驟進一步包括下述子步驟為第一區域定義一組邊界，其中，所述第一區域是包括所有所述的檢測到的人臉和/ 或人頭的圖像的最小可定義的區域；以及通過用一組補償值擴展所述邊界來定義所述關注區域。
6. 根據權利要求5所述的方法，其中，所述關注區域進一步被擴展以適合標準圖像寬高比。
7. 根據權利要求1所述的方法，其中，所述關注區域表示對象或對象組的特寫視圖。
8. 根據權利要求1所述的方法，其中，所述預定義的事件包括接通所述視頻會議系統、接收或發送會議呼叫發起請求、和/或接收來自用戶的命令。
9. 根據權利要求1所述的方法，其中，所述方法進一步包括處理來自一組音頻拾取設備的音頻信號，以確定音頻源相對於參考點的位置。
10. 根據權利要求8所述的方法，其中，所述預定義的事件包括檢測所取景的關注區域外的音頻源的存在。
11. 根據權利要求1所述的方法，其中，所述預定義的事件包括檢測參會者的一個或多個從所取景的關注區域的消失。
12. —種用於自動操縱與視頻會議系統相關聯的圖像拾取設備的朝向和變焦的系統，其中，所述圖像拾取設備生成用來表示所述圖像拾取設備所取景的圖像的圖像信號，其中，所述系統包括視頻檢測單元，所述視頻檢測單元被配置成處理所述圖像信號以識別所述圖像中的對象，並且確定所有被識別對象相對於參考點的位置以及它們各自的大小，所述系統的特徵在於，所述系統進一步包括圖像處理單元，所述圖像處理單元被配置用來定義所述圖像中的關注區域，其中，所述區域至少包括所有被識別對象；以及控制單元，所述控制單元被配置成當發生預定義的事件時，則將所述圖像拾取設備操縱成初始朝向，從所述圖像處理單元接收與所述關注區域相對應的攝像機坐標，以及操縱所述圖像拾取設備來取景所定義的所述關注區域。
13. 根據權利要求12所述的系統，其中，所述圖像信號表示視頻圖像的畫面，並且其中，所述被識別對象是所述視頻的畫面中所檢測到的人臉和/或人頭的圖像。
14. 根據權利要求13所述的系統，進一步包括人臉跟蹤單元，所述人臉跟蹤單元被配置成在一系列畫面中跟蹤所檢測到的人臉/人頭，並且只有當檢測在全部預定義數目的相繼畫面中發生時，將該檢測識別為人臉/人頭。
15. 根據權利要求13所述的系統，其中，所述圖像處理單元進一步被配置成為第一矩形區域定義一組邊界，其中，所述第一區域是包括所有所述的檢測到的人臉和/或人頭的圖像的最小可定義的區域，以及通過用一組補償值擴展所述邊界來定義所述關注區域。
16. 根據權利要求15所述的系統，其中，所述關注區域進一步被擴展以適合標準圖像覽局比o
17. 根據權利要求13到16中的任何一項所述的系統，所述系統進一步包括音頻源定位器，所述音頻源定位器被配置成處理來自一組音頻拾取設備的音頻信號，以確定按攝像機坐標的音頻源的位置。
18. 根據權利要求13到17中的任何一項所述的系統，其中，所述控制單元進一步被配置成從所述音頻源定位器接收音頻源坐標，將所述音頻源坐標與當前視野作比較。
19. 根據權利要求13到18中的任何一項所述的系統，其中，所述圖像拾取設備包括攝像機控制單元，所述攝像機控制單元用於布置所述圖像拾取設備，其中，所述控制單元向所述攝像機控制單元提供控制信號來用於所述圖像拾取設備的朝向和變焦，所述控制信號基於所述關注區域而生成。
20. 根據前述權利要求中的一項所述的系統，其中，所述預定義的事件包括檢測在當前視野外的音頻源的存在。
21. 根據前述權利要求中的一項所述的系統，其中，所述預定義的事件包括檢測參會者的一個或多個從所取景的關注區域的消失。
22. 根據前述權利要求中的一項所述的系統，其中，所述預定義的事件包括檢測在當前取景的關注區域外的音頻源的存在。
全文摘要
本發明使用視頻檢測技術來檢測由攝像機捕捉到的視頻畫面中的參會者及其各自的位置，並且基於所述檢測到的參會者的位置和大小來自動地確定和使用最佳攝像機朝向和變焦，使得捕捉所有參會者的最佳視圖。
文檔編號H04N7/15GK101785306SQ200880104287
公開日2010年7月21日申請日期2008年6月30日優先權日2007年7月13日
發明者吉斯勒·昂斯塔德, 珀·奧韋·胡索伊, 簡·託雷·科內柳森申請人:坦德伯格電信公司

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

用於自動攝像機控制的方法和系統的製作方法

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法