學習設備、學習方法和程序的製作方法
2023-07-06 13:26:41
專利名稱:學習設備、學習方法和程序的製作方法
技術領域:
本發明涉及一種學習設備,學習方法和程序,更具體地說,涉及一種適合於在訓練 鑑別器的情況下使用的學習設備、學習方法和程序,所述鑑別器用於根據少量的學習圖像, 鑑別在圖像中是否存在預定的鑑別目標。
背景技術:
在現有技術中,提出了一種圖像分類方法,用於把多個圖像分成與圖像的被攝主 題對應的類別,並生成包括每個類別的分類圖像的圖像聚類。例如,在這種圖像分類方法中,利用鑑別在圖像中是否存在預定鑑別目標(例如, 人臉)的鑑別器,鑑別在多個圖像中的每個圖像中是否存在預定鑑別目標。此外,根據鑑別結果,多個圖像分別被分類到其中在圖像中存在預定鑑別目標的 類別中,或者被分類到其中在圖像中不存在預定鑑別目標的類別中,隨後對於每個分類類 別生成圖像聚類。這裡,在產生(訓練)鑑別器,以供現有技術中的圖像分類方法之用的情況下,需 要附加有指示在圖像中是否存在預定鑑別目標的正解標籤的大量學習圖像,和根據所述大 量學習圖像,生成鑑別器的極大運算。從而,儘管對企業和研究機構來說,準備能夠處理大量學習圖像,並且執行生成上 述鑑別器所必需的極大運算的計算機是相對容易的,不過對個人來說,準備這樣的計算機 是非常困難的。因此,個人很難生成用於生成每個個人的所需圖像聚類的鑑別器。此外,提出一種搜索方法,用於利用鑑別存在於圖像中的預定鑑別目標的鑑別器, 在多個圖像之中搜索圖像中存在預定鑑別目標的圖像(例如,參見未經審查的日本專利申 請公開 No. 2008-276775)。在這種搜索方法中,用戶在多個圖像之中,指定圖像中存在預定鑑別目標的正圖 像,和圖像中不存在預定鑑別目標的負圖像。此外,通過利用用戶指定的正圖像和負圖像作 為學習圖像,生成鑑別器。此外,在這種搜索方法中,利用生成的鑑別器,從多個圖像中搜索圖像中存在預定 鑑別目標的圖像。在這種搜索方法中,通過快速縮小解空間,快速生成鑑別器,從而能夠更快速地搜 索希望的圖像。這裡,為了生成高精度地鑑別預定鑑別目標的鑑別器,應提供大量的各種正圖像 (例如,其中以各種角度拍攝預定鑑別目標的正圖像)。不過,在上述搜索方法中,由於用戶逐張指定學習圖像,因此與用於生成現有技術 中的圖像分類方法中的鑑別器的學習圖像的數目相比,學習圖像的數目很小。結果,在學習 圖像之中,正圖像的數目也很小。利用數目很小的正圖像的鑑別器的學習容易引起過度學習(過度擬合),從而降低鑑別器的鑑別精度。此外,儘管學習圖像的數目較小,不過在通過詞袋(bag-of-words),學習圖像中 的多個特徵的組合等,把指示學習圖像的特徵的圖像特徵量表示成具有數百維到數千維的 向量,並且通過利用所述向量作為學習圖像,生成鑑別器的情況下,預期由於高維向量的緣 故,易於發生過度學習。另外,提出一種在生成鑑別器的情況下,利用裝袋來增強鑑別器的泛化的方法 (例如,參見 Leo Breiman, Bagging Predictors,MachineLearning, 1996,123-140)。然而,即使在利用裝袋的方法中,儘管學習圖像的數目較小,不過在使用表示成具 有數百維到數千維的向量的學習圖像的圖像特徵量的情況下,預期也會發生過度學習。
發明內容
如上所述,在利用少量的學習圖像生成鑑別器的情況下,當使用表示成具有數百 維到數千維的向量的圖像特徵量作為學習圖像的圖像特徵量時,會發生過度學習,從而使 得難以生成具有高鑑別精度的鑑別器。因此,理想的是提供一種在利用少量的學習圖像進行學習時,能夠抑制過度學習, 從而訓練具有高鑑別精度的鑑別器的技術。按照本發明的一個實施例,提供一種學習設備,所述學習設備包括學習裝置,所述 學習裝置按照由用戶從多個樣本圖像中指定的,用於訓練鑑別在圖像中是否存在預定鑑別 目標的鑑別器的學習圖像,利用包括從包含在指示學習圖像的特徵的圖像特徵量中的多個 維特徵量中,隨機選擇的維特徵量的隨機特徵量,訓練所述鑑別器,和使計算機起所述學習 裝置作用的程序。學習裝置可通過間隔最大化學習,訓練所述鑑別器,所述間隔最大化學習使隨機 特徵量所存在的特徵空間中的間隔達到最大,所述間隔表示用於鑑別在圖像中是否存在預 定鑑別目標的分離超平面和包括在隨機特徵量中的維特徵量之中的,存在於分離超平面附 近的維特徵量之間的距離。學習裝置可包括圖像特徵量提取裝置,用於從學習圖像中提取表示學習圖像的 特徵,並被表示成具有多維的向量的圖像特徵量;隨機特徵量生成裝置,用於隨機選擇作為 圖像特徵量的相應維的元素的所述多個維特徵量中的一些維特徵量,並生成包括所選維特 徵量的隨機特徵量;和鑑別器生成裝置,用於利用隨機特徵量,通過間隔最大化學習,生成 鑑別器。鑑別器可根據用於確定在鑑別目標圖像中是否存在預定鑑別目標的多個弱鑑別 器的確定結果,輸出最終的確定結果,隨機特徵量生成裝置可關於所述多個弱鑑別器中的 每個弱鑑別器,生成用於生成該弱鑑別器的隨機特徵量,鑑別器生成裝置可根據關於所述 多個弱鑑別器中的每個弱鑑別器生成的隨機特徵量,生成所述多個弱鑑別器。鑑別器生成裝置還可根據隨機特徵量,生成指示弱鑑別器的判定的可靠性程度的 置信度。鑑別器生成裝置可根據所述多個弱鑑別器和置信度,生成輸出鑑別確定值的鑑別 器,所述鑑別確定值表示作為從所述多個弱鑑別器中的每個弱鑑別器輸出的確定結果的確 定值,和所述置信度之間的乘積和運算結果,鑑別裝置可根據從鑑別器輸出的鑑別確定值,鑑別在鑑別目標圖像中是否存在預定鑑別目標。每當用戶指定學習圖像時,隨機特徵量生成裝置可生成不同的隨機特徵量。學習圖像可包括在圖像中存在預定鑑別目標的正圖像,和在圖像中不存在預定鑑 別目標的負圖像,學習裝置還可包括增加偽負圖像作為學習圖像的負圖像增加裝置。學習裝置還可包括當在鑑別器生成裝置生成鑑別器之後,預定條件被滿足時,增 加偽正圖像作為學習圖像的正圖像增加裝置,鑑別器生成裝置可根據被增加偽正圖像的學 習圖像的隨機特徵量,生成鑑別器。在正圖像和偽正圖像的總數小於負圖像和偽負圖像的總數的條件被滿足的情況 下,正圖像增加裝置增加偽正圖像作為學習圖像。學習裝置可利用SVM(支持向量機)作為間隔最大化學習,進行學習。學習設備還可包括鑑別在鑑別目標圖像中是否存在預定鑑別目標的鑑別裝置,在 用戶按照鑑別裝置的鑑別處理,重新指定學習圖像的情況下,學習裝置可以利用指定的學 習圖像,重複進行鑑別器的學習。在用戶按照鑑別裝置的鑑別處理,指令生成包括在圖像中存在預定鑑別目標的鑑 別目標圖像的圖像聚類的情況下,鑑別裝置可根據由學習裝置生成的最新鑑別器,用多個 鑑別目標圖像生成圖像聚類。按照本發明的一個實施例,提供一種學習設備中的學習方法,所述學習方法訓練 用於鑑別在圖像中是否存在預定鑑別目標的鑑別器。這裡,所述學習設備包括學習裝置,所 述方法包括下述步驟按照由用戶從多個樣本圖像中指定的,用於訓練鑑別在圖像中是否 存在預定鑑別目標的鑑別器的學習圖像,用學習裝置利用包括從包含在指示學習圖像的特 徵的圖像特徵量中的多個維特徵量中,隨機選擇的維特徵量的隨機特徵量,訓練所述鑑別
ο按照本發明的實施例,按照由用戶從多個樣本圖像中指定的,用於訓練鑑別在圖 像中是否存在預定鑑別目標的鑑別器的學習圖像,利用包括從包含在指示學習圖像的特徵 的圖像特徵量中的多個維特徵量中,隨機選擇的維特徵量的隨機特徵量,訓練所述鑑別器。按照本發明的實施例,在利用數目較少的學習圖像進行學習時,能夠抑制過度學 習,從而訓練具有高鑑別精度的鑑別器。
圖1是圖解說明按照本發明的一個實施例的圖像分類設備的結構例子的方框圖;圖2是圖解說明由圖像分類設備執行的圖像分類處理的概況的示圖;圖3是圖解說明隨機標弓丨的示圖;圖4是圖解說明弱鑑別器的生成的示圖;圖5是圖解說明交叉驗證的示圖;圖6是圖解說明由圖像分類設備執行的圖像分類處理的流程圖;圖7是圖解說明由學習部分執行的學習處理的流程圖;圖8是圖解說明由鑑別部分執行的鑑別處理的流程圖;圖9是圖解說明由學習部分執行的反饋學習處理的流程圖;圖10是圖解說明計算機的結構例子的方框圖。
具體實施例方式下面,說明實現本發明的優選例證實施例。將按照下述順序進行說明1.實施例(在利用學習圖像的隨機特徵量,生成鑑別器的情況下的例子)2.改進例1.實施例[圖像分類設備1的結構例子]圖1是圖解說明按照本發明的一個實施例的圖像分類設備1的結構例子的示圖。圖像分類設備1鑑別在保存(保留)在圖像分類設備1中的多個圖像之中的每個 圖像中,是否存在預定鑑別目標(例如,圖2中所示的手錶等)。此外,圖像分類設備1根據鑑別結果,把多個圖像分成其中存在預定鑑別目標的 類別,和其中不存在預定鑑別目標的類別,並生成和保存包括分類到其中存在預定鑑別目 標的類別中的圖像的圖像聚類。圖像分類設備1包括操作部分21,控制部分22,圖像存儲部分23,顯示控制部分 對,顯示部分25,學習部分沈和鑑別部分27。例如,操作部分21包括由用戶操作的操作按鈕等,隨後把與用戶的操作相應的操 作信號提供給控制部分22。控制部分22按照來自操作部分21的操作信號,控制顯示控制部分24,學習部分 26,鑑別部分27等。圖像存儲部分23包括保存圖像的多個圖像資料庫。顯示控制部分M在控制部分22的控制下,從在構成圖像存儲部分23的多個圖像 資料庫之中,按照用戶的選擇操作選擇的圖像資料庫中,讀取多個樣本圖像,隨後把讀出的 樣本圖像提供給顯示部分25,以便顯示。這裡,樣本圖像是為允許用戶指定正圖像和負圖像而顯示的圖像,所述正圖像指 示在圖像中存在預定鑑別目標的圖像(例如,在圖像上存在作為被攝主題的手錶的圖像), 所述負圖像指示在圖像中不存在預定鑑別目標的圖像(例如,在圖像上不存在作為被攝主 題的手錶的圖像)。顯示控制部分M把與用戶的指定操作對應的正解標籤附加到顯示在顯示部分25 上的多個樣本圖像之中,按照用戶的指定操作指定的樣本圖像上。此外,顯示控制部分M 把附加有正解標籤的樣本圖像作為學習圖像提供給學習部分26。這裡,正解標籤指示樣本圖像是正圖像還是負圖像,包括指示樣本圖像是正圖像 的正標籤,和指示樣本圖像是負圖像的負標籤。S卩,顯示控制部分M把正標籤附加到由用戶的指定操作指定為正圖像的樣本圖 像上,和把負標籤附加到由用戶的指定操作指定為負圖像的樣本圖像上。此外,顯示控制部 分M把附加有正標籤或負標籤的樣本圖像作為學習圖像提供給學習部分26。此外,顯示控制部分M把作為來自鑑別部分27的鑑別結果,鑑別的其中存在預定 鑑別目標的圖像提供給顯示部分25,以便顯示。顯示部分25顯示來自顯示控制部分M的樣本圖像,鑑別結果等等。學習部分沈根據來自顯示控制部分M的學習圖像,執行生成用於鑑別在圖像中是否存在預定鑑別目標(例如,圖2中所示的手錶)的鑑別器的學習處理,並把作為結果獲 得的鑑別器提供給鑑別部分27。學習部分沈執行的學習處理的細節將在後面參考圖3-5,及圖7中的流程圖進行 說明。鑑別部分27利用來自學習部分沈的鑑別器,執行鑑別處理,所述鑑別處理鑑別在 保存在圖像存儲部分23據有的,依據用戶的選擇操作選擇的圖像資料庫中的圖像(這裡, 把學習圖像排除在外)中,是否存在預定鑑別目標。此外,鑑別部分27把在鑑別處理中鑑別的,在圖像中存在預定鑑別目標的圖像作 為鑑別結果提供給顯示控制部分對。由鑑別部分27執行的鑑別處理的細節將在後面參考 圖8中的流程圖進行說明。[圖像分類設備1執行的圖像分類處理的概況]圖2圖解說明由圖像分類設備1執行的圖像分類處理的概況。在步驟Si,顯示控制部分對從在構成圖像存儲部分23的多個圖像資料庫之中,依 據用戶的選擇操作選擇的圖像資料庫(下面稱為「所選圖像資料庫」)中,讀取多個樣本圖 像,隨後把讀出的樣本圖像提供給顯示部分25,以便顯示。這種情況下,用戶利用操作部分21,執行從顯示在顯示部分25上的多個樣本圖 像中,指定正圖像或負圖像的指定操作。即,例如,用戶執行把圖像中存在手錶的樣本圖像 指定為正圖像,或者把圖像中存在除手錶外的被攝主題的樣本圖像指定為負圖像的指定操 作。在步驟S2,顯示控制部分M把正標籤附加到被指定為正圖像的樣本圖像上。相 反,顯示控制部分M把負標籤附加到被指定為負圖像的樣本圖像上。此外,顯示控制部分 M把附加了正標籤或負標籤的樣本圖像,作為學習圖像提供給學習部分26。在步驟S3,學習部分沈利用來自顯示控制部分M的學習圖像,執行生成用於鑑別 在圖像中是否存在預定鑑別目標(圖2中所示例子中的手錶)的鑑別器的學習處理,隨後 把作為結果獲得的鑑別器提供給鑑別部分27。鑑別部分27從圖像存儲部分23中,讀出保存在圖像存儲部分23的所選圖像數據 庫中的多個圖像之中,除學習圖像之外的一些圖像(未附加正標籤或負標籤的圖像),作為 鑑別目標圖像,所述鑑別目標圖像是鑑別處理的目標。此外,通過利用讀出的一些鑑別目標圖像作為各個目標,鑑別部分27利用來自學 習部分沈的鑑別器,執行鑑別在圖像中是否存在預定鑑別目標的鑑別處理。鑑別部分27把在鑑別處理中鑑別的,在圖像中存在預定鑑別目標的鑑別目標圖 像作為鑑別結果提供給顯示控制部分對。在步驟S4,顯示控制部分M把作為鑑別結果,來自鑑別部分27的鑑別目標圖像提 供給顯示部分25,以便顯示。在參考顯示在顯示部分25上的鑑別結果,用戶不滿意藉助於鑑別器的圖像分類 的精度的情況下(例如,如圖2中所示,在包含作為被攝主題的熊貓的圖像被包括在鑑別結 果中的情況下),用戶通過操作部分21執行指令生成新的鑑別器的指令操作。當執行指令 操作時,程序從步驟S4進入步驟S5。在步驟S5,顯示控制部分M按照用戶的指令操作,從圖像資料庫中讀出多個新的樣本圖像,所述多個新的樣本圖像不同於在先前的步驟S2的處理中顯示的多個樣本圖像, 隨後把讀取的新的樣本圖像提供給顯示部分25,以便顯示。隨後,程序返回步驟S2,之後執 行相同的處理。此外,在參考顯示在顯示部分25上的鑑別結果,用戶滿意藉助於鑑別器的圖像分 類的精度的情況下(例如,在只有包含作為被攝主題的手錶的圖像被包括在鑑別結果中的 情況下),用戶利用操作部分21,執行指令藉助於鑑別器生成圖像聚類的指令操作。按照該指令操作,程序從步驟S4進入步驟S6。在步驟S6,鑑別部分27利用在先 前的步驟S3的處理中生成的鑑別器,鑑別在保存在所選圖像資料庫中的多個圖像中,是否 存在預定鑑別目標。此外,鑑別部分27根據鑑別結果,生成由在圖像中存在預定鑑別目標的多個圖像 形成的圖像聚類,並把圖像聚類提供給圖像存儲部分23,以便保存。隨後,結束圖像分類處理。[學習部分沈執行的學習處理]下面參考圖3-5,說明由學習部分沈執行的學習處理。學習部分沈執行根據來自顯示控制部分M的學習圖像,生成鑑別器的學習處理。鑑別器包括鑑別在圖像中是否存在預定鑑別目標的多個弱鑑別器,並根據藉助於 所述多個弱鑑別器的鑑別結果,確定最終鑑別結果。因此,由於在學習處理中,鑑別器的生成和多個弱鑑別器的生成是等價的,因此下 面將說明多個弱鑑別器的生成。學習部分沈從由顯示控制部分M供給的學習圖像中,提取表示學習圖像的特徵 並被表示成多維向量的圖像特徵量。此外,學習部分沈根據提取的圖像特徵量,生成多個弱鑑別器。不過,在用數量較 少的學習圖像進行鑑別器的生成的情況下,學習圖像的圖像特徵量的維數較大(構成作為 圖像特徵量的向量的元素的數目較大),從而引起過度學習(過度擬合)。從而,為了抑制過度學習,學習部分沈按照學習圖像的數目,執行限制用於學習 的圖像特徵量的維數的隨機標引(randomindexing)。[隨機標引]下面,圖3是圖解說明由學習部分沈執行的隨機標引的示圖。圖3圖解說明用於生成多個弱鑑別器41-1 41-M的隨機特徵量的例子。在圖3中,作為用於多個弱鑑別器41-1 41-M中的每個弱鑑別器的圖像特徵量, 顯示了用M維向量表示的圖像特徵量。因此,在圖3中,圖像特徵量是用M個維特徵量(元素)構成的。學習部分沈生成指示構成圖像特徵量的多個維特徵量之中,用於生成每個弱鑑 別器41-1 41-M的維特徵量的隨機索引。即,例如,對於多個弱鑑別器41-1 41-M中的每個弱鑑別器,學習部分沈隨機確 定構成學習圖像的圖像特徵量的多個維特徵量之中的,用於每個弱鑑別器41-1 41-M的 學習的預定數目的維特徵量。依據按照學習圖像的數目,構成學習圖像的圖像特徵量的維特徵量的數目等,預 先進行的實驗結果等,用於每個弱鑑別器41-1 41-M的學習的維特徵量的數目較小,以致不會發生過度學習。此外,學習部分沈執行隨機標引,所述隨機標引生成指示隨機確定的維特徵量的 隨機索引,即,指示隨機確定的維特徵量在構成向量(它是圖像特徵量)的元素之中的順序 的隨機索引。具體地說,例如,學習部分沈生成把構成作為圖像特徵量的向量的M個元素之中 的,存在於第一、第三、第四、第六、第九到第十一、第十五到第十七、第二十、第二十一和第 二十四位置(圖3中用斜線表示)的13個維特徵量表示為用於弱鑑別器41-1的學習的維 特徵量的隨機索引。此外,例如,學習部分沈類似地分別生成指示用於弱鑑別器41-2 41-M的學習 的維特徵量的隨機索引。學習部分沈根據關於要生成的每個弱鑑別器41-1 41-M生成的隨機索引,提取 在構成學習圖像的圖像特徵量的多個維特徵量之中,用隨機標引指示的維特徵量。此外,學習部分沈根據由提取的維特徵量構成的隨機特徵量,生成弱鑑別器 41-1 41-M。[弱鑑別器的生成]下面,圖4圖解說明學習部分沈利用根據隨機索引提取的隨機特徵量,生成弱鑑 別器41-1 41-M的例子。在圖4的左側,表示從顯示控制部分M提供給學習部分沈的學習圖像61-1 61-N。學習部分沈根據關於弱鑑別器41-1生成的隨機索引,提取由來自顯示控制部 分24的學習圖像61-n(n = 1,2,...N)的圖像特徵量提取的維特徵量構成的隨機特徵量 81-n。此外,學習部分沈分別根據從學習圖像61-1 61-N的圖像特徵量中提取的N個 隨機特徵量81-1 81-N,利用SVM(支持向量機),生成弱鑑別器41-1。這裡,SVM指的是在構成每個給定的隨機特徵量81-1 81-N的維特徵量之中,建 立稱為支持向量的分離超平面(供圖像鑑別之用的邊界面,和特徵空間上的構成隨機特徵 量的維特徵量存在於的邊界面),以使置於分離超平面附近並且作為置於分離超平面周圍 的維特徵量和分離超平面之間的距離的間隔(margin)最大化,隨後利用建立的分離超平 面,生成用於鑑別圖像的弱鑑別器的處理。學習部分沈還進行除了弱鑑別器41-1之外的弱鑑別器41-2 41-M的生成。這 裡,由於生成方法與弱鑑別器41-1的生成方法相同,因此其說明將被省略。這同樣適用於 下面的說明。此外,當在利用SVM的弱鑑別器41-1的生成中,應用SVM時,在SVM中使用出現在 核函數中的參數、由於軟間隔的緩和而出現的用於補償控制(penalty control)的參數,等等。因此,在進行利用SVM的弱鑑別器41-1的生成之前,學習部分沈必須利用如圖5 中所示的確定方法,確定用於SVM的參數。[利用交叉驗證的參數的確定方法]下面參考圖5,說明由學習部分沈執行的確定方法,所述確定方法利用交叉驗證,確定用於SVM的參數。在圖5的上部,學習圖像Ll L4被表示成從顯示控制部分M提供給學習部分沈 的學習圖像。在學習圖像Ll L4之中,學習圖像Ll和L2代表正圖像,學習圖像L3和L4 代表負圖像。學習部分沈執行順序把作為在SVM中使用的參數的候選者的多個候選參數設定 為關注參數,並計算指示關於關注參數的評價的評價值的交叉驗證。S卩,例如,學習部分沈順序把四個學習圖像Ll L4設定為關注學習圖像(例如, 學習圖像Li)。此外,通過把利用關注參數的SVM應用於四個學習圖像Ll L4之中的不 同於關注學習圖像的剩餘學習圖像(例如,學習圖像L2 L4),學習部分沈生成弱鑑別器 41-1。此外,學習部分沈通過利用生成的弱鑑別器41-1,使用關注學習圖像作為目標,鑑別 在圖像中是否存在預定鑑別目標。學習部分沈根據弱鑑別器41-1的鑑別結果,和附加在關注學習圖像上的正解標 籤,鑑別弱鑑別器41-1是否正確地鑑別了關注學習圖像。如圖5中所示,通過順序把所有四個學習圖像Ll L4用作關注學習圖像,學習部 分26確定四個學習圖像Ll L4是否都被正確鑑別。此外,例如,學習部分沈根據作為關 注參數的評價值的確定結果,產生四個學習圖像Ll L4中的每個學習圖像能夠被精確鑑 別的概率。學習部分沈把與關於作為關注參數的相應候選參數計算的多個評價值中的最大 評價值(最高評價值)對應的候選參數,確定為用於SVM的最終參數。此外,學習部分沈根據四個學習圖像Ll L4,用被應用所確定參數的SVMdAR 生成弱鑑別器41-m(m= 1,2,...,M)的學習處理。此外,學習部分沈按照下述公式1,計算指示用生成的弱鑑別器41-m執行的鑑別 的置信程度的置信度。[公式1]
權利要求
1.一種學習設備,包括學習裝置,所述學習裝置隨著用戶從多個樣本圖像中指定了用 於使鑑別在圖像中是否存在預定鑑別目標的鑑別器進行學習的學習圖像,利用包括維特徵 量的隨機特徵量來使得所述鑑別器進行學習,所述維特徵量是從包含在指示學習圖像的特 徵的圖像特徵量中的多個維特徵量中隨機選擇的。
2.按照權利要求1所述的學習設備,其中學習裝置通過間隔最大化學習來訓練所述鑑別器,所述間隔最大化學習使所述隨 機特徵量所存在的特徵空間中的間隔最大化,所述間隔表示用於鑑別在圖像中是否存在預 定鑑別目標的分離超平面與包括在所述隨機特徵量中的維特徵量之中的、位於所述分離超 平面附近的維特徵量之間的距離。
3.按照權利要求2所述的學習設備,其中學習裝置包括圖像特徵量提取裝置,用於從學習圖像中提取表示學習圖像的特徵並被表示成具有多 維的向量的圖像特徵量;隨機特徵量生成裝置,用於隨機選擇作為圖像特徵量的各維的元素的所述多個維特徵 量中的一些維特徵量,並生成包括所選擇的維特徵量的隨機特徵量;以及鑑別器生成裝置,用於利用所述隨機特徵量,通過間隔最大化學習,生成鑑別器。
4.按照權利要求3所述的學習設備,其中鑑別器根據用於確定在鑑別目標圖像中是否存在預定鑑別目標的多個弱鑑別器 的確定結果,輸出最終的確定結果,其中隨機特徵量生成裝置針對所述多個弱鑑別器中的每個弱鑑別器,生成用於生成弱 鑑別器的隨機特徵量,和其中鑑別器生成裝置根據針對所述多個弱鑑別器中的每個弱鑑別器生成的隨機特徵 量,生成所述多個弱鑑別器。
5.按照權利要求4所述的學習設備,其中鑑別器生成裝置還根據所述隨機特徵量,生成指示弱鑑別器的確定結果的可靠性 程度的置信度。
6.按照權利要求5所述的學習設備,其中鑑別器生成裝置根據所述多個弱鑑別器和置信度,生成輸出鑑別確定值的鑑別 器,所述鑑別確定值表示作為從所述多個弱鑑別器中的每個弱鑑別器輸出的確定結果的確 定值與所述置信度之間的乘積和運算結果,其中鑑別裝置根據從鑑別器輸出的鑑別確定值,鑑別在鑑別目標圖像中是否存在預定 鑑別目標。
7.按照權利要求3所述的學習設備,其中每當用戶指定學習圖像時,隨機特徵量生成裝置生成不同的隨機特徵量。
8.按照權利要求7所述的學習設備,其中學習圖像包括在圖像中存在預定鑑別目標的正圖像和在圖像中不存在預定鑑別 目標的負圖像,其中學習裝置還包括增加偽負圖像作為學習圖像的負圖像增加裝置。
9.按照權利要求8所述的學習設備,其中學習裝置還包括正圖像增加裝置,該正圖像增加裝置用於在鑑別器生成裝置生成 鑑別器之後預定條件被滿足時,增加偽正圖像作為學習圖像,和其中鑑別器生成裝置根據被增加了偽正圖像的學習圖像的隨機特徵量,生成鑑別器。
10.按照權利要求9所述的學習設備,其中在正圖像和偽正圖像的總數小於負圖像和偽負圖像的總數的條件被滿足的情況 下,正圖像增加裝置增加偽正圖像作為學習圖像。
11.按照權利要求2所述的學習設備,其中學習裝置進行利用支持向量機的學習作為間隔最大化學習。
12.按照權利要求1所述的學習設備,還包括利用鑑別器鑑別在鑑別目標圖像中是否存在預定鑑別目標的鑑別裝置,其中在用戶按照鑑別裝置的鑑別處理重新指定了學習圖像的情況下,學習裝置利用所 指定的學習圖像,重複進行鑑別器的學習。
13.按照權利要求12所述的學習設備,其中在用戶按照鑑別裝置的鑑別處理,指示生成包括在圖像中存在預定鑑別目標的鑑 別目標圖像的圖像聚類的情況下,鑑別裝置根據由學習裝置生成的最新鑑別器,從所述多 個鑑別目標圖像生成圖像聚類。
14.一種學習設備中的學習方法,所述學習設備使用於鑑別在圖像中是否存在預定鑑 別目標的鑑別器進行學習,所述學習設備包括學習裝置,所述方法包括下述步驟隨著用戶從多個樣本圖像中指定了用於使鑑別在圖像中是否 存在預定鑑別目標的鑑別器進行學習的學習圖像,由學習裝置利用包括維特徵量的隨機特 徵量來使得所述鑑別器進行學習,所述維特徵量是從包含在指示學習圖像的特徵的圖像特 徵量中的多個維特徵量中隨機選擇的。
15.一種使計算機起學習裝置作用的程序,所述學習裝置按照由用戶從多個樣本圖像 中指定的,用於訓練鑑別在圖像中是否存在預定鑑別目標的鑑別器的學習圖像,利用包括 從包含在指示學習圖像的特徵的圖像特徵量中的多個維特徵量中,隨機選擇的維特徵量的 隨機特徵量,訓練所述鑑別器。
16.一種學習設備,包括學習部分,所述學習部分隨著用戶從多個樣本圖像中指定了用 於使得鑑別在圖像中是否存在預定鑑別目標的鑑別器進行學習的學習圖像,利用包括維特 徵量的隨機特徵量來使得所述鑑別器進行學習,所述維特徵量是從包含在指示學習圖像的 特徵的圖像特徵量中的多個維特徵量中隨機選擇的。
全文摘要
本發明涉及學習設備、學習方法和程序。一種學習設備,包括學習部分,所述學習部分按照由用戶從多個樣本圖像中指定的,用於訓練鑑別在圖像中是否存在預定鑑別目標的鑑別器的學習圖像,利用包括從包含在指示學習圖像的特徵的圖像特徵量中的多個維特徵量中,隨機選擇的維特徵量的隨機特徵量,訓練所述鑑別器。
文檔編號G06K9/66GK102136072SQ201010610590
公開日2011年7月27日 申請日期2010年12月29日 優先權日2010年1月21日
發明者巖井嘉昭, 本間俊一, 蘆原隆之 申請人:索尼公司