一種利用多來源數據具有隱私保護功能的圖象分類方法與流程

2023-04-30 03:18:56 2

本發明涉及圖象特徵抽取、應用技術，圖象分類技術，特別涉及一種基於從圖象抽取多組特徵之間關係的圖象識別方法以及保護圖象具體特徵提取方法的隱私保護技術。

背景技術：

目前，隨著多媒體技術的發展和智能設備的普及，圖象信息的獲取日益便捷，同時，對於圖象的分類需求也日益提高，如使用只能手機拍照之後，需要對照片進行分類；機器人對物體進行識別時，也會用到圖像識別技術；在網絡搜索圖象時也有相關技術的需求。

目前圖象分類的流程主要是先針對圖象提取特徵，之後使用某些分類器進行分類。對於圖象進行標記十分昂貴，需要花費大量的人力資源，而從網際網路上獲取圖象十分便捷，但是獲取到的都是沒有標記的圖象。對於一幅圖象，可以有多種不同類型的特徵屬性集合：如可以使用不同圖象特徵提取方法對圖象進行特徵抽取，每一種方法抽取到的特徵構成一個屬性集；網絡上一幅圖象往往配有文字、視頻等其它多媒體資源，從這些附帶的資源中也可以提取出特徵；智慧型手機配備多個傳感器，使用手機拍一張照片，其它傳感器可以提供時間、溫度、光照強度等信息，這些信息也可以輔助圖象的分類。傳統的方法一方面需要獲取有標記的圖象進行分類器的訓練，一方面依賴於特定的特徵，無法較好地利用未標記圖象和多組不同的圖象特徵屬性集。

圖象分類往往也是多個公司、研究組織的共同需求。不同的公司或者研究組織會針對其獲取的數據使用他們自己的方法提取特徵，之後根據他們提取的特徵進行分類器的訓練。將多個公司(組織)的特徵進行結合，無疑可以得到更好的特徵，但是各組特徵涉及多個公司(組織)的隱私信息，如提取特徵的具體技術，這些往往不適合和他人共享，因此需要一種具有隱私保護的利用不同特徵進行圖象分類的方法。

技術實現要素：
：

發明目的：目前關於圖象分類的算法往往依賴於有標記的圖象，或者只針對圖象的某一類屬性集，同時已有的方法幾乎沒有考慮過在「競爭-合作」的場景下對每一個數據來源的特徵進行隱私保護，針對上述問題，本發明提出一種利用多來源數據具有隱私保護功能的圖象分類方法，將圖像的多個特徵集合看作多個視圖，通過利用視圖之間的相關性提升圖象分類的性能。

技術方案：一種利用多來源數據具有隱私保護功能的圖象分類方法，首先針對圖象收集(提取)不同類型的特徵屬性，將每一組特徵看作一個視圖，每一個視圖上訓練一個分類器，對圖象的結果進行預測，要求在有標記數據上預測的結果和真實的結果相同；在之後的訓練過程中，要求不同視圖的預測結果儘可能相近，使得預測性能強的視圖能夠輔助其它的視圖，從而提升每一個視圖以及綜合的分類結果；最後利用在迭代訓練過程中得到的分類器在每一個視圖上進行圖象分類。本發明方法可分為圖象分類模型訓練步驟和圖象分類模型分類步驟，具體如下：

所述圖象分類模型的訓練步驟具體為：

步驟100，從不同的k個數據源獲取圖象特徵屬性集，將每一個屬性集看作一個視圖；

步驟101，在每一個視圖上利用本視圖的特徵屬性訓練分類器，得到每一個視圖上對所有樣本的預測結果，訓練過程中要求在有標記樣本上每一個分類器的預測結果和真實標記相同；

步驟102，將每個視圖對所有圖象的預測結果收集，拼接成一個矩陣(apm)，優化該矩陣的秩，使每一個視圖的預測結果儘可能一致；

步驟103，判斷每一個視圖預測拼接構成的矩陣秩是否滿足要求，如果否，則轉入步驟101，繼續分類器的訓練；如果是，則通過該矩陣重構分類器，即每一個視圖最終的預測結果根據該視圖上的特徵構造出針對該視圖的分類器wk確定。

所述圖象分類模型的分類步驟具體為：

步驟200，從不同的k個數據源獲取圖象特徵屬性集，將每一個屬性集看作一個視圖；

步驟201，利用訓練過程中在每一個視圖上得到的分類器wk對每一個視圖上的圖象進行分類；

步驟202，判斷是否需要綜合每一個視圖進行圖象分類，如果否，則獲得每一個視圖上的分類結果；如果是，則收集每一個視圖的分類結果，將其進行融合，得到綜合的分類結果。

所述步驟100從不同的k個數據源獲取圖象特徵屬性集的方法包括使用不同的特徵提取方法對圖象進行特徵提取、使用網絡上的附帶信息作為其它數據源和從真實存在的多數據源(如多傳感器)提取特徵等。

所述步驟101在每一個視圖上利用本視圖的特徵屬性訓練分類器具體方法為：在每一個視圖上構建線性分類器wk，分類器的維度同時取決於圖象類別的數目c和該視圖特徵屬性集的維度dk，使用最小二乘方法在有標記樣本上使得分類器的預測結果和真實的結果儘可能相似，具體公式如下：

其中，bk為每個視圖上的分類偏置，γ為參數，fk是分類器的輸出。

所述步驟102使每一個視圖的預測結果儘可能一致的具體方法為：在每一個視圖上對訓練集中所有圖象進行類別的預測，得到預測結果fk，其維度同時取決於訓練集中圖象的數目和類別數目，將所有視圖的預測結果拼接，得到一個擴展的矩陣表示apm，使各個視圖的預測結果一致即優化apm的秩，使其儘可能低秩。優化目標及使得apm的秩為c-1，和理想情況下的秩相同。

所述優化apm的秩方法為優化apm的截斷核範數的方法，包括加速近端梯度方法和交替方向乘子法，具體優化方法如下：

其中，lk為最小二乘損失函數，fk是第k個視圖上分類器的輸出，||f||r是擴展矩陣apm的截斷核範數，集合d為可用分類器集合，在本申請中d為帶偏置的線性分類器集合。

所述步驟201利用訓練過程中在每一個視圖上得到的分類器wk對每一個視圖上的圖象進行分類的具體方法為：將該視圖上某一幅圖象的特徵和wk做內積運算，得到一個長為c的向量，其中每一個元素表示分類到每一個類的置信度，圖象分類過程即把當前圖象分類為置信度最高的一類。

所述步驟202將各類別的預測結果融合，具體是指使用某些集成方法(如多個預測結果投票)得到最終的預測。

有益效果：與現有技術相比，本發明所提供的利用多數具有的圖象分類方法，實施過程中能夠充分利用有標記數據和未標記數據上不同數據源的多種特徵屬性，適合數據源很多的情況，同時在整個訓練過程中能夠確保每一個數據源的特徵屬性不被其它數據源所獲取。

附圖說明

圖1是本發明的圖象分類模型訓練階段的工作流程圖；

圖2是本發明的圖象分類模型分類階段的工作流程圖；

圖3是本發明的訓練圖象分類模型m的工作流程圖。

具體實施方式

下面結合具體實施例，進一步闡明本發明，應理解這些實施例僅用於說明本發明而不用於限制本發明的範圍，在閱讀了本發明之後，本領域技術人員對本發明的各種等價形式的修改均落於本申請所附權利要求所限定的範圍。

圖象分類模型訓練階段的工作流程如圖1所示。圖象分類模型在訓練階段需要收集一定數量的帶標記和大量不帶標記的圖象用於訓練，具體來說，以公司之間「競爭-合作」為例，首先不同的公司確定對於同一個任務(對於某一類型的圖象分類任務)進行協作，從網絡上收集大量數據(步驟10)；然後不同公司確定針對相同一部分的圖象進行模型的訓練(可以某一方搜集圖象然後共享，或者由各公司都從同一數據源獲取圖象，步驟11)；各個公司使用其自己的方法進行對搜集到的圖象進行特徵提取(步驟12a)，並對同一批圖象進行類別的標註(步驟12b)。判斷各公司搜集數據、對數據的特徵提取是否完成(步驟13)，如果否，等待所有公司數據準備完成；如果是，則各公司使用搜集到的數據以及提取到的特徵進行模型訓練(步驟14)，最終得到模型m(步驟15)，包含每一個類別的分類器wk，用於每一個公司的圖象分類。

圖象分類模型分類工作階段的工作流程如圖2所示。首先各個公司獲取訓練過程中得到的針對每一個公司(每個視圖)的圖象分類器wk(步驟16)，然後判定各公司之間是否存在進一步協作(步驟17)，即是否需要綜合多個公司的預測結果提供最終的圖象分類結果，如果是，則將圖象分發給各個公司或各公司收集同一批圖象(步驟18b)，各公司使用自己的對應的特徵提取技術對該圖象提取特徵(步驟19b)，之後使用各公司的分類器進行判定，得到預測結果(步驟20b)，最後將這些預測結果進行集成，得到最終的綜合的預測結果(步驟21)。如果各公司獨立分類，則各個公司分別收集新的數據，這裡不要求不同公司搜集的圖象相同，也不要求不同公司要同步操作(步驟18a)；對於每一個公司，每當搜集到一個(一批)圖象，使用訓練過程中同樣的方法對該(批)圖象進行特徵提取，得到圖象的特徵(步驟19a)；最後，公司使用自己的分類器對圖像特徵進行類別判定，分類結果為置信度最高的一個類別(步驟20a)。註：在圖象分類過程中，各個公司對於數據獨立處理，但要保證使用訓練過程中相同的方式對圖象提取特徵。

訓練圖象分類模型m的工作流程如圖3所示。首先各公司使用各自的特徵提取方法對圖象進行特徵提取，獲取到的數據記為x1，x2，…，xk(步驟141)；然後每個公司在有標記的圖象上分別訓練一個線性分類器w1，w2，…，wk(步驟142)；各公司使用訓練好的分類器對所有樣本的標記進行預測，得到的預測結果分別為f1，f2，…，fk(步驟143)；將各個公司的預測結果集中到一個中間結點，拼接成一個矩陣(步驟144)，在中間結點對該矩陣進行優化，得到更好的預測結果矩陣apm，通過優化該矩陣的秩實現(步驟145)；將更新之後的預測結果分別傳給各個公司(步驟146)；判斷各公司的預測結果是否足夠好(步驟147)，如果否，則返回步驟，繼續訓練；如果是，則停止，各公司通過預測結果fk更新分類器wk，各公司得到各自的分類器(步驟148)。註：在訓練過程中，中心結點只獲取各個公司針對圖象的預測結果，不需要獲取各個公司提取到的圖象特徵，保護了各公司圖象提取技術的隱私性。在實現中，通過優化apm的秩來對預測結果更新，使用優化apm的截斷核範數的方法實現，具體有加速近端梯度方法和交替方向乘子法等。

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

一種利用多來源數據具有隱私保護功能的圖象分類方法與流程

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法