新四季網

一種利用多來源數據具有隱私保護功能的圖象分類方法與流程

2023-04-30 03:18:56


本發明涉及圖象特徵抽取、應用技術,圖象分類技術,特別涉及一種基於從圖象抽取多組特徵之間關係的圖象識別方法以及保護圖象具體特徵提取方法的隱私保護技術。



背景技術:

目前,隨著多媒體技術的發展和智能設備的普及,圖象信息的獲取日益便捷,同時,對於圖象的分類需求也日益提高,如使用只能手機拍照之後,需要對照片進行分類;機器人對物體進行識別時,也會用到圖像識別技術;在網絡搜索圖象時也有相關技術的需求。

目前圖象分類的流程主要是先針對圖象提取特徵,之後使用某些分類器進行分類。對於圖象進行標記十分昂貴,需要花費大量的人力資源,而從網際網路上獲取圖象十分便捷,但是獲取到的都是沒有標記的圖象。對於一幅圖象,可以有多種不同類型的特徵屬性集合:如可以使用不同圖象特徵提取方法對圖象進行特徵抽取,每一種方法抽取到的特徵構成一個屬性集;網絡上一幅圖象往往配有文字、視頻等其它多媒體資源,從這些附帶的資源中也可以提取出特徵;智慧型手機配備多個傳感器,使用手機拍一張照片,其它傳感器可以提供時間、溫度、光照強度等信息,這些信息也可以輔助圖象的分類。傳統的方法一方面需要獲取有標記的圖象進行分類器的訓練,一方面依賴於特定的特徵,無法較好地利用未標記圖象和多組不同的圖象特徵屬性集。

圖象分類往往也是多個公司、研究組織的共同需求。不同的公司或者研究組織會針對其獲取的數據使用他們自己的方法提取特徵,之後根據他們提取的特徵進行分類器的訓練。將多個公司(組織)的特徵進行結合,無疑可以得到更好的特徵,但是各組特徵涉及多個公司(組織)的隱私信息,如提取特徵的具體技術,這些往往不適合和他人共享,因此需要一種具有隱私保護的利用不同特徵進行圖象分類的方法。



技術實現要素:

發明目的:目前關於圖象分類的算法往往依賴於有標記的圖象,或者只針對 圖象的某一類屬性集,同時已有的方法幾乎沒有考慮過在「競爭-合作」的場景下對每一個數據來源的特徵進行隱私保護,針對上述問題,本發明提出一種利用多來源數據具有隱私保護功能的圖象分類方法,將圖像的多個特徵集合看作多個視圖,通過利用視圖之間的相關性提升圖象分類的性能。

技術方案:一種利用多來源數據具有隱私保護功能的圖象分類方法,首先針對圖象收集(提取)不同類型的特徵屬性,將每一組特徵看作一個視圖,每一個視圖上訓練一個分類器,對圖象的結果進行預測,要求在有標記數據上預測的結果和真實的結果相同;在之後的訓練過程中,要求不同視圖的預測結果儘可能相近,使得預測性能強的視圖能夠輔助其它的視圖,從而提升每一個視圖以及綜合的分類結果;最後利用在迭代訓練過程中得到的分類器在每一個視圖上進行圖象分類。本發明方法可分為圖象分類模型訓練步驟和圖象分類模型分類步驟,具體如下:

所述圖象分類模型的訓練步驟具體為:

步驟100,從不同的k個數據源獲取圖象特徵屬性集,將每一個屬性集看作一個視圖;

步驟101,在每一個視圖上利用本視圖的特徵屬性訓練分類器,得到每一個視圖上對所有樣本的預測結果,訓練過程中要求在有標記樣本上每一個分類器的預測結果和真實標記相同;

步驟102,將每個視圖對所有圖象的預測結果收集,拼接成一個矩陣(apm),優化該矩陣的秩,使每一個視圖的預測結果儘可能一致;

步驟103,判斷每一個視圖預測拼接構成的矩陣秩是否滿足要求,如果否,則轉入步驟101,繼續分類器的訓練;如果是,則通過該矩陣重構分類器,即每一個視圖最終的預測結果根據該視圖上的特徵構造出針對該視圖的分類器wk確定。

所述圖象分類模型的分類步驟具體為:

步驟200,從不同的k個數據源獲取圖象特徵屬性集,將每一個屬性集看作一個視圖;

步驟201,利用訓練過程中在每一個視圖上得到的分類器wk對每一個視圖上 的圖象進行分類;

步驟202,判斷是否需要綜合每一個視圖進行圖象分類,如果否,則獲得每一個視圖上的分類結果;如果是,則收集每一個視圖的分類結果,將其進行融合,得到綜合的分類結果。

所述步驟100從不同的k個數據源獲取圖象特徵屬性集的方法包括使用不同的特徵提取方法對圖象進行特徵提取、使用網絡上的附帶信息作為其它數據源和從真實存在的多數據源(如多傳感器)提取特徵等。

所述步驟101在每一個視圖上利用本視圖的特徵屬性訓練分類器具體方法為:在每一個視圖上構建線性分類器wk,分類器的維度同時取決於圖象類別的數目c和該視圖特徵屬性集的維度dk,使用最小二乘方法在有標記樣本上使得分類器的預測結果和真實的結果儘可能相似,具體公式如下:

其中,bk為每個視圖上的分類偏置,γ為參數,fk是分類器的輸出。

所述步驟102使每一個視圖的預測結果儘可能一致的具體方法為:在每一個視圖上對訓練集中所有圖象進行類別的預測,得到預測結果fk,其維度同時取決於訓練集中圖象的數目和類別數目,將所有視圖的預測結果拼接,得到一個擴展的矩陣表示apm,使各個視圖的預測結果一致即優化apm的秩,使其儘可能低秩。優化目標及使得apm的秩為c-1,和理想情況下的秩相同。

所述優化apm的秩方法為優化apm的截斷核範數的方法,包括加速近端梯度方法和交替方向乘子法,具體優化方法如下:

其中,lk為最小二乘損失函數,fk是第k個視圖上分類器的輸出,||f||r是擴展矩陣apm的截斷核範數,集合d為可用分類器集合,在本申請中d為帶偏置的線性分類器集合。

所述步驟201利用訓練過程中在每一個視圖上得到的分類器wk對每一個視圖上的圖象進行分類的具體方法為:將該視圖上某一幅圖象的特徵和wk做內積運算,得到一個長為c的向量,其中每一個元素表示分類到每一個類的置信度,圖象分類過程即把當前圖象分類為置信度最高的一類。

所述步驟202將各類別的預測結果融合,具體是指使用某些集成方法(如多個預測結果投票)得到最終的預測。

有益效果:與現有技術相比,本發明所提供的利用多數具有的圖象分類方法,實施過程中能夠充分利用有標記數據和未標記數據上不同數據源的多種特徵屬性,適合數據源很多的情況,同時在整個訓練過程中能夠確保每一個數據源的特徵屬性不被其它數據源所獲取。

附圖說明

圖1是本發明的圖象分類模型訓練階段的工作流程圖;

圖2是本發明的圖象分類模型分類階段的工作流程圖;

圖3是本發明的訓練圖象分類模型m的工作流程圖。

具體實施方式

下面結合具體實施例,進一步闡明本發明,應理解這些實施例僅用於說明本發明而不用於限制本發明的範圍,在閱讀了本發明之後,本領域技術人員對本發明的各種等價形式的修改均落於本申請所附權利要求所限定的範圍。

圖象分類模型訓練階段的工作流程如圖1所示。圖象分類模型在訓練階段需要收集一定數量的帶標記和大量不帶標記的圖象用於訓練,具體來說,以公司之間「競爭-合作」為例,首先不同的公司確定對於同一個任務(對於某一類型的圖象分類任務)進行協作,從網絡上收集大量數據(步驟10);然後不同公司確定針對相同一部分的圖象進行模型的訓練(可以某一方搜集圖象然後共享,或者由各公司都從同一數據源獲取圖象,步驟11);各個公司使用其自己的方法進行對搜集到的圖象進行特徵提取(步驟12a),並對同一批圖象進行類別的標註(步驟12b)。判斷各公司搜集數據、對數據的特徵提取是否完成(步驟13),如果否,等待所有公司數據準備完成;如果是,則各公司使用搜集到的數據以及提取到的特徵進行模型訓練(步驟14),最終得到模型m(步驟15),包含每一個類別的 分類器wk,用於每一個公司的圖象分類。

圖象分類模型分類工作階段的工作流程如圖2所示。首先各個公司獲取訓練過程中得到的針對每一個公司(每個視圖)的圖象分類器wk(步驟16),然後判定各公司之間是否存在進一步協作(步驟17),即是否需要綜合多個公司的預測結果提供最終的圖象分類結果,如果是,則將圖象分發給各個公司或各公司收集同一批圖象(步驟18b),各公司使用自己的對應的特徵提取技術對該圖象提取特徵(步驟19b),之後使用各公司的分類器進行判定,得到預測結果(步驟20b),最後將這些預測結果進行集成,得到最終的綜合的預測結果(步驟21)。如果各公司獨立分類,則各個公司分別收集新的數據,這裡不要求不同公司搜集的圖象相同,也不要求不同公司要同步操作(步驟18a);對於每一個公司,每當搜集到一個(一批)圖象,使用訓練過程中同樣的方法對該(批)圖象進行特徵提取,得到圖象的特徵(步驟19a);最後,公司使用自己的分類器對圖像特徵進行類別判定,分類結果為置信度最高的一個類別(步驟20a)。註:在圖象分類過程中,各個公司對於數據獨立處理,但要保證使用訓練過程中相同的方式對圖象提取特徵。

訓練圖象分類模型m的工作流程如圖3所示。首先各公司使用各自的特徵提取方法對圖象進行特徵提取,獲取到的數據記為x1,x2,…,xk(步驟141);然後每個公司在有標記的圖象上分別訓練一個線性分類器w1,w2,…,wk(步驟142);各公司使用訓練好的分類器對所有樣本的標記進行預測,得到的預測結果分別為f1,f2,…,fk(步驟143);將各個公司的預測結果集中到一個中間結點,拼接成一個矩陣(步驟144),在中間結點對該矩陣進行優化,得到更好的預測結果矩陣apm,通過優化該矩陣的秩實現(步驟145);將更新之後的預測結果分別傳給各個公司(步驟146);判斷各公司的預測結果是否足夠好(步驟147),如果否,則返回步驟,繼續訓練;如果是,則停止,各公司通過預測結果fk更新分類器wk,各公司得到各自的分類器(步驟148)。註:在訓練過程中,中心結點只獲取各個公司針對圖象的預測結果,不需要獲取各個公司提取到的圖象特 徵,保護了各公司圖象提取技術的隱私性。在實現中,通過優化apm的秩來對預測結果更新,使用優化apm的截斷核範數的方法實現,具體有加速近端梯度方法和交替方向乘子法等。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀