一種移動拍照類app用戶的性別識別方法及系統的製作方法
2023-07-02 23:09:51 3
一種移動拍照類app用戶的性別識別方法及系統的製作方法
【專利摘要】本發明公開了一種移動拍照類APP用戶的性別識別方法及系統,涉及數據挖掘領域,尤其是針對應用軟體,如拍照軟體,的用戶使用行為特徵進行用戶性別識別的方法。本發明技術要點:採集測試對象的目標特徵值(x1,x2,...,xm);根據測試對象的目標特徵值計算z值,z=w0+w1×x1+w2×x2+...wm×xm;其中,(w0,w1,w2,...wm)為已知的目標特徵權值;計算測試對象的sigmoid函數值g,g=1/(1+exp(-z));根據g值求取測試對象的類標號t:其中a為二分類閾值。
【專利說明】-種移動拍照類APP用戶的性別識別方法及系統
【技術領域】
[0001] 本發明涉及數據挖掘領域,尤其是一種分類/預測技術。
【背景技術】
[0002] 隨著網絡及智能移動終端的不斷發展,湧現出很多APP,為了擴大用戶量,很多 APP降低了用戶使用門檻,大多數不需要註冊,用戶便可使用。如拍照軟體等。
[0003] 拍照軟體在移動APP中佔有極其重要的地位,為即時數字圖像娛樂提供了極大便 利。由於大多拍照軟體不需註冊,造成了用戶資料的基本空白(如:性別等)。對用戶信息 不了解,APP開發上對產品的改進、營銷活動(針對性地特效推薦、廣告投放等)等將很難 開展。
[0004] 因此,很有必要提供一種基於用戶對該類APP的使用行為特徵確定用戶性別等信 息的方法。
【發明內容】
[0005] 本發明所要解決的技術問題是:針對上述存在的問題,提供一種二分類方法及系 統,尤其是根據應用軟體,如拍照軟體,的用戶使用行為特徵進行用戶性別識別的方法。
[0006] 本發明提供的二分類方法,包括:
[0007]步驟1:採集測試對象使用拍照類APP行為的的目標特徵值(Xl,x2,...,Xm);
[0008] 步驟2 :根據所述目標特徵值計算z值,z = Wc^w 1XxJw2Xx2+. .. WmXxm ;其中, (w。,》1,%,... wm)為已知的目標特徵權值;
[0009]步驟3 :計算測試對象的sigmoid函數值g,g=l/(l+exp(_z));
[0010] 步驟4 :根據g值求取測試對象的類標號t:
【權利要求】
1. 一種移動拍照類APP用戶的性別識別方法,其特徵在於,包括: 步驟1 :採集測試對象使用拍照類APP行為的目標特徵值(Xl,x2, ...,xm); 步驟2 :根據所述目標特徵值計算z值,z=Wc^w1XXfw2Xx2+. ..wmXxm ;其中, (W。,》1,%,...Wm)為已知的目標特徵權值; 步驟3 :計算測試對象的sigmoid函數值g,g=l/(l+exp(-z)); Γ^I當g2u 步驟4 :根據g值求取測試對象的類標號t:b= ^gg^fl其中a為二分類閾值。
2. 根據權利要求1所述的一種移動拍照類APP用戶的性別識別方法,其特徵在於,所述 目標特徵的確定步驟為: 步驟al:確定訓練對象及訓練對象使用拍照類APP行為的初步特徵,採集每個訓練對 象的初步特徵的特徵值;將不同訓練對象的相同的初步特徵的特徵值集合在一起作為一個 初步特徵值向量; 步驟a2 :將初步特徵值向量分別作為InfoGain特徵選擇函數、Chi_Square特徵選擇函 數以及CFS特徵選擇函數的輸入得到每個初步特徵的InfoGain權值、Chi_Square權值以 及CFS權值; 步驟a3 :將每個初步特徵的InfoGain權值與InfoGain篩選閾值比較,將大於InfoGain篩選閾值的初步特徵值保留並作為第一特徵集合;將每個初步特徵的Chi_ Square權值與Chi_Square篩選閾值比較,將大於Chi_Square篩選閾值的初步特徵值保留 並作為第二特徵集合;將每個初步特徵的CFS權值與CFS篩選閾值比較,將大於CFS篩選閾 值的初步特徵值保留並作為第三特徵集合; 步驟a4 :計算第一特徵集合、第二特徵集合與第三特徵集合的交集,並將交集中的成 員作為目標特徵。
3. 根據權利要求1所述的一種移動拍照類APP用戶的性別識別方法,其特徵在於,目標 特徵權值的(Wtl,W1,W2, ...Wm)的獲取方法包括: η 令目標特徵數量為m;對似然函數"》') = 1^/4(^.) + (1UnG-g,.)丨求導,將不同訓練 對象的目標特徵的特徵值依次帶入求導後的似然函數並令求導後的函數值為〇得到包含η個方程的方程組,利用牛頓-拉斐森方法進行迭代,得到方程組的解(^,Wl,w2,...wm) ;η為 訓練對象個數;其中(Xli,x2i,...,xmi)為第i個訓練對象的目標特徵值山為第i個訓練對 象的類標號,h為已知量,其取值為0或I;gi為第i個訓練對象的sigmoid值,gi= 1/(1+ θχρ(_(?νΗ¥ιΧχπ+¥2Χχ2?+· · .WmXxmi)));n不小於m+1。
4. 根據權利要求1所述的一種移動拍照類APP用戶的性別識別方法,其特徵在於,目標 特徵權值的(Wtl,W1,W2, ...Wm)的獲取方法包括: 令 目 標特徵 數量為m; 對似 然函數 2 /(VV)=乞!,>(g,.) + (1 -)ln(l-g,)!-乞!In具+ 2^ + 求導,將不同訓練對象的目標 1=1 7=1 LIoj 特徵的特徵值依次帶入求導後的似然函數並令求導後的函數值為〇得到包含η個方程的方 程組,利用牛頓-拉斐森方法進行迭代,得到方程組的解(%,W1,w2,. . .Wm) ;n為訓練對象個 數; 其中(Xli,x2i,. . .,xmi)為第i個訓練對象的目標特徵值山為第i個訓練對象的類標 號,h為已知量,其取值為O或I;gi為第i個訓練對象的sigmoid值,gi=l/(l+exp(-(wQ +W1Xx1^w2Xx2i+. · .WmXxmi))) ;δj為基於η個訓練對象的第j個目標特徵值計算得到的第 j個目標特徵的方差;η不小於m+1。
5. 根據權利要求1所述的一種移動拍照類APP用戶的性別識別方法,其特徵在於,a取 值為0.5。
6. -種移動拍照類APP用戶的性別識別系統,其特徵在於,包括:目標特徵值獲取模 塊,用於採集測試對象使用拍照類APP行為的目標特徵值(Xl,x2,...,xm); 中間值計算模塊,用於根據所述目標特徵值計算z值,z=Wc^w1Xxdw2Xx2+. . .WmXxm; 其中,(wQ,W1,W2, ...wm)為已知的目標特徵權值; sigmoid函數值計算模塊,用於計算測試對象的sigmoid函數值g,g=1/ (l+exp(-z)); = 1 當g 類標號獲取模塊,用於根據g值求取測試對象的類標號t 其中a為二 分類閾值。
7.根據權利要求6所述的一種移動拍照類APP用戶的性別識別系統,其特徵在於,所述 目標特徵的確定步驟為: 步驟al:確定訓練對象及訓練對象使用拍照類APP行為的初步特徵,採集每個訓練對 象的初步特徵的特徵值;將不同訓練對象的相同的初步特徵的特徵值集合在一起作為一個 初步特徵值向量; 步驟a2 :將初步特徵值向量分別作為InfoGain特徵選擇函數、Chi_Square特徵選擇函 數以及CFS特徵選擇函數的輸入得到每個初步特徵的InfoGain權值、Chi_Square權值以 及CFS權值; 步驟a3 :將每個初步特徵的InfoGain權值與InfoGain篩選閾值比較,將大於InfoGain篩選閾值的初步特徵值保留並作為第一特徵集合;將每個初步特徵的Chi_ Square權值與Chi_Square篩選閾值比較,將大於Chi_Square篩選閾值的初步特徵值保留 並作為第二特徵集合;將每個初步特徵的CFS權值與CFS篩選閾值比較,將大於CFS篩選閾 值的初步特徵值保留並作為第三特徵集合; 步驟a4 :計算第一特徵集合、第二特徵集合與第三特徵集合的交集,並將交集中的成 員作為目標特徵。
8. 根據權利要求6所述的一種移動拍照類APP用戶的性別識別系統,其特徵在於,目標 特徵權值的(Wtl,W1,W2, ...Wm)的獲取方法包括: η 令目標特徵數量為m;對似然函數,^ = + -乂丨求導,將不同訓練 對象的目標特徵的特徵值依次帶入求導後的似然函數並令求導後的函數值為〇得到包含η個方程的方程組,利用牛頓-拉斐森方法進行迭代,得到方程組的解(^,Wl,w2,...wm) ;η為 訓練對象個數;其中(Xli,X2i,...,Xmi)為第i個訓練對象的目標特徵值山為第i個訓練對 象的類標號,ti為已知量,其取值為O或I;gi為第i個訓練對象的sigmoid值,gi= 1/(1+ θχρ(_(?νΗ¥ιΧχπ+¥2Χχ2?+· · .WmXxmi)));n不小於m+1。
9.根據權利要求6所述的一種移動拍照類APP用戶的性別識別系統,其特徵在於,目標 特徵權值的(Wtl,W1,W2, ...Wm)的獲取方法包括: 令 目 標特徵 數量為m; 對似 然函數 /(w) =Σln(g/) +(1 - 1η〇 -g/)卜Σ彳In^ + 一^ + 丨求導,將不同訓練對象的目標 /-Ii-i 2 2〇j 特徵的特徵值依次帶入求導後的似然函數並令求導後的函數值為〇得到包含η個方程的方 程組,利用牛頓-拉斐森方法進行迭代,得到方程組的解(^,Wl,《2,...wm) ;η為訓練對象個 數;其中(Xli,x2i,. . .,xmi)為第i個訓練對象的目標特徵值山為第i個訓練對象的類標號, h為已知量,其取值為0或1沿為第i個訓練對象的sigmoid值,gi=l/d+expiHwd+Wi Xxu+w2Xx2i+. . .wmXxmi))) ;δ』為基於η個訓練對象的第j個目標特徵值計算得到的第j 個目標特徵的方差;η不小於m+1。
10. 根據權利要求6所述的一種移動拍照類APP用戶的性別識別系統,其特徵在於,a 取值為0.5。
【文檔編號】G06K9/62GK104318255SQ201410654279
【公開日】2015年1月28日 申請日期:2014年11月17日 優先權日:2014年11月17日
【發明者】陳若田 申請人:成都品果科技有限公司