基於多級邏輯回歸的點擊率預測方法和系統的製作方法
2023-10-05 21:37:04 2
基於多級邏輯回歸的點擊率預測方法和系統的製作方法
【專利摘要】本發明公開了一種基於多級邏輯回歸的點擊率預測方法和系統。該方法包括:特徵抽取步驟,通過對已獲得的點擊率數據進行分析,分析對點擊率有影響的因素,從中選取特徵向量,構建特徵模型;模型訓練步驟,使用多級邏輯回歸模型,對特徵模型進行機器學習,得到預測模型;點擊率預測步驟:使用預測模型對待預測點擊率數據進行預測。本發明通過多級邏輯回歸,能夠在維度不變以及樣本數量不變的前提下,減少運算量,提高運算速度,解決目前點擊率預測中數據量大、預測不準確的問題。
【專利說明】基於多級邏輯回歸的點擊率預測方法和系統
【技術領域】
[0001]本發明涉及網際網路大數據機器學習處理領域,尤其涉及一種基於多級邏輯回歸的點擊率預測的方法和系統。
【背景技術】
[0002]隨著全球信息化程度的提高,網際網路應用越來越普及,相對於傳統媒體的廣告,網際網路廣告所佔比重越來越大。近年來隨著網路遊戲、電子商務的興起以及重視長尾流量的網盟發展,廣告商對網絡廣告產生的實際效果越來越受到關注。通過對廣告連結的點擊率進行統計計算,可以了解不同用戶感興趣的廣告,從而向每個用戶更精準的展示對應的廣告,以提高廣告的點擊率,改善廣告投放效果和頁面的訪問量。所謂點擊率,又叫CTR (Click-through Rate),或者CR (Clicks Ratio),是一個比值,即連結點擊數量/連結展示數量。對於廣告連結來講,其點擊率通常反映了該廣告的投送質量。對廣告平臺來講,如果能夠根據用戶的網絡瀏覽或搜索行為,以及頁面的內容的等預測出備選廣告的點擊率,則能夠衡量每次廣告投放的質量,對點擊率預測值較高的廣告進行投放,從而提高廣告的轉化率(ROI)。
[0003]目前預測點擊率的方法通常都要首先選取對廣告點擊率有影響的因素來建立原始數據模型。影響廣告的點擊率的因素有很多種,例如廣告、媒體、受眾。每個因素本身又可細分多個方面。每個方面都可以看所一個維度數據,每個維度的樣本數據都是該維度在一段時間內的實際點擊率,因此多維度的樣本數據是海量的。這就導致在預測點擊率時,要面對計算量太大的問題。目前為了解決這一問題,在點擊率預測時一般都會採用減少維度或者減少樣本數量的方法進行降維處理,從而減少計算量。但由於減少了樣本維度或者樣本數量,從而影響了預測結果的準確性。
【發明內容】
[0004]本發明提供了一種基於多級邏輯回歸的點擊率的預測方法和系統,通過多級邏輯回歸,在維度不變以及樣本數量不變的前提下,減少運算量,以解決目前點擊率預測中數據量大、預測不準確的問題。
[0005]根據本發明的一個方面,提供了一種基於多級邏輯回歸的點擊率預測方法,該方法包括:
[0006]特徵抽取步驟,通過對已獲得的點擊率數據進行分析,分析對點擊率有影響的因素,從中選取特徵向量,構建特徵模型;
[0007]模型訓練步驟,使用多級邏輯回歸模型,對特徵模型進行多級邏輯回歸機器學習,得到預測模型;
[0008]點擊率預測步驟:使用預測模型對待預測點擊率數據進行預測。
[0009]根據本發明的另一方面,提供了一種基於多級邏輯回歸的點擊率預測系統,該系統包括:[0010]特徵抽取裝置,用於通過對已獲得的點擊率數據進行分析,分析對點擊率有影響的因素,從中選取特徵向量,構建特徵模型;
[0011]模型訓練裝置,用於使用多級邏輯回歸模型,對特徵模型進行多級邏輯回歸機器學習,得到預測模型;
[0012]點擊率預測裝置:用於使用預測模型對待預測點擊率數據進行預測。
[0013]與現有技術相比,本發明的方法提供了多級邏輯回歸的方法,提高了點擊率預測的準確度和效率。具體應用在廣告領域,可以使廣告得到更精準的投放。本發明用的點擊率預測方法並不是適用於廣告領域,還可應用於其他大數據檢索預測領域。
【專利附圖】
【附圖說明】
[0014]圖1為本發明實施例進行多級邏輯回歸點擊率預測的方法。
【具體實施方式】
[0015]以下結合附圖及實施例來詳細說明本發明的實施方式,藉此對本發明解決的技術問題、採用的技術手段,並達到的技術效果能充分說明。需要說明的是,只要不構成衝突,本發明中的各個實施例以及各實施例的各特徵可以相互結合,所形成的技術方案均在本發明的保護範圍之內。
[0016]實施例1
[0017]如圖1所示,本發明實施例的基於多級邏輯回歸的點擊率預測方法主要包括如下步驟:
[0018]特徵抽取步驟,通過對已獲得的點擊率數據進行分析,分析對點擊率有影響的因素,從中選取特徵向量,構建特徵模型;
[0019]模型訓練步驟,使用多級邏輯回歸模型,對特徵模型進行多級邏輯回歸機器學習,得到預測模型;以及
[0020]點擊率預測步驟:使用預測模型對待預測點擊率數據進行預測。
[0021]其中,影響點擊率的因素有多種,最主要的包括:廣告、媒體、受眾。本發明優選使用如下模型構建點擊率特徵模型:
[0022]μ (a, u, c) = p (click | a, u, c)
[0023]其中,a:代表廣告,u:代表受眾,c:代表媒體
[0024]其中在模型訓練步驟中,優選使用下面多級邏輯回歸模型:
[0025]P (click I a, U,c) = σ (WtX)
[0026]其中,Wt:表示η維特徵權重向量(參數),χ:表示η維特徵向量
[0027]其中在多級邏輯回歸模型中,優選使用下面邏輯回歸函數:
[0028]σ(t)=1/1+et[0029]其中,模型訓練步驟中的多級邏輯回歸機器學習步驟包括:
[0030]自身邏輯回歸計算步驟:對特徵模型中的N維特徵向量進行自身的邏輯回歸計算,得到該維特徵向量的回歸值;
[0031]其中N的大小根據具體數據特點和自身需要而確定;[0032]中間邏輯回歸計算步驟:選取M個第一級回歸值進行中間級計算,其中M〈N ;
[0033]其中該步驟可以根據實際需要進行多次運算,每一次都將上一級的輸出作為下一級的輸入進行邏輯回歸運算。每一次邏輯回歸運算都會降低數據維度,減少下一次運算的
運算量。
[0034]以及最終邏輯回歸計算步驟:將中間級回歸運算的中間值作為最後一級的回歸運算的輸入,最後得到點擊率的預測值。
[0035]實施例2
[0036]本發明實施例的基於多級邏輯回歸的點擊率預測系統主要包括如下:
[0037]特徵抽取裝置,用於通過對已獲得的點擊率數據進行分析,分析對點擊率有影響的因素,從中選取特徵向量,構建特徵模型;
[0038]模型訓練裝置,用於使用多級邏輯回歸模型,對特徵模型進行多級邏輯回歸機器學習,得到預測模型;以及
[0039]點擊率預測裝置:使用預測模型對待預測點擊率數據進行預測。
[0040]其中,影響點擊率的因素有多種,最主要的包括:廣告、媒體、受眾。本發明優選使用如下模型構建點擊率特徵模型:
[0041]μ (a, u, c) = p (click | a, u, c)
[0042]其中,a:代表廣告,u:代表受眾,c:代表媒體
[0043]其中在模型訓練裝置中,優選使用下面的多級邏輯回歸模型:
[0044]P (click I a, U,c) = σ (WtX)
[0045]其中,Wt:表示η維特徵權重向量(參數),χ:表示η維特徵向量
[0046]其中在多級邏輯回歸模型中,優選使用下面邏輯回歸函數:
[0047]
【權利要求】
1.一種基於多級邏輯回歸的點擊率預測方法,其特徵在於:該方法包括如下步驟: 特徵抽取步驟,通過對已獲得的點擊率數據進行分析,分析對點擊率有影響的因素,從中選取特徵向量,構建特徵模型; 模型訓練步驟,使用多級邏輯回歸模型,對特徵模型進行多級邏輯回歸機器學習,得到預測模型;以及 點擊率預測步驟:使用預測模型對待預測點擊率數據進行預測。
2.如權利要求1所述的預測方法,其特徵在於:所述特徵抽取步驟中的特徵模型為:μ (a, u, c) = p (click I a, u, c),其中,a代表廣告,u代表受眾,c代表媒體,p O為多級邏輯回歸模型,有P (click I a, U,c) = σ (WtX),其中Wt表示η維特徵權重向量,χ表示η維特徵向量,σ 為邏輯回歸函數,有σ(?)
\ + e
3.如權利要求1所述的預測方法,其特徵在於:所述特徵抽取步驟中的多級邏輯回歸機器學習的步驟包括: 自身邏輯回歸計算步驟,對特徵模型中的N維特徵向量進行自身的邏輯回歸計算,得到該維特徵向量的回歸值; 中間邏輯回歸計算步驟,選取M個第一級回歸值進行中間級計算,其中M〈N;以及最終邏輯回歸計算步驟,將中間級回歸運算的中間值做為最後一級的回歸運算的輸入,最後得到點擊率的預測值。
4.如權利要求5所述的預測方法,其特徵在於:所述中間邏輯回歸計算步驟中的中間級計算可以根據實際需要進行多次運算,每一次都將上一級的輸出作為下一級的輸入進行邏輯回歸運算。
5.一種基於多級邏輯回歸的點擊率預測系統,其特徵在於:該系統包括如下裝置: 特徵抽取裝置,用於通過對已獲得的點擊率數據進行分析,分析對點擊率有影響的因素,從中選取特徵向量,構建特徵模型; 模型訓練裝置,用於使用多級邏輯回歸模型,對特徵模型進行多級邏輯回歸機器學習,得到預測模型;以及 點擊率預測裝置:用於使用預測模型對待預測點擊率數據進行預測。
6.如權利要求5所述的預測系統,其特徵在於:所述特徵模型為:μ(a,u,c)=P (click I a,u,c),其中,a代表廣告,u代表受眾,c代表媒體,p O為多級邏輯回歸模型,有P (click I a, u, c) = σ (WtX),其中Wt表示η維特徵權重向量,χ表示η維特徵向量,σ 為邏輯回歸函數,有σ(0= I。
7.如權利要求5所述的預測系統,其特徵在於:所述模型訓練裝置包括多級邏輯回歸機器學習裝置,該多級邏輯回歸機器學習裝置包括: 自身邏輯回歸計算裝置,用於對特徵模型中的N維特徵向量進行自身的邏輯回歸計算,得到該維特徵向量的回歸值; 中間邏輯回歸計算裝置:用於選取M個第一級回歸值進行中間級計算,其中Μ〈Ν; 最終邏輯回歸計算裝置:用於將中間級回歸運算的中間值做為最後一級的回歸運算的輸入,最後得到點擊率的預測值。
8.如權利要求7所述的預測系統,其特徵在於:所述中間邏輯回歸計算裝置可以根據實際需要進行多次運算,每一次都將上一級的輸出作為下一級的輸入進行邏輯回歸運算。
【文檔編號】G06F17/30GK103761266SQ201410001103
【公開日】2014年4月30日 申請日期:2014年1月2日 優先權日:2014年1月2日
【發明者】崔晶晶, 林佳婕, 李春華, 受春柏, 劉立娜 申請人:北京集奧聚合網絡技術有限公司