新四季網

基於多級邏輯回歸的點擊率預測方法和系統的製作方法

2023-10-05 21:37:04

基於多級邏輯回歸的點擊率預測方法和系統的製作方法
【專利摘要】本發明公開了一種基於多級邏輯回歸的點擊率預測方法和系統。該方法包括:特徵抽取步驟,通過對已獲得的點擊率數據進行分析,分析對點擊率有影響的因素,從中選取特徵向量,構建特徵模型;模型訓練步驟,使用多級邏輯回歸模型,對特徵模型進行機器學習,得到預測模型;點擊率預測步驟:使用預測模型對待預測點擊率數據進行預測。本發明通過多級邏輯回歸,能夠在維度不變以及樣本數量不變的前提下,減少運算量,提高運算速度,解決目前點擊率預測中數據量大、預測不準確的問題。
【專利說明】基於多級邏輯回歸的點擊率預測方法和系統
【技術領域】
[0001]本發明涉及網際網路大數據機器學習處理領域,尤其涉及一種基於多級邏輯回歸的點擊率預測的方法和系統。
【背景技術】
[0002]隨著全球信息化程度的提高,網際網路應用越來越普及,相對於傳統媒體的廣告,網際網路廣告所佔比重越來越大。近年來隨著網路遊戲、電子商務的興起以及重視長尾流量的網盟發展,廣告商對網絡廣告產生的實際效果越來越受到關注。通過對廣告連結的點擊率進行統計計算,可以了解不同用戶感興趣的廣告,從而向每個用戶更精準的展示對應的廣告,以提高廣告的點擊率,改善廣告投放效果和頁面的訪問量。所謂點擊率,又叫CTR (Click-through Rate),或者CR (Clicks Ratio),是一個比值,即連結點擊數量/連結展示數量。對於廣告連結來講,其點擊率通常反映了該廣告的投送質量。對廣告平臺來講,如果能夠根據用戶的網絡瀏覽或搜索行為,以及頁面的內容的等預測出備選廣告的點擊率,則能夠衡量每次廣告投放的質量,對點擊率預測值較高的廣告進行投放,從而提高廣告的轉化率(ROI)。
[0003]目前預測點擊率的方法通常都要首先選取對廣告點擊率有影響的因素來建立原始數據模型。影響廣告的點擊率的因素有很多種,例如廣告、媒體、受眾。每個因素本身又可細分多個方面。每個方面都可以看所一個維度數據,每個維度的樣本數據都是該維度在一段時間內的實際點擊率,因此多維度的樣本數據是海量的。這就導致在預測點擊率時,要面對計算量太大的問題。目前為了解決這一問題,在點擊率預測時一般都會採用減少維度或者減少樣本數量的方法進行降維處理,從而減少計算量。但由於減少了樣本維度或者樣本數量,從而影響了預測結果的準確性。

【發明內容】

[0004]本發明提供了一種基於多級邏輯回歸的點擊率的預測方法和系統,通過多級邏輯回歸,在維度不變以及樣本數量不變的前提下,減少運算量,以解決目前點擊率預測中數據量大、預測不準確的問題。
[0005]根據本發明的一個方面,提供了一種基於多級邏輯回歸的點擊率預測方法,該方法包括:
[0006]特徵抽取步驟,通過對已獲得的點擊率數據進行分析,分析對點擊率有影響的因素,從中選取特徵向量,構建特徵模型;
[0007]模型訓練步驟,使用多級邏輯回歸模型,對特徵模型進行多級邏輯回歸機器學習,得到預測模型;
[0008]點擊率預測步驟:使用預測模型對待預測點擊率數據進行預測。
[0009]根據本發明的另一方面,提供了一種基於多級邏輯回歸的點擊率預測系統,該系統包括:[0010]特徵抽取裝置,用於通過對已獲得的點擊率數據進行分析,分析對點擊率有影響的因素,從中選取特徵向量,構建特徵模型;
[0011]模型訓練裝置,用於使用多級邏輯回歸模型,對特徵模型進行多級邏輯回歸機器學習,得到預測模型;
[0012]點擊率預測裝置:用於使用預測模型對待預測點擊率數據進行預測。
[0013]與現有技術相比,本發明的方法提供了多級邏輯回歸的方法,提高了點擊率預測的準確度和效率。具體應用在廣告領域,可以使廣告得到更精準的投放。本發明用的點擊率預測方法並不是適用於廣告領域,還可應用於其他大數據檢索預測領域。
【專利附圖】

【附圖說明】
[0014]圖1為本發明實施例進行多級邏輯回歸點擊率預測的方法。
【具體實施方式】
[0015]以下結合附圖及實施例來詳細說明本發明的實施方式,藉此對本發明解決的技術問題、採用的技術手段,並達到的技術效果能充分說明。需要說明的是,只要不構成衝突,本發明中的各個實施例以及各實施例的各特徵可以相互結合,所形成的技術方案均在本發明的保護範圍之內。
[0016]實施例1
[0017]如圖1所示,本發明實施例的基於多級邏輯回歸的點擊率預測方法主要包括如下步驟:
[0018]特徵抽取步驟,通過對已獲得的點擊率數據進行分析,分析對點擊率有影響的因素,從中選取特徵向量,構建特徵模型;
[0019]模型訓練步驟,使用多級邏輯回歸模型,對特徵模型進行多級邏輯回歸機器學習,得到預測模型;以及
[0020]點擊率預測步驟:使用預測模型對待預測點擊率數據進行預測。
[0021]其中,影響點擊率的因素有多種,最主要的包括:廣告、媒體、受眾。本發明優選使用如下模型構建點擊率特徵模型:
[0022]μ (a, u, c) = p (click | a, u, c)
[0023]其中,a:代表廣告,u:代表受眾,c:代表媒體
[0024]其中在模型訓練步驟中,優選使用下面多級邏輯回歸模型:
[0025]P (click I a, U,c) = σ (WtX)
[0026]其中,Wt:表示η維特徵權重向量(參數),χ:表示η維特徵向量
[0027]其中在多級邏輯回歸模型中,優選使用下面邏輯回歸函數:
[0028]σ(t)=1/1+et[0029]其中,模型訓練步驟中的多級邏輯回歸機器學習步驟包括:
[0030]自身邏輯回歸計算步驟:對特徵模型中的N維特徵向量進行自身的邏輯回歸計算,得到該維特徵向量的回歸值;
[0031]其中N的大小根據具體數據特點和自身需要而確定;[0032]中間邏輯回歸計算步驟:選取M個第一級回歸值進行中間級計算,其中M〈N ;
[0033]其中該步驟可以根據實際需要進行多次運算,每一次都將上一級的輸出作為下一級的輸入進行邏輯回歸運算。每一次邏輯回歸運算都會降低數據維度,減少下一次運算的
運算量。
[0034]以及最終邏輯回歸計算步驟:將中間級回歸運算的中間值作為最後一級的回歸運算的輸入,最後得到點擊率的預測值。
[0035]實施例2
[0036]本發明實施例的基於多級邏輯回歸的點擊率預測系統主要包括如下:
[0037]特徵抽取裝置,用於通過對已獲得的點擊率數據進行分析,分析對點擊率有影響的因素,從中選取特徵向量,構建特徵模型;
[0038]模型訓練裝置,用於使用多級邏輯回歸模型,對特徵模型進行多級邏輯回歸機器學習,得到預測模型;以及
[0039]點擊率預測裝置:使用預測模型對待預測點擊率數據進行預測。
[0040]其中,影響點擊率的因素有多種,最主要的包括:廣告、媒體、受眾。本發明優選使用如下模型構建點擊率特徵模型:
[0041]μ (a, u, c) = p (click | a, u, c)
[0042]其中,a:代表廣告,u:代表受眾,c:代表媒體
[0043]其中在模型訓練裝置中,優選使用下面的多級邏輯回歸模型:
[0044]P (click I a, U,c) = σ (WtX)
[0045]其中,Wt:表示η維特徵權重向量(參數),χ:表示η維特徵向量
[0046]其中在多級邏輯回歸模型中,優選使用下面邏輯回歸函數:
[0047]
【權利要求】
1.一種基於多級邏輯回歸的點擊率預測方法,其特徵在於:該方法包括如下步驟: 特徵抽取步驟,通過對已獲得的點擊率數據進行分析,分析對點擊率有影響的因素,從中選取特徵向量,構建特徵模型; 模型訓練步驟,使用多級邏輯回歸模型,對特徵模型進行多級邏輯回歸機器學習,得到預測模型;以及 點擊率預測步驟:使用預測模型對待預測點擊率數據進行預測。
2.如權利要求1所述的預測方法,其特徵在於:所述特徵抽取步驟中的特徵模型為:μ (a, u, c) = p (click I a, u, c),其中,a代表廣告,u代表受眾,c代表媒體,p O為多級邏輯回歸模型,有P (click I a, U,c) = σ (WtX),其中Wt表示η維特徵權重向量,χ表示η維特徵向量,σ 為邏輯回歸函數,有σ(?)


\ + e
3.如權利要求1所述的預測方法,其特徵在於:所述特徵抽取步驟中的多級邏輯回歸機器學習的步驟包括: 自身邏輯回歸計算步驟,對特徵模型中的N維特徵向量進行自身的邏輯回歸計算,得到該維特徵向量的回歸值; 中間邏輯回歸計算步驟,選取M個第一級回歸值進行中間級計算,其中M〈N;以及最終邏輯回歸計算步驟,將中間級回歸運算的中間值做為最後一級的回歸運算的輸入,最後得到點擊率的預測值。
4.如權利要求5所述的預測方法,其特徵在於:所述中間邏輯回歸計算步驟中的中間級計算可以根據實際需要進行多次運算,每一次都將上一級的輸出作為下一級的輸入進行邏輯回歸運算。
5.一種基於多級邏輯回歸的點擊率預測系統,其特徵在於:該系統包括如下裝置: 特徵抽取裝置,用於通過對已獲得的點擊率數據進行分析,分析對點擊率有影響的因素,從中選取特徵向量,構建特徵模型; 模型訓練裝置,用於使用多級邏輯回歸模型,對特徵模型進行多級邏輯回歸機器學習,得到預測模型;以及 點擊率預測裝置:用於使用預測模型對待預測點擊率數據進行預測。
6.如權利要求5所述的預測系統,其特徵在於:所述特徵模型為:μ(a,u,c)=P (click I a,u,c),其中,a代表廣告,u代表受眾,c代表媒體,p O為多級邏輯回歸模型,有P (click I a, u, c) = σ (WtX),其中Wt表示η維特徵權重向量,χ表示η維特徵向量,σ 為邏輯回歸函數,有σ(0= I。
7.如權利要求5所述的預測系統,其特徵在於:所述模型訓練裝置包括多級邏輯回歸機器學習裝置,該多級邏輯回歸機器學習裝置包括: 自身邏輯回歸計算裝置,用於對特徵模型中的N維特徵向量進行自身的邏輯回歸計算,得到該維特徵向量的回歸值; 中間邏輯回歸計算裝置:用於選取M個第一級回歸值進行中間級計算,其中Μ〈Ν; 最終邏輯回歸計算裝置:用於將中間級回歸運算的中間值做為最後一級的回歸運算的輸入,最後得到點擊率的預測值。
8.如權利要求7所述的預測系統,其特徵在於:所述中間邏輯回歸計算裝置可以根據實際需要進行多次運算,每一次都將上一級的輸出作為下一級的輸入進行邏輯回歸運算。
【文檔編號】G06F17/30GK103761266SQ201410001103
【公開日】2014年4月30日 申請日期:2014年1月2日 優先權日:2014年1月2日
【發明者】崔晶晶, 林佳婕, 李春華, 受春柏, 劉立娜 申請人:北京集奧聚合網絡技術有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀