一種預估網絡廣告效果的方法及系統的製作方法
2023-05-30 13:19:26
專利名稱:一種預估網絡廣告效果的方法及系統的製作方法
技術領域:
本發明涉及網絡技術領域,更具體地,涉及一種預估網絡廣告效果的方法及系統。
背景技術:
網絡廣告稱為在線廣告或者網際網路廣告,是以計算機為核心,計算機網絡為媒介 的廣告行為。網絡廣告效果預估結果的高低,與該網絡廣告的直接收益有著密切的聯繫。現 有廣告效果預估方法是一種以經驗為主的預估方法,即根據廣告位在前一個預測周期內的 實際效果數據,取其平均值作為下一個預測周期的預估結果。比如在11月底,想要預估12月份的某一廣告位的曝光數。曝光數是統計周期內, 用戶瀏覽網站頁面的總次數,重複訪問則重複統計。以經驗為主的預估方法是將11月份的 該廣告位每天的曝光數相加,然後求平均作為12月份該廣告位曝光的預估效果。實際上就 是利用廣告位近期的效果估算下一個周期的效果。然而,影響廣告投放效果的因素有很多,在不同周期內影響因素是不一樣的,僅僅 根據廣告位在前一預測周期內的實際效果數據無法對下一周期內的效果做出準確的預估。 另外,以經驗為主的預估方法對同一廣告位上的不同廣告,得到的是單一的預估結果,無法 根據不同的投放條件做出不同的效果預估。
發明內容
本發明實施例提出一種預估網絡廣告效果的方法,可以對廣告投放效果做出高精 度預測且預估結果是多樣化的。本發明實施例還提出一種預估網絡廣告效果的系統,可以對廣告投放效果做出高 精度預測且預估結果是多樣化的。本發明實施例的技術方案如下一種預估網絡廣告效果的方法,該方法包括將原始數據依據廣告效果影響因子進行分類;從廣告效果影響因子中提取廣告效果影響子因子;依據廣告效果影響子因子,採用回歸分析和重抽樣算法Bagging建立至少於一個 預估模型;由交叉驗證方法從預估模型中選擇出最佳預估模型;利用最佳預估模型對下一預測周期內的廣告效果進行預估,得到廣告預估效果。所述交叉驗證算法是十折交叉驗證算法。所述廣告效果影響因子包括廣告位屬性、廣告屬性、日期因子、廣告主屬性、用戶 屬性、歷史效果數據屬性、突發事件和偶然因子。所述回歸分析方法包括保序回歸IsotonicRegression、回歸剪枝樹REPTree和局 部力口權回歸 Locally weighted learning。所述將原始數據依據廣告效果影響因子進行分類與所述從廣告效果影響因子提取廣告效果影響子因子之間進一步包括,對分類後的原始數據進行預處理。所述預處理包括利用預估廣告位上一周期內的效果數據的平均值替代缺失或錯 誤數據。所述預處理包括對數據進行平滑處理,得到缺失或錯誤數據。所述得到廣告預估效果後進一步包括,根據廣告預估效果安排不同廣告的投放時 間。所述得到廣告預估效果後進一步包括,根據廣告預估效果和實際效果發現原始數 據的錯誤,對原始數據進行校正。一種預估網絡廣告效果的系統,該系統包括數據模塊,將原始數據依據廣告效果影響因子進行分類。特徵模塊,從廣告效果影響因子中提取廣告效果影響子因子。模型模塊,依據廣告效果影響子因子,採用回歸分析和重抽樣算法Bagging建立 至少一個預估模型,由交叉驗證方法從預估模型中選擇出最佳預估模型,利用最佳預估模 型對下一預測周期內的廣告效果進行預估,得到廣告預估效果。所述模型模塊由十折交叉驗證方法從預估模型中選擇出最佳預估模型。所述系統進一步包括預處理模塊,對分類後的原始數據進行預處理。所述預處理模塊包括替代單元,利用預估廣告位上一周期內的效果數據的平均值 替代預設或錯誤數據。所述預處理模塊包括平滑處理單元,對數據進行平滑處理,得到缺失或錯誤數據。所述系統進一步包括分析模塊,對預處理後的廣告效果因子進行分析,為廣告產 品的設計,廣告創意的設計提供支持;排期模塊,根據廣告預估效果安排不同廣告的投放時間;監控模塊,根據廣告預估效果和實際效果發現原始數據的錯誤,對原始數據進行 校正。從上述技術方案中可以看出,在本發明實施例中,將原始數據依據廣告效果影響 因子進行分類;從廣告效果影響因子中提取廣告效果影響子因子;依據廣告效果影響子因 子,採用回歸分析和重抽樣算法Bagging建立不少於一個預估模型;由十折交叉驗證方法 從預估模型中選擇出最佳預估模型;利用最佳預估模型對下一預測周期內的廣告效果進行 預估,得到廣告預估效果。由不同的廣告效果影響因子建模可以對廣告投放效果做出高精 度預測,且輸入不同的廣告效果影響因子有不同的預估結果。
圖1為本發明實施例一種預估網絡廣告效果的方法中模型選擇示意圖;圖2為本發明實施例中廣告效果影響因子的分類示意圖;圖3為本發明實施例一種預估網絡廣告效果的方法流程示意圖;圖4為本發明實施例一種預估網絡廣告效果的結構示意圖。
具體實施例方式為使本發明的目的、技術方案和優點表達得更加清楚明白,下面結合附圖及具體實施例對本發明再作進一步詳細的說明。在本發明實施例中,通過分析不同廣告效果影響因子與廣告效果之間的相關性, 提取出相關性大的影響因子作為預估模型的建模欄位,採用回歸分析的方法建立廣告效果 預估模型,對廣告的曝光量和點擊量進行有效預測。從而提高廣告效果的預估精度,並針對 不同的投放條件自動產生不同的預估效果。參見附圖1,廣告效果預估模型的構建共採用了三種回歸分析方法,分別是保序回 歸(IsotonicRegression)、回歸剪枝樹(REPTree)以及局部加權回歸(Locally weighted learning) 0具體模型的訓練採用了重抽樣算法(Bagging)的方法,即針對某一學習算法, 讓該學習算法訓練多輪,每輪的訓練數據由從初始的訓練數據集中隨機採樣組成,每次採 樣固定比例的樣本,訓練之後得到一個預估函數序列,最終的預估函數採用簡單平均方法 對示例進行預測。同時,本發明中利用十折交叉驗證方法對模型的參數進行選擇,最後從所 有的模型中選擇出一個最優的模型作為最佳預估模型。當然也可以利用多種交叉驗證方法 對模型的參數進行選擇,例如,九折交叉驗證方法,八折交叉驗證方法等。如圖2所示,在本發明中廣告效果影響因子包括,廣告位屬性、廣告屬性、日期因 子、廣告主屬性、用戶屬性、歷史效果數據屬性、突發事件和偶然因子。每個廣告效果影響因 子又包括多個廣告效果影響子因子。廣告位屬性包括,廣告位大小、廣告位資源級別、廣告位所屬頻道及頻道的曝光數 據、廣告位分類、廣告位的輪播數、廣告位位置。廣告屬性包括,廣告播放類型、廣告輪播數、廣告的播出時間、是否彈出廣告、廣告 創意屬性(代言明星數、主色系、有無獎品吸引、互動、創意格式、清晰度、價格/促銷/獎 品、產品賣點/品牌特性、創意大小)。日期相關因子包括,是否工作日、是否農曆節假日、是否陽曆節假日、是否西方節 日、季節性因子。廣告主屬性包括,廣告主所屬行業、廣告主在行業中的排名。用戶屬性包括,年齡、性別、地理、上網場景、時段、行為。歷史效果數據屬性包括,前η天的歷史效果數據、周同期歷史數據、月同期歷史數 據。突發事件和偶然因子包括,網站及頁面改版、重大社會事件(如高考、兩會等)。參見附圖3,是本發明實施例一種預估網絡廣告效果的方法流程示意圖,該方法具 體包括以下步驟步驟301、對所有收集到的數據按照廣告效果影響因子分類。將數據按照廣告位屬 性、廣告屬性、日期因子、廣告主屬性、用戶屬性、歷史效果數據屬性、突發事件和偶然因子 分類。 步驟302、對分類後的數據預處理。由於監測錯誤或數據缺失等原因,首先需要對 原始數據進行預處理,減少噪音數據對整個模型預估精度的影響。數據預處理主要包括以下兩種情況a)由於故障導致的數據缺失或者數據錯誤,則利用預估廣告位上一周期內的效果 數據的平均值替代缺失或錯誤數據。b)對於未知原因的數據跳變進行平滑處理。
平滑處理的公式如下
『avgPV-stdPV, PV < avgPV-stdPV
權利要求
1.一種預估網絡廣告效果的方法,其特徵在於,該方法包括將原始數據依據廣告效果影響因子進行分類;從廣告效果影響因子中提取廣告效果影響子因子;依據廣告效果影響子因子,採用回歸分析和重抽樣算法Bagging建立至少一個預估模型;由交叉驗證方法從預估模型中選擇出最佳預估模型;利用最佳預估模型對下一預測周期內的廣告效果進行預估,得到廣告預估效果。
2.根據權利要求1所述預估網絡廣告效果的方法,其特徵在於,所述交叉驗證算法是 十折交叉驗證算法。
3.根據權利要求1所述預估網絡廣告效果的方法,其特徵在於,所述廣告效果影響因 子包括廣告位屬性、廣告屬性、日期因子、廣告主屬性、用戶屬性、歷史效果數據屬性、突發 事件和偶然因子。
4.根據權利要求1所述預估網絡廣告效果的方法,其特徵在於,所述回歸分析方法包 括保序回歸IsotonicRegression、回歸剪枝樹REPTree和局部加權回歸Locally weighted learning。
5.根據權利要求1所述預估網絡廣告效果的方法,其特徵在於,所述將原始數據依據 廣告效果影響因子進行分類與所述從廣告效果影響因子提取廣告效果影響子因子之間進 一步包括,對分類後的原始數據進行預處理。
6.根據權利要求5所述預估網絡廣告效果的方法,其特徵在於,所述預處理包括利用 預估廣告位上一周期內的效果數據的平均值替代缺失或錯誤數據。
7.根據權利要求5所述預估網絡廣告效果的方法,其特徵在於,所述預處理包括對數 據進行平滑處理,得到缺失或錯誤數據。
8.根據權利要求1至7中任意一項權利要求所述預估網絡廣告效果的方法,其特徵在 於,所述得到廣告預估效果後進一步包括,根據廣告預估效果安排不同廣告的投放時間;根據廣告預估效果和實際效果發現原始數據的錯誤,對原始數據進行校正。
9.一種預估網絡廣告效果的系統,其特徵在於,該系統包括數據模塊,將原始數據依據廣告效果影響因子進行分類;特徵模塊,從廣告效果影響因子中提取廣告效果影響子因子;模型模塊,依據廣告效果影響子因子,採用回歸分析和重抽樣算法Bagging建立至少 一個預估模型,由交叉驗證方法從預估模型中選擇出最佳預估模型,利用最佳預估模型對 下一預測周期內的廣告效果進行預估,得到廣告預估效果。
10.根據權利要求9所述預估網絡廣告效果的系統,其特徵在於,所述模型模塊由十折 交叉驗證方法從預估模型中選擇出最佳預估模型。
11.根據權利要求9所述預估網絡廣告效果的系統,其特徵在於,所述系統進一步包括 預處理模塊,對分類後的原始數據進行預處理。
12.根據權利要求11所述所述預估網絡廣告效果的系統,其特徵在於,所述預處理模 塊包括替代單元,利用預估廣告位上一周期內的效果數據的平均值替代預設或錯誤數據。
13.根據權利要求11所述所述預估網絡廣告效果的系統,其特徵在於,所述預處理模 塊包括平滑處理單元,對數據進行平滑處理,得到缺失或錯誤數據。
14.根據權利要求10所述預估網絡廣告效果的系統,其特徵在於,所述系統進一步包 括排期模塊,根據廣告預估效果安排不同廣告的投放時間;監控模塊,根據廣告預估效果和實際效果發現原始數據的錯誤,對原始數據進行校正;分析模塊,對預處理後的廣告效果因子進行分析,為廣告產品的設計,廣告創意的設計 提供支持。
全文摘要
一種預估網絡廣告效果的方法,該方法包括將原始數據依據廣告效果影響因子進行分類;從廣告效果影響因子中提取廣告效果影響子因子;依據廣告效果影響子因子,採用回歸分析和重抽樣算法Bagging建立不少於一個預估模型;由十折交叉驗證方法從預估模型中選擇出最佳預估模型;利用最佳預估模型對下一預測周期內的廣告效果進行預估,得到廣告預估效果。本文還公開了一種預估網絡廣告效果的系統。應用本發明實施例以後,可以對廣告投放效果做出高精度預測且預估結果是多樣化的。
文檔編號G06Q30/00GK102110265SQ20091026205
公開日2011年6月29日 申請日期2009年12月23日 優先權日2009年12月23日
發明者劉大鵬, 葉幸春, 嶽亞丁, 李多全, 李邕, 肖磊, 言豔花, 貢鳴, 賴曉平, 陳顯露, 陳永鋒, 黃華基 申請人:深圳市騰訊計算機系統有限公司