新四季網

一種移動網際網路廣告投放方法與流程

2023-06-16 13:08:06 2

本發明涉及機器學習領域,特別是涉及一種移動網際網路廣告投放方法。



背景技術:

移動網際網路廣告主要採用廣告橫幅、文本連結、多媒體等方式,通過網絡廣告平臺在移動智能終端上投放廣告。隨著移動網際網路技術的迅速發展,與傳統媒體廣告如報紙、雜誌、電視、廣播以及戶外廣告相比,移動網際網路廣告具有得天獨厚的優勢。然而,目前很多廣告都是隨機投放的,即每次用戶來了,隨機選擇一個廣告投放給他,投放效率很低。同時,隨意投放的廣告幹擾了用戶正常的生活,普遍引起用戶的反感。面對這種情況,移動網際網路廣告的個性化精準投放受到了研究者的廣泛關注。

在網際網路廣告投放平臺方面,百度聯盟推出了「按效果付費」的cpa(costperaction)廣告平臺。微軟公司開發了microsoftadcenter廣告銷售平臺,在微軟的資源平臺上進行廣告投放。谷歌公司研發了googleadsense網絡廣告投放平臺,頁面上的廣告會隨著頁面內容的不同而有所不同,提高了廣告投放的精準度。相比谷歌的個性化廣告推薦系統,facebook利用海量的用戶數據和社交網絡關係建立的廣告投放系統,可以深入挖掘用戶興趣,通過朋友的推薦,幫助用戶找到相關性更高和更準確的廣告信息。除此之外,學術界和工業界在廣告的個性化精準投放方面上也取得了一些研究成果,例如:在考慮內容定向和地理位置的基礎上,採用貝葉斯技術進行移動廣告的高效、精準投放;通過對廣告日誌數據的統計分析,使用hadoop平臺挖掘廣告特徵與廣告間的聯繫,進而改善廣告的投放效果;研究表明,用戶更喜歡來自朋友的推薦而不是被系統「算出來的推薦」,社會影響力被認為比歷史行為的相似性更加重要,通過社會關係的分析,可以大幅度提高推薦的精確度;根據用戶的喜好進行廣告的推薦更有利於提高廣告的瀏覽率,並且更加容易讓用戶接受廣告推銷的產品;同時,用戶的興趣隨著時間的推移會逐漸發生變化,而用戶的活動呈現出明顯的本地化特徵,如果推薦附近用戶喜歡的廣告,將有利於提高廣告的轉化率。



技術實現要素:

本發明所要解決的技術問題是:考慮實際的移動應用環境,針對移動網際網路廣告發展的現狀、存在的問題,如何創新地設計一種綜合考慮用戶興趣、好友關係以及時間和位置上下文影響的移動網際網路廣告投放方法。

為了解決上述問題,本發明公開了一種移動網際網路廣告投放方法,其技術方案包括以下步驟:

步驟1:獲取用戶發布的微博文本數據,通過中文分詞和噪聲內容處理,創建詞彙表,得到表示用戶興趣的詞向量;

步驟2:利用用戶的社交網絡關係計算用戶之間的熟悉度,根據表示用戶興趣的詞向量空間計算用戶之間的興趣相似度,通過線性組合,得到用戶之間的相似度矩陣;

步驟3:獲取與用戶u最相似的前k個用戶對廣告的行為數據,得到「用戶-廣告」矩陣;根據用戶之間的相似度矩陣,採用基於用戶的協同過濾方法生成擬推薦的廣告列表l1;

步驟4:獲取用戶u的位置信息,從與用戶u最相似的前k個用戶中找出與用戶u在同一區域的n個用戶,其中n≤k;利用「用戶-廣告」矩陣,根據用戶之間的相似度矩陣,採用基於用戶的協同過濾方法再次對用戶u生成擬推薦的廣告列表l2;

步驟5:對兩個推薦列表l1和l2進行線性加權組合,得到擬推薦給任意用戶u的廣告列表l=θ×l1+(1-θ)×l2,θ∈(0,1)為線性組合係數;

步驟6:通過重複步驟1和步驟2,定期更新表示用戶興趣的詞向量空間和用戶相似度矩陣,以適應用戶興趣的變化。

所述的移動網際網路廣告投放方法,所述步驟1還包括:

步驟11:將累積一段時間的用戶微博文本數據整理成一個文檔;

步驟12:一個用戶只對應一個文檔,所有用戶的文檔形成一個文檔集合;

步驟13:中文分詞處理的具體方法可以採用基於字符串匹配的分詞方法即機械分詞方法、基於理解的分詞方法或者基於統計的分詞方法等;

步驟14:微博文本數據的噪聲內容處理包括對停用詞、標點字符的清理等;

步驟15:停用詞包括語氣介詞、助詞、連詞、副詞等虛詞,在中文分詞處理後需要過濾掉這些停用詞;

步驟16:一些標點符號、阿拉伯數字、網頁連結等文本分析時不需要的字符,需要在處理微博文本數據之前過濾清理掉;

步驟17:通過對文檔集合進行中文分詞和噪聲內容處理可以獲得詞彙表,詞彙表包含了文檔集合中的所有單詞但是不重複;

步驟18:通過對詞彙表操作得到表示用戶興趣的詞向量,詞向量的元素表示詞彙表中的詞彙在文檔中出現的頻率與其在文檔集合中出現頻率的倒數的乘積。

所述的移動網際網路廣告投放方法,所述步驟2還包括:

步驟21:用戶之間的熟悉度可以用微博上用戶之間的共同好友的比例來度量;

步驟22:根據表示用戶興趣的詞向量空間,採用餘弦相似公式或者皮爾遜相似公式計算用戶之間的興趣相似度;

步驟23:設用戶u和v之間的熟悉度為f,興趣相似度為h,則用戶u和v之間的相似度s=β×f+(1-β)×h,β∈(0,1)為線性組合係數,從而得到用戶之間的相似度矩陣。

所述的移動網際網路廣告投放方法,所述步驟3還包括:

步驟31:用戶對廣告產生的行為包括瀏覽、點擊和評論等,設用戶在最近一次時間t對任意廣告a產生過用戶行為,表示為c=1,而c=0表示用戶u從來沒有對廣告a產生過用戶行為;

步驟32:考慮時間對用戶行為的影響,即用戶當前的行為應該和用戶最近的行為關係更大,則用戶在當前時間t0對廣告a的用戶行為表示為c乘以一個時間衰減函數1/(1+λ×(t0-t)),λ∈(0,1)為權重係數,從而得到「用戶-廣告」矩陣,其值為用戶在當前時間對廣告的用戶行為;

步驟33:利用「用戶-廣告」矩陣,根據用戶之間的相似度矩陣,採用基於用戶的協同過濾方法對任意用戶u生成擬推薦的廣告列表l1。

所述的移動網際網路廣告投放方法,所述步驟4還包括:

步驟41:通過提取微博用戶的註冊信息,或者通過提取微博用戶經常發布微博時的ip地址,可以得到用戶的位置信息。

所述的移動網際網路廣告投放方法,所述步驟6還包括:

步驟61:通過及時獲取用戶發布的微博文本數據和社交網絡關係,重新計算表示用戶興趣的詞向量空間以及用戶之間的興趣相似度和熟悉度,從而更新用戶相似度矩陣。

與現有技術相比,本發明具有以下優點:

(1)根據用戶的喜好進行廣告的推薦有利於提高廣告的瀏覽率,並且更加容易讓用戶接受廣告推銷的產品。但是,由於用戶興趣隨著時間的推移會發生變化,因此,希望儘可能通過刻畫用戶當前的興趣以實現廣告的精準投放。本發明通過及時獲取用戶發布的微博文本數據和社交網絡關係,定期計算表示用戶興趣的詞向量空間以及用戶之間的興趣相似度和熟悉度,更新用戶相似度矩陣,從而生成能夠適應用戶興趣變化的廣告推薦列表;

(2)受時間效應的影響,廣告具有一定的生命周期。同樣,用戶對廣告的行為也具有時間效應,廣告剛推出時可能被很多用戶關注,但是,隨著時間推移,很多廣告逐漸被用戶淡忘。因此,本發明充分考慮了時間因素對用戶行為的影響,在計算「用戶-廣告」矩陣時,通過引入時間衰減函數對用戶行為進行了懲罰,從而儘可能將新近推出的而不是已經過時的廣告推薦給用戶;

(3)通常,用戶更加相信自己熟悉的好友的推薦。同時,根據用戶的喜好進行廣告的推薦有利於提高廣告的瀏覽率。本發明綜合考慮了以上兩個方面的影響,首先利用用戶的社交網絡關係計算用戶之間的熟悉度,然後根據表示用戶興趣的詞向量空間計算用戶之間的興趣相似度,最後通過線性組合,得到用戶之間的相似度矩陣;

(4)用戶通常在附近區域活動,如果推薦附近用戶喜歡的廣告,則用戶更有可能去消費。因此,本發明在計算最終的推薦列表時,除了考慮用戶興趣等因素,還考慮了位置的影響,強化了用戶活動的本地化特徵,將最有可能進行線下活動的廣告推薦給用戶,從而實現了線上線下的結合,提高了廣告的轉化率。

附圖說明

圖1為本發明的移動網際網路廣告投放方法的流程圖。

具體實施方式

下面結合附圖對本發明進行詳細說明。

如附圖1所示,本發明方法按照以下步驟進行:

步驟1:獲取用戶發布的微博文本數據,通過中文分詞和噪聲內容處理,創建詞彙表,得到表示用戶興趣的詞向量;

微博作為一種社交網絡平臺,用戶可以在上面發布自己感興趣的話題,也可以評論、轉發其他用戶的微博內容;一條微博一般包含了發布該微博的用戶id、用戶暱稱、微博id以及微博的文本、圖片、音頻等信息;通過微博開放平臺提供的應用程式編程接口以及各種程式語言的外部調用包可以獲取用戶的微博文本數據;將累積一段時間的用戶微博文本數據整理成一個文檔;一個用戶只對應一個文檔,所有用戶的文檔形成一個文檔集合;

在中文微博中,用戶發布的微博文本數據大多是由漢語句子構成,而漢語句子又是由多個漢語詞彙構成,漢語詞彙通常由兩個或者兩個以上的漢字組成;在對漢語句子進行分析時,需要將這些具有連續性的句子劃分成若干個部分,中文分詞處理就是將一個漢語句子序列切分為一個個單獨的詞彙的過程;中文分詞處理的具體方法可以採用基於字符串匹配的分詞方法即機械分詞方法、基於理解的分詞方法或者基於統計的分詞方法等;

微博文本數據的噪聲內容處理包括對停用詞、標點字符的清理等;一般情況下,用戶主要通過動詞、名詞以及形容詞等實詞來表達文本的中心思想和主要內容,而語氣介詞、助詞、連詞、副詞等虛詞雖然在文本數據中使用廣泛、出現頻率非常高,但是對於文本分析沒有太大的意義,這類詞語稱之為「停用詞」,因此在中文分詞處理後需要過濾掉這些停用詞;另外,還有一些標點符號、阿拉伯數字、網頁連結等文本分析時不需要的字符,需要在處理微博文本數據之前過濾清理掉;

通過對文檔集合進行中文分詞和噪聲內容處理可以獲得詞彙表,詞彙表包含了文檔集合中的所有單詞但是不重複;通過對詞彙表操作得到表示用戶興趣的詞向量,詞向量的元素表示詞彙表中的詞彙在文檔中出現的頻率與其在文檔集合中出現頻率的倒數的乘積。

步驟2:利用用戶的社交網絡關係計算用戶之間的熟悉度,根據表示用戶興趣的詞向量空間計算用戶之間的興趣相似度,通過線性組合,得到用戶之間的相似度矩陣;

用戶之間的熟悉度描述了用戶在現實社會中的熟悉程度,通常,用戶更加相信自己熟悉的好友的推薦,熟悉度可以用微博上用戶之間的共同好友的比例來度量;根據表示用戶興趣的詞向量空間,採用餘弦相似公式或者皮爾遜相似公式計算用戶之間的興趣相似度;設用戶u和v之間的熟悉度為f,興趣相似度為h,則用戶u和v之間的相似度s=β×f+(1-β)×h,β∈(0,1)為線性組合係數,從而得到用戶之間的相似度矩陣。

步驟3:獲取與用戶u最相似的前k個用戶對廣告的行為數據,得到「用戶-廣告」矩陣;根據用戶之間的相似度矩陣,採用基於用戶的協同過濾方法生成擬推薦的廣告列表l1;

用戶對廣告產生的行為包括瀏覽、點擊和評論等,設用戶在最近一次時間t對任意廣告a產生過用戶行為,表示為c=1,而c=0表示用戶u從來沒有對廣告a產生過用戶行為;考慮時間對用戶行為的影響,即用戶當前的行為應該和用戶最近的行為關係更大,則用戶在當前時間t0對廣告a的用戶行為表示為c乘以一個時間衰減函數1/(1+λ×(t0-t)),λ∈(0,1)為權重係數,從而得到「用戶-廣告」矩陣,其值為用戶在當前時間對廣告的用戶行為;利用「用戶-廣告」矩陣,根據用戶之間的相似度矩陣,採用基於用戶的協同過濾方法對任意用戶u生成擬推薦的廣告列表l1。

步驟4:獲取用戶u的位置信息,從與用戶u最相似的前k個用戶中找出與用戶u在同一區域的n個用戶,其中n≤k;利用「用戶-廣告」矩陣,根據用戶之間的相似度矩陣,採用基於用戶的協同過濾方法再次對用戶u生成擬推薦的廣告列表l2;

通過提取微博用戶的註冊信息,或者通過提取微博用戶經常發布微博時的ip地址,可以得到用戶的位置信息。

步驟5:對兩個推薦列表l1和l2進行線性加權組合,得到擬推薦給任意用戶u的廣告列表l=θ×l1+(1-θ)×l2,θ∈(0,1)為線性組合係數。

步驟6:通過重複步驟1和步驟2,定期更新表示用戶興趣的詞向量空間和用戶相似度矩陣,以適應用戶興趣的變化;

用戶最近的行為最能體現用戶當前的興趣,通過及時獲取用戶發布的微博文本數據和社交網絡關係,重新計算表示用戶興趣的詞向量空間以及用戶之間的興趣相似度和熟悉度,從而更新用戶相似度矩陣,生成適應用戶興趣變化的廣告推薦列表。

本領域的技術人員在不脫離權利要求書確定的本發明的精神和範圍的條件下,還可以對以上內容進行各種各樣的修改。因此,本發明的範圍並不僅限於以上的說明,而是由權利要求書的範圍來確定的。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀