新四季網

推送推廣信息的方法、裝置、設備和計算機存儲介質與流程

2023-09-20 16:44:15 2


【技術領域】

本發明涉及推送技術領域,尤其涉及一種推送推廣信息的方法、裝置、設備和計算機存儲介質。



背景技術:

現有技術在進行推廣信息的推送時,一般採用如下方式:廣告主購買人群的定向屬性,例如年齡、性別、興趣等,在進行推廣信息的推送時,將推廣信息向符合廣告主所購買定向屬性的用戶進行展現。但採用傳統的人群定向屬性購買的方式進行推廣信息的推送時具有很大的局限性:根據用戶的定向屬性向用戶推送的推廣信息較為固定,無法靈活地根據用戶在一定時段內的真實需求向用戶推送推廣信息。



技術實現要素:

有鑑於此,本發明提供了一種推送推廣信息的方法、裝置、設備和計算機存儲介質,用於實現根據用戶的真實需求,靈活地向用戶推送推廣信息。

本發明為解決技術問題而採用的技術方案是提供一種推送推廣信息的方法,所述方法包括:根據用戶標識,獲取對應該用戶的候選query集合以及第二預設時段內的推廣展現日誌;基於所述第二預設時段內的推廣展現日誌,對所述候選query集合中各query的質量度進行評估;根據所述各query質量度的評估結果,向用戶推送推廣信息;其中,用戶的候選query集合是利用第一預設時段內用戶的檢索日誌和推廣展現日誌中至少一種預先訓練得到的。

根據本發明一優選實施例,所述候選query集合是採用如下方式預先離線訓練得到的:獲取第一預設時段內用戶的檢索日誌以及推廣展現日誌;基於所述第一預設時段內的檢索日誌,挖掘用戶感興趣的query集合;基於所述第一預設時段內的推廣展現日誌,對所述用戶感興趣的query集合中的各query進行商業價值預估;根據所述各query商業價值的預估結果,挑選商業價值大於預設閾值的query構成候選query集合。

根據本發明一優選實施例,所述推廣展現日誌包括:頁面瀏覽日誌以及推廣日誌;其中,所述頁面瀏覽日誌包括檢索query的時間、檢索用戶的標識、檢索返回的推廣數以及點擊檢索結果所對應的query中的至少一種;所述推廣日誌包括推廣的觸發方式、query對應的推廣是否被點擊以及推廣出價中的至少一種。

根據本發明一優選實施例,所述基於所述第一預設時段內的推廣展現日誌,對所述用戶感興趣的query集合中的各query進行商業價值預估包括:依據query在第一預設時段內的被檢索狀況以及query所對應推廣的出價狀況,預估所述用戶感興趣的query集合中的各query的商業價值。

根據本發明一優選實施例,所述在預估所述用戶感興趣的query集合中的各query的商業價值時,針對各query分別執行:基於所述第一預設時段內的推廣展現日誌,得到第一預設時段內檢索該query時返回推廣的次數佔檢索總次數的百分比;基於所述第一預設時段內的推廣展現日誌,獲取第一預設時段內該query所對應推廣的平均出價;將檢索該query時返回推廣的次數佔檢索總次數的百分比以及該query所對應推廣的平均出價的乘積作為該query商業價值的預估結果。

根據本發明一優選實施例,所述第二預設時段為:以當前時間為中心,取預設長度日期區間中的預設長度時間區間作為第二預設時段。

根據本發明一優選實施例,所述基於所述第二預設時段內的推廣展現日誌,對所述候選query集合中各query的質量度進行評估包括:基於所述第二預設時段內的推廣展現日誌,對所述候選query集合中的各query進行商業價值預估以及點擊率預估;根據各query商業價值的預估結果以及點擊率的預估結果,得到所述候選query集合中各query的質量度。

根據本發明一優選實施例,所述在基於所述第二預設時段內的推廣展現日誌,對所述候選query集合中的各query進行商業價值預估時,針對各query分別執行:基於所述第二預設時段內的推廣展現日誌,獲取第二預設時段內query所對應推廣的平均出價;將第一預設時段內檢索該query時返回推廣的次數佔檢索總次數的百分比與所述第二預設時段內該query所對應推廣的平均出價的乘積作為該query商業價值的預估結果。

根據本發明一優選實施例,所述在基於所述第二預設時段內的推廣展現日誌,對所述候選query集合中的各query進行點擊率預估時,針對各query分別執行:提取該query的字面或語義特徵中的至少一種作為該query的query特徵;基於第二預設時段內的推廣展現日誌,提取該用戶的行為特徵;將所述用戶的行為特徵以及所述query特徵作為輸入數據,輸入到點擊率預估模型中;將點擊率預估模型的輸出值作為該query的點擊率預估結果;其中,該點擊率預估模型是預先使用歷史query特徵以及用戶行為特徵訓練得到。

根據本發明一優選實施例,所述根據所述各query質量度的評估結果向用戶推送推廣信息包括:根據所述各query質量度的評估結果,確定目標query;獲取目標query所對應的推廣信息集合,並對所述推廣信息集合中的推廣信息進行排序;根據所述推廣信息的排序結果,向用戶推送推廣信息。

根據本發明一優選實施例,所述根據所述各query質量度的評估結果,確定目標query包括:將質量度大於預設閾值的query作為目標query,或者將質量度排在前n個的query作為目標query,所述n為預設的正整數。

本發明為解決技術問題而採用的技術方案是提供一種推送推廣信息的裝置,所述裝置包括:獲取單元,用於根據用戶標識,獲取對應該用戶的候選query集合以及第二預設時段內的推廣展現日誌;評估單元,用於基於所述第二預設時段內的推廣展現日誌,對所述候選query集合中各query的質量度進行評估;推送單元,用於根據所述各query質量度的評估結果,向用戶推送推廣信息;訓練單元,用於利用第一預設時段內用戶的檢索日誌和推廣展現日誌中至少一種預先訓練得到候選query集合。

根據本發明一優選實施例,所述訓練單元是採用如下方式預先離線訓練得到候選query集合的:獲取第一預設時段內用戶的檢索日誌以及推廣展現日誌;基於所述第一預設時段內的檢索日誌,挖掘用戶感興趣的query集合;基於所述第一預設時段內的推廣展現日誌,對所述用戶感興趣的query集合中的各query進行商業價值預估;根據所述各query商業價值的預估結果,挑選商業價值大於預設閾值的query構成候選query集合。

根據本發明一優選實施例,所述推廣展現日誌包括:頁面瀏覽日誌以及推廣日誌;其中,所述頁面瀏覽日誌包括檢索query的時間、檢索用戶的標識、檢索返回的推廣數以及點擊檢索結果所對應的query中的至少一種;所述推廣日誌包括推廣的觸發方式、query對應的推廣是否被點擊以及推廣出價中的至少一種。

根據本發明一優選實施例,所述訓練單元在基於所述第一預設時段內的推廣展現日誌,對所述用戶感興趣的query集合中的各query進行商業價值預估時,具體執行:依據query在第一預設時段內的被檢索狀況以及query所對應推廣的出價狀況,預估所述用戶感興趣的query集合中的各query的商業價值。

根據本發明一優選實施例,所述訓練單元在預估所述用戶感興趣的query集合中的各query的商業價值時,具體執行:基於所述第一預設時段內的推廣展現日誌,得到第一預設時段內檢索該query時返回推廣的次數佔檢索總次數的百分比;基於所述第一預設時段內的推廣展現日誌,獲取第一預設時段內該query所對應推廣的平均出價;將檢索該query時返回推廣的次數佔檢索總次數的百分比以及該query所對應推廣的平均出價的乘積作為該query商業價值的預估結果。

根據本發明一優選實施例,所述第二預設時段為:以當前時間為中心,取預設長度日期區間中的預設長度時間區間作為第二預設時段。

根據本發明一優選實施例,所述評估單元在基於所述第二預設時段內的推廣展現日誌,對所述候選query集合中各query的質量度進行評估時,具體執行:基於所述第二預設時段內的推廣展現日誌,對所述候選query集合中的各query進行商業價值預估以及點擊率預估;根據各query商業價值的預估結果以及點擊率的預估結果,得到所述候選query集合中各query的質量度。

根據本發明一優選實施例,所述評估單元在基於所述第二預設時段內的推廣展現日誌,對所述候選query集合中的各query進行商業價值預估時,針對各query分別執行:基於所述第二預設時段內的推廣展現日誌,獲取第二預設時段內query所對應推廣的平均出價;將第一預設時段內檢索該query時返回推廣的次數佔檢索總次數的百分比與所述第二預設時段內該query所對應推廣的平均出價的乘積作為該query商業價值的預估結果。

根據本發明一優選實施例,所述評估單元在基於所述第二預設時段內的推廣展現日誌,對所述候選query集合中的各query進行點擊率預估時,針對各query分別執行:提取該query的字面或語義特徵中的至少一種作為該query的query特徵;基於第二預設時段內的推廣展現日誌,提取該用戶的行為特徵;將所述用戶的行為特徵以及所述query特徵作為輸入數據,輸入到點擊率預估模型中;將所述點擊率預估模型的輸出值作為該query的點擊率預估結果;其中,該點擊率預估模型是預先使用歷史query特徵以及用戶行為特徵訓練得到。

根據本發明一優選實施例,所述推送單元在根據所述各query質量度的評估結果,向用戶推送推廣信息時,具體執行:根據所述各query質量度的評估結果,確定目標query;獲取目標query所對應的推廣信息集合,並對所述推廣信息集合中的推廣信息進行排序;根據所述推廣信息的排序結果,向用戶推送推廣信息。

根據本發明一優選實施例,所述推送單元在根據所述各query質量度的評估結果確定目標query時,具體執行:將質量度大於預設閾值的query作為目標query,或者將質量度排在前n個的query作為目標query,所述n為預設的正整數。

由以上技術方案可以看出,本發明通過推廣展現日誌,對用戶候選query集合中的各query進行質量度評估,再根據query質量度的評估結果向用戶推送推廣信息,從而實現利用用戶實際的搜索狀況以及推廣展現狀況,靈活地向用戶推送推廣信息。

【附圖說明】

圖1為本發明一實施例提供的推送推廣信息的方法流程圖。

圖2為本發明一實施例提供的推送推廣信息的示意圖。

圖3為本發明一實施例提供的推送推廣信息的裝置結構圖。

圖4為本發明一實施例提供的計算機系統/伺服器的框圖。

【具體實施方式】

為了使本發明的目的、技術方案和優點更加清楚,下面結合附圖和具體實施例對本發明進行詳細描述。

在本發明實施例中使用的術語是僅僅出於描述特定實施例的目的,而非旨在限制本發明。在本發明實施例和所附權利要求書中所使用的單數形式的「一種」、「所述」和「該」也旨在包括多數形式,除非上下文清楚地表示其他含義。

應當理解,本文中使用的術語「和/或」僅僅是一種描述關聯對象的關聯關係,表示可以存在三種關係,例如,a和/或b,可以表示:單獨存在a,同時存在a和b,單獨存在b這三種情況。另外,本文中字符「/」,一般表示前後關聯對象是一種「或」的關係。

取決於語境,如在此所使用的詞語「如果」可以被解釋成為「在……時」或「當……時」或「響應於確定」或「響應於檢測」。類似地,取決於語境,短語「如果確定」或「如果檢測(陳述的條件或事件)」可以被解釋成為「當確定時」或「響應於確定」或「當檢測(陳述的條件或事件)時」或「響應於檢測(陳述的條件或事件)」。

傳統的推廣信息推送方法,即按照用戶所屬的標籤,向用戶推送對應該標籤的推廣信息,該種方法存在一定的局限性。因此本發明提供一種推送推廣信息的方法、裝置、設備和計算機存儲介質,用於解決傳統推廣信息推送方法的局限性,通過推廣展現日誌,在線評估候選query集合中各query的質量度,進而根據各query的質量度向用戶推送對應的推廣信息,從而使得向用戶所推送的推廣信息更加精準豐富,且更能夠符合用戶近期的實際需要。在本發明中,query的中文含義為「檢索詞」。

其中,推廣展現日誌為推廣信息系統在處理推廣信息請求的過程中所保存的相關信息,包括頁面瀏覽日誌以及推廣日誌。其中,頁面瀏覽日誌記錄頁面瀏覽的粒度信息,頁面瀏覽的粒度信息包括檢索query的時間、檢索用戶的標識、檢索返回的推廣數以及點擊檢索結果所對應的query中的至少一種。而推廣日誌則記錄檢索所返回推廣的粒度信息,檢索所返回推廣的粒度信息包括推廣的觸發方式、推廣是否被點擊以及推廣出價中的至少一種。

在本發明中,推廣展現日誌分為第一預設時段內的推廣展現日誌以及第二預設時段內的推廣展現日誌。為了描述方便,在下文中使用在線推廣展現日誌表示第二預設時段內的推廣展現日誌,使用離線推廣展現日誌表示第一預設時段內的推廣展現日誌。其中,在線推廣展現日誌用於在線評估query的質量度,其存放在推廣信息系統中的短期存儲伺服器中,根據用戶標識對應不同用戶的近期行為信息(例如幾個星期);離線推廣展現日誌則用於離線訓練候選query集合,其存放在推廣信息系統中的長期存儲伺服器中,對應全部用戶的長期行為信息(例如幾年)。

圖1為本發明一實施例提供的推送推廣信息的方法流程圖,如圖1中所示,所述方法包括:

在101中,根據用戶標識,獲取對應該用戶的候選query集合以及在線推廣展現日誌。

在本步驟中,用戶標識代表用戶的身份信息。可選地,在本實施例的一個具體實現過程中,用戶標識可以為用戶的帳號信息,例如帳號名稱或者uid,也可以為用戶所使用終端的設備號,還可以為用戶的瀏覽器cookie。

在獲取到對應用戶的用戶標識後,根據該用戶標識,獲取對應該用戶的候選query集合以及在線推廣展現日誌,即根據用戶的身份信息獲取對應該用戶的候選query集合以及在線推廣展現日誌。這是由於每個用戶的搜索需求、搜索興趣以及對推廣信息的感興趣程度不同,因此所得到的候選query集合以及在線推廣展現日誌也會因人而異,而為了確保向用戶所推送的推廣信息儘可能準確,所以需要根據用戶標識對候選query集合以及在線推廣展現日誌進行區分,進而根據用戶標識獲取對應該用戶的候選query集合以及在線推廣展現日誌。

其中,在線推廣展現日誌是根據用戶標識訪問推廣信息系統中的短期存儲伺服器獲取的在第二預設時段內的推廣展現日誌。具體地,第二預設時段由當前時間確定。優選地,可以以當前時間為中心取預設長度日期區間中的預設長度時間區間作為第二預設時段。舉例來說,若當前時間為2017年5月7日上午11點18分,則第二預設時段可以為2017.04.07~2017.05.07的11:00~12:00,也可以為2017.04.07~2017.05.07的11:00~13:00,還可以為2017.03.07~2017.05.07的11:00~12:00。在本發明的實施例中,第二預設時段優選的預設長度日期區間為1個月,預設長度時間區間為1個小時。

在本步驟中,根據用戶標識所獲取的候選query集合是採用離線訓練的方式預先得到的。可以理解的是,在離線訓練得到候選query集合後,將所得到的候選query集合存儲在推廣信息系統的特定伺服器或資料庫中。當根據用戶標識獲取對應該用戶的候選query集合時,便能夠通過訪問推廣信息系統中特定伺服器或者資料庫的方式,根據用戶標識獲取對應該用戶的候選query集合。

具體地,候選query集合可以採用如下離線訓練方式預先得到:

首先獲取第一預設時段內用戶的檢索日誌以及推廣展現日誌。其中,用戶的檢索日誌通過訪問檢索伺服器獲取,離線推廣展現日誌則通過訪問推廣信息系統的長期存儲伺服器獲取。需要說明的是,在第一預設時段內所獲取的檢索日誌以及推廣展現日誌對應全部用戶,根據所獲取的檢索日誌以及推廣展現日誌中用戶的身份信息對不同的用戶進行區分,進而獲取對應每個用戶的候選query集合。

其中,第一預設時段與第二預設時段不同,第二預設時段必須根據當前時間進行確定,而第一預設時段則是預先設置的。舉例來說,第一預設時段可以預先設置為當前日期之前1個月以內的時段,例如當前日期為2017.05.07,則第一預設時段可以為2017.04.07~2017.05.07,也可以設置為當前日期其他值以內的時段,例如1個星期、2個星期或幾天等。可以理解的是,由於離線推廣展現日誌存儲有用戶長期的行為信息,因此也可以根據用戶實際需求將第一預設時段設置為任意一段日期,例如2016.05.07~2017.05.07。

基於所獲取的檢索日誌,採用機器學習或數據挖掘的方式獲取用戶感興趣的query。可選地,用戶感興趣的query可以為用戶進行檢索時所輸入的query,還可以為用戶在檢索過程中點擊的檢索結果所對應的query。然後將所獲取的用戶感興趣的各條query構成用戶感興趣的query集合。

在獲取用戶感興趣的query集合後,基於離線推廣展現日誌,對用戶感興趣query集合中的各query進行商業價值預估,將用戶感興趣的query集合中商業價值小於預設閾值的query過濾掉,進而挑選出商業價值滿足一定要求的query構成候選query集合。

在對query進行商業價值預估時,可以依據query在第一預設時段內的被檢索狀況以及該query所對應推廣的出價狀況確定。具體地,首先基於離線推廣展現日誌,得到第一預設時段內檢索各query時返回推廣的次數佔檢索總次數的百分比,該百分比表示有推廣展現的檢索query數量佔全部檢索query數量的比率(為了描述方便,使用pvr1(pageviewrate,頁面瀏覽比率)表示該比率);然後再基於離線推廣展現日誌,獲取第一預設時段內各query所對應推廣的平均出價(為了描述方便,使用acb1(averageclickbid,平均點擊出價)表示該平均出價)。將在第一預設時段內所得到的各query的pvr1與acb1相乘得到的乘積,作為該query商業價值的預估結果。

在得到用戶感興趣query集合中各query商業價值的預估結果後,根據各query所具有的商業價值,將商業價值大於預設閾值的query構成對應用戶的候選query集合。例如,預設閾值可以為0,則將商業價值大於0的query構成對應用戶的候選query集合,可以理解的是該預設閾值也可以根據實際需要設置為其他值。因此,使用離線訓練的方式預先得到的候選query集合中的各query滿足既符合用戶的興趣,也具有一定的商業價值的要求。

舉例來說,若某用戶感興趣query集合中的一條query為「一天中最好的健身時間」,若該條query在第一預設時段內沒有返回推廣,則該條query的pvr1為0,進而確定該query的商業價值為0。若商業價值的預設閾值為0,而由於該條query的商業價值為0,則對應該用戶的候選query集合中就不包含該條「一天中最好的健身時間」的query。若該條query在第一預設時段內有返回的推廣,則該條query的pvr1不為0,若該條query的acb1也不為0,則確定該條query具有商業價值。由於該條query具有商業價值,則對應該用戶的候選query集合中就包含有該條「一天中最好的健身時間」的query。

可以理解的是,在基於檢索日誌以及離線推廣日誌進行候選query集合的離線訓練時,可以根據用戶檢索日誌中或離線推廣日誌中所包含的用戶身份信息,例如用戶的帳號信息、用戶所使用終端的設備號或者用戶的瀏覽器cookie中的至少一種,對離線訓練得到的候選query集合進行區分,從而使得在進行在線預估時能夠根據用戶標識獲取對應該用戶的候選query集合。

在102中,基於所述在線推廣展現日誌,對所述候選query集合中的各query進行質量度評估。

在步驟101中,獲取候選query集合以及在線推廣展現日誌後,基於在線推廣展現日誌對所得到的候選query集合中各query的質量度進行在線評估。在線評估所獲取的候選query集合中各query的質量度的意義在於:由於每個query的出價會隨著一天中不同時段的變化而變化,因此為了實現推廣收益的最大化,需要實時地在線評估候選query集合中各query的質量度。

在本步驟中,對候選query集合中的各query進行的質量度評估包括兩部分:預估候選query集合中各query的商業價值以及點擊率。進而根據各query商業價值的預估結果以及點擊率的預估結果,最終得到候選query集合中各query的質量度。

其中,基於在線推廣展現日誌對候選query集合中各query進行商業價值預估的具體步驟為:基於在線推廣展現日誌,獲取第二預設時段內各query所對應推廣的平均出價(為了描述方便,使用acb2表示該平均出價);然後將第一預設時段內所得到的pvr1與第二預設時段內所得到的acb2相乘得到的乘積,作為候選query集合中各query商業價值的預估結果。第二預設時段已在步驟101中描述,在此不再進行贅述。

基於在線推廣展現日誌,對候選query集合中各query進行點擊率預估時,對各query分別執行:首先提取該query的字面或語義特徵中的至少一種作為該query的query特徵;然後基於第二預設時段內的推廣展現日誌,提取對應該用戶的行為特徵,例如用戶會話特徵;然後將該用戶的行為特徵以及該query的query特徵進行組合,將組合後的數據作為輸入到點擊率預估模型中的輸入數據;將點擊率預估模型根據輸入數據得到的輸出結果,作為該query的點擊率預估結果。在本步驟中,該點擊率預估模型是預先使用歷史query特徵以及用戶行為特徵訓練得到。可以理解的是,還可以進一步提取用戶的屬性特徵,例如年齡、性別、興趣等,將該屬性特徵與query特徵以及用戶行為特徵組合輸入到點擊率預估模型,進行對該query的點擊率預估。

其中,在使用歷史query特徵以及用戶行為特徵訓練得到點擊率預估模型時,具體步驟為:將歷史query的query特徵以及用戶的行為特徵組合形成輸入數據,然後基於歷史推廣展現日誌,將歷史query所對應推廣的點擊結果設置為標籤以作為輸出數據,使用預設模型進行訓練,例如邏輯回歸模型,從而確定由輸入數據得到輸出數據的參數。可以理解的是,也可以使用深度學習的方式,通過對歷史query特徵和用戶行為特徵以及歷史query對應推廣的點擊結果進行學習,得到相應的深度學習模型,在線評估時使用該深度學習模型即可進行query點擊率的預估。

舉例來說,若預設模型為函數y=f(x),其中x為輸入數據,包括query特徵以及用戶行為特徵;y為輸出數據,表示某query對應推廣的點擊結果,例如若點擊則設置為1,未點擊則設置為0。通過對該模型的訓練,確定使得由輸入數據得到輸出數據的函數關係。當在線評估時,將由候選query集合中的某條query所得到的query特徵以及在線推廣展現日誌中所得到的用戶行為特徵組合作為輸入數據x,輸入到所獲得的函數f(x)中,將得到的輸出結果y作為該query的點擊率預估結果。

在得到候選query集合中各query商業價值的預估結果以及點擊率的預估結果後,按照預設方法將兩者進行融合,例如使用多目標融合的方法進行融合,然後再根據融合結果得到候選query集合中各query的質量度。

在使用多目標融合的方法對各query商業價值的預估結果以及點擊率的預估結果進行融合時,可以使用如下公式:

q=α·ctr+β·ecom_value+γ·ctr·ecom_value

在公式中:q為候選query集合中各query的質量度,α、β、γ為預設參數,ctr為query的點擊率預估結果,ecom_value為query的商業價值預估結果。

在103中,根據所述各query質量度的評估結果,向用戶推送推廣信息。

在本步驟中,首先根據步驟102所得到的候選query集合中各query的質量度,確定目標query。所確定的目標query為向用戶推送的推廣消息所對應的query。在根據所得到的各query的質量度確定目標query時,可以為將質量度排在前n個的query作為目標query,也可以為將質量度大於預設閾值的query作為目標query。

在確定目標query後,獲取目標query所對應的推廣信息集合,然後使用傳統的推廣信息排序模型,例如使用推廣點擊率與推廣出價相乘的形式,對所得到的推廣信息集合中的推廣信息進行排序,再根據推廣信息的排序結果向用戶推送推廣信息。

舉例來說,如圖2中所示,在新聞類app中使用傳統方法進行推廣信息的推送時,若該用戶的標籤為「房地產」,則向用戶推送的推廣信息固定與房地產相關,如圖2中a圖方框中所示「裝修得花多少錢,三秒出預算」的推廣信息。而使用本發明所提供的技術方案,若該用戶近期檢索過「人才引進」的相關內容,則會在新聞類app中向用戶推送與「人才引進」相關的推廣信息,如圖2中b圖中方框所示的「2017人才引進條件-落戶幫」的推廣信息,從而使得向用戶推送的推廣信息更符合用戶當前時段內的興趣。

下面對本發明實施例提供的裝置結構圖進行詳述。如圖3中所示,所述裝置包括:訓練單元31、獲取單元32、評估單元33以及推送單元34。

訓練單元31,用於利用第一預設時段內用戶的檢索日誌和推廣展現日誌中至少一種預先訓練得到候選query集合。

訓練單元31根據訓練數據,使用離線訓練的方式得到候選query集合。在得到候選query集合後,訓練單元31將所得到的候選query集合存儲在推廣信息系統的特定伺服器或資料庫中。其中,訓練單元31所使用的訓練數據為第一預設時段內用戶的檢索日誌以及推廣展現日誌中的至少一種。

具體地,訓練單元31可以採用如下離線訓練方式得到候選query集合:

首先訓練單元31獲取第一預設時段內用戶的檢索日誌以及推廣展現日誌。其中,用戶的檢索日誌通過訪問檢索伺服器獲取,離線推廣展現日誌則通過訪問推廣信息系統的長期存儲伺服器獲取。需要說明的是,訓練單元31在第一預設時段內所獲取的檢索日誌以及推廣展現日誌對應全部用戶,訓練單元31可以根據所獲取的檢索日誌以及推廣展現日誌中用戶的身份信息對不同的用戶進行區分,進而確定對應每個用戶的候選query集合。

其中,第一預設時段是預先設置的。舉例來說,第一預設時段可以預先設置為當前日期之前1個月以內的時段,例如當前日期為2017.05.07,則第一預設時段可以為2017.04.07~2017.05.07,也可以設置為當前日期其他值以內的時段,例如1個星期、2個星期或幾天等。可以理解的是,由於離線推廣展現日誌存儲有用戶長期的行為信息,因此也可以根據用戶實際需求將第一預設時段設置為任意一段日期,例如2016.05.07~2017.05.07。

訓練單元31基於所獲取的檢索日誌,採用機器學習或數據挖掘的方式獲取用戶感興趣的query。可選地,用戶感興趣的query可以為用戶進行檢索時所輸入的query,還可以為用戶在檢索過程中點擊的檢索結果所對應的query。然後訓練單元31將所獲取的用戶感興趣的各條query構成用戶感興趣的query集合。

訓練單元31在獲取用戶感興趣的query集合後,基於離線推廣展現日誌,對用戶感興趣query集合中的各query進行商業價值預估,將用戶感興趣的query集合中商業價值小於預設閾值的query過濾掉,進而挑選出具有商業價值或商業價值較高的query構成候選query集合。

訓練單元31在對query進行商業價值預估時,可以依據query在第一預設時段內的被檢索狀況以及該query所對應推廣的出價狀況確定。具體地,訓練單元31首先基於離線推廣展現日誌,得到第一預設時段內檢索各query時返回推廣的次數佔檢索總次數的百分比,該百分比表示有推廣展現的檢索query數量佔全部檢索query數量的比率(為了描述方便,使用pvr1(pageviewrate,頁面瀏覽比率)表示該比率);然後訓練單元31再基於離線推廣展現日誌,獲取第一預設時段內各query所對應推廣的平均出價(為了描述方便,使用acb1(averageclickbid,平均點擊出價)表示該平均出價)。訓練單元31將在第一預設時段內所得到的各query的pvr1與acb1相乘得到的乘積,作為該query商業價值的預估結果。

訓練單元31在得到用戶感興趣query集合中各query商業價值的預估結果後,根據各query所具有的商業價值,將商業價值大於預設閾值的query構成對應用戶的候選query集合。例如,預設閾值可以為0,則將商業價值大於0的query構成對應用戶的候選query集合,該預設閾值也可以根據實際需要設置為其他值。因此,訓練單元31使用離線訓練的方式預先得到的候選query集合中的各query滿足既符合用戶的興趣,也具有一定的商業價值的要求。

可以理解的是,訓練單元31在基於檢索日誌以及離線推廣日誌進行候選query集合的離線訓練時,可以根據用戶檢索日誌中或離線推廣日誌中所包含的用戶身份信息,例如用戶的帳號信息、用戶所使用終端的設備號或者用戶的瀏覽器cookie中的至少一種,對離線訓練得到的候選query集合進行區分,從而使得在進行在線預估時能夠根據用戶標識獲取對應該用戶的候選query集合。

獲取單元32,用於根據用戶標識,獲取對應該用戶的候選query集合以及在線推廣展現日誌。

獲取單元32所使用的用戶標識代表用戶的身份信息。可選地,在本實施例的一個具體實現過程中,用戶標識可以為用戶的帳號信息,例如帳號名稱或者uid,也可以為用戶所使用終端的設備號,還可以為用戶的瀏覽器cookie。

獲取單元32在得到對應用戶的用戶標識後,根據用戶標識,獲取對應該用戶的候選query集合以及在線推廣展現日誌,即根據用戶的身份信息獲取對應該用戶的候選query集合以及在線推廣展現日誌。這是由於每個用戶的搜索需求、搜索興趣以及對推廣信息的感興趣程度不同,因此所得到的候選query集合以及在線推廣展現日誌也會因人而異,而為了確保向用戶所推送的推廣信息儘可能準確,所以需要根據用戶標識對候選query集合以及在線推廣展現日誌進行區分,進而根據用戶標識獲取對應該用戶的候選query集合以及在線推廣展現日誌。

其中,候選query集合是由訓練單元31預先訓練得到的,獲取單元32根據用戶標識訪問推廣信息系統的特定伺服器進行獲取;在線推廣展現日誌是根據用戶標識訪問推廣信息系統中的短期存儲伺服器獲取的在第二預設時段內的推廣展現日誌。

具體地,第二預設時段與第一預設時段不同,第二預設時段是由當前時間確定的。優選地,可以以當前時間為中心取預設長度日期區間中的預設長度時間區間作為第二預設時段。舉例來說,若當前時間為2017年5月7日上午11點18分,則第二預設時段可以為2017.04.07~2017.05.07的11:00~12:00,也可以為2017.04.07~2017.05.07的11:00~13:00,還可以為2017.03.07~2017.05.07的11:00~12:00。在本發明的實施例中,第二預設時段優選的預設長度日期區間為1個月,預設長度時間區間為1個小時。

評估單元33,用於基於所述在線推廣展現日誌,對所述候選query集合中的各query進行質量度評估。

獲取單元32在獲取候選query集合以及在線推廣展現日誌後,由評估單元33基於在線推廣展現日誌對所得到的候選query集合中各query的質量度進行在線評估。評估單元33在線評估所獲取的候選query集合中各query的質量度的意義在於:由於每個query的出價會隨著一天中不同時段的變化而變化,因此為了實現推廣收益的最大化,需要由評估單元33實時地在線評估候選query集合中各query的質量度。

評估單元33對候選query集合中的各query進行的質量度評估包括兩部分:預估候選query集合中各query的商業價值以及點擊率。評估單元33進而根據各query商業價值的預估結果以及點擊率的預估結果,最終得到候選query集合中各query的質量度。

其中,評估單元33基於在線推廣展現日誌對候選query集合中各query進行商業價值的預估時,具體執行:評估單元33基於在線推廣展現日誌,獲取第二預設時段內各query所對應推廣的平均出價(為了描述方便,使用acb2表示該平均出價);然後評估單元33將第一預設時段內所得到的pvr1與第二預設時段內所得到的acb2相乘得到的乘積,作為候選query集合中各query商業價值的預估結果。

評估單元33基於在線推廣展現日誌,對候選query集合中各query進行點擊率預估的具體步驟為:評估單元33首先提取該query的字面或語義特徵中的至少一種作為該query的query特徵;然後基於第二預設時段內的推廣展現日誌,評估單元33提取對應該用戶的行為特徵,例如用戶會話特徵;然後評估單元33將該用戶的行為特徵以及該query的query特徵進行組合,將組合後的數據作為輸入到點擊率預估模型中的輸入數據;評估單元33將點擊率預估模型根據輸入數據得到的輸出結果,作為該query的點擊率預估結果。可以理解的是,評估單元33還可以進一步使用用戶的屬性特徵,例如年齡、性別、興趣等,將該屬性特徵與query特徵以及用戶行為特徵組合輸入到點擊率預估模型,進行對該query的點擊率預估。

評估單元33所使用的點擊率預估模型是預先根據歷史query特徵以及用戶行為特徵訓練得到。其中,在使用歷史query特徵以及用戶行為特徵訓練得到點擊率預估模型時,具體步驟為:將歷史query的query特徵以及用戶的行為特徵組合形成輸入數據,然後基於歷史推廣展現日誌,將歷史query所對應推廣的點擊結果設置為標籤以作為輸出數據,使用預設模型進行訓練,例如邏輯回歸模型,從而確定由輸入數據得到輸出數據的參數。可以理解的是,也可以使用深度學習的方式,通過對歷史query特徵和用戶行為特徵以及歷史query對應推廣的點擊結果進行學習,得到相應的深度學習模型,在線評估時使用該深度學習模型即可進行query點擊率的預估。

在評估單元33得到候選query集合中各query商業價值的預估結果以及點擊率的預估結果後,按照預設方法將兩者進行融合,例如使用多目標融合的方法進行融合,然後再根據融合結果得到候選query集合中各query的質量度。

在使用多目標融合的方法對各query商業價值的預估結果以及點擊率的預估結果進行融合時,可以使用如下公式:

q=α·ctr+β·ecom_value+γ·ctr·ecom_value

在公式中:q為候選query集合中各query的質量度,α、β、γ為預設參數,ctr為query的點擊率預估結果,ecom_value為query的商業價值預估結果。

推送單元34,用於根據所述各query質量度的評估結果,向用戶推送推廣信息。

推送單元34首先根據評估單元33所得到的候選query集合中各query的質量度,確定目標query。推送單元34所確定的目標query為向用戶推送的推廣消息所對應的query。在推送單元34根據所得到的各query的質量度確定目標query時,可以為將質量度大於預設閾值的query作為目標query,也可以為將質量度排在前n個的query作為目標query,其中n為預設的正整數。

在確定目標query後,推送單元34獲取目標query所對應的推廣信息集合,然後使用傳統的推廣信息排序模型,例如使用推廣點擊率與推廣出價相乘的形式,對所得到的推廣信息集合中的推廣信息進行排序,再根據推廣信息的排序結果向用戶推送推廣信息。

圖4示出了適於用來實現本發明實施方式的示例性計算機系統/伺服器012的框圖。圖4顯示的計算機系統/伺服器012僅僅是一個示例,不應對本發明實施例的功能和使用範圍帶來任何限制。

如圖4所示,計算機系統/伺服器012以通用計算設備的形式表現。計算機系統/伺服器012的組件可以包括但不限於:一個或者多個處理器或者處理單元016,系統存儲器028,連接不同系統組件(包括系統存儲器028和處理單元016)的總線018。

總線018表示幾類總線結構中的一種或多種,包括存儲器總線或者存儲器控制器,外圍總線,圖形加速埠,處理器或者使用多種總線結構中的任意總線結構的局域總線。舉例來說,這些體系結構包括但不限於工業標準體系結構(isa)總線,微通道體系結構(mac)總線,增強型isa總線、視頻電子標準協會(vesa)局域總線以及外圍組件互連(pci)總線。

計算機系統/伺服器012典型地包括多種計算機系統可讀介質。這些介質可以是任何能夠被計算機系統/伺服器012訪問的可用介質,包括易失性和非易失性介質,可移動的和不可移動的介質。

系統存儲器028可以包括易失性存儲器形式的計算機系統可讀介質,例如隨機存取存儲器(ram)030和/或高速緩存存儲器032。計算機系統/伺服器012可以進一步包括其它可移動/不可移動的、易失性/非易失性計算機系統存儲介質。僅作為舉例,存儲系統034可以用於讀寫不可移動的、非易失性磁介質(圖4未顯示,通常稱為「硬碟驅動器」)。儘管圖4中未示出,可以提供用於對可移動非易失性磁碟(例如「軟盤」)讀寫的磁碟驅動器,以及對可移動非易失性光碟(例如cd-rom,dvd-rom或者其它光介質)讀寫的光碟驅動器。在這些情況下,每個驅動器可以通過一個或者多個數據介質接口與總線018相連。存儲器028可以包括至少一個程序產品,該程序產品具有一組(例如至少一個)程序模塊,這些程序模塊被配置以執行本發明各實施例的功能。

具有一組(至少一個)程序模塊042的程序/實用工具040,可以存儲在例如存儲器028中,這樣的程序模塊042包括——但不限於——作業系統、一個或者多個應用程式、其它程序模塊以及程序數據,這些示例中的每一個或某種組合中可能包括網絡環境的實現。程序模塊042通常執行本發明所描述的實施例中的功能和/或方法。

計算機系統/伺服器012也可以與一個或多個外部設備014(例如鍵盤、指向設備、顯示器024等)通信,在本發明中,計算機系統/伺服器012與外部雷達設備進行通信,還可與一個或者多個使得用戶能與該計算機系統/伺服器012交互的設備通信,和/或與使得該計算機系統/伺服器012能與一個或多個其它計算設備進行通信的任何設備(例如網卡,數據機等等)通信。這種通信可以通過輸入/輸出(i/o)接口022進行。並且,計算機系統/伺服器012還可以通過網絡適配器020與一個或者多個網絡(例如區域網(lan),廣域網(wan)和/或公共網絡,例如網際網路)通信。如圖所示,網絡適配器020通過總線018與計算機系統/伺服器012的其它模塊通信。應當明白,儘管圖中未示出,可以結合計算機系統/伺服器012使用其它硬體和/或軟體模塊,包括但不限於:微代碼、設備驅動器、冗餘處理單元、外部磁碟驅動陣列、raid系統、磁帶驅動器以及數據備份存儲系統等。

處理單元016通過運行存儲在系統存儲器028中的程序,從而執行各種功能應用以及數據處理,例如實現一種推送推廣信息的方法,可以包括:

根據用戶標識,獲取對應該用戶的候選query集合以及第二預設時段內的推廣展現日誌;

基於所述第二預設時段內的推廣展現日誌,對所述候選query集合中各query的質量度進行評估;

根據所述各query質量度的評估結果,向用戶推送推廣信息。

上述的電腦程式可以設置於計算機存儲介質中,即該計算機存儲介質被編碼有電腦程式,該程序在被一個或多個計算機執行時,使得一個或多個計算機執行本發明上述實施例中所示的方法流程和/或裝置操作。例如,被上述一個或多個處理器執行的方法流程,可以包括:

根據用戶標識,獲取對應該用戶的候選query集合以及第二預設時段內的推廣展現日誌;

基於所述第二預設時段內的推廣展現日誌,對所述候選query集合中各query的質量度進行評估;

根據所述各query質量度的評估結果,向用戶推送推廣信息。

隨著時間、技術的發展,介質含義越來越廣泛,電腦程式的傳播途徑不再受限於有形介質,還可以直接從網絡下載等。可以採用一個或多個計算機可讀的介質的任意組合。計算機可讀介質可以是計算機可讀信號介質或者計算機可讀存儲介質。計算機可讀存儲介質例如可以是——但不限於——電、磁、光、電磁、紅外線、或半導體的系統、裝置或器件,或者任意以上的組合。計算機可讀存儲介質的更具體的例子(非窮舉的列表)包括:具有一個或多個導線的電連接、可攜式計算機磁碟、硬碟、隨機存取存儲器(ram)、只讀存儲器(rom)、可擦式可編程只讀存儲器(eprom或快閃記憶體)、光纖、可攜式緊湊磁碟只讀存儲器(cd-rom)、光存儲器件、磁存儲器件、或者上述的任意合適的組合。在本文件中,計算機可讀存儲介質可以是任何包含或存儲程序的有形介質,該程序可以被指令執行系統、裝置或者器件使用或者與其結合使用。

計算機可讀的信號介質可以包括在基帶中或者作為載波一部分傳播的數據信號,其中承載了計算機可讀的程序代碼。這種傳播的數據信號可以採用多種形式,包括——但不限於——電磁信號、光信號或上述的任意合適的組合。計算機可讀的信號介質還可以是計算機可讀存儲介質以外的任何計算機可讀介質,該計算機可讀介質可以發送、傳播或者傳輸用於由指令執行系統、裝置或者器件使用或者與其結合使用的程序。

計算機可讀介質上包含的程序代碼可以用任何適當的介質傳輸,包括——但不限於——無線、電線、光纜、rf等等,或者上述的任意合適的組合。可以以一種或多種程序設計語言或其組合來編寫用於執行本發明操作的電腦程式代碼,所述程序設計語言包括面向對象的程序設計語言—諸如java、smalltalk、c++,還包括常規的過程式程序設計語言—諸如「c」語言或類似的程序設計語言。程序代碼可以完全地在用戶計算機上執行、部分地在用戶計算機上執行、作為一個獨立的軟體包執行、部分在用戶計算機上部分在遠程計算機上執行、或者完全在遠程計算機或伺服器上執行。在涉及遠程計算機的情形中,遠程計算機可以通過任意種類的網絡——包括區域網(lan)或廣域網(wan)連接到用戶計算機,或者,可以連接到外部計算機(例如利用網際網路服務提供商來通過網際網路連接)。

本發明所提供的技術方案,不僅適用於普通推廣信息的推送,而且還適用於目前較為流行的feed流推廣信息的推送,該feed流推廣信息為信息流推廣信息,主要表現為在新聞類app中的瀏覽信息中插入推廣信息或在微信朋友圈中的好友動態中插入推廣信息。

利用本發明所提供的技術方案,通過推廣展現日誌,對用戶候選query集合中的各query進行質量度評估,再根據query質量度的評估結果向用戶推送推廣信息,從而實現利用用戶實際的搜索狀況以及推廣展現狀況,靈活地向用戶推送推廣信息。

在本發明所提供的幾個實施例中,應該理解到,所揭露的系統,裝置和方法,可以通過其它的方式實現。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現時可以有另外的劃分方式。

所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位於一個地方,或者也可以分布到多個網絡單元上。可以根據實際的需要選擇其中的部分或者全部單元來實現本實施例方案的目的。

另外,在本發明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以採用硬體的形式實現,也可以採用硬體加軟體功能單元的形式實現。

上述以軟體功能單元的形式實現的集成的單元,可以存儲在一個計算機可讀取存儲介質中。上述軟體功能單元存儲在一個存儲介質中,包括若干指令用以使得一臺計算機設備(可以是個人計算機,伺服器,或者網絡設備等)或處理器(processor)執行本發明各個實施例所述方法的部分步驟。而前述的存儲介質包括:u盤、移動硬碟、只讀存儲器(read-onlymemory,rom)、隨機存取存儲器(randomaccessmemory,ram)、磁碟或者光碟等各種可以存儲程序代碼的介質。

以上所述僅為本發明的較佳實施例而已,並不用以限制本發明,凡在本發明的精神和原則之內,所做的任何修改、等同替換、改進等,均應包含在本發明保護的範圍之內。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀