移動應用信息推送方法和裝置製造方法
2023-11-05 12:43:42 2
移動應用信息推送方法和裝置製造方法
【專利摘要】本發明公開了一種移動應用信息推送方法和裝置,其中,所述移動應用信息推送方法包括:獲取客戶端瀏覽的網頁,解析所述網頁,得到網頁內容,計算所述網頁內容與移動應用資料庫中各個移動應用描述信息的相似度,並根據所述計算出的相似度選取與所述網頁內容對應的移動應用描述信息,根據選取的所述移動應用描述信息向所述客戶端推送相應的移動應用信息。本發明實現了根據客戶端瀏覽的網頁,捕捉到客戶端當前的興趣點,從而觸發客戶端下載移動應用的潛在需求,提高了客戶端對推送的移動應用的使用率。
【專利說明】移動應用信息推送方法和裝置
【技術領域】
[0001]本發明涉及計算機技術,尤其涉及一種移動應用信息推送方法和裝置。
【背景技術】
[0002]隨著計算機技術的不斷發展,現有的移動應用的數量以百萬計,但很多移動應用一直沉睡在移動應用商店中無人問津,使得這些移動應用無法被需要它的用戶接觸到並下載。因此,移動應用的分發機制一直是一個業界普遍關注的重要問題。
[0003]現有技術中,相比於移動應用搜索和各種應用排行榜,一般採用主動推送的方式更容易使不活躍的移動應用接觸到用戶,吸引用戶去下載和使用,滿足用戶的潛在需求。該主動推送的過程為:根據用戶屬性給用戶推薦一個或幾個字符條,讓用戶去選擇,然後根據用戶選擇的字符條,推薦給用戶與這些文字描述相關聯的移動應用;或者根據移動應用的類別,用戶在移動應用商店中查看或下載移動應用的信息,以及用戶使用移動應用的時長信息,來計算移動應用之間的相似度和與用戶的推薦度。
[0004]但是,當根據用戶屬性進行推送時,用戶需要主動選擇某一字符條,然後再展現相關聯的移動應用,使得這種推送方式較為繁瑣,還有,字符條中的信息量有限,依據它推薦出來的移動應用不一定滿足用戶的需求或興趣點;當根據移動應用的類別進行推送時,該推送方法依賴於用戶查看、下載、使用移動應用的信息,當無法得到這些信息的時候,則無法採用該推送方法,使得該推送方法的局限性很大,而且,該推送方法的依據是用戶的歷史行為,而不能捕捉用戶當前的興趣點。
【發明內容】
[0005]有鑑於此,本發明實施例的目的在於提出一種移動應用信息推送方法和裝置,以更加準確、便捷地獲取客戶端下載移動應用的潛在需求,提高了客戶端對推送的移動應用的使用率。
[0006]第一方面,本發明實施例提供了一種移動應用信息推送方法,所述方法包括:
[0007]獲取客戶端瀏覽的網頁;
[0008]解析所述網頁,得到網頁內容;
[0009]計算所述網頁內容與移動應用資料庫中各個移動應用描述信息的相似度,並根據所述計算出的相似度選取與所述網頁內容對應的移動應用描述信息;
[0010]根據選取的所述移動應用描述信息向所述客戶端推送相應的移動應用信息。
[0011]第二方面,本發明實施例提供了 一種移動應用信息推送裝置,所述裝置包括:
[0012]獲取模塊,用於獲取客戶端瀏覽的網頁;
[0013]解析模塊,用於解析所述網頁,得到網頁內容;
[0014]處理模塊,用於計算所述網頁內容與移動應用資料庫中各個移動應用描述信息的相似度,並根據所述計算出的相似度選取與所述網頁內容對應的移動應用描述信息;
[0015]推送模塊,用於根據選取的所述移動應用描述信息向所述客戶端推送相應的移動應用信息。
[0016]本發明實施例獲取客戶端瀏覽的網頁,解析所述網頁,得到網頁內容,計算所述網頁內容與移動應用資料庫中各個移動應用描述信息的相似度,並根據所述計算出的相似度選取與所述網頁內容對應的移動應用描述信息,根據選取的所述移動應用描述信息向所述客戶端推送相應的移動應用信息,以使所述客戶端下載所述移動應用信息,實現了根據客戶端瀏覽的網頁,向客戶端推送與網頁相對應的移動應用,從而觸發客戶端下載移動應用的潛在需求,提高了客戶端對推送的移動應用的使用率。
【專利附圖】
【附圖說明】
[0017]圖1是本發明第一實施例的移動應用信息推送方法的流程圖;
[0018]圖2是本發明第二實施例的移動應用信息推送方法的流程圖;
[0019]圖3是本發明第三實施例的移動應用信息推送方法的流程圖;
[0020]圖4是本發明第四實施例的移動應用信息推送方法的流程圖;
[0021]圖5是本發明第五實施例的移動應用信息推送裝置的示意圖;
[0022]圖6是本發明第六實施例的移動應用信息推送裝置中處理模塊的示意圖;
[0023]圖7是本發明第七實施例的移動應用信息推送裝置中處理模塊的示意圖;
[0024]圖8是本發明第八實施例的移動應用信息推送裝置中處理模塊的示意圖。
【具體實施方式】
[0025]為了使本發明的目的、技術方案和優點更加清楚,下面結合附圖對本發明具體實施例作進一步的詳細描述。可以理解的是,此處所描述的具體實施例僅僅用於解釋本發明,而非對本發明的限定。另外還需要說明的是,為了便於描述,附圖中僅示出了與本發明相關的部分而非全部內容。
[0026]本發明實施例提供的移動應用信息推送方法,通過獲取客戶端瀏覽的網頁,解析所述網頁,得到網頁內容,計算所述網頁內容與移動應用資料庫中各個移動應用描述信息的相似度,並根據所述計算出的相似度選取與所述網頁內容對應的移動應用描述信息,根據選取的所述移動應用描述信息向所述客戶端推送相應的移動應用信息,以使所述客戶端下載所述移動應用信息,實現了根據客戶端瀏覽的網頁,捕捉到客戶端當前的興趣點,從而觸發客戶端下載移動應用的潛在需求,提高了客戶端對推送的移動應用的使用率。
[0027]圖1是本發明第一實施例的移動應用信息推送方法的流程圖。如圖1所示,所述方法包括:
[0028]步驟110、獲取客戶端瀏覽的網頁。
[0029]具體地,獲取客戶端瀏覽的網頁的方式有很多,可以從瀏覽器獲得客戶端當前瀏覽的網頁,也可以從網頁所屬的伺服器獲得客戶端當前瀏覽的網頁。如,當用戶使用百度瀏覽器訪問網頁時,通過百度瀏覽器獲得用戶正在瀏覽的網頁;或者,通過與各個網站合作,並在網站上嵌入調用移動應用推薦應用程式編程接口(Application ProgrammingInterface, API)的代碼,從而獲得用戶正在瀏覽的網頁。
[0030]步驟120、解析客戶端瀏覽的網頁,得到該網頁的網頁內容。
[0031]具體地,首先,對客戶端瀏覽的超文本標記語言(Hypertext MarkupLanguage,HTML)網頁進行解析,生成對應的HTML DOM樹,其中,DOM是文檔對象化模型(DocumentObject Model)的簡稱,DOM樹是指通過DOM將HTML頁面進行解析,並生成的HTMLtree樹狀結構和對應訪問方法。
[0032]然後,遍歷HTML DOM樹,並從HTML DOM樹中提取所需要的文字信息即網頁內容,t匕如,標題、正文等。其中,網頁上不同區域的文字可以採用不同的權重,比如,網頁正文文本的權重為1、網頁標題文本的權重為10,該權重代表了網頁不同區域文本的重要性。
[0033]步驟130、計算網頁內容與移動應用資料庫中各個移動應用描述信息的相似度,並根據計算出的相似度選取與網頁內容對應的移動應用描述信息。
[0034]具體地,移動應用資料庫中包括各個移動應用信息,以及各個移動應用信息對應的移動應用描述信息,其中,將網頁內容與移動應用資料庫中各個移動應用描述信息進行相似度計算,目的是找到與網頁內容相似度高的移動應用信息,使得這些移動應用信息更能出激發出用戶下載移動應用的潛在需求。
[0035]步驟140、根據選取的移動應用描述信息向客戶端推送相應的移動應用信息。其中,推送的移動應用信息至少包括移動應用的連結和描述,還可包括移動應用的圖標或封面,其中,在計算機上連結可以是二維碼。
[0036]具體地,向客戶端推送相應的移動應用信息,是以客戶端當前瀏覽的網頁為依據,使得這些移動應用信息更能出激發出用戶下載移動應用的潛在需求。
[0037]在本實施例的一個優選實施方式中,步驟110之前還包括:建立所述移動應用資料庫,所述移動應用資料庫包括各個移動應用的移動應用描述信息、所述移動應用描述信息中的移動應用關鍵詞和移動應用關鍵詞權重、以及所述移動應用描述信息中的移動應用主題和移動應用主題概率。
[0038]其中,建立移動應用資料庫的過程具體如下:`[0039](I)獲取各個移動應用的移動應用描述信息,比如,在移動商店中的介紹信息中獲取移動應用描述信息,或者通過靜態解析技術從行動應用程式中提取的描述信息。
[0040]( 2 )提取各個移動應用的移動應用描述信息的移動應用關鍵詞,計算所述關鍵詞的權重,並根據所述移動應用關鍵詞權重獲得所述移動應用描述信息的權重向量信息。比如,對移動應用的描述信息進行移動應用關鍵詞提取時,保留與該移動應用密切相關的詞語,並根據詞頻 _ 逆向文件頻率(Term Fequency -1nverse Document Frequency, TF-1DF)方法對每個關鍵詞賦予權重,並刪除權重較小的關鍵詞。其中,TF-1DF是一種用於資訊檢索與資訊探勘的常用加權技術。TF-1DF是一種統計方法,用以評估一字詞對於一個文件集或一個語料庫中的其中一份文件的重要程度。字詞的重要性隨著它在文件中出現的次數成正比增加,但同時會隨著它在語料庫中出現的頻率成反比下降。
[0041]若對第m個移動應用描述信息中每一個關鍵詞給予一個編號,則第m個移動應用描述信息可以表不成一個權重向量app文字m,如公式(I)所不。
[0042]app文字m= (b」 b2,...,b」...,bn)公式(I)
[0043]其中,I3i表示第i個移動應用關鍵詞的權重,η表示移動應用關鍵詞的總數量。
[0044]另外,還可以對提取出的各個移動應用的移動應用描述信息的關鍵詞建立移動應用關鍵詞索引,該索引可以是倒排索引,也可以正排索引。其中,建立索引的目的是用於提高網頁內容與移動應用描述信息的匹配效率。[0045](3)提取各個移動應用的移動應用描述信息的移動應用主題,計算所述移動應用主題的概率,並根據所有移動應用主題概率獲得所述移動應用描述信息的概率分布向量。
[0046]具體地,採用主題模型計算移動應用主題的概率,比如,採用概率潛語義分析(probabilitistic Latent Semantic Analysis,pLSA)獲取移動應用的描述信息的主題概率分布。其中,主題概率分布可以對一段文字的宏觀描述,從而有效地避免無關詞語偶然命中所帶來的推送錯誤。PLSA是基於雙模式和共現的數據分析方法延伸的經典的統計學方法。
[0047]若對第m個移動應用描述信息中每一個移動應用主題給予一個編號,則第m個移動應用描述信息還可以表示成一個概率向量app±jgm,如公式(2)所示。
[0048]app主題m= (tb」 tb2,...,tb」...,tbn)公式(2)
[0049]其中,tbi表示第i個移動應用主題出現的概率,η表示網頁主題的總數量。
[0050]上述(2)和(3)可以以任意順序執行,也可以只執行(2)和(3)中的任意一個。
[0051]另外,上述(2)還可以對提取出的移動應用關鍵詞建立移動應用關鍵詞索引,該索引可以是倒排索引,也可以正排索弓丨。其中,建立索引的目的是用於提高網頁內容與移動應用描述信息的匹配效率。
[0052]圖2是本發明第二實施例的移動應用信息推送方法的流程圖。如圖2所示,所述方法包括:
[0053]步驟210和步驟220、與步驟110和步驟120相同,在這裡不再贅述。
[0054]步驟230、提取網頁內容的網頁關鍵詞。
[0055]具體地,提取網頁內容的網頁關鍵詞是將網頁內容中反映段落語義的描述性詞語提取出來的過程。因為,網頁內容有很多文字,但並不是所有文字都是有用的,比如,一些常用的詞語「可以」、「已經」等出現頻率非常高,但不反映文欄位落的內容語義,所以只提取所需的關鍵詞。
[0056]步驟240、計算網頁關鍵詞的權重。
[0057]具體地,根據TF-1DF計算提取出來的每個網頁關鍵詞的權重。
[0058]若對每一個網頁關鍵詞給予一個編號,則該網頁內容可以表示成一個權重向量page文字,如公式(3)所示。
[0059]page文字=(a」 a2,...,a」...,an)公式(3)
[0060]其中,表示第i個網頁關鍵詞的權重,n表示網頁關鍵詞的總數量。
[0061]步驟250、根據網頁關鍵詞的權重和移動應用資料庫中各個移動應用描述信息的移動應用關鍵詞權重,計算所述網頁內容與移動應用資料庫中各個移動應用描述信息的文字相似度。
[0062]具體地,根據公式(I)和公式(3)計算網頁內容與第m個移動應用描述信息的文字相似度的過程如公式(4)所示。
[0063]
【權利要求】
1.一種移動應用信息推送方法,其特徵在於,所述方法包括: 獲取客戶端瀏覽的網頁; 解析所述網頁,得到網頁內容; 計算所述網頁內容與移動應用資料庫中各個移動應用描述信息的相似度,並根據所述計算出的相似度選取與所述網頁內容對應的移動應用描述信息; 根據選取的所述移動應用描述信息向所述客戶端推送相應的移動應用信息。
2.根據權利要求1所述的移動應用信息推送方法,其特徵在於,所述獲取客戶端瀏覽的網頁之前,還包括: 建立所述移動應用資料庫,所述移動應用資料庫包括各個移動應用的移動應用描述信息、所述移動應用描述信息中的移動應用關鍵詞和移動應用關鍵詞權重、以及所述移動應用描述信息中的移動應用主題和移動應用主題概率。
3.根據權利要求2所述的移動應用信息推送方法,其特徵在於,所述計算所述網頁內容與移動應用資料庫中各個移動應用描述信息的相似度,並根據所述計算出的相似度選取與所述網頁內容對應的移動應用描述信息,包括: 提取所述網頁內容的網頁關鍵詞; 計算所述網頁關鍵詞的權重; 根據所述網頁關鍵詞的權重和所述移動應用資料庫中各個移動應用描述信息的移動應用關鍵詞權重,計算所述網頁內容與移動應用資料庫中各個移動應用描述信息的文字相似度; 根據計算出的所述文字相似度選取與所述網頁內容對應的移動應用描述信息。
4.根據權利要求2所述的移動應用信息推送方法,其特徵在於,所述計算所述網頁內容與移動應用資料庫中各個移動應用描述信息的相似度,並根據所述計算出的相似度選取與所述網頁內容對應的移動應用描述信息,包括: 提取網頁內容的網頁主題; 計算所述網頁主題的概率; 根據所述網頁主題的概率和所述移動應用資料庫中各個移動應用描述信息的移動應用主題概率,計算所述網頁內容與移動應用資料庫中各個移動應用描述信息的主題相似度; 根據計算出的所述主題相似度選取與所述網頁內容對應的移動應用描述信息。
5.根據權利要求2所述的移動應用信息推送方法,其特徵在於,所述計算所述網頁內容與移動應用資料庫中各個移動應用描述信息的相似度,並根據所述計算出的相似度選取與所述網頁內容對應的移動應用描述信息,包括: 提取所述網頁內容的網頁關鍵詞和網頁主題; 計算所述網頁關鍵詞的權重和所述網頁主題的概率; 根據所述網頁關鍵詞的權重和所述移動應用資料庫中各個移動應用描述信息的移動應用關鍵詞權重,計算所述網頁內容與移動應用資料庫中各個移動應用描述信息的文字相似度;以及,根據所述網頁主題的概率和所述移動應用資料庫中各個移動應用描述信息的移動應用主題概率,計算所述網頁內容與移動應用資料庫中各個移動應用描述信息的主題相似度;確定所述文字相似度的權重和所述主題相似度的權重; 根據所述文字相似度和主題相似度、以及所述文字相似度的權重和所述主題相似度的權重,計算所述網頁內容與各個移動應用描述信息的相似度; 根據計算出的所述網頁內容與各個移動應用描述信息的相似度選取與所述網頁內容對應的移動應用描述信息。
6.根據權利要求3或5所述的移動應用信息推送方法,其特徵在於,所述移動應用資料庫還包括移動應用關鍵詞索引,所述根據所述網頁關鍵詞的權重和所述移動應用資料庫中各個移動應用描述信息的移動應用關鍵詞權重,計算所述網頁內容與移動應用資料庫中各個移動應用描述信息的文字相似度,包括: 在所述移動應用關鍵詞索引中查詢所述網頁關鍵詞,獲取所述查詢到的網頁關鍵詞對應的移動應用描述信息,以及根據所述查詢到的網頁關鍵詞對應的移動應用描述信息的移動應用關鍵詞權重與所述網頁關鍵詞的權重,計算所述查詢到的網頁關鍵詞對應的移動應用描述信息與所述網頁內容的文字相似度。
7.根據權利要求1所述的移動應用信息推送方法,其特徵在於,所述根據所述計算出的相似度選取與所述網頁內容對應的移動應用描述信息,包括: 將所述計算出的相似度進行從大到小的排序後,選取前η個相似度對應的移動應用描述信息,所述選取的前η個移動應用描述信息為與所述網頁內容對應的移動應用描述信息;或者,將所述計算出的相似度進行從小到大的排序後,選取後η個相似度對應的移動應用描述信息,所述選取的後η個移動應用描述信息為與所述網頁內容對應的移動應用描述信息。`
8.一種移動應用信息推送裝置,其特徵在於,所述裝置包括: 獲取模塊,用於獲取客戶端瀏覽的網頁; 解析模塊,用於解析所述網頁,得到網頁內容; 處理模塊,用於計算所述網頁內容與移動應用資料庫中各個移動應用描述信息的相似度,並根據所述計算出的相似度選取與所述網頁內容對應的移動應用描述信息; 推送模塊,用於根據選取的所述移動應用描述信息向所述客戶端推送相應的移動應用信息。
9.根據權利要求8所述的移動應用信息推送裝置,其特徵在於,所述裝置還包括: 建立模塊,用於建立所述移動應用資料庫,所述移動應用資料庫包括各個移動應用的移動應用描述信息、所述移動應用描述信息中的移動應用關鍵詞和移動應用關鍵詞權重、以及所述移動應用描述信息中的移動應用主題和移動應用主題概率。
10.根據權利要求9所述的移動應用信息推送裝置,其特徵在於,所述處理模塊包括: 第一提取單元,用於提取所述網頁內容的網頁關鍵詞; 第一計算單元,用於計算所述網頁關鍵詞的權重,根據所述網頁關鍵詞的權重和所述移動應用資料庫中各個移動應用描述信息的移動應用關鍵詞權重,計算所述網頁內容與所述移動應用資料庫中各個移動應用描述信息的文字相似度; 第一選取單元,用於根據計算出的所述文字相似度選取與所述網頁內容對應的移動應用描述信息。
11.根據權利要求10所述的移動應用信息推送裝置,其特徵在於,所述移動應用資料庫還包括移動應用關鍵詞索引,所述第一計算單元還用於在所述應用關鍵詞索引中查詢所述網頁關鍵詞,獲取所述查詢到的網頁關鍵詞對應的移動應用描述信息,以及根據所述查詢到的網頁關鍵詞對應的移動應用描述信息的移動應用關鍵詞權重與所述網頁關鍵詞的權重,計算所述查詢到的網頁關鍵詞對應的移動應用描述信息與所述網頁內容的文字相似度。
12.根據權利要求9所述的移動應用信息推送裝置,其特徵在於,所述處理模塊包括: 第二提取單元,用於提取網頁內容的網頁主題; 第二計算單元,用於計算所述網頁主題的概率;根據所述網頁主題的概率和所述移動應用資料庫中各個移動應用描述信息的移動應用主題概率,計算所述網頁內容與所述移動應用資料庫中各個移動應用描述信息的主題相似度; 第二選取單元,用於根據計算出的所述主題相似度選取與所述網頁內容對應的移動應用描述信息。
13.根據權利要求9所述的移動應用信息推送裝置,其特徵在於,所述處理模塊包括: 第三提取單元,用於提取所述網頁內容的網頁關鍵詞和網頁內容的網頁主題; 第三計算單元,用於計算所述網頁主題的概率;根據所述網頁關鍵詞的權重和所述移 動應用資料庫中各個移動應用描述信息的移動應用關鍵詞權重,計算所述網頁內容與移動應用資料庫中各個移動應用描述信息的文字相似度;以及,根據所述網頁主題的概率和所述移動應用資料庫中各個移動應用描述信息的移動應用主題概率,計算所述網頁內容與移動應用資料庫中各個移動應用描述信息的主題相似度; 確定單元,用於確定所述文字相似度的權重和所述主題相似度的權重; 第四計算單元,用於根據所述文字相似度和主題相似度、以及所述文字相似度的權重和所述主題相似度的權重,計算所述網頁內容與各個移動應用描述信息的相似度; 第三選取單元,用於根據計算出的所述網頁內容與各個移動應用描述信息的相似度選取與所述網頁內容對應的移動應用描述信息。
14.根據權利要求13所述的移動應用信息推送裝置,其特徵在於,所述移動應用資料庫還包括移動應用關鍵詞索引,所述第三計算單元還用於在所述移動應用關鍵詞索引中查詢所述網頁關鍵詞,獲取所述查詢到的網頁關鍵詞對應的移動應用描述信息,以及根據所述查詢到的網頁關鍵詞對應的移動應用描述信息的應用關鍵詞權重與所述網頁關鍵詞的權重,計算所述查詢到的網頁關鍵詞對應的移動應用描述信息與所述網頁內容的文字相似度。
15.根據權利要求8所述的移動應用信息推送裝置,其特徵在於,所述處理模塊具體用於將所述計算出的相似度進行從大到小的排序後,選取前η個相似度對應的移動應用描述信息,所述選取的前η個移動應用描述信息為與所述網頁內容對應的移動應用描述信息;或者,將所述計算出的相似度進行從小到大的排序後,選取後η個相似度對應的移動應用描述信息,所述選取的後η個移動應用描述信息為與所述網頁內容對應的移動應用描述信息。
【文檔編號】G06F17/30GK103530339SQ201310463741
【公開日】2014年1月22日 申請日期:2013年10月8日 優先權日:2013年10月8日
【發明者】劉峰, 劉亦梁, 羅威, 王維煜 申請人:北京百度網訊科技有限公司