新四季網

面向個性化應用的跨網絡行為關聯方法

2023-12-07 06:18:11 1

面向個性化應用的跨網絡行為關聯方法
【專利摘要】本發明是一種面向個性化應用的跨網絡行為關聯方法,首先確定不同網絡特有的異構信息並分別對其在各自網絡進行主題建模,得到相應信息的主題分布表示;然後,聚合用戶在各自網絡的行為信息來分別計算得到用戶在不同網絡的主題分布表示,並利用跨網絡關聯用戶在不同網絡上主題分布的一一對應關係分別對不同網絡學習一組網絡相關的用戶屬性因子向量;最後,通過不同網絡的用戶屬性因子向量使不同網絡信息的主題分布可以進行互相轉換,達到跨網絡行為信息關聯的目的。本發明通過引入主題模型和用戶感知,使該關聯突破語義關聯的局限性,在更細的粒度下進行感知。
【專利說明】面向個性化應用的跨網絡行為關聯方法

【技術領域】
[0001] 本發明屬於社會媒體計算【技術領域】,涉及一種面向個性化應用的跨網絡行為關聯 方法。

【背景技術】
[0002] 隨著網際網路技術的發展,各種社會媒體和網絡應用應運而生。為更好進行社交和 信息獲取,用戶越來越頻繁的使用多種社會媒體服務,這也使得用戶的信息分散在不同的 網絡平臺上,只從單一的網絡平臺去分析用戶的行為無法全方位的理解用戶。因此,將不同 網絡平臺用戶的行為進行整合可以更好的分析用戶興趣,從而有助於設計更加精準的個性 化應用。然而,用戶在不同網絡平臺的行為往往是異構的,這種異構的跨網絡行為經常無法 簡單的進行一一加和。因此,如何將不同網絡平臺的異構行為進行有效的整合是一個亟待 解決的問題,而這裡的關鍵就是找到跨網絡異構行為之間的關聯模式。
[0003] 目前,跨網絡分析和應用研究是一個相對嶄新的領域,還處在起步階段。研究者們 目前主要從兩方面研究該領域:多網絡拓撲結構分析和跨網絡用戶建模。多網絡拓撲結構 分析主要利用社會網絡分析(Social Network Analysis, SNA)的方法研究多網絡下總體網 絡拓撲結構和屬性,並分析不同網絡平臺屬性和結構的相似性和差異性,以及信息在多網 絡結構下的傳播機制。跨網絡用戶建模專注於將不同網絡平臺的同質用戶行為進行聚合, 比如將不同網絡平臺用戶的標籤和簡介聚合起來,作為一個更加完整的用戶文檔來表示用 戶,然後基於該聚合文檔對用戶進行用戶建模,得到多網絡聚合的用戶興趣。這兩方面研究 目前還是主要分別從社會關係結構和同質行為(比如用戶標籤)來研究多網絡場景下的相 應特性,然而多網絡情形下往往伴隨著多種異構行為(比如用戶標籤和用戶好友關係),這 些異構的跨網絡行為有時才能反映更加穩定的用戶興趣,因此如果能挖掘出跨網絡異構行 為之間的關聯模式,則可以更好的理解跨網絡下的用戶興趣和不同網絡的知識特性。
[0004] 遷移學習 (Transfer Learning)和子空間學習 (Subspace Learning)是學習不同 網絡空間關聯的兩種重要技術。前者通過找一些共現數據(Co-occurrence Data)來學習 得到不同平臺的潛在關聯模式,並將知識從源網絡遷移到目標網絡來解決目標網絡上的分 類、回歸等問題。後者的主要思想是通過學習一個公共的子空間來同時表達不同類型的異 構數據,使得不同形式的異構數據可以在這個公共的子空間進行直接的比較。但這些技術 都沒有考慮過從跨網絡關聯用戶的角度去對不同網絡的異構行為進行關聯,進而以用戶集 體智慧的方式發現不同網絡間的關聯模式。


【發明內容】

[0005] (一)要解決的技術問題
[0006] 本發明的目的是將不同網絡上的異構行為信息進行用戶層的關聯,並基於此關聯 設計個性化的應用。為此提出利用跨網絡關聯用戶作為連接不同網絡的橋梁,基於潛在用 戶屬性發現的跨網絡行為關聯方法。
[0007] (二)技術方案
[0008] 為實現上述目的,本發明提供面向個性化應用的跨網絡行為關聯方法包括:
[0009] S1、分別對兩個具有異構知識實體和用戶行為的網絡進行主題建模,分別得到反 映用戶行為的異構知識在不同主題空間的主題分布;
[0010] S2、將用戶在所述兩個網絡的行為信息進行主題聚合,得到用戶在所述兩個網絡 的主題分布;
[0011] S3、基於潛在用戶屬性發現對所述兩個網絡進行跨網絡主題關聯;
[0012] S4、將所述跨網絡的主題關聯轉換為跨網絡的用戶行為分布關聯。
[0013] (三)有益效果
[0014] 從上述技術方案可以看出,本發明面向個性化應用的跨網絡行為關聯方法具有以 下有益效果:
[0015] (1)利用跨網絡關聯用戶的集體智慧,使不同網絡的異構行為能在用戶層上進行 跨網絡關聯,同時通過引入主題模型和用戶感知,使該關聯突破語義關聯的局限性,在更細 的粒度下進行感知。
[0016] (2)該發明提出了一種用戶感知的跨網絡異構行為關聯方法,基於該關聯可以從 多種方向設計跨網絡的個性化應用,有效的緩解了冷啟動和數據稀疏性問題。

【專利附圖】

【附圖說明】
[0017] 圖1是本發明面向個性化應用的跨網絡行為關聯方法的流程圖;
[0018] 圖2是本發明一個實施例中視頻主題空間多模態主題建模(iCorr-LDA)的圖表 示;
[0019] 圖3和圖4分別是本發明實施例中對步驟S1異質主題建模學到的視頻主題空間 和社交網絡用戶興趣空間的可視化表示。

【具體實施方式】
[0020] 本發明的目的是跨網絡的行為關聯。該問題存在如下挑戰:首先,不同網絡具有異 構的知識實體和行為,例如視頻興趣行為和社交網絡社會關係行為,如何對它們進行合理 的泛化表示;另外,不同網絡的知識間沒有直接的顯式關聯,也無法直觀的給出不同網絡上 知識和行為的相關性指標,如何在跨平臺網絡間建立合理的聯繫。
[0021] 本發明中所稱的異構的知識實體和行為是指知識實體的內容屬性,以及用戶對知 識實體的行為屬性均不相同。上述的視頻興趣行為也可以擴展到音頻興趣或者商品興趣行 為等,社交網絡社會關係行為也可以是微博文本興趣行為或者加入圈子行為等。
[0022] 為使本發明的目的、技術方案和優點更加清楚明白,以下結合具體實施例,並參照 附圖,對本發明作進一步的詳細說明。在下面的實施例中,主要以視頻行為和社會關係行為 的異構關聯為例進行說明,但本發明並不局限於此。
[0023] 該實施例中,具有異構的知識實體和用戶行為的兩個不同網絡為社交網絡推特 (Twitter)和視頻分享網絡優突博(YouTube)。
[0024] 圖1是本發明面向個性化應用的跨網絡行為關聯方法的流程圖。如圖1所示,本發 明首先用恰當的主題模型將不同網絡的異構行為進行主題層泛化,然後利用跨網絡關聯用 戶的集體智慧將不同網絡的主題進行量化關聯,使不同網絡的異構行為表示可以通過潛在 的用戶屬性因子向量相互轉換,基於此可以進而從多方向設計跨網絡的個性化應用。所謂 跨網絡關聯用戶是指在不同網絡均有帳號的關聯用戶。由此,本發明提出了一種全新的用 戶感知的跨網絡行為關聯方法,為理解多網絡情景下用戶的異構行為奠定了堅實基礎。本 發明主要分以下幾個主要步驟:S1、異質主題建模;S2、用戶主題分布聚合;S3、基於潛在用 戶屬性發現的跨網絡主題關聯;S4、基於主題關聯的跨網絡行為分布轉換。
[0025] 這裡的主題是指用戶的興趣主題。
[0026] S1、分別對兩個具有異構知識實體和用戶行為的網絡進行主題建模,分別得到反 映用戶行為的異構知識在不同主題空間的主題分布。
[0027] 該步驟的目的是發現視頻分享網絡和社交網絡空間行為的潛在泛化結構,有助於 後續的基於主題層次的分析和應用。我們設計生成式的主題模型分別對優突博視頻和社 交網絡用戶進行主題建模,分別得到優突博視頻和社交網絡用戶在各自主題空間的主題分 布。在具體實施例中,步驟S1包括如下步驟 :
[0028] SI. 1對所述視頻分享網絡上的視頻提取文本描述信息以及關鍵幀視覺信息並建 立視頻語義-視覺文檔,對每個視頻文檔,進行多模態主題建模(iCorr-LDA),最終得到每 個視頻在其語義空間上的主題分布向量。
[0029] 為了使學到的視頻主題能同時涵蓋視頻的文本和視覺描述信息,我們設計了一種 變體的多模態主題模型(iCorr-LDA)。在我們的問題中,每個優突博視頻可以表示為一個二 元組(f ;w),其中f為該視頻的N個關鍵幀的視覺特徵向量集合,w為該視頻的Μ個標籤單 詞集合,我們對跨網絡數據集中所有優突博用戶的視頻二元組集合進行多模態主題建模, 得到每個視頻的視覺-語義主題分布。具體來說,首先從標準的潛在狄利克雷分布主題模 型(LDA)中抽樣得到視頻的Μ個標籤單詞。然後,對視頻的每個關鍵幀,先抽樣得到一個標 籤單詞,再從生成該標籤單詞的主題上抽樣得到相應的關鍵幀視覺單詞。該多模態主題模 型(iCorr-LDA)的圖表示參見圖2。其中α,μ,σ,β為該主題模型的超參數,可以通過 吉布斯採樣方法進行近似求解;y為離散指示變量,等概率的在1到Μ間取整數值來控制選 擇合適的標籤單詞。圖3抽樣了兩個視頻主題進行可視化呈現,其中每個主題給出了該主 題的前5個生成概率最大的標籤單詞以及前3個生成概率最大的視頻。可以看出,這兩個 主題都有很明確的領域主題(遊戲和德國),同時這兩個學到的主題在視覺表示和文本語 義表示上也具有很高的一致性。
[0030] S1. 2提取所述社交網絡上用戶的社會關係信息,然後對用戶的社會關係圖進行標 準的潛在狄利克雷分布主題建模(LDA),最終得到每個用戶在該用戶興趣空間上的主題分 布向量。
[0031] 在社交網絡中,用戶會根據自己的興趣任意的關注各種感興趣的門戶帳號、領域 專家以及真實好友等,用戶的好友關係作為社交網絡上的一種重要的用戶行為,反映了一 段時間內穩定的用戶興趣。因此,我們這裡主要研究推特社交網絡上的用戶好友關係行為 數據,進而對用戶的興趣進行主題建模。具體地說,我們將推特用戶作為標準主題模型的 "文檔",該用戶的所有粉絲作為相應的"文檔單詞",然後對該用戶文檔進行標準的潛在狄 利克雷分布主題建模(LDA),以得到每個推特用戶在這種用戶-粉絲社交圖譜結構空間的 主題分布。由於主題建模本質上是利用了單詞的共現關係,得到的推特社會關係用戶主題 實際上捕捉到的是每個粉絲群子集共同感興趣的一些專業用戶,反映了每個粉絲群子集的 公共興趣。同時,由於一段時間內用戶的社會關係一般基本保持不變,通過用戶的社會關係 學得的用戶興趣因此也將會更加穩定和準確。圖4抽樣了 3個學到的推特社會關係用戶主 題,其中每個主題給出了該主題的前3個生成概率最大的熱門用戶,每個熱門用戶由其用 戶ID,用戶名,居住地,粉絲數量以及自我描述所表示。可以看出,學得的推特主題在粒度上 有著很廣的覆蓋性:有遊戲這種一般的主題,也有專門由福布斯影響力用戶構成的特有主 題,還有由來自同一個地方(德國)用戶組成的地域性主題。以這種方式學得的多角度細 粒度的主題也使得後續學得的跨網絡關聯具有更大的隨意性,便於捕捉到更精準的跨網絡 主題關係。
[0032] S2、將用戶在所述兩個網絡的行為信息進行主題聚合,得到用戶在所述兩個網絡 的主題分布。
[0033] 由於不同網絡的行為和信息都是由用戶創造的,同一個用戶在不同網絡的行為應 該具有一定的關聯性,因此我們希望通過以同一個用戶在視頻分享網絡和社交網絡上主題 分布的一一對應關係為約束,通過大量跨網絡關聯用戶的集體智慧來求得跨網絡主題間的 關係。所以,首先我們需要將用戶在各自網絡的行為信息分別進行主題聚合,得到用戶在各 自網絡的興趣主題分布。
[0034] 在該實施例中,步驟S2聚合用戶在所述視頻分享網絡中感興趣的視頻的主題分 布,得到用戶在視頻語義空間上的主題分布,使所述視頻分享網絡和所述社交網絡上行為 的主題分布表示都上升到用戶層次。
[0035] 由於在社交網絡上,我們直接對用戶的社會關係進行主題建模,所以我們已經得 到了用戶的興趣主題分布。因此,我們只需將用戶在視頻分享網絡的視頻行為進行主題聚 合即可。具體地說,對任意給定的優突博用戶,我們把該用戶上傳的視頻,最喜愛的視頻以 及播放列表裡的視頻作為他感興趣的視頻集合,已知用戶u感興趣的視頻集合以及第一步 異質主題建模後得到的視頻主題分布P (zY| v),通過簡單的推導,我們可以得到用戶u的主 題分布如下:

【權利要求】
1. 一種跨網絡行為關聯方法,其特徵在於,所述方法包括如下步驟: 51、 分別對兩個具有異構知識實體和用戶行為的網絡進行主題建模,分別得到反映用 戶行為的異構知識在不同主題空間的主題分布; 52、 將用戶在所述兩個網絡的行為信息進行主題聚合,得到用戶在所述兩個網絡的主 題分布; 53、 基於潛在用戶屬性發現對所述兩個網絡進行跨網絡主題關聯; 54、 將所述跨網絡的主題關聯轉換為跨網絡的用戶行為分布關聯。
2. 如權利要求1所述的跨網絡行為關聯方法,其特徵在於,所述兩個具有異構知識實 體和用戶行為的網絡是視頻分享網絡和社交網絡。
3. 如權利要求2所述的跨網絡行為關聯方法,其特徵在於,所述步驟S1包括: S1. 1、對所述視頻分享網絡上的視頻提取文本描述信息以及關鍵幀視覺信息並建立視 頻語義-視覺文檔,對每個視頻文檔,進行多模態主題建模(iCorr-LDA),最終得到每個視 頻在其語義空間上的主題分布向量; S1. 2、提取所述社交網絡上用戶的社會關係信息,然後對用戶的社會關係圖進行標準 的潛在狄利克雷分布主題建模(LDA),最終得到每個用戶在該用戶興趣空間上的主題分布 向量。
4. 如權利要求2所述的跨網絡行為關聯方法,其特徵在於, 所述步驟S2為:聚合用戶在所述視頻分享網絡中感興趣的視頻的主題分布,得到用戶 在視頻語義空間上的主題分布,使所述視頻分享網絡和所述社交網絡上行為的主題分布表 示都上升到用戶層次。
5. 如權利要求4所述的跨網絡行為關聯方法,其特徵在於,在步驟S2中,對任意給定的 視頻分享網絡用戶,把該用戶上傳的視頻,最喜愛的視頻以及播放列表裡的視頻作為他感 興趣的視頻集合,已知用戶u感興趣的視頻集合以及第一步異質主題建模後得到的視頻主 題分布p (zY| v),得到用戶u的主題分布如下:
6. 如權利要求2所述的跨網絡行為關聯方法,其特徵在於,所述步驟S3為:利用跨網 絡關聯用戶在所述視頻分享網絡和社交網絡上主題分布的一一對應關係,分別對所述兩個 網絡各自學習一組網絡相關的用戶屬性因子向量,使用戶在該兩個網絡的主題分布投影到 相應的用戶屬性因子向量構成的空間後得到一致的用戶表示。
7. 如權利要求6所述的跨網絡行為關聯方法,其特徵在於,在步驟S3中,所述視頻分享 網絡和所述社交網絡共有的跨網絡用戶子集為U。= uY n UT,其中UY和UT分別為視頻分享 網絡和社交網絡所有用戶總集,通過如下優化目標函數來學習和發現每種潛在用戶屬性在 視頻分享網絡和社交網絡所對應的成對用戶因子向量:
其中DY和DT分別為視頻分享網絡和社交網絡上所有成對的用戶因子向量的矩陣表示, 該矩陣的每一列d表示一個用戶因子向量,兩個矩陣上相同位置的列反映同一種用戶屬 性;S為跨網絡用戶在不同的網絡上共有的潛在用戶屬性表示,該矩陣的每一列s表示某個 用戶的主題分布投影到成對的用戶因子向量空間後的屬性表示。
8. 如權利要求7所述的跨網絡行為關聯方法,其特徵在於, 所述步驟S4為:利用視頻分享網絡和社交網絡各自學到的用戶屬性因子向量使對主 題分布進行轉換。
9. 如權利要求8所述的跨網絡行為關聯方法,其特徵在於, 在所述步驟S4中,當給定新用戶在所述視頻分享網絡的主題分布uY,通過稀疏編碼的 方式得到該用戶投影到DY構成的用戶屬性空間後的潛在屬性表示如下:
【文檔編號】G06F17/30GK104090971SQ201410341643
【公開日】2014年10月8日 申請日期:2014年7月17日 優先權日:2014年7月17日
【發明者】徐常勝, 嚴明, 桑基韜 申請人:中國科學院自動化研究所

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀