新四季網

獲取地圖興趣點評價數據的方法和裝置製造方法

2023-05-08 01:22:41 2

獲取地圖興趣點評價數據的方法和裝置製造方法
【專利摘要】一種獲取地圖興趣點評價數據的方法,首先獲取第三方網絡平臺上的用戶發布內容,並將用戶發布內容與興趣點進行關聯處理,獲得與興趣點關聯的用戶發布內容。然後對關聯的用戶發布內容進行處理。獲得與興趣點匹配的用戶發布內容。由於第三方網絡平臺上具有所需的評價數據,通過自動的關聯和處理便能從中選擇出與興趣點匹配的評價數據。不需要運營商收集反饋信息,也不需用戶登錄對某興趣點進行評論。因此,通過上述方法和裝置能簡單、方便地獲取地圖興趣點評價數據。此外,本發明還提供一種獲取地圖興趣點評價數據的裝置。
【專利說明】獲取地圖興趣點評價數據的方法和裝置
【技術領域】
[0001]本發明涉及電子地圖技術,特別是涉及一種獲取地圖興趣點評價數據的方法和裝置。
【背景技術】
[0002]地圖興趣點(POI)指的是地圖中各種能引起人們關注的地點,如「清華大學」、「中關村」「***餐廳」等。POI信息一般包括名稱、地址、電話、類別等基礎信息。在越來越多的LBS (基於位置的服務)應用中,上述信息不足以讓用戶對其感興趣的POI進行深入的了解。因此,用戶需要更多的POI信息,如其他用戶的評價數據來了解感興趣的Ρ0Ι。
[0003]用戶的評價數據包含了對POI整體情況的評價,具體內容因POI的類別不同而不同。以餐飲類的POI為例,評價數據可包括環境、氛圍、消費水平、服務水平、特色菜、滿意度等。傳統添加用戶的評價數據的方式有兩種。一種方式是LBS應用的運營商通過客戶回訪、評論反饋等方式獲得用戶對興趣點的評價,然後通過運營商添加。另一種方式是直接允許用戶對興趣點進行評論,從而增加該興趣點的評價數據。
[0004]然而,第一種方式需要運營商回訪客戶、收集評論,然後再添加評論。第二種方式需要用戶在實際訪問興趣點,並了解該興趣點後,登錄並找到相關的興趣點,然後再進行評論。因此,通過上述兩種方式添加評價數據的過程繁瑣,造成添加興趣點評價數據操作不方便。

【發明內容】

[0005]基於此,有必要針對添加評價數據的過程繁瑣,操作不方便的問題,提供一種能簡單、方便地獲取地圖興趣點評價數據的方法和裝置。
[0006]一種獲取地圖興趣點評價數據的方法,包括:
[0007]獲取第三方網絡平臺上的用戶發布內容;
[0008]將所述用戶發布內容與興趣點進行關聯處理,獲得與所述興趣點關聯的用戶發布內容;
[0009]對所述關聯的用戶發布內容進行處理,獲得與所述興趣點匹配的用戶發布內容。
[0010]此外,本發明還提供一種獲取地圖興趣點評價數據的裝置,所述裝置包括:
[0011]信息獲取模塊,用於獲取第三方網絡平臺上的用戶發布內容;
[0012]關聯模塊,用於將所述用戶發布內容與興趣點進行關聯處理,獲得與所述興趣點關聯的用戶發布內容;
[0013]篩選模塊,用於對所述關聯的用戶發布內容進行處理,獲得與所述興趣點匹配的用戶發布內容。
[0014]上述獲取地圖興趣點評價數據的方法和裝置,首先獲取第三方網絡平臺上的用戶發布內容,並將用戶發布內容與興趣點進行關聯處理,獲得與興趣點關聯的用戶發布內容。然後對關聯的用戶發布內容進行處理,獲得與興趣點匹配的用戶發布內容。由於第三方網絡平臺上具有所需的評價數據,通過自動的關聯和處理便能從中選擇出與興趣點匹配的評價數據。不需要運營商收集反饋信息,也不需用戶登錄對某興趣點進行評論。因此,通過上述方法和裝置能簡單、方便地獲取地圖興趣點評價數據。
【專利附圖】

【附圖說明】
[0015]圖1為一實施例中獲取地圖興趣點評價數據的方法的流程示意圖;
[0016]圖2為一實施例中獲得與興趣點關聯的用戶發布內容的方法流程示意圖;
[0017]圖3為一實施例中獲得與興趣點匹配的用戶發布內容的方法流程示意圖;
[0018]圖4為一實施例中獲取地圖興趣點評價數據的裝置的模塊示意圖;
[0019]圖5為一實施例中關聯模塊的詳細模塊示意圖;
[0020]圖6為一實施例中篩選模塊的詳細模塊不意圖。
【具體實施方式】
[0021]如圖1所示,在一個實施例中,獲取地圖興趣點評價數據的方法包括以下步驟:
[0022]步驟S110,獲取第三方網絡平臺上的用戶發布內容。
[0023]在一個實施例中,第三方網絡平臺是區別於電子地圖的平臺,包括SNS (社會性網絡服務)社區、社交網絡、微博平臺等。用戶發布內容中包括含有用戶發布內容發布的時間、地址、內容的來源、發布者、內容的正文等。以微博平臺為例,可通過兩種方式獲取用戶發布內容:一種是直接調用微博接口,另一種是通過微博實時推送,然後從推送的內容中進行篩選。採用第一種方式可大大減少了檢索的開發量,少了很多建索引和平臺維護的成本,但是這種方法依靠微博接口的搜索功能的精準度,有可能會丟掉一些應該召回的內容,獲取的信息量也少於通過微博實時推送獲取的信息量。採用第二種方式可以拿到充足的內容,並可按照自己的需求精確、去噪,但需要另外編寫檢索程序,搭建檢索平臺,資源耗費較大。
[0024]在一個實施例中,獲取用戶發布內容後,還需要對用戶發布內容進行預處理。預處理包括對用戶發布內容進行編碼、格式化及賦權值。編碼是將用戶發布內容歸一化為gbk(漢字內碼擴展規範)編碼,以方便對用戶發布內容進行比較、計算。格式化是指將用戶發布內容按照發布者、發布時間、發布內容、內容內照片等進行重新調整,即實現用戶發布內容組織形式上的標準化。賦權值是指將不同來源的用戶發布內容(名稱、話題、評論內容)賦予不同的權值,便於後續對用戶發布內容進行篩選。用戶發布內容的來源可體現用戶發布內容的重要性,例如,用戶發布內容來源於評論內容,則表示該用戶發布內容不是很重要,故賦予較小的權值。
[0025]步驟S120,將用戶發布內容與興趣點進行關聯處理,獲得與興趣點關聯的用戶發布內各。
[0026]由於獲取的用戶發布內容是海量的,在進一步識別出與興趣點匹配的用戶發布內容之前,需要從用戶發布內容中篩選出與興趣點相關聯的用戶發布內容。相關聯指的是用戶發布內容與興趣點具有一定的關聯性,一條用戶發布內容與某興趣點相關聯,可能僅僅是指用戶發布內容中包含有與興趣點名稱相同或相似的字詞,並不一定表示該用戶發布內容對該興趣點進行了描述。
[0027]如圖2所示,在一個實施例中,上述步驟S120具體包括以下步驟:[0028]步驟S121,將用戶發布內容進行分詞處理,得到與用戶發布內容相關的分詞。
[0029]分詞處理是進行用戶發布內容關聯的第一步。分詞指的是指根據分詞庫將完整的用戶發布內容分成孤立的詞組,所用的分詞庫是根據地圖中的興趣點名稱和地址挖掘出來的。
[0030]步驟S123,將興趣點名稱進行規範化和向量化處理。
[0031]對興趣點的規範化是指對興趣點的名稱做處理,發散出多個可能的組合。用戶在發微博的時候具有隨意性,有可能不會按照某個興趣點官方或通用的名稱來命名。例如,「清華大學北門」這個名稱有可能發散為多個名稱:「清華大學北門」、清華大學、清華及清華北門等。因此,為了命中更多有用的記錄,需要對興趣點的名稱進行發散。
[0032]向量化處理就是將規範化的興趣點名稱格式化為二個維度:名稱和城市。某些興趣點如餐廳可能在多地設有分店,例如,「麥當勞」,當通過這個詞進行篩選時,全國的麥當勞餐廳都會被命中。因此,為了是獲得的用戶發布內容更具針對性,需要在篩選關聯的用戶發布內容時,將城市作為一個維度來限制篩選的範圍。
[0033]步驟S125,計算分詞與興趣點名稱的相似度,並獲得相似度大於預定值的分詞。
[0034]預定值可根據經驗設定,若兩個詞的相似度大於該預定值,則表示兩個詞有可能描述同一事物。通過特定的算法,計算每個分詞與經過規範化和向量化處理的興趣點名稱的相似度。分詞與興趣點名稱的相似度越高,則表示該分詞所在的用戶發布內容與興趣點的相關性越強。由於興趣點的名稱可被發散為多個,因此獲得的相似度大於預定值的分詞有可能具有多個。
[0035]步驟S127,根據相似度最大的分詞,獲得關聯的用戶發布內容。
[0036]在獲取相似度大於預定值的分詞後,根據分詞的來源查找到與興趣點關聯的用戶發布內容。例如,獲取的相似度大於預定值的分詞為「清華大學」,則在所有用戶發布內容中查找,所有含有該分詞「清華大學」的用戶發布內容都被選作為興趣點的關聯的用戶發布內容。
[0037]步驟S130,對關聯的用戶發布內容進行處理,獲得與興趣點匹配的用戶發布內容。
[0038]由於相似度大於預定值的分詞有多個,且每個分詞對應的用戶發布內容有多個,因此關聯的用戶發布內容的數量依然龐大。而且,在關聯的用戶發布內容中,有一部分只是含有相似度大於預定值的分詞,但卻對興趣點的描述很少,這類用戶發布內容不應該被當作擴展數據顯示在地圖中。因此,在作為擴展數據展示之前,還需對關聯的用戶發布內容進行篩選,剔除關聯的用戶發布內容中無實質作用的部分。
[0039]在一個實施例中,上述步驟130具體為:根據預設的關聯因子及每個關聯因子對應的權值對所述關聯的用戶發布內容進行處理,獲得與興趣點匹配的用戶發布內容。其中,關聯因子可以包括分詞位置因子、發布位置因子、發布時間因子及信息來源因子等。
[0040]如圖3所示,在本實施例中,根據預設的關聯因子及每個關聯因子對應的權值對所述關聯的用戶發布內容進行處理,獲得與興趣點匹配的用戶發布內容具體包括以下步驟:
[0041]步驟S131,根據關聯的用戶發布內容和/或興趣點的信息獲取每個關聯因子對應的權值。
[0042]在一個實施例中,分詞位置因子的權值根據相似度大於預定值的分詞在關聯的用戶發布內容中的位置獲得。具體地,若相似度大於預定值的分詞出現在用戶發布內容的正文中,則賦予該關聯因子較大的權值,若相似度大於預定值的分詞出現在用戶發布內容的評論中或發布者的用戶名中,則賦予該關聯因子較小的權值。
[0043]興趣點的信息包括興趣點對應的經緯度。發布位置因子的權值的權值根據關聯的用戶發布內容的發布位置與興趣點對應的位置的關係獲得。具體地,若發布關聯的用戶發布內容時的經緯度與興趣點對應的經緯度越接近,則賦予該關聯因子的權值就越大。否則,根據預設規則賦予該關聯因子的權值就越小。
[0044]發布時間因子的權值根據關聯的用戶發布內容的發布時間獲得。具體地,關聯的用戶發布內容發布的時間與當前時間越接近,則表示該用戶發布內容反應的內容更具時效性。因此,關聯的用戶發布內容發布時間與當前時間越接近,則賦予該關聯因子越大的權值。否則,賦予該關聯因子越小的權值。
[0045]信息來源因子的權值根據關聯的用戶發布內容的來源獲得。具體地,關聯的用戶發布內容有可能來自全文、評論或是用戶名,來自全文的用戶發布內容包含有更多信息,因此更重要。若關聯的用戶發布內容來自全文,則賦予該關聯因子較大的權值,若關聯的用戶發布內容來自評論或者是用戶名,則賦予較小的權值。
[0046]可以理解,在其他實施例中,關聯因子可僅包含上述關聯因子的一種或任意幾種的組合。
[0047]步驟S133,將關聯因子及關聯因子對應的權值進行線性處理,得到關聯的用戶發布內容的歸一化值。
[0048]具體地,將步驟S131獲得的關聯因子及每個關聯因子的權值進行線性處理,得到歸一化值,該歸一化值表不用戶發布內容與興趣點的匹配度。即一條用戶發布內容的歸一化值越大,則表示該用戶發布內容與興趣點匹配的可能性越大。
[0049]步驟S135,將歸一化值與預設的閾值比較,獲得歸一化值大於等於所述預設的閾值的用戶發布內容為與興趣點匹配的用戶發布內容。
[0050]裝置預設有一閾值,若歸一化值超過該閾值,則表示用戶發布內容可與興趣點匹配。將步驟S133獲得的歸一化值與閾值進行比較,選擇所有大於等於閾值的歸一化值,並將選擇的歸一化值所對應的用戶發布內容作為與興趣點匹配的用戶發布內容。
[0051]需要指出的是,在其他實施例中,獲得與興趣點匹配的用戶發布內容不限於上述方式。
[0052]在另一個實施例中,在上述步驟S120之前,還包括篩選用戶發布內容中的垃圾信息並剔除的步驟。
[0053]由於獲取的用戶發布內容的數目是巨大的,因此對於系統會造成很大壓力。而獲取的用戶發布內容中有很大一部分屬於垃圾信息,在進行進一步的處理前應予以剔除。剔除垃圾信息後,既可減輕系統的負擔,又能提供更健康的內容。
[0054]垃圾信息一般包括內容過短的微博(少於8個字符,表情字符、直接轉播等)、色情內容、反動言論、廣告內容等。識別垃圾信息的方式一般為:預設若干關鍵字,查找用戶發布內容中是否有與關鍵字匹配的字詞,若有,則識別為垃圾信息。此外,還可建立一個黑名單,黑名單中記錄被舉報或查處過的用戶名,當獲得的用戶發布內容的發布者為黑名單中的用戶時,直接將該用戶發布內容作為垃圾信息處理。[0055]在一個實施例中,在步驟S130之後,還包括建立興趣點和匹配的用戶發布內容之間的對應關係的步驟。
[0056]本實施例中,由於興趣點與某個地理位置對應,預先存儲了地理位置與興趣點的對應關係。當電子地圖運行過程中,用戶可定位到某個或多個地理位置,根據用戶定位的地理位置即可獲取到與該地理位置對應的興趣點,並可將與該興趣點相關信息進行展示。由於建立了興趣點和匹配的用戶發布內容之間的對應關係,當獲取到興趣點後,即可通過該對應關係將與該興趣點匹配的用戶發布內容就作為擴展數據顯示給用戶。
[0057]因此,不必每個用戶訪問某興趣點時,都要重新從第三方網絡平臺上獲取數據。在地圖詳情頁上展示匹配的用戶發布內容的結果,包括用戶名,發布時間、發布文字內容、多媒體內容等。對於轉播次數和點評次數較多的用戶發布內容,還可利用其位置信息對興趣點進行坐標和地址糾錯。此外,還可在匹配的用戶發布內容的名稱、話題,在地圖搜索結果上加連結,允許用戶在該點上發微博。
[0058]需要指出的是,在其他實施例中,獲取地圖興趣點評價數據的方法可僅包括上述兩個步驟中的一個。
[0059]如圖4所示,本發明還提供一種獲取地圖興趣點評價數據的裝置,該包括信息獲取模塊110、關聯模塊120及篩選模塊130其中:
[0060]信息獲取模塊110用於獲取第三方網絡平臺上的用戶發布內容。
[0061]在一個實施例中,第三方網絡平臺是區別於電子地圖平臺的,包括SNS (社會性網絡服務)社區、社交網絡、微博平臺等。用戶發布內容中包括含有用戶發布內容發布的時間、地址、內容的來源、發布者、內容的正文等。以微博平臺為例,信息獲取模塊110可通過兩種方式獲取用戶發布內容:一種是直接調用微博接口,另一種是通過微博實時推送,然後從推送的內容中進行篩選。採用第一種方式可大大減少了檢索的開發量,少了很多建索引和平臺維護的成本,但是這種方法依靠微博接口的搜索功能的精準度,有可能會丟掉一些應該召回的內容,獲取的信息量也少於通過微博實時推送獲取的信息量。採用第二種方式可以拿到充足的內容,並可按照自己的需求精確、去噪,但需要另外編寫檢索程序,搭建檢索平臺,資源耗費較大。
[0062]在一個實施例中,信息獲取模塊110獲取用戶發布內容後,還需要對用戶發布內容進行預處理。預處理包括對用戶發布內容進行編碼、格式化及賦權值。編碼是將用戶發布內容歸一化為gbk (漢字內碼擴展規範)編碼,以方便對用戶發布內容進行比較、計算。格式化是指將用戶發布內容按照發布者、發布時間、發布內容、內容內照片等進行重新調整,即實現用戶發布內容組織形式上的標準化。賦權值是指將不同來源的用戶發布內容(名稱、話題、評論內容)賦予不同的權值,便於後續對用戶發布內容進行篩選。用戶發布內容的來源可體現用戶發布內容的重要性,例如,用戶發布內容來源於評論內容,則表示該用戶發布內容不是很重要,故賦予較小的權值。
[0063]關聯模塊120用於將用戶發布內容與興趣點進行關聯處理,獲得與興趣點關聯的用戶發布內容。
[0064]由於信息獲取模塊110獲取的用戶發布內容是海量的,在進一步識別出與興趣點匹配的用戶發布內容之前,需要關聯模塊120從用戶發布內容中篩選出與興趣點相關聯的用戶發布內容。相關聯指的是用戶發布內容與興趣點具有一定的關聯性,一條用戶發布內容與某興趣點相關聯,可能僅僅是指用戶發布內容中包含有與興趣點名稱相同或相似的字詞,並不一定表示該用戶發布內容對該興趣點進行了描述。
[0065]如圖5所示,在一個實施例中,關聯模塊120包括分詞單元121、興趣點處理單元123、相似度獲取單元125及用信息查找單元127。其中:
[0066]分詞單元121用於將用戶發布內容進行分詞處理,得到與用戶發布內容相關的分
ο
[0067]分詞處理是進行用戶發布內容關聯的第一步。分詞指的是指分詞單元121根據分詞庫將完整的用戶發布內容分成孤立的詞組,所用的分詞庫是根據地圖中的興趣點名稱和地址挖掘出來的。
[0068]興趣點處理單元123用於將興趣點名稱進行規範化和向量化處理。
[0069]對興趣點的規範化是指對興趣點的名稱做處理,發散出多個可能的組合。用戶在發微博的時候具有隨意性,有可能不會按照某個興趣點官方或通用的名稱來命名。例如,「清華大學北門」這個名稱有可能發散為多個名稱:「清華大學北門」、清華大學、清華及清華北門等。因此,為了命中更多有用的記錄,需要興趣點處理單元123對興趣點的名稱進行發散。
[0070]向量化處理就是將規範化的興趣點名稱格式化為二個維度:名稱和城市。某些興趣點如餐廳可能在多地設有分店,例如,「麥當勞」,當通過這個詞進行篩選時,全國的麥當勞餐廳都會被命中。因此,為了是獲得 的用戶發布內容更具針對性,需要在篩選關聯的用戶發布內容時,將城市作為一個維度來限制篩選的範圍。
[0071]相似度獲取單元125用於計算分詞與興趣點名稱的相似度,並獲得相似度大於預定值的分詞。
[0072]預定值可根據經驗設定,若兩個詞的相似度大於該預定值,則表示兩個詞有可能描述同一事物。通過特定的算法,相似度獲取單元125計算每個分詞與經過規範化和向量化處理的興趣點名稱的相似度。分詞與興趣點名稱的相似度越高,則表示該分詞所在的用戶發布內容與興趣點的相關性越強。由於興趣點的名稱可被發散為多個,因此相似度獲取單元125獲得的相似度大於預定值的分詞有可能具有多個。
[0073]信息查找單元127用於根據相似度大於預定值的分詞,獲得關聯的用戶發布內容。
[0074]在相似度獲取單元125獲取相似度大於預定值的分詞後,信息查找單元127根據分詞的來源查找到與興趣點關聯的用戶發布內容。例如,相似度獲取單元125獲取的相似度大於預定值的分詞為「清華大學」,則信息查找單元127將會在所有用戶發布內容中查找,所有含有該分詞「清華大學」的用戶發布內容都被選作為興趣點的關聯的用戶發布內容。
[0075]篩選模塊130用於對關聯的用戶發布內容進行處理,獲得與興趣點匹配的用戶發布內各。
[0076]由於相似度大於預定值的分詞有多個,且每個分詞對應的用戶發布內容有多個,因此關聯的用戶發布內容的數量依然龐大。而且,在關聯的用戶發布內容中,有一部分只是含有相似度大於預定值的分詞,但卻對興趣點的描述很少,這類用戶發布內容不應該被當作擴展數據顯示在地圖中。因此,在作為擴展數據展示之前,還需篩選模塊130對關聯的用戶發布內容進行篩選,剔除關聯的用戶發布內容中無實質作用的部分。
[0077]在一個實施例中,篩選模塊130具體用於根據預設的關聯因子及每個關聯因子對應的權值對所述關聯的用戶發布內容進行處理,獲得與興趣點匹配的用戶發布內容。其中,關聯因子可以包括分詞位置因子、發布位置因子、發布時間因子及信息來源因子等。
[0078]如圖6所示,在本實施例中,篩選模塊130包括關聯因子獲取單元131、歸一化單元133及識別單元135。其中:
[0079]關聯因子獲取單元131用於根據關聯的用戶發布內容和/或興趣點的信息獲取每個關聯因子對應的權值。
[0080]在一個實施例中,分詞位置因子的權值根據相似度大於預定值的分詞在關聯的用戶發布內容中的位置獲得。具體地,若相似度大於預定值的分詞出現在用戶發布內容的正文中,則賦予該關聯因子較大的權值,若相似度大於預定值的分詞出現在用戶發布內容的評論中或發布者的用戶名中,則賦予該關聯因子較小的權值。
[0081]興趣點的信息包括興趣點對應的經緯度。發布位置因子的權值的權值根據關聯的用戶發布內容的發布位置與興趣點對應的位置的關係獲得。具體地,若發布關聯的用戶發布內容時的經緯度與興趣點對應的經緯度越接近,則賦予該關聯因子的權值就越大。否則,根據預設規則賦予該關聯因子的權值就越小。
[0082]發布時間因子的權值根據關聯的用戶發布內容的發布時間獲得。具體地,關聯的用戶發布內容發布的時間與當前時間越接近,則表示該用戶發布內容反應的內容更具時效性。因此,關聯的用戶發布內容發布時間與當前時間越接近,則賦予該關聯因子越大的權值。否則,賦予該關聯因子越小的權值。
[0083]信息來源因子的權值根據關聯的用戶發布內容的來源獲得。具體地,關聯的用戶發布內容有可能來自全文、評論或是用戶名,來自全文的用戶發布內容包含有更多信息,因此更重要。若關聯的用戶發布內容來自全文,則賦予該關聯因子較大的權值,若關聯的用戶發布內容來自評論或者是用戶名,則賦予較小的權值。
[0084]可以理解,在其他實施例中,關聯因子可僅包含上述關聯因子的一種或任意幾種的組合。
[0085]歸一化單元133用於將關聯因子及關聯因子對應的權值進行線性處理,得到關聯的用戶發布內容的歸一化值。
[0086]具體地,將關聯因子獲取單元131獲得的關聯因子及每個關聯因子的權值進行線性處理,得到歸一化值,該歸一化值表示用戶發布內容與興趣點的匹配度。即一條用戶發布內容的歸一化值越大,則表示該用戶發布內容與興趣點匹配的可能性越大。
[0087]識別單元135用於將歸一化值與預設的閾值比較,獲得歸一化值大於等於所述預設的閾值的用戶發布內容為與興趣點匹配的用戶發布內容。
[0088]裝置預設有一閾值,若歸一化值超過該閾值,則表示用戶發布內容可與興趣點匹配。識別單元135將歸一化單元133獲得的歸一化值與閾值進行比較,選擇所有大於等於閾值的歸一化值,並將選擇的歸一化值所對應的用戶發布內容作為與興趣點匹配的用戶發布內各。
[0089]需要指出的是,在其他實施例中,獲得與興趣點匹配的用戶發布內容不限於上述方式。[0090]在另一實施例中,所述裝置還包括垃圾篩選模塊及對應模塊。其中:
[0091]垃圾篩選模塊用於篩選用戶發布內容中的垃圾信息並剔除。
[0092]由於獲取的用戶發布內容的數目是巨大的,因此對於裝置會造成很大壓力。而獲取的用戶發布內容中有很大一部分屬於垃圾信息,在進行進一步的處理前應予以剔除。剔除垃圾信息後,既可減輕裝置的負擔,又能提供更健康的內容。
[0093]垃圾信息一般包括內容過短的微博(少於8個字符,表情字符、直接轉播等)、色情內容、反動言論、廣告內容等。垃圾篩選模塊識別垃圾信息的方式一般為:預設若干關鍵字,查找用戶發布內容中是否有與關鍵字匹配的字詞,若有,則識別為垃圾信息。此外,還可建立一個黑名單,黑名單中記錄被舉報或查處過的用戶名,當垃圾篩選模塊檢測到獲得的用戶發布內容的發布者為黑名單中的用戶時,直接將該用戶發布內容作為垃圾信息處理。
[0094]對應模塊用於建立興趣點和匹配的用戶發布內容之間的對應關係。
[0095]本實施例中,由於興趣點與某個地理位置對應,預先存儲了地理位置與興趣點的對應關係。當電子地圖運行過程中,用戶可定位到某個或多個地理位置,根據用戶定位的地理位置即可獲取到與該地理位置對應的興趣點,並可將與該興趣點相關信息進行展示。由於建立了興趣點和匹配的用戶發布內容之間的對應關係,當獲取到興趣點後,即可通過該對應關係將與該興趣點匹配的用戶發布內容就作為擴展數據顯示給用戶。
[0096]因此,不必每個用戶訪問某興趣點時,都要重新從第三方網絡平臺上獲取數據。在地圖詳情頁上展示匹配的用戶發布內容的結果,包括用戶名,發布時間、發布文字內容、多媒體內容等。對於轉播次數和點評次數較多的用戶發布內容,還可利用其位置信息對興趣點進行坐標和地址糾錯。此外,還可在匹配的用戶發布內容的名稱、話題,在地圖搜索結果上加連結,允許用戶在該點上發微博。
[0097]需要指出的是,在其他實施例中,獲取地圖興趣點評價數據的裝置可僅包括垃圾篩選模塊及對應模塊中的一個。
[0098]上述獲取地圖興趣點評價數據的方法和裝置,首先獲取第三方網絡平臺上的用戶發布內容,並將用戶發布內容與興趣點進行關聯處理,獲得與興趣點關聯的用戶發布內容。然後根據興趣點的信息及關聯的用戶發布內容對關聯的用戶發布內容進行識別處理,獲得與興趣點匹配的用戶發布內容。由於第三方網絡平臺上具有所需的評價數據,通過自動的關聯和識別處理便能從中選擇出與興趣點匹配的評價數據。不需要運營商收集反饋信息,也不需用戶登錄對某興趣點進行評論。因此,通過上述方法和裝置能簡單、方便地獲取地圖興趣點評價數據。
[0099]本領域普通技術人員可以理解實現上述實施例方法中的全部或部分流程,是可以通過電腦程式來指令相關的硬體來完成,所述的程序可存儲於一計算機可讀取存儲介質中,該程序在執行時,可包括如上述各方法的實施例的流程。其中,所述的存儲介質可為磁碟、光碟、只讀存儲記憶體(Read-Only Memory, ROM)或隨機存儲記憶體(Random AccessMemory, RAM)等。
[0100]以上所述實施例僅表達了本發明的幾種實施方式,其描述較為具體和詳細,但並不能因此而理解為對本發明專利範圍的限制。應當指出的是,對於本領域的普通技術人員來說,在不脫離本發明構思的前提下,還可以做出若干變形和改進,這些都屬於本發明的保護範圍。因此,本發明專利的保護範圍應以所附權利要求為準。
【權利要求】
1.一種獲取地圖興趣點評價數據的方法,包括: 獲取第三方網絡平臺上的用戶發布內容; 將所述用戶發布內容與興趣點進行關聯處理,獲得與所述興趣點關聯的用戶發布內容; 對所述關聯的用戶發布內容進行處理,獲得與所述興趣點匹配的用戶發布內容。
2.根據權利要求1所述的獲取地圖興趣點評價數據的方法,其特徵在於,所述將所述用戶發布內容與興趣點進行關聯處理,獲得與所述興趣點關聯的用戶發布內容的方法具體包括: 將所述用戶發布內容進行分詞處理,得到與所述用戶發布內容相關的分詞; 將興趣點名稱進行規範化和向量化處理; 計算所述分詞與所述興趣點名稱的相似度,並獲得相似度大於預定值的分詞; 根據所述相似度大於預定值的分詞,獲得所述關聯的用戶發布內容。
3.根據權利要求1所述的獲取地圖興趣點評價數據的方法,其特徵在於,所述對所述關聯的用戶發布內容進行處理,獲得與所述興趣點匹配的用戶發布內容的步驟為: 根據預設的關聯因子及每個所述關聯因子對應的權值對所述關聯的用戶發布內容進行處理,獲得與所述興趣點 匹配的用戶發布內容。
4.根據權利要求3所述的獲取地圖興趣點評價數據的方法,其特徵在於,所述根據預設的關聯因子及每個所述關聯因子對應的權值對所述關聯的用戶發布內容進行處理,獲得與所述興趣點匹配的用戶發布內容的方法具體包括: 根據所述關聯的用戶發布內容和/或所述興趣點的信息獲取每個所述關聯因子對應的權值; 將所述關聯因子及與所述關聯因子對應的權值進行線性處理,得到所述關聯的用戶發布內容的歸一化值; 將所述歸一化值與預設的閾值比較,獲得歸一化值大於等於所述預設的閾值的用戶發布內容為與所述興趣點匹配的用戶發布內容。
5.根據權利要求3或4所述的獲取地圖興趣點評價數據的方法,其特徵在於,所述關聯因子包括分詞位置因子、發布位置因子、發布時間因子及信息來源因子中的至少一個,所述分詞位置因子的權值根據所述相似度大於預定值的分詞在所述關聯的用戶發布內容中的位置獲得,所述發布位置因子的權值根據所述關聯的用戶發布內容的發布位置與所述興趣點對應的位置的關係獲得,所述發布時間因子的權值根據所述關聯的用戶發布內容的發布時間獲得,所述信息來源因子的權值根據所述關聯的用戶發布內容的來源中獲得。
6.根據權利要求f4任一項所述的獲取地圖興趣點評價數據的方法,其特徵在於,在所述將所述用戶發布內容與興趣點進行關聯處理,獲得關聯的用戶發布內容的步驟之前,還包括: 篩選所述用戶發布內容中的垃圾信息並剔除; 在所述根據所述興趣點的信息對所述關聯的用戶發布內容進行識別處理,獲得與所述興趣點匹配的用戶發布內容的步驟之後,還包括: 建立所述興趣點和所述匹配的用戶發布內容之間的對應關係。
7.一種獲取地圖興趣點評價數據的裝置,其特徵在於,包括:信息獲取模塊,用於獲取第三方網絡平臺上的用戶發布內容; 關聯模塊,用於將所述用戶發布內容與興趣點進行關聯處理,獲得與所述興趣點關聯的用戶發布內容; 篩選模塊,用於對所述關聯的用戶發布內容進行處理,獲得與所述興趣點匹配的用戶發布內容。
8.根據權利要求7所述的獲取地圖興趣點評價數據的裝置,其特徵在於,所述關聯模塊包括: 分詞單元,用於將所述用戶發布內容進行分詞處理,得到與所述用戶發布內容相關的分詞; 興趣點處理單元,用於將興趣點名稱進行規範化和向量化處理; 相似度獲取單元,用於計算所述分詞與所述興趣點名稱的相似度,並獲得相似度大於預定值的分詞; 信息查找單元,用於根據所述相似度大於預定值的分詞,獲得所述關聯的用戶發布內容。
9.根據權利要求7所述的獲取地圖興趣點評價數據的裝置,其特徵在於,所述篩選模塊用於根據預設的關聯因子及每個所述關聯因子對應的權值對所述關聯的用戶發布內容進行處理,獲得與所述興趣點匹配的用戶發布內容。
10.根據權利要求9所述的獲取地圖興趣點評價數據的裝置,其特徵在於,所述篩選模塊包括:` 關聯因子獲取單元,用於根據所述關聯的用戶發布內容和/或所述興趣點的信息獲取每個所述關聯因子對應的權值; 歸一化單元,用於將所述關聯因子及與所述關聯因子對應的權值進行線性處理,得到所述關聯的用戶發布內容的歸一化值; 識別單元,用於將所述歸一化值與預設的閾值比較,獲得歸一化值大於等於所述預設的閾值的用戶發布內容為與所述興趣點匹配的用戶發布內容。
11.根據權利要求9或10所述的獲取地圖興趣點評價數據的裝置,其特徵在於,所述關聯因子包括分詞位置因子、發布位置因子、發布時間因子及信息來源因子中的至少一個,其中,所述分詞位置因子的權值根據所述相似度大於預定值的分詞在所述關聯的用戶發布內容中的位置獲得,所述發布位置因子的權值根據所述關聯的用戶發布內容的發布位置與所述興趣點對應的位置的關係獲得,所述發布時間因子的權值根據所述關聯的用戶發布內容的發布時間獲得,所述信息來源因子的權值根據所述關聯的用戶發布內容的來源中獲得。
12.根據權利要求7-10任一項所述的獲取地圖興趣點評價數據的裝置,其特徵在於,所述裝置還包括: 垃圾篩選模塊,用於篩選所述用戶發布內容中的垃圾信息並剔除; 對應模塊,用於建立所述興趣點和所述匹配的用戶發布內容之間的對應關係。
【文檔編號】H04L29/08GK103457975SQ201210178968
【公開日】2013年12月18日 申請日期:2012年6月1日 優先權日:2012年6月1日
【發明者】張弦, 李瑞方 申請人:騰訊科技(深圳)有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀