地址信息處理方法及裝置與流程
2023-05-08 00:37:01 2
【技術領域】
本申請涉及信息處理技術領域,尤其涉及一種地址信息處理方法及裝置。
背景技術:
隨著網際網路技術的發展,基於網際網路的應用越來越廣泛。在網際網路應用中,經常需要用戶以文本方式填寫一些地址信息,例如家庭住址、公司地址等。例如,用戶在註冊某些應用過程中,往往需要用戶填寫地址信息。又例如,用戶在網絡購買東西時,也需要填寫收貨地址。
在實際應用中,有時會基於用戶填寫的地址信息進行相應操作,例如基於用戶填寫的地址信息輔助判斷用戶的身份,或者基於用戶填寫的地址信息為用戶提供上門服務等,所以有必要預先獲知用戶填寫的地址信息是否為真實地址。
在現有技術中,最方便且最常用的判斷用戶填寫的地址信息是否為真實地址的方法是:將用戶填寫的地址信息作為待判定地址信息,根據待判定地址信息查詢地圖,然後判斷待判定地址信息是否可以在地圖上展現出來;如果待判定地址信息能夠在地圖上展現出來,則判定其為真實地址;如果待判定地址信息不能在地圖上展現出來,則判定其為虛假地址。
上述方法需要地圖信息能夠及時更新,如果地圖信息未能及時更新,就會導致部分真實地址無法在地圖上展現出來,從而被判定為虛假地址。由此可見,這種基於地圖的判定方法存在誤判的情況,其判定結果的準確度較低。
技術實現要素:
本申請的多個方面提供一種地址信息處理方法及裝置,用以更加準確的判定地址信息是否為真實地址,提高判定結果的準確度。
本申請的一方面,提供一種地址信息處理方法,包括:
獲取待判定地址信息;
基於至少兩種地址信息資料庫,對所述待判定地址信息的真實性進行判定,以獲得至少兩種初始判定結果;
根據所述至少兩種初始判定結果,確定所述待判定地址信息是否為真實地址。
本申請的另一方面,提供一種地址信息處理裝置,包括:
獲取模塊,用於獲取待判定地址信息;
判定模塊,用於基於至少兩種地址信息資料庫,對所述待判定地址信息的真實性進行判定,以獲得至少兩種初始判定結果;
確定模塊,用於根據所述至少兩種初始判定結果,確定所述待判定地址信息是否為真實地址。
由上述技術方案可知,本申請基於至少兩種地址信息資料庫,對待判定地址信息的真實性進行判定,獲得至少兩種初始判定結果,然後綜合至少兩種初始判定結果,最終確定待判定地址信息是否為真實信息,可以克服基於單一信息進行判斷時存在的各種缺陷,有利於更加準確的判定地址信息是否為真實地址,提高了判定結果的精確度。
【附圖說明】
為了更清楚地說明本申請實施例中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本申請的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1為本申請一實施例提供的地址信息處理方法的流程示意圖;
圖2為本申請另一實施例提供的地址信息處理裝置的結構示意圖;
圖3為本申請又一實施例提供的地址信息處理裝置的結構示意圖。
【具體實施方式】
為使本申請實施例的目的、技術方案和優點更加清楚,下面將結合本申請實施例中的附圖,對本申請實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本申請一部分實施例,而不是全部的實施例。基於本申請中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬於本申請保護的範圍。
圖1為本申請一實施例提供的地址信息處理方法的流程示意圖。如圖1所示,該方法包括:
101、獲取待判定地址信息。
102、基於至少兩種地址信息資料庫,對待判定地址信息的真實性進行判定,以獲得至少兩種初始判定結果。
103、根據至少兩種初始判定結果,確定待判定地址信息是否為真實地址。
本實施例提供一種地址信息處理方法,可由地址信息處理裝置來執行,用以更加準確的判定地址信息是否為真實地址,提高判定結果的準確度。
具體的,當用戶需要對地址信息的真實性進行判斷時,可以將地址信息提供給信息處理裝置,由地址信息處理裝置完成判斷,不需要依賴人工實地考察,也不需要依賴了解該地址信息的用戶提供判斷依據,可以避免受人為主觀因素的影響,有利於降低人力成本,提高判定效率,節約時間成本。
為便於描述,本實施例將用戶需要進行真實性判斷的地址信息稱為待判定地址信息。本實施例不對待判定地址信息進行限制,可以是任何應用場景中的地址信息,例如可以是訂單中的收貨地址、發貨地址、用戶在註冊過程 中填寫的地址信息,等等。
其中,面向不同用戶,地址信息處理裝置可以提供不同的信息入口,以供用戶輸入待判定地址信息。
例如,地址信息處理裝置可以提供網頁入口,以支持用戶通過地址信息處理裝置提供的網頁輸入待判定地址信息,這種方式適合遠程場景。
又例如,地址信息處理裝置可以作為一客戶端,用戶預先在其終端設備上下載並安全該客戶端,用戶只要打開該客戶端即可在客戶端提供的輸入框內輸入待判定地址信息。
又例如,地址信息處理裝置還提供掃描入口,允許用戶通過掃描儀輸入待判定地址信息。
地址信息處理裝置在獲取待判定地址信息之後,基於至少兩種地址信息資料庫,對待判定地址信息的真實性進行判定,以獲得至少兩種初始判定結果;然後根據至少兩種初始判定給結果,確定待判定地址信息是否為真實地址。進一步,地址信息處理裝置還可以通過文本或者聲音等方式將待判定地址信息是否為真實地址的最終判斷結果輸出。
由於本實施例不像現有技術那樣僅根據地圖數據進行判斷,而是同時結合至少兩種地址信息資料庫進行判斷,並綜合考慮至少兩種初始判定結果得出最終判定結果,可以克服基於單一信息進行判斷時存在的各種缺陷,有利於更加準確的判定地址信息是否為真實地址,提高了判定結果的精確度。例如,相對於現有技術中僅根據地圖數據進行判斷的方案,同時基於至少兩種地址信息資料庫,有利於減少因地圖數據更新不及時造成部分地址信息被誤判為虛假地址的情況,並且至少兩種地址信息資料庫的信息覆蓋度更廣,所以有利於提高判定結果的準確度。
在一可選實施方式中,上述至少兩種地址信息資料庫包括:地址規則資料庫、地圖資料庫、待判定地址信息所屬業務方提供的第一地址資料庫、以及與該業務方相關的第三方提供的第二地址資料庫中的至少兩種地址信息資料庫。基於此,上述步驟102的一種實施方式具體為:
基於地址規則資料庫、地圖資料庫、待判定地址信息所屬業務方提供的第一地址資料庫、以及與該業務方相關的第三方提供的第二地址資料庫中的至少兩種地址信息資料庫,對待判定地址信息的真實性進行判定,以獲得至少兩種初始判定結果。
其中,每基於一種地址信息資料庫,對待判定地址信息的真實性進行判定,就可以得到一種初始判定結果。
可選的,每種初始判定結果可以包括:用於指示待判定地址信息偏向於真實地址或虛假地址的真偽指示信息以及待判定地址信息的判定得分中的至少一種信息。
上述地址規則資料庫中包括用於判定待判定地址信息是否為真實地址的字符規則。在一具體應用場景中,上述至少兩種地址信息資料庫包括:地址規則資料庫。也就是說,地址信息處理裝置需要基於地址規則資料庫,對待判定地址信息的真實性進行判定,以獲得至少兩種初始判定結果中的一種初始判定結果。
進一步,地址信息處理裝置在基於地址規則資料庫,對待判定地址信息的真實性進行判定的過程包括:
將待判定地址信息與地址規則資料庫中的字符規則逐一進行比較,以確定待判定地址信息滿足的目標字符規則;為便於描述,這裡將待判定地址信息滿足的字符規則稱為目標字符規則;根據待判定地址信息滿足的目標字符規則,生成初始判定結果。
可選的,這裡的初始判定結果可以包括:用於指示待判定地址信息偏向於真實地址或虛假地址的真偽指示信息以及待判定地址信息的判定得分中的至少一種信息。
可選的,上述地址規則資料庫中的字符規則是真實地址應該滿足的規則,即如果一個地址信息按照一定條件滿足了地址規則資料庫中的字符規則,那麼該地址信息為真實地址;另外,上述地址規則資料庫還包括字符規則對 應的增加分數。或者,上述地址規則資料庫中的字符規則是虛假地址應該滿足的規則,即如果一個地址信息按照一定條件滿足了地址規則資料庫中的字符規則,那麼該地址信息為虛假地址;另外,上述地址規則資料庫還包括字符規則對應的扣減分數。
基於上述,在上述地址規則資料庫中的字符規則是真實地址應該滿足的規則的情況下,地址信息處理裝置根據待判定地址信息滿足的目標字符規則,生成初始判定結果,包括執行以下至少一種生成操作:
真偽指示信息生成操作:將目標字符規則的個數與預設個數閾值進行比較,根據目標字符規則的個數與預設個數閾值的比較結果,生成用於指示待判定地址信息偏向於真實地址或虛假地址的真偽指示信息;或者,將目標字符規則對應的扣減分數之和與預設分數閾值進行比較,根據目標字符規則對應的增加分數之和與預設分數閾值的比較結果,生成用於指示待判定地址信息偏向於真實地址或虛假地址的真偽指示信息。
具體的,若目標字符規則的個數大於或等於預設個數閾值,則生成用於指示待判定地址信息偏向於真實地址的真偽指示信息;若目標字符規則的個數小於預設個數閾值,則生成用於指示待判定地址信息偏向於虛假地址的真偽指示信息。
相應的,若目標字符規則對應的增加分數之和大於或等於預設分數閾值,則生成用於指示待判定地址信息偏向於真實地址的真偽指示信息;若目標字符規則對應的增加分數之和小於預設分數閾值,則生成用於指示待判定地址信息偏向於虛假地址的真偽指示信息。
判定得分生成操作:根據目標字符規則對應的增加分數,生成待判定地址信息的判定得分。具體的,地址信息處理裝置可以將各目標字符規則對應的增加分數相加,將相加結果作為待判定地址信息的判定得分。
基於上述,在上述地址規則資料庫中的字符規則是虛假地址應該滿足的規則的情況下,地址信息處理裝置根據待判定地址信息滿足的目標字符規則, 生成初始判定結果,包括執行以下至少一種生成操作:
真偽指示信息生成操作:將目標字符規則的個數與預設個數閾值進行比較,根據目標字符規則的個數與預設個數閾值的比較結果,生成用於指示待判定地址信息偏向於真實地址或虛假地址的真偽指示信息;或者,根據目標字符規則對應的扣減分數之和與預設分數閾值的比較結果,生成用於指示待判定地址信息偏向於真實地址或虛假地址的真偽指示信息。
具體的,若目標字符規則的個數大於或等於預設個數閾值,則生成用於指示待判定地址信息偏向於虛假地址的真偽指示信息;若目標字符規則的個數小於預設個數閾值,則生成用於指示待判定地址信息偏向於真實地址的真偽指示信息。
相應的,若目標字符規則對應的扣減分數之和大於或等於預設分數閾值(例如40),則生成用於指示待判定地址信息偏向於虛假地址的真偽指示信息;若目標字符規則對應的扣減分數之和小於預設分數閾值,則生成用於指示待判定地址信息偏向於真實地址的真偽指示信息。
判定得分生成操作:根據目標字符規則對應的扣減分數,生成待判定地址信息的判定得分。具體的,地址信息處理裝置可以預先設置待判定地址信息的初始得分,例如設置初始得分為100,然後用待判定地址信息的初始得分減去各目標字符規則對應的扣減分數,以獲得待判定地址信息的判定得分。
可選的,在上述地址規則資料庫中的字符規則是虛假地址應該滿足的規則的情況下,地址規則資料庫中的字符規則包括以下至少一種:
含有指定的特殊字符:例如,@、#、¥、%、&等特殊字符一般不會出現在地址信息中所以屬於亂碼,如果待判定地址信息包含這些特殊字符就要進行扣分;
包含的數字個數大於第一指定個數:按照地址信息的常規形式可知,地址信息中樓號、單元號、門牌號等可能是數字,這些數字一般不會太多,所以待判定地址信息包含的數字的個數不應大於第一指定個數,例如一般不會超過10,若大於第一指定個數,就要進行扣分;
包含的漢字個數小於第二指定個數:按照地址信息的常規形式可知,地址信息中一般會包括若干個漢字,通常漢字的個數不應太少,所以待判定地址信息包含的漢字個數不應小於第二指定個數,例如不應小於5,若小於第二指定個數,就要進行扣分;
指定標點分隔方式的出現次數大於第一指定次數:按照地址信息的常規形式可知,地址信息中的標點分割不應過密,即字符和標點交錯出現的次數不應過多,所以待判定地址信息中指定標點分割方式的出現次數不應大於第一指定次數,例如不應大於3次,若大於第一指定次數,就要進行扣分;
標點分隔出非語義詞組的出現次數大於第二指定次數:對標點分割出的詞組進行語義分析,若識別出標點分割出的詞組屬於非語義詞組,則統計該非語義詞組在指定地址庫中的出現次數,若大於第二指定次數,例如大於3次,就要進行扣分。所述指定地址庫可以是第一地址資料庫或第二地址資料庫,或者也可以同時包括第一地址資料庫和第二地址資料庫。
當然,地址規則資料庫中還可以包括其他字符規則,在此不再詳述。
具體的,地址信息處理裝置可以將待判定地址信息在地址規則資料庫中進行匹配,以確定待判定地址信息滿足的目標字符規則,然後根據目標字符規則的個數或各目標字符規則對應的扣減分數,生成用於指示該待判定地址信息是偏向於真實地址還是虛假地址的真偽指示信息,例如若各目標字符規則對應的扣減分數之和超過指定分數閾值,例如40,則生成指示待判定地址信息偏向於虛假地址的真偽指示信息,並根據各目標字符規則對應的扣減分數,生成該待判定地址信息的判定得分。
在一具體應用場景中,上述至少兩種地址信息資料庫包括:地圖資料庫、第一地址資料庫或第二地址資料庫。也就是說,地址信息處理裝置需要基於地圖資料庫、第一地址資料庫或第二地址資料庫,對待判定地址信息的真實性進行判定,以獲得至少兩種初始判定結果中的一種初始判定結果。由於基於地圖資料庫、第一地址資料庫或第二地址資料庫,對待判定地址信息的真 實性進行判定的過程類似,所以本實施例放在一起進行說明。
具體的,地址信息處理裝置需要基於地圖資料庫、第一地址資料庫或第二地址資料庫,對待判定地址信息的真實性進行判定的過程包括:
執行整體查詢操作和切分查詢操作中的至少一種,並根據至少一種查詢操作的查詢結果,生成初始判定結果;
其中,整體查詢操作為:將待判定地址信息作為查詢條件,到地圖資料庫、第一地址資料庫或第二地址資料庫中進行查詢;
切分查詢操作為:按照預設地址切分規則將待判定地址信息切分為至少一個地址片段,將至少一個地址片段中的每個地址片段作為查詢條件,到地圖資料庫、第一地址資料庫或第二地址資料庫中進行查詢。
在一具體實施方式中,在基於地圖資料庫、第一地址資料庫或第二地址資料庫,對待判定地址信息的真實性進行判定的過程中,可以僅執行整體查詢操作,即將待判定地址信息作為查詢條件,到地圖資料庫、第一地址資料庫或第二地址資料庫中進行查詢,並根據查詢結果,生成初始判定結果。
在另一具體實施方式中,在基於地圖資料庫、第一地址資料庫或第二地址資料庫,對待判定地址信息的真實性進行判定的過程中,可以僅執行切分查詢操作,即按照預設地址切分規則將待判定地址信息切分為至少一個地址片段,將至少一個地址片段中的每個地址片段作為查詢條件,到地圖資料庫、第一地址資料庫或第二地址資料庫中進行查詢,並根據每個地址片段的查詢結果,生成初始判定結果。
在又一具體實施方式中,在基於地圖資料庫、第一地址資料庫或第二地址資料庫,對待判定地址信息的真實性進行判定的過程中,結合執行整體查詢操作和切分查詢操作,並根據兩種查詢操作的查詢結果,生成初始判定結果。
在一具體實施方式中,結合執行整體查詢操作和切分查詢操作,對待判定地址信息的真實性進行判定的過程包括:
首先執行整體查詢操作,以生成第一子判定結果;
若第一子判定結果指示待判定地址信息偏向於虛假地址,則執行切分查詢 操作,以生成第二子判定結果,根據第一子判定結果和所述第二子判定結果,生成初始判定結果;
若第一子判斷結果指示待判定地址信息偏向於真實地址,則直接根據第一子判定結果,生成初始判定結果,並結束操作。
在另一具體實施方式中,結合執行整體查詢操作和切分查詢操作,對待判定地址信息的真實性進行判定的過程包括:
分別執行整體查詢操作以及切分查詢操作,以生成第一子判定結果和第二子判定結果,根據第一子判定結果和第二子判定結果,生成初始判定結果。其中,整體查詢操作和切分查詢操作的執行順序不做限定,可以順序執行,也可以並行執行。
下面分別針對地圖資料庫、第一地址資料庫或第二地址資料庫,地圖資料庫,對上述結合執行整體查詢操作和切分查詢操作,對待判定地址信息的真實性進行判定的過程進行詳細說明。
地圖資料庫:
地址信息處理裝置可以將待判定地址信息輸入到地圖資料庫的查詢接口中進行查詢;如果有超過1條的匹配結果返回,則直接判定該待判定地址信息偏向於真實地址,並且進行真實性加分,並結束操作;如果沒有任何匹配結果返回,則將待判定地址信息按照省、市、區以及詳細地址的切分規則,將待判定地址信息切分為地址片段,即省、市、區以及詳細地址,然後將各地址片段分別輸入到地圖資料庫的查詢接口中進行查詢,對於每個地址片段,如果有超過1條的匹配結果返回,則直接判定該地址片段偏向於真實地址,並且進行真實性加分,如果沒有任何匹配結果返回,則結束操作。
第一地址資料庫:
地址信息處理裝置可以將待判定地址信息輸入到第一地址資料庫的查詢接口中進行查詢;如果有超過1條的匹配結果返回,則直接判定該待判定地址信息偏向於真實地址,並且進行真實性加分,並結束操作;
如果沒有任何匹配結果返回,則將待判定地址信息按照省、市、區以及 詳細地址的切分規則,將待判定地址信息切分為地址片段,即省、市、區以及詳細地址,然後將各地址片段分別輸入到第一地址資料庫的查詢接口中進行查詢,對於每個地址片段,如果有超過1條的匹配結果返回,則直接判定該地址片段偏向於真實地址,並且進行真實性加分,如果沒有任何匹配結果返回,則結束操作。
可選的,以業務方是電子商務領域中的電商平臺為例,則第一地址資料庫可以包括:用戶自定義的收貨地址信息、訂單中的收貨地址信息以及退款單中的收貨地址信息中的至少一種地址信息。
在一具體實施方式中,第一地址資料庫包括:用戶自定義的收貨地址信息、訂單中的收貨地址信息以及退款單中的收貨地址信息。基於此,地址信息處理裝置在第一地址資料庫中進行整體查詢操作或切分查詢操作的過程包括:
將待判定地址信息或地址片段輸入到用於存儲用戶自定義的收貨地址信息的子資料庫的查詢接口中進行查詢,如果有超過1條的匹配結果返回,則直接判定該待判定地址信息或地址片段為偏向於真實地址,並且進行真實性加分;
如果沒有任何匹配結果返回,則將待判定地址信息或地址片段輸入到用於存儲訂單中的收貨地址信息的子資料庫的查詢接口中進行查詢,如果有超過1條的匹配結果返回,則直接判定該待判定地址信息或地址片段為偏向於真實地址,並且進行真實性加分;
如果沒有任何匹配結果返回,則將待判定地址信息或地址片段輸入到用於存儲退款單中的收貨地址信息的子資料庫的查詢接口中進行查詢,如果有超過1條的匹配結果返回,則直接判定該待判定地址信息或地址片段為偏向於真實地址,並且進行真實性加分,如果沒有任何匹配結果返回,則結束此次查詢操作。
第二地址資料庫:
地址信息處理裝置可以將待判定地址信息輸入到第二地址資料庫的查 詢接口中進行查詢;如果有超過1條的匹配結果返回,則直接判定該待判定地址信息偏向於真實地址,並且進行真實性加分,並結束操作;
如果沒有任何匹配結果返回,則將待判定地址信息按照省、市、區以及詳細地址的切分規則,將待判定地址信息切分為地址片段,即省、市、區以及詳細地址,然後將各地址片段分別輸入到第二地址資料庫的查詢接口中進行查詢,對於每個地址片段,如果有超過1條的匹配結果返回,則直接判定該地址片段偏向於真實地址,並且進行真實性加分,如果沒有任何匹配結果返回,則結束操作。
可選的,若業務方是電子商務領域中的電商平臺,則與業務方相關的第三方為物流平臺。基於此,第二地址資料庫可以包括:收貨地址信息、發貨地址信息以及途徑地址信息中的至少一種地址信息。
在一具體實施方式中,第二地址資料庫包括:收貨地址信息、發貨地址信息以及途徑地址信息。基於此,地址信息處理裝置在第二地址資料庫中進行整體查詢操作或切分查詢操作的過程包括:
將待判定地址信息或地址片段輸入到用於存儲收貨地址信息的子資料庫的查詢接口中進行查詢,如果有超過1條的匹配結果返回,則直接判定該待判定地址信息或地址片段為偏向於真實地址,並且進行真實性加分;
如果沒有任何匹配結果返回,則將待判定地址信息或地址片段輸入到用於存儲發貨地址信息的子資料庫的查詢接口中進行查詢,如果有超過1條的匹配結果返回,則直接判定該待判定地址信息或地址片段為偏向於真實地址,並且進行真實性加分;
如果沒有任何匹配結果返回,則將待判定地址信息或地址片段輸入到用於存儲途徑地址信息的子資料庫的查詢接口中進行查詢,如果有超過1條的匹配結果返回,則直接判定該待判定地址信息或地址片段為偏向於真實地址,並且進行真實性加分,如果沒有任何匹配結果返回,則結束此次查詢操作。
在上述各實施方式中,在獲得匹配結果後,需要根據匹配結果生成初始判定結果。
可選的,初始判定結果可以包括:用於指示待判定地址信息偏向於真實地址或虛假地址的真偽指示信息和待判定地址信息的判定得分中的至少一個。
基於上述,根據查詢結果生成初始判定結果的過程可以包括執行以下至少一種操作:
根據至少一種查詢操作的查詢結果,生成用於指示待判定地址信息偏向於真實地址或虛假地址的真偽指示信息;
根據至少一種查詢操作的查詢結果對應的增加分數,以生成待判定地址信息的判定得分。
具體的,若上述實施過程中僅執行了整體查詢操作未執行切分查詢操作,則可以直接上述整體查詢操作的查詢結果作為初始判定結果,即直接將整體查詢操作的查詢結果中確定待判定地址信息偏向於真實地址或虛假地址的信息作為真偽指示信息,並將其中的真實性加分作為待判定地址信息的判定得分。
若上述實施過程中既執行了整體查詢操作又執行了切分查詢操作,則可以同時結合兩種查詢操作的查詢結果,生成初始判定結果。具體生成真偽指示信息的方式為:若至少一種查詢操作的查詢結果滿足預設第一真實判定條件,則生成用於指示待判定地址信息偏向於真實地址的真偽指示信息;若至少一種查詢操作的查詢結果不滿足第一真實判定條件,則生成用於指示待判定地址信息偏向於虛假地址的真偽指示信息。具體生成待判定地址信息的判定得分的方式為:將每種查詢操作的查詢結果對應的增加分數相加,將相加的結果作為待判定地址信息的判定得分。
上述第一真實判定條件可以是指示待判定地址信息偏向於真實地址的結果個數大於或等於指示待判定地址信息偏向於虛假地址的結果個數,或者,可以是指示待判定地址信息偏向於真實地址的結果個數大於預設閾值,或者,可以是指示待判定地址信息偏向於真實地址的結果對應的增加分數之和大於預設分數閾值,等等。
經過上述各實施方式,獲得了至少兩個初始判定結果。地址信息處理裝置可以根據至少兩個初始判定結果,確定待判定地址信息是否為真實地址。
具體的,地址信息處理裝置可以判斷至少兩種初始判定結果是否滿足第二真實判定條件;如果判斷結果為至少兩種初始判定結果滿足預設第二真實判定條件,則確定待判定地址信息為真實地址;如果判斷結果為至少兩種初始判定結果不滿足第二真實判定條件,則確定待判定地址信息為虛假地址。
可選的,上述第二真實判定條件可以是指示待判定地址信息偏向於真實地址的結果個數大於或等於指示待判定地址信息偏向於虛假地址的結果個數,或者,可以是指示待判定地址信息偏向於真實地址的結果個數大於預設閾值,或者,可以是各初始判定結果中待判定地址信息的判定得分之和大於預設分數閾值,等等。
經過上述分析可知,本申請各實施例基於至少兩種地址信息資料庫,對待判定地址信息的真實性進行判定,獲得至少兩種初始判定結果,然後綜合至少兩種初始判定結果,最終確定待判定地址信息是否為真實信息,可以克服基於單一信息進行判斷時存在的各種缺陷,有利於更加準確的判定地址信息是否為真實地址,提高了判定結果的精確度。
需要說明的是,對於前述的各方法實施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領域技術人員應該知悉,本申請並不受所描述的動作順序的限制,因為依據本申請,某些步驟可以採用其他順序或者同時進行。其次,本領域技術人員也應該知悉,說明書中所描述的實施例均屬於優選實施例,所涉及的動作和模塊並不一定是本申請所必須的。
在上述實施例中,對各個實施例的描述都各有側重,某個實施例中沒有詳述的部分,可以參見其他實施例的相關描述。
圖2為本申請另一實施例提供的地址信息處理裝置的結構示意圖。如圖2所示,該裝置包括:獲取模塊21、判定模塊22和確定模塊23。
獲取模塊21,用於獲取待判定地址信息。
判定模塊22,用於基於至少兩種地址信息資料庫,對獲取模塊21獲取的待判定地址信息的真實性進行判定,以獲得至少兩種初始判定結果。
確定模塊23,用於根據判定模塊22獲得的至少兩種初始判定結果,確定待判定地址信息是否為真實地址。
在一可選實施方式中,判定模塊22具體用於:
基於地址規則資料庫、地圖資料庫、待判定地址信息所屬業務方提供的第一地址資料庫、以及與業務方相關的第三方提供的第二地址資料庫中的至少兩種地址信息資料庫,對待判定地址信息的真實性進行判定,以獲得至少兩種初始判定結果。
在一可選實施方式中,如圖3所示,判定模塊22的一種實現結構包括:比較單元221和第一生成單元222。
比較單元221,用於將待判定地址信息與地址規則資料庫中的字符規則逐一進行比較,以確定待判定地址信息滿足的目標字符規則。
第一生成單元222,用於根據目標字符規則,生成初始判定結果。
進一步,第一生成單元222具體用於執行以下至少一種操作:
根據目標字符規則的個數與預設個數閾值的比較結果,或目標字符規則對應的扣減分數之和與預設分數閾值的比較結果,生成用於指示待判定地址信息偏向於真實地址或虛假地址的真偽指示信息;
根據目標字符規則對應的扣減分數,生成待判定地址信息的判定得分。
在一可選實施方式中,地址規則資料庫中的字符規則包括以下至少一種:
含有指定的特殊字符;
包含的數字個數大於第一指定個數;
包含的漢字個數小於第二指定個數;
指定標點分隔方式的出現次數大於第一指定次數;
標點分隔出非語義詞組的出現次數大於第二指定次數。
在一可選實施方式中,如圖3所示,判定模塊22的一種實現結構還包 括:查詢單元223和第二生成單元224。
查詢單元223,用於執行整體查詢操作和切分查詢操作中的至少一種。
第二生成單元224,用於根據至少一種查詢操作的查詢結果,生成初始判定結果。
其中,整體查詢操作為:將待判定地址信息作為查詢條件,到地圖資料庫、第一地址資料庫或第二地址資料庫中進行查詢。
切分查詢操作為:按照預設地址切分規則將待判定地址信息切分為至少一個地址片段,將至少一個地址片段中的每個地址片段作為查詢條件,到地圖資料庫、第一地址資料庫或第二地址資料庫中進行查詢。
進一步,第二生成單元224具體用於執行以下至少一種操作:
根據至少一種查詢操作的查詢結果,生成用於指示待判定地址信息偏向於真實地址或虛假地址的真偽指示信息;
根據至少一種查詢操作的查詢結果對應的增加分數,以生成待判定地址信息的判定得分。
更進一步,第二生成單元224在根據至少一種查詢操作的查詢結果,生成用於指示待判定地址信息偏向於真實地址或虛假地址的真偽指示信息時,具體用於:
若至少一種查詢操作的查詢結果滿足預設第一真實判定條件,則生成用於指示待判定地址信息偏向於真實地址的真偽指示信息;
若至少一種查詢操作的查詢結果不滿足第一真實判定條件,則生成用於指示待判定地址信息偏向於虛假地址的真偽指示信息。
可選的,上述第一真實判定條件可以是指示待判定地址信息偏向於真實地址的結果個數大於或等於指示待判定地址信息偏向於虛假地址的結果個數,或者,可以是指示待判定地址信息偏向於真實地址的結果個數大於預設閾值,或者,可以是指示待判定地址信息偏向於真實地址的結果對應的增加分數之和大於預設分數閾值,等等。
在一可選實施方式中,確定模塊23具體用於:
若至少兩種初始判定結果滿足預設第二真實判定條件,則確定待判定地址信息為真實地址;
若至少兩種初始判定結果不滿足第二真實判定條件,則確定待判定地址信息為虛假地址。
可選的,上述第二真實判定條件可以是指示待判定地址信息偏向於真實地址的結果個數大於或等於指示待判定地址信息偏向於虛假地址的結果個數,或者,可以是指示待判定地址信息偏向於真實地址的結果個數大於預設閾值,或者,可以是各初始判定結果中待判定地址信息的判定得分之和大於預設分數閾值,等等。
在一可選實施方式中,業務方為電商平臺,第三方為物流平臺。相應的,第一地址資料庫包括:用戶自定義的收貨地址信息、訂單中的收貨地址信息以及退款單中的收貨地址信息中的至少一種地址信息;第二地址資料庫包括:收貨地址信息、發貨地址信息以及途徑地址信息中的至少一種地址信息。
本實施例提供的地址信息處理裝置,基於至少兩種地址信息資料庫,對待判定地址信息的真實性進行判定,獲得至少兩種初始判定結果,然後綜合至少兩種初始判定結果,最終確定待判定地址信息是否為真實信息,可以克服基於單一信息進行判斷時存在的各種缺陷,有利於更加準確的判定地址信息是否為真實地址,提高了判定結果的精確度。
所屬領域的技術人員可以清楚地了解到,為描述的方便和簡潔,上述描述的系統,裝置和單元的具體工作過程,可以參考前述方法實施例中的對應過程,在此不再贅述。
在本申請所提供的幾個實施例中,應該理解到,所揭露的系統,裝置和方法,可以通過其它的方式實現。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現時可以有另外的劃分方式,例如多個單元或組件可以結合或者可以集成到另一個系統,或一些特徵可以忽略,或不執行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合 或通信連接,可以是電性,機械或其它的形式。
所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位於一個地方,或者也可以分布到多個網絡單元上。可以根據實際的需要選擇其中的部分或者全部單元來實現本實施例方案的目的。
另外,在本申請各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以採用硬體的形式實現,也可以採用硬體加軟體功能單元的形式實現。
上述以軟體功能單元的形式實現的集成的單元,可以存儲在一個計算機可讀取存儲介質中。上述軟體功能單元存儲在一個存儲介質中,包括若干指令用以使得一臺計算機設備(可以是個人計算機,伺服器,或者網絡設備等)或處理器(processor)執行本申請各個實施例所述方法的部分步驟。而前述的存儲介質包括:u盤、移動硬碟、只讀存儲器(read-onlymemory,rom)、隨機存取存儲器(randomaccessmemory,ram)、磁碟或者光碟等各種可以存儲程序代碼的介質。
最後應說明的是:以上實施例僅用以說明本申請的技術方案,而非對其限制;儘管參照前述實施例對本申請進行了詳細的說明,本領域的普通技術人員應當理解:其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分技術特徵進行等同替換;而這些修改或者替換,並不使相應技術方案的本質脫離本申請各實施例技術方案的精神和範圍。