新四季網

面向車間製造過程的海量RFID數據智能清洗方法及系統與流程

2023-04-23 03:35:31 1


本發明涉及機械製造自動化、工業自動控制和計算機網絡領域,尤其涉及一種面向車間製造過程的海量RFID數據智能清洗方法及系統。



背景技術:

在車間製造生產過程中,射頻識別技術RFID作為一門快捷方便且非接觸式感知處理信息技術被廣泛使用在各大製造企業中,對人員、設備、物料等製造資源完成動態感知以便進行生產狀態監控、物流控制優化和智能定位跟蹤等處理。然而製造車間環境惡劣,常常伴隨金屬介質的阻礙和強電磁幹擾,導致感知設備不能實時可靠感知。同時RFID應用場景環境複雜,分布範圍廣,涉及人員、物料、設備等多個對象,需要分布部署大量RFID裝置,導致感知數據呈現多源、海量、分布廣泛、高噪聲的特點。在實際中,RFID數據主要存在漏讀、多讀和冗餘三種質量問題。根據「垃圾進,垃圾出」的理論,如果將這些原始感知數據不經過處理直接傳遞給管理人員使用,不僅會增加數據傳輸的負擔、系統的計算量、生產成本及能耗,還會降低生產效率甚至導致嚴重的決策錯誤。因此對海量RFID感知數據進行數據清洗,消除冗餘、多讀數據,填補漏讀數據,提高數據質量為製造車間運行分析與管理決策提供基本數據支持,對車間智能製造的發展具有重要意義。

目前國內外研究人員對改善RFID數據質量問題已經做了大量的相關研究,針對RFID數據存在的漏讀、冗餘、多讀三類問題提出了相應的解決方法。現有文獻提出了一種可擴展的清理RFID數據流的框架(Extensible Receptor Stream Processing,ESP),引入了時間粒度和空間粒度的概念來探索數據流處理方法,利用管道設計的描述性查詢處理工具,結合數據語義都低到高層次性處理。該模型將數據處理分為以下階段:Point階段、Smooth階段、Merge階段、Arbitrate階段和Virtualize階段。該方法可以根據實際對每個階段組合使用,數據管道很容易在每個應用場景中安裝和配置,適應範圍比較廣,但如何確定合適的時間粒度和空間粒度並不容易,同時該方法在平滑階段仍然使用了定長窗口平滑技術,難以同時有效消除積極讀和消極讀。此外RFID本身的複雜性以及動態性導致使用ESP模型處理RFID數據困難。由於固定窗口平滑方法很難選擇合適的窗口大小使它既能保證數據的完整性又能獲取標籤的動態變化,另一篇文獻中Jeffery S R等人提出了一種自動調整窗口大小的RFID數據清洗方法(Statistical Smoothing for Unreliable RFID data,SMURF)。該方法把感知到的RFID數據流抽象成統計學中的隨機樣本,利用二項分布等相關理論進行建模。首先設定初始窗口,然後基於RFID數據流中觀測值自適用調整滑動窗口的大小,以滿足數據的完整性和標籤的動態性。該方法的自適應性機制大大改進了因為固定窗口過大或過小造成的積極讀和消極讀。另一篇文獻通過一種改進的過度檢測機制,比較兩個子窗口中的數據以及估計標籤的數量來檢測標籤躍遷發生的時間提出了一種自適應的數據清洗方法(WSTD)。上述方法主要用來消除漏讀數據,然而在製造車間中,由於RFID自身閱讀範圍的局限性,導致少數幾個RFID閱讀器無法滿足車間信息數據感知的需求,在一個裝配車間或是一個物料倉庫中可能需要部署成百上千的RFID閱讀器來構成感知網絡。此時由於RFID交叉部署、標籤的長時間停留導致了大量的數據冗餘。另一篇文獻提出了一種閱讀器冗餘消除方法(Redundant Reader Elimination,RRE)。該方法根據當閱讀器範圍內被讀到的標籤數越少,則該閱讀器冗餘的可能性越大這一理論消除冗餘閱讀器從而減少冗餘數據。首先每個閱讀器獲取閱讀範圍內所有應答的標籤總數,然後每個閱讀器將總數發送給閱讀範圍內的所有標籤,標籤屬於讀取總數多的那個閱讀器。最終,沒有標籤屬於的閱讀器被判斷為冗餘閱讀器。但該算法依賴閱讀器的分布情況,在閱讀器分布密集時不能得到正確結果。另一篇文獻提出了一種最優分層閱讀器冗餘消除方法(Layered Elimination Optimization,LEO),該方法基於標籤最先接收到的信息來自哪個閱讀器,則判斷這個閱讀器為標籤的擁有者。雖然該算法減少了對標籤的寫操作,但該算法依賴於閱讀器的讀取次序,讀取次序不同結果也不同,隨機性較大。由於RFID網絡的不穩定性導致閱讀器的讀取次序隨機且不固定,因此其可靠性還有待研究解決。另一篇文獻提出了一種基於布隆濾波(Bloom Filter,BF)的本地過濾算法用來過濾本地數據冗餘,再進一步擴展到全局的冗餘過濾,與別的方法相比,布隆濾波器能有效節省空間和時間。但隨著RFID數據的增多,布隆濾波位數組中0位越來越少,位數組慢慢被填滿從而算法失效。另一篇文獻利用貝葉斯推斷去除空間冗餘,利用狀態檢測模型來獲得最大似然概率,通過馬爾科夫蒙特卡洛(Markov Chain Monte Carlo,MCMC)抽樣方法來得到標籤位置分布的樣本,尋找最大後驗概率得到樣本中最可能的標籤分布從而去除空間冗餘。還考慮了貨架空間的限制條件,即每個貨架上可能同時存在的標籤數量的限制。

綜上所述大部分文獻都只是針對RFID數據問題中的一個方面進行清洗處理,針對製造車間RFID數據的特點提出一種有效的綜合的數據清洗方法具有重要的意義。



技術實現要素:

本發明要解決的技術問題在於針對現有技術中缺乏有效的綜合數據清洗方法的缺陷,提供一種面向車間製造過程的海量RFID數據智能清洗方法及系統。

本發明解決其技術問題所採用的技術方案是:

本發明提供一種面向車間製造過程的海量RFID數據智能清洗方法,包括以下步驟:

S1、獲取製造車間中不同的RFID拓撲結構中感知到的RFID數據;

S2、構建面向數據的分割器將RFID數據分割為漏讀數據和空間冗餘數據;

S3、對漏讀數據採用自適應實時的漏讀平滑算法進行處理,包括進行閱讀預處理、置信度調整和多線程處理,得到高準確率的RFID數據;

S4、對空間冗餘數據採用面向實用性的數據級冗餘消除方法進行處理,引入空間位置檢測模型,得到去除冗餘後的RFID數據。

進一步地,本發明的步驟S2中進行RFID數據分割的步驟具體包括:

S21、將RFID數據轉換為三維數據,通過基於三維十字窗的滑動分割方法對漏讀數據和空間冗餘數據進行檢測;

S22、對每個時刻的數據進行空間窗口檢測將存在冗餘的數據位置標記出來,分割出空間冗餘數據;

S23、利用多個時刻的數據分布窗口沿時間軸滑動,標記出該時間段內的漏讀數據發生的起始及終止時間,分割出漏讀數據。

進一步地,本發明的步驟S3中採用自適應實時的漏讀平滑算法進行處理的步驟具體包括:

S31、統計感知RFID數據的閱讀率,對閱讀率參數進行中值濾波預處理,有效消除數據孤立點,同時保持其邊緣特性;

S32、設置初始窗口大小及置信度,通過觀測數據自適應調整窗口大小和置信度平滑RFID漏讀數據;

S33、採用多線程技術對數據閱讀率進行預處理以及自適應調節窗口大小平滑數據改善漏讀,兩個線程獨立並行運行,中間備有數據緩存區保存中間數據,實時處理得到高準確率的RFID數據。

進一步地,本發明的步驟S4中採用面向實用性的數據級冗餘消除方法進行處理的步驟具體包括:

S41、根據冗餘數據的產生依賴的RFID閱讀器的拓撲結構、RFID閱讀器的閱讀範圍以及RFID閱讀器的最大閱讀率,建立空間位置檢測模型;

S42、利用MCMC抽樣獲取海量標籤位置分布樣本;

S43、基於貝葉斯推斷理論以及空間位置檢測模型,統計樣本的後驗概率,取後驗概率最大的樣本為標籤的位置分布,得到去除冗餘後的RFID數據。

進一步地,本發明的步驟S31中進行閱讀率預處理的步驟具體包括:

S311、選取一定大小的窗口在標籤的閱讀率數據上漫遊,並將窗口的中心與某個閱讀率數據位置重合;

S312、讀取窗口中各對應位置的閱讀率大小;

S313、將讀取到的閱讀率從小到大排列;

S314、取排序後閱讀率數據中的中間值,將其作為窗口中心位置的閱讀率。

進一步地,本發明的步驟S32中自適應平滑處理的步驟具體包括:

S321、初始化窗口大小w0並設置置信度δ;

S322、統計窗口當前wi中標籤i的平均閱讀率閱讀率的變化量Δpi,t以及|Si1|和|Si2|;

S323、利用當前標籤速度下的置信度參數δ計算滿足數據完整性要求需要的窗口大小以及統計閱讀率的變化量Δpi,t連續為負數的次數;

S324、如果閱讀率的變化量Δpi,t連續為負數的次數大於2並且|Si2|為0則確定標籤i正在離開閱讀器範圍,此時應減少窗口大小以防止標籤積極讀錯誤,將當前窗口大小wi減為原來的一半;

S325、否則判斷是否滿足標籤躍遷條件,如果滿足說明標籤i正在移動,此時應減少窗口大小以防止標籤積極讀錯誤,將當前窗口大小wi減小2個閱讀周期;

S326、否則比較當前窗口大小wi和如果wi小於並且說明標籤i正在像閱讀器移動,此時應增加窗口大小增加標籤i被讀到的概率,將當前窗口大小wi增加2個閱讀周期。

進一步地,本發明的步驟S41中建立空間位置檢測模型的步驟具體包括:

S411、根據拓撲系統中相距最遠的兩個閱讀器之間的距離以及閱讀率變化曲線得到在該拓撲系統中標籤被兩個閱讀器同時讀到的最小概率,最小概率Pmin為:

S412、根據拓撲系統中任意兩個閱讀器之間的距離以及閱讀器的最大閱讀範圍得到某個標籤同時被這兩個閱讀器讀到的概率;標籤同時被閱讀器i和閱讀器j閱讀到的概率p(i,j):

p(i,j)=1-Dis/Sminor

S413、在最小概率的基礎上計算標籤被兩個閱讀器同時讀到發生冗餘的位置轉移概率P:

在已知標籤的位置分布H和RFID數據的觀察值Z的情況下,將位置轉移概率P代入下式即可由下式求得極大似然概率p(Z|H):

Q=Z*P

其中,相距最遠的閱讀器之間距離為L,閱讀器的主閱讀範圍為Smajor,次閱讀範圍為Sminor,最大閱讀率為Pmax;閱讀器i和閱讀器j之間的距離為Dis,閱讀器最大閱讀範圍為Sminor。

本發明提供一種面向車間製造過程的海量RFID數據智能清洗系統,包括:

RFID數據感知模塊,用於獲取製造車間中不同的RFID拓撲結構中感知到的RFID數據;

數據分割模塊,用於構建面向數據的分割器將RFID數據分割為漏讀數據和空間冗餘數據;

數據清洗模塊,包括漏讀數據處理單元、空間冗餘數據處理單元和時間冗餘處理單元,用於對漏讀數據採用自適應實時的漏讀平滑算法進行處理,包括進行閱讀預處理、置信度調整和多線程處理,得到高準確率的RFID數據;對空間冗餘數據採用面向實用性的數據級冗餘消除方法進行處理,引入空間位置檢測模型,得到去除冗餘後的RFID數據;時間冗餘處理則是對漏讀處理和空間冗餘處理後的數據進行合併和相應轉化。

進一步地,本發明的漏讀數據處理單元包括:

閱讀預處理單元,用於統計感知RFID數據的閱讀率,對閱讀率參數進行中值濾波預處理,有效消除數據孤立點,同時保持其邊緣特性;

自適應窗口平滑處理單元,用於設置初始窗口大小及置信度,通過觀測數據自適應調整窗口大小和置信度平滑RFID漏讀數據;

多線程實時處理單元,用於採用多線程技術對數據閱讀率進行預處理以及自適應調節窗口大小平滑數據改善漏讀,兩個線程獨立並行運行,中間備有數據緩存區保存中間數據,實時處理得到高準確率的RFID數據。

進一步地,本發明的空間冗餘數據處理單元包括:

空間位置檢測模型建立單元,用於根據冗餘數據的產生依賴的RFID閱讀器的拓撲結構、RFID閱讀器的閱讀範圍以及RFID閱讀器的最大閱讀率,建立空間位置檢測模型;

樣板抽取單元,用於利用MCMC抽樣獲取海量標籤位置分布樣本;

冗餘去除單元,用於基於貝葉斯推斷理論以及空間位置檢測模型,統計樣本的後驗概率,取後驗概率最大的樣本為標籤的位置分布,得到去除冗餘後的RFID數據。

本發明產生的有益效果是:本發明的面向車間製造過程的海量RFID數據智能清洗方法及系統,通過構建一種將數據分割同步處理的總體清洗框架,解決了稀疏部署時漏讀數據、密集部署時冗餘數據的問題,提升系統處理效率;針對大量漏讀數據中閱讀率這個重要參數,通過對閱讀率的預處理消除孤立噪聲點,考慮標籤的動態性動態調整置信度參數,利用多線程及數據緩存提高處理的時效性;針對現有基於貝葉斯推斷去冗餘方法中獲取極大似然概率只考慮了RFID直線均勻部署以及平面規則部署的情形,構建了一種RFID空間位置分布的空間關係模型,使得方法更具有普適性和魯棒性。

附圖說明

下面將結合附圖及實施例對本發明作進一步說明,附圖中:

圖1為本發明實施例的製造車間RFID數據清洗架構;

圖2為本發明實施例的「三維十字窗」數據分割模型;

圖3為本發明實施例的自適應實時RFID漏讀平滑算法AORFC框圖;

圖4為本發明實施例的多線程實時清洗框架;

圖5為本發明實施例的PraRRE算法框圖;

圖6為本發明實施例的漏讀數據處理後錯誤率比較圖;

圖7為本發明實施例的標籤隨機移動時漏讀數據處理結果比較圖;

圖8(a)為本發明實施例的RFID閱讀器稀疏部署圖;

圖8(b)為本發明實施例的RFID閱讀器密集部署圖;

圖9(a)為本發明實施例的場景一的去冗餘率結果比較圖;

圖9(b)為本發明實施例的場景二的去冗餘率結果比較圖;

圖10(a)為本發明實施例的RFID數據清洗系統模塊的漏讀清洗模塊;

圖10(b)為本發明實施例的RFID數據清洗系統模塊的冗餘清洗模塊;

圖10(c)為本發明實施例的RFID數據清洗系統模塊的綜合處理模塊。

具體實施方式

為了使本發明的目的、技術方案及優點更加清楚明白,以下結合附圖及實施例,對本發明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅用以解釋本發明,並不用於限定本發明。

本發明實施例的面向車間製造過程的海量RFID數據智能清洗方法,包括以下步驟:

S1、獲取製造車間中不同的RFID拓撲結構中感知到的RFID數據;

S2、構建面向數據的分割器將RFID數據分割為漏讀數據和空間冗餘數據;

進行RFID數據分割的步驟具體包括:

S21、將RFID數據轉換為三維數據,通過基於三維十字窗的滑動分割方法對漏讀數據和空間冗餘數據進行檢測;

S22、對每個時刻的數據進行空間窗口檢測將存在冗餘的數據位置標記出來,分割出空間冗餘數據;

S23、利用多個時刻的數據分布窗口沿時間軸滑動,標記出該時間段內的漏讀數據發生的起始及終止時間,分割出漏讀數據。

S3、對漏讀數據採用自適應實時的漏讀平滑算法進行處理,包括進行閱讀預處理、置信度調整和多線程處理,得到高準確率的RFID數據;

採用自適應實時的漏讀平滑算法進行處理的步驟具體包括:

S31、統計感知RFID數據的閱讀率,對閱讀率參數進行中值濾波預處理,有效消除數據孤立點,同時保持其邊緣特性;

S32、設置初始窗口大小及置信度,通過觀測數據自適應調整窗口大小和置信度平滑RFID漏讀數據;

S33、採用多線程技術對數據閱讀率進行預處理以及自適應調節窗口大小平滑數據改善漏讀,兩個線程獨立並行運行,中間備有數據緩存區保存中間數據,實時處理得到高準確率的RFID數據。

S4、對空間冗餘數據採用面向實用性的數據級冗餘消除方法進行處理,引入空間位置檢測模型,得到去除冗餘後的RFID數據。

採用面向實用性的數據級冗餘消除方法進行處理的步驟具體包括:

S41、根據冗餘數據的產生依賴的RFID閱讀器的拓撲結構、RFID閱讀器的閱讀範圍以及RFID閱讀器的最大閱讀率,建立空間位置檢測模型;

S42、利用MCMC抽樣獲取海量標籤位置分布樣本;

S43、基於貝葉斯推斷理論以及空間位置檢測模型,統計樣本的後驗概率,取後驗概率最大的樣本為標籤的位置分布,得到去除冗餘後的RFID數據。

在本發明的另一個具體實施例中,主要包括系統總體框架,漏讀填補算法,冗餘消除算法和系統實現四個部分。

(1)總體框架。實際製造車間中RFID閱讀器存在兩種拓撲結構:稀疏部署和密集部署。在RFID閱讀器稀疏部署時,相鄰閱讀器之間距離較大,標籤在某個時刻只可能被一個閱讀器讀到,幾乎不可能被多個閱讀器同時讀到,因此產生的RFID數據不存在空間冗餘。標籤處於閱讀區域以外沒有被任何閱讀器讀到,或由於其他信號幹擾標籤處於閱讀區域以內卻沒有被閱讀器讀到,產生的RFID數據存在大量的漏讀。密集部署時利用多個閱讀器區域交叉覆蓋,增加標籤被閱讀器讀到的概率,從而減少漏讀。此時標籤在某個時刻可能被多個閱讀器同時讀到,產生大量的空間冗餘數據。RFID閱讀器在車間不同的拓補結構將導致主要存在的數據質量問題不同,因此設計綜合的數據清洗系統,包括製造車間RFID數據感知模塊、數據分割模塊以及數據清洗模塊三個部分。

(2)漏讀填補算法,主要包括閱讀率預處理、自適應窗口平滑和多線程實時處理三個部分。

閱讀率預處理:因為製造車間信號的幹擾以及數據漏讀的存在,得到的閱讀率並不準確,含有噪聲,在使用之前利用中值濾波對閱讀率進行處理。

自適應窗口平滑:假設標籤i在時間窗口Wi(Wi=(t-Wi,t))時間內可以被閱讀wi個周期,即Wi=wi*T(T是每個閱讀周期的時間)。前提假設:標籤i一直處於閱讀器的閱讀範圍內,並且在相同長的時間段Wi中,標籤被讀到的概率pi相同。那麼實際中標籤被讀到的次數服從二項分布B(wi,pi)。

其中閱讀率pi可以通過標籤的應答次數和請求次數計算,定義為:

假設實際中標籤被讀到的次數為Si(Si∈[0,wi]),則這段時間的平均閱讀概率為

將上面Si看作是伯努利隨機抽樣,|Si|服從於二項分布基於統計概率理論,|Si|的期望和方差分別為:

考慮到窗口大小既要保證數據的完整性又要準確獲取標籤的動態性,進行以下分析。標籤i在窗口wi閱讀周期內一次都不被讀到的概率為設置置信度為δ,當時,可以保證數據的完整性。動態調整置信度δ,標籤的移動速度快,置信度δ相對越大;標籤的移動速度慢,置信度δ越小,因此置信度δ正比於標籤的速度V。

基於中心極限定理,標籤i在閱讀器的閱讀範圍內時,|Si|應該小於因此標籤發生躍遷的條件為:

為進一步改進RFID標籤移動時的檢測機制,充分利用子窗口中的數據情況做出判斷,統計前後兩個子窗口中讀取次數以及閱讀率輔助平滑過程中窗口的變化。

多線程實時處理:車間製造過程中感知獲取的RFID數據量大,數據清洗算法需具備海量數據的實時處理能力。採用多線程技術來提高系統對海量數據的實時處理能力,提高系統的吞吐量。

(3)冗餘消除算法。貝葉斯推斷是一種在已知觀測值Z的情形下估計假設H出現的概率的統計推斷技術,貝葉斯推斷的內容:後驗概率正比於先驗概率與極大似然概率得乘積。基於貝葉斯推斷去除RFID空間冗餘數據,基本思路是根據感知到的RFID數據計算每一種關於標籤所在的閱讀器區域的假設可能的概率,通過比較後驗概率的大小得到最有可能的標籤分布情況,從而去除空間冗餘數據。使用貝葉斯推斷時給出以下兩個假設:1)每個閱讀器讀取標籤事件是相互獨立的;2)每個標籤的先驗分布不依賴於其他標籤。

在消除RFID數據冗餘時,假設第i個標籤的位置hi,如第一個標籤在閱讀器2的範圍內則h1=2,全部n個標籤的位置構成矢量H=(h1,h2,…hn)。

利用閱讀器-標籤矩陣Z儲存原始RFID數據,矩陣Z計算如下:

其中Ti表示第i個標籤,Rj表示第j個閱讀器,標籤被閱讀器讀到Z(i,j)記為1,沒被閱讀器讀到Z(i,j)記為0。

對於給定的位置矢量H以及觀察到的數據矩陣Z可以利用貝葉斯推斷公式計算其後驗概率的大小,即標籤位於當前位置矢量H的情況下得到觀察矩陣Z的可能性大小。

post(H|Z)∝p(Z|H)p(H)

只需要比較不同位置矢量下後驗概率的大小就可以得到當前數據下標籤的位置分布,即可以去除冗餘。

(4)系統實現。基於JAVA語言,利用Java Web相關技術開發海量RFID數據智能清洗系統。

本發明面向車間製造過程的海量RFID數據智能清洗系統,包括:

RFID數據感知模塊,用於獲取製造車間中不同的RFID拓撲結構中感知到的RFID數據;

數據分割模塊,用於構建面向數據的分割器將RFID數據分割為漏讀數據和空間冗餘數據;

數據清洗模塊,包括漏讀數據處理單元和空間冗餘數據處理單元,用於對漏讀數據採用自適應實時的漏讀平滑算法進行處理,包括進行閱讀預處理、置信度調整和多線程處理,得到高準確率的RFID數據;對空間冗餘數據採用面向實用性的數據級冗餘消除方法進行處理,引入空間位置檢測模型,得到去除冗餘後的RFID數據。

進一步地,本發明的漏讀數據處理單元包括:

閱讀預處理單元,用於統計感知RFID數據的閱讀率,對閱讀率參數進行中值濾波預處理,有效消除數據孤立點,同時保持其邊緣特性;

自適應窗口平滑處理單元,用於設置初始窗口大小及置信度,通過觀測數據自適應調整窗口大小和置信度平滑RFID漏讀數據;

多線程實時處理單元,用於採用多線程技術對數據閱讀率進行預處理以及自適應調節窗口大小平滑數據改善漏讀,兩個線程獨立並行運行,中間備有數據緩存區保存中間數據,實時處理得到高準確率的RFID數據。

進一步地,本發明的空間冗餘數據處理單元包括:

空間位置檢測模型建立單元,用於根據冗餘數據的產生依賴的RFID閱讀器的拓撲結構、RFID閱讀器的閱讀範圍以及RFID閱讀器的最大閱讀率,建立空間位置檢測模型;

樣板抽取單元,用於利用MCMC抽樣獲取海量標籤位置分布樣本;

冗餘去除單元,用於基於貝葉斯推斷理論以及空間位置檢測模型,統計樣本的後驗概率,取後驗概率最大的樣本為標籤的位置分布,得到去除冗餘後的RFID數據。

系統架構如圖1所示,主要包括製造車間RFID數據感知模塊、數據分割模塊以及數據清洗模塊三個部分。

製造車間RFID數據感知模塊:在加工生產車間、裝配車間、物料車間製造區域內部署RFID設備,感知車間加工生產狀態、物料儲備信息。

數據分割模塊:空間冗餘主要分布在空間維度上,通過對每個時刻的數據進行空間窗口檢測將存在冗餘的數據位置標記出來。數據漏讀主要分布在時間維度上,利用多個時刻的數據分布窗口沿時間軸滑動檢測漏讀數據,標記出該時間段內漏讀發生的起始及終止時間。如圖2所示,數據分割模塊同時進行漏讀和空間冗餘的檢測即在空間維度和時間維度上滑動窗口十字交叉,稱為一種基於「三維十字窗」的滑動分割方法。這樣原始混合數據中被數據分割器標記的冗餘部分將被送到冗餘消除模塊處理,被標記的漏讀數據被漏讀清洗模塊處理。利用數據分割模塊將數據分開處理降低了RFID數據清洗系統的處理時間,提高了效率。

數據清洗模塊:含漏讀數據處理、空間冗餘處理以及時間冗餘處理三個部分,其中漏讀數據處理以及空間冗餘處理由對應的處理算法進行處理,而時間冗餘處理首先將漏讀處理和空間冗餘處理後的數據合併及轉化為原來的三元組形式,然後設置時間閾值,將位置不經常變動的標籤信息合併以四元組的形式傳輸給上層管理系統。

而如圖3所示,上述針對漏讀數據的清洗方法是自適應實時RFID漏讀平滑算法AORFC。

第一步:閱讀率預處理。具體步驟如下:

Step1 選取一定大小的窗口在標籤的閱讀率數據上漫遊,並將窗口的中心與某個閱讀率數據位置重合;

Step2 讀取窗口中各對應位置的閱讀率大小;

Step3 將這些閱讀率從小到大排列;

Step4 取排序後閱讀率數據中的中間值,將其作為窗口中心位置的閱讀率。

第二步:自適應平滑處理。具體流程如下:

Step1 初始化窗口大小w0並設置置信度δ;

Step2 統計窗口當前wi中標籤i的平均閱讀率閱讀率的變化量Δpi,t以及|Si1|和|Si2|;

Step3 利用當前標籤速度下的置信度參數δ計算滿足數據完整性要求需要的窗口大小以及統計閱讀率的變化量Δpi,t連續為負數的次數;

Step4 如果閱讀率的變化量Δpi,t連續為負數的次數大於2並且|Si2|為0則確定標籤i正在離開閱讀器範圍,此時應減少窗口大小以防止標籤積極讀錯誤,將當前窗口大小wi減為原來的一半;

Step5 否則判斷是否滿足標籤躍遷條件,如果滿足說明標籤i正在移動,此時應減少窗口大小以防止標籤積極讀錯誤,將當前窗口大小wi減小2個閱讀周期;

Step6 否則比較當前窗口大小wi和如果wi小於並且說明標籤i正在像閱讀器移動,此時應增加窗口大小增加標籤i被讀到的概率,將當前窗口大小wi增加2個閱讀周期。

第三步:多線程實時處理。數據清洗算法被分成了兩個主線程:①對閱讀率數據進行預處理(簡稱預處理線程);②自適應調節窗口大小平滑數據改善漏讀(簡稱清洗線程)。如圖4所示,採用多線程技術,線程並行處理,清洗線程無需等待預處理線程處理完,而是直接從中間緩存區取走已經處理好的數據進行清洗,減少等待時間,提高效率。

如圖5所示,上述針對空間冗餘數據的清洗方法是面向實用性的RFID數據冗餘消除算法PraRRE。根據冗餘數據的產生依賴於RFID閱讀器的拓撲結構、RFID閱讀器的閱讀範圍以及RFID閱讀器的最大閱讀率這一特點,建立空間位置檢測模型。

首先,根據拓撲系統中相距最遠的兩個閱讀器之間的距離以及閱讀率變化曲線得到在該拓撲系統中標籤被兩個閱讀器同時讀到的最小概率。假設兩個相距最遠的閱讀器之間距離為L,閱讀器的主閱讀範圍為Smajor,次閱讀範圍為Sminor,最大閱讀率為Pmax,則最小概率Pmin為:

其次,根據拓撲系統中任意兩個閱讀器之間的距離以及閱讀器的最大閱讀範圍得到某個標籤同時被這兩個閱讀器讀到的概率。假設閱讀器i和閱讀器j之間的距離為Dis,閱讀器最大閱讀範圍為Sminor,則標籤同時被閱讀器i和閱讀器j閱讀到的概率p(i,j):

p(i,j)=1-Dis/Sminor

最後,在最小概率的基礎上計算標籤被兩個閱讀器同時讀到發生冗餘的位置轉移概率P:

在已知標籤的位置分布H和RFID數據的觀察值Z的情況下,將位置轉移概率P代入下式即可由下式求得極大似然概率p(Z|H):

Q=Z*P

其中,兩個相距最遠的閱讀器之間距離為L,閱讀器的主閱讀範圍為Smajor,次閱讀範圍為Sminor,最大閱讀率為Pmax;閱讀器i和閱讀器j之間的距離為Dis,閱讀器最大閱讀範圍為Sminor。

而由於後驗概率正比於先驗概率與極大似然概率的乘積,利用貝葉斯推斷以及MCMC抽樣得到大量樣本的後驗概率,取後驗概率最大的樣本為標籤的位置分布,即可去除空間冗餘。

在Matlab軟體上對發明中提出的方法的性能進行仿真測試評估。

實驗一:數據生成器生成以速度0.1-0.9m/epoch勻速移動的標籤在100個閱讀器區域內來回移動的數據,每種速度的數據量大約為1500000條,數據總數為9*1500000=13500000。對這些海量數據分別採用靜態窗口3(窗口大小為3個閱讀周期,static3)、靜態窗口25(窗口大小為25個閱讀周期,static25)、SMURF、WSTD、以及本文提出的AORFC五種算法進行了大量對比實驗。如圖6所示,給出了9種標籤移動速度下數據經過這五種算法分別處理後總的錯誤率,由圖可看出:①採用靜態窗口的方法,錯誤率隨速度變化,但總體都較大,為獲取較低的錯誤率窗口大小難以設置。②對比SMURF算法和WSTD算法,SMURF算法的錯誤率明顯較大,說明WSTD算法中的標籤躍遷檢測機制有效,能降低錯誤率。③對比本文提出的AORFC算法和WSTD算法,隨著標籤移動速度的增加,AORFC算法的錯誤率一直都比WSTD算法低,且隨著標籤速度的增加,錯誤率有所上升但上升的幅度不大。

實驗二:為模擬標籤隨機移動的情形,數據生成器生成了標籤先以0.3m/epoch移動,在停留一點時間,然後以速度0.9m/epoch移動的數據,經過SMURF、WSTD以及AORFC算法處理後結果圖如圖7所示。圖中黑色部分表示標籤被讀到,白色部分表是標籤沒有被閱讀器讀到。在標籤勻速移動時間段內,標籤不停地進出閱讀器的閱讀範圍,理想的數據如圖中「Reality」所示為均勻的黑色小段;當標籤停留時,由於標籤處於閱讀器閱讀區域內,理想數據為一段黑色圖形。然而實際產生的數據如圖中「Raw」所示,標籤在本該被閱讀器讀到的時間沒有被讀到,本不該被讀到的區域被讀到了,即出現了大量的積極讀和消極讀錯誤,其中漏讀數據偏多。由圖可以看出經過三種算法處理後,結果都比原始數據「Raw」有所改善,其中AORFC算法處理的結果與理想數據最為接近。

實驗三:設計如圖8所示的兩種RFID拓撲結構,採集了標籤數量為10、20、30到90的9組實際感知數據以及9組理想數據。圖9顯示了兩種場景下隨標籤數量變化產生的去冗餘率結果。在RFID閱讀器水平均勻部署時,PraRRE算法的去冗餘率比現有算法略低,但差距不大;在RFID閱讀器隨機無規則部署時,隨標籤數量遞增,PraRRE算法的去冗餘率隨數據量的增加而逐漸降低,但一直保持高於現有算法。

最後基於J2EE體系架構開發了製造企業RFID數據清洗系統,本系統可以是製造車間信息管理系統中的一個模塊,該模塊的主要功能是將在製造車間部署的RFID設備感知到的海量數據進行綜合的清洗處理,結合製造車間信息管理系統中的其它功能模塊,合理設計該模塊的結構流程,提高RFID數據質量,為製造車間信息管理提供可靠有效的感知數據。如圖10所示,展示了系統中的某些模塊,完成了系統各功能模塊的測試與運行,驗證了該系統在實際車間製造過程中的可行性。

本發明與現有技術相比具有如下優點:

1.本發明考慮現有方法在全面綜合處理漏讀、冗餘、多讀三種問題的方面的缺憾,構建一種將數據分割同步處理的總體清洗框架,解決了稀疏部署時漏讀數據、密集部署時冗餘數據的問題,提升系統處理效率。

2.本發明針對大量漏讀數據中閱讀率這個重要參數,通過對閱讀率的預處理消除孤立噪聲點,考慮標籤的動態性動態調整置信度參數,利用多線程及數據緩存提高處理的時效性。

3.本發明針對現有基於貝葉斯推斷去冗餘方法中獲取極大似然概率只考慮了RFID直線均勻部署以及平面規則部署的情形,構建了一種RFID空間位置分布的空間關係模型,使得方法更具有普適性和魯棒性。

4.本發明開發了RFID數據智能清洗系統。首先利用Matlab軟體搭建了實驗仿真平臺,分析比較本發明提出的數據清洗算法與各經典算法改進算法的準確率與效率。然後基於JAVA語言,利用Java Web相關技術開發實現了RFID數據智能清洗系統。大量的試驗數據表明該技術是非常有效並且可行的。

應當理解的是,對本領域普通技術人員來說,可以根據上述說明加以改進或變換,而所有這些改進和變換都應屬於本發明所附權利要求的保護範圍。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀