一種基於可穿戴設備的室內、室外場景識別方法與流程
2023-12-04 05:41:46 2

本發明涉及一種無監督的室內、室外場景識別方法,具體涉及一種通過融合不同來源的環境信息數據,在無人工標記數據的情況下探測出數據源場景信息的方法。
背景技術:
場景信息的挖掘能夠為上層的應用提供重要的環境信息。例如在通信過程中,設備需要在良好的環境中工作。設備的故障率和環境有著密切的關係。然而,設備站內與站外、線路整體區域和局部區域的環境有所差異,精準定位差異意味著知道環境的信息越準確,有利於提高運維的效率。現有技術中的環境測量方法是通過固定站測得,這種固定站體積大、成本高、對部署地的要求較高。因此,固定環境測量站點的部署數量有限,局部地區數據缺失,提供信息不足。
場景信息是上層應用的基礎,只有對場景信息進行區分才能更好的使得基於場景信息的應用發揮其價值。在實際的生活環境中,人們對溫度、溼度、光照強度等較為敏感。人們獲取環境信息的來源主要通過權威部門發布的天氣信息。這種信息體現的是某個較大區域的環境信息,然而由於其缺少局部的數據,使得它對於局部的信息其無法作精準的預測。
現有技術中對環境數據的區分主要有三種。第一種,通過對特定區域的歷史環境在室內或者室外進行測量,指標主要包括光線強度、基站信號強度、磁場強度。由於室內外光線強度、基站信號強度和磁場強度(室內的家用電器較多,室內磁場感應較強)不同,通過檢測這三種信號的強度,當信號超出某個閾值則認為是在室內。例如,在正常日照情況下室內光照強度大於室外光照強度,室內磁場強度高於室外磁場強度,而基站信號較弱。通過找出室內、室外這三種信號的強度邊界以此作為室內、室外場景的邊界。當新的測量點沒有落在室內的邊界內,則認為數據採集點的磁場強度為室外,反之為室內。這種方法的擴展性有限,當測量的位置和環境發生變化,則傳感器邊界將需要通過實驗重新界定。第二種方法是通過半監督的機器學習的方法,直接對數據進行室內、室外場景的分類。該方法首先對數據進行聚類,然後採用人工方法對少量的數據進行標註,最後採用貝葉斯分類和決策樹分類對數據進行場景區分。該方法在建模的過程中,對參數較為敏感,當環境發生劇烈變化,模型的精度將受到影響。因此,在環境惡劣多變的環境中該方法有其局限性。另外,一種通過GPS信號、室內的溫、溼度以及Web天氣信息等來判斷室內、室外場景。當設備,如手機等,探測不到GPS信號則認為其可能在室內,反之則認為其在室外。然後,通過直接對比室內和室外的溫、溼度與環境的差異,當這種差異超過傳感器的誤差,則認為是數據點在室內,反之則認為數據點在室外。該方法主要採用規則的方法,嚴重依賴傳感器的測量誤差,利用室內、室外環境的差異是否超出該測量範圍進行場景的分類。該方法對傳感器的測量誤差較為敏感。在實際的應用過程中需要對每批傳感器的誤差範圍進行參數記錄,單一的應用實際的判斷有所差別,不利於規模化部署。
技術實現要素:
本發明的目的在於提供一種基於可穿戴設備的室內、室外場景識別方法,簡單有效,在無需人工標記的前提下,運用較小的算法複雜度識別可穿戴設備環境測量的場景信息,為基於場景應用提供重要信息。
為了達到上述目的,本發明通過以下技術方案實現:一種基於可穿戴設備的室內、室外場景識別方法,其特點是,包含以下步驟:
S1、對室外自動站點測量的第一環境信息數據及可穿戴設備採集的第二環境信息數據進行時序數據融合處理,得到多維環境信息時間序列;
S2、對多維環境信息時間序列進行環境時間序列濾波處理,得到場景變化的邊界點;
S3、對每個維度的環境信息分別執行步驟S1和步驟S2,得到多維邊界點集合;
S4、根據多維邊界點集合,對可穿戴設備採集的第二環境信息數據進行室內外相似性檢測,得到第二環境信息數據的位置場景信息。
所述的步驟S1包含:
對室外自動站點測量的第一環境信息數據和可穿戴設備的採集的第二環境信息數據進行序列化處理,得到第一環境信息時間序列和第二環境信息時間序列,並且第一環境信息時間序列和第二環境信息時間序列具有相同時間標籤;
將第一環境信息時間序列與第二環境信息時間序列相減取絕對值,得到融合後的多維環境信息時間序列。
所述的步驟S2包含:
差分化處理:對多維環境信息時間序列求其二階差分,從而得到多維差分時間序列;
平滑加權處理:利用寬度為L的滑動窗對多維差分時間序列求取方差得到方差序列;
加權高通濾波:對方差序列作指數加權並賦予係數k,然後求取均值,將該均值作為方差序列的濾波閾值,超出濾波閾值的點認為原始的時間序列變化劇烈,將這些點作為邊界檢測的輸入點。
所述的步驟S3包含:
對於每個維度的時間序列,進行時間序列的濾波處理;
經濾波處理後的時間序列看作邊界點的集合,如果有m維的時間序列,則每個時間序列的邊界點均可構成一個邊界點的集合。
所述的維度m由測量環境的指標、時間信息和測量點的地理位置信息決定。
所述的步驟S3還包含:對每個維度相同時間點的集合,如果某個時間點對應的所有維度的數據均與之維度對應的邊界點集合中,那麼該點被認為是邊界點,對於連續出現的邊界點,取該連續序列段的第一個點。
所述的步驟S4中,進行室內外相似性檢測之前還包含:對時序數據進行分段,根據檢查的邊界點對時序的數列進行分段,每一段中具有相同的環境場景信息。
所述的步驟S4中,進行室內外相似性檢測的步驟中包含:對於被切分長度為n的第二環境信息時間序列和第一環境信息時間序列之間的距離由兩者每個點之間絕對值的平均決定。
所述的步驟S4中,進行室內外相似性檢測的步驟中還包含:第二環境信息時間序列與第一環境信息時間序列的相似標準由所有未分段的第二環境信息時間序列和第一環境信息時間序列之間的距離的期望決定。
所述的步驟S4中,進行室內外相似性檢測的步驟中還包含:當分段的第二環境信息時間序列和第一環境信息時間序列之間的距離小於該期望則表明兩者相似,該時段的第二環境信息數據是在室外採集;反之,則在室內採集。
本發明一種基於可穿戴設備的室內、室外場景識別方法與現有技術相比具有以下優點:通過對可穿戴設備傳感器數據流進行處理,對採集的數據點的場景進行區分;通過提取可穿戴設備數據在室內、室外場景切換的特徵,對可穿戴設備數據流進行分段處理以減少計算量,接著將分段後的數據與室外環境數據比對,提取出於室外環境;相對於現有技術的方法,可穿戴設備體積小、成本低,能實時將數據採集到雲端進行分析,利於大規模數據採集和實時信息反饋,在對信息分析過程中需要對場景進行區分,這樣才能將不同場景下的環境信息更精確地展示出來;通過數據融合的方式,避免人工對數據進行標記分類;該識別方法簡單易操作,容易實施;通過對數據進行分段處理,使得計算量減少同時又能保證準確率。
附圖說明
圖1為本發明一種基於可穿戴設備的室內、室外場景識別方法的流程圖;
圖2A及圖2B為步驟一中,時序數據的融合處理的示意圖;
圖3A及圖3B為步驟二中,環境時間序列濾波處理的示意圖;
圖4為步驟三中,多維度時序數列邊界點檢測的示意圖;
圖5為步驟四中,室內外相似性檢測的示意圖。
具體實施方式
以下結合附圖,通過詳細說明一個較佳的具體實施例,對本發明做進一步闡述。
由於室內空間密閉性較好,且室內電器較多,室內環境受電器等室內設備等因素的影響,內部環境變化相比室外更為明顯。而室外空間開闊,在較短的時間內,其局部地區的環境變化較小。這種變化的趨勢通過探測室內、室外環境指標在場景切換時的變化而獲取。通過分析歷史的環境信息,獲取場景切換時變化的邊界,從而對室內、室外場景進行識別。在實際的操作過程中,測量指標均帶有時間標記,將帶標記的測量指標進行歸一化處理,得到時間序列。通過分析時間序列在場景發生變化的劇烈程度判讀是否有場景的切換,從而找出所有的場景切換的邊界點。邊界點將時間序列分割成不同的場景片段,將這些場景片段與外部的環境信息進行對比,找出兩者的相似性。通過兩者的相似性識別信息片段的場景。
本發明對室內、室外場景具有一定的假定,包括:室內場景相對室外場景在空間上更為密閉、室外場景在較短時間內在局部地區的環境穩定、傳感器能夠真實測量到環境信息。通過對可穿戴設備獲取的數據與外部環境數據源進行相似度的匹配,從而獲取室內室外的環境信息。在本方法中我們指定帶連續時間標籤的可穿戴設備的數據為時序數列。例如,ti時刻時的溫度為則時間序列可以表示為其中i=1,2,...n,n為時序數列的長度。
採用可穿戴設備可以彌補缺少局部數據的不足,但可穿戴設備由於其移動性引入了不同的環境信息,這不利於局部地區數據的獲取。如果不對場景信息加以區分,其可能帶來錯誤環境的預估,這將運維的工作產生不利的影響。例如,對某個維護站內的溫度高達45度,嚴重影響某設備的使用,而室外的溫度為為20攝氏度左右。如果不對場景區分,盲目的融合,將外部的環境中和了出故障的局部地區的環境,從未使得負責人員未能對事故進行排查。在這一方面,場景的區分保證了數據的較高質量,從而使得分析結果更為準確。
如圖1所示,一種基於可穿戴設備的室內、室外場景識別方法,其特徵在於,包含以下步驟:
S1、對室外自動站點測量的第一環境信息數據(一般由權威機構發布)及可穿戴設備採集的第二環境信息數據進行時序數據融合處理,得到多維環境信息時間序列。
對室外自動站點測量的第一環境信息數據和可穿戴設備的採集的第二環境信息數據進行序列化處理,得到第一環境信息時間序列和第二環境信息時間序列,並且第一環境信息時間序列和第二環境信息時間序列具有相同時間標籤(第一環境信息時間序列和第二環境信息時間序列按照時間點對齊);
將第一環境信息時間序列與第二環境信息時間序列相減取絕對值(這樣,原來的兩個不同的第一環境信息數據、第二環境信息數據被轉化為差值化的時間序列),得到融合後的多維環境信息時間序列。
S2、對多維環境信息時間序列進行環境時間序列濾波處理,得到場景變化的邊界點。
差分化處理:對多維環境信息時間序列求其二階差分,從而得到多維差分時間序列,二階差分序列反映了原始數據的波動狀況,根據波動的劇烈程度計算原始序列在室內、室外場景切換時的分界點;
平滑加權處理:利用寬度為L的滑動窗對多維差分時間序列求取方差得到方差序列,其中L根據實際情況設定;
加權高通濾波:對方差序列作指數加權並賦予係數k,然後求取均值,將該均值作為方差序列的濾波閾值,超出濾波閾值的點認為原始的時間序列變化劇烈,將這些點作為邊界檢測的輸入點。
S3、對每個維度的環境信息分別執行步驟S1和步驟S2,得到多維邊界點集合(每個維度的邊界點集合中均帶有時間信息)。
對於每個維度的時間序列,進行時間序列的濾波處理;
經濾波處理後的時間序列看作邊界點的集合,如果有m維的時間序列,則每個時間序列的邊界點均可構成一個邊界點的集合;其中,所述的維度m由測量環境的指標、時間信息和測量點的地理位置信息決定。
對每個維度相同時間點的集合,如果某個時間點對應的所有維度的數據均與之維度對應的邊界點集合中,那麼該點被認為是邊界點,對於連續出現的邊界點,取該連續序列段的第一個點。
S4、根據多維邊界點集合,對可穿戴設備採集的第二環境信息數據進行室內外相似性檢測,得到第二環境信息數據的位置場景信息。
進行室內外相似性檢測之前還包含:對時序數據進行分段,根據檢查的邊界點對時序的數列進行分段,每一段中具有相同的環境場景信息。
進行室內外相似性檢測的步驟中包含:
對於被切分長度為n的第二環境信息時間序列和第一環境信息時間序列之間的距離由兩者每個點之間絕對值的平均決定;
第二環境信息時間序列與第一環境信息時間序列的相似標準由所有未分段的第二環境信息時間序列和第一環境信息時間序列之間的距離的期望決定。
當分段的第二環境信息時間序列和第一環境信息時間序列之間的距離小於該期望則表明兩者相似,該時段的第二環境信息數據是在室外採集;反之,則在室內採集。
具體應用:
步驟一、如圖2A及圖2B中所示,將帶有時間標籤的傳感器溫度數據和室外溫度數據作序列化處理,並將序列化的數據按照時間點對齊,得到如圖2A所示。計算每個時間點傳感器數據和室外環境的數據差值,將其轉化為絕對值差值化的時間序列,如圖2B所示。
步驟二、如圖3A及3B所示,對步驟一中得到的差值化數據中的每個點求二階差分,得到圖3A中的差分序列。接著對差分序列作滑動平均處理。此處用於平滑處理的窗口寬度為300秒。同時,利用指數函數的性質,對平滑後的序列作指數加權處理,得到圖3B中加權序列。在本實施例中取全局加權指數的平均值最為邊界點取值。由圖3B可知,邊界點集中在橫軸1937至1979之間。
步驟三、如圖4所示,對其他維度的數據作同樣如步驟一和步驟2的處理,得到多維的邊界點的集合。如果對於某個時間點的在每個維度上均在邊界點集合中,則可確定該點為區分傳感器序列的邊界點。對於時間上連續的邊界點,取第一個邊界點為最終的邊界點。在本試試例中,取橫坐標值為1937的時間點作為邊界點。
步驟四、根據步驟三所獲取的邊界點,將傳感器數值時間序列分割成若干段。求每段傳感器時間序列與室外環境的結合距離。當幾何距離小於某個數值時,則認為該序列與外部的環境具有相同場景信息。在本實施例中,根據該方法得到的室內、室外場景的識別如圖5所示,右側的部分為室外環境信息。
通過數據融合的方式,避免人工對數據進行標記分類;該識別方法簡單易操作,容易實施;通過對數據進行分段處理,使得計算量減少同時又能保證準確率。
儘管本發明的內容已經通過上述優選實施例作了詳細介紹,但應當認識到上述的描述不應被認為是對本發明的限制。在本領域技術人員閱讀了上述內容後,對於本發明的多種修改和替代都將是顯而易見的。因此,本發明的保護範圍應由所附的權利要求來限定。