新四季網

深度學習如何感知跟蹤位置變化(深度學習如何感知跟蹤位置變化)

2023-09-11 10:05:45

位置感知能力是基於位置的服務(LBS)的核心。但是,準確估計目標的位置有時候並不是一件容易的事。全球定位系統(GPS)是戶外最好的位置感知計算使能者,能夠直接輸出地理空間坐標,但其誤差可能會超出某些應用的容忍極限。在 GPS 無法使用的地方,位置可以通過來自慣性測量單元(IMU)和攝像頭等傳感器提供的原始數據間接推斷出來。傳統上,不管是直接測量地理空間坐標還是推理得到位置,數據都必須經過一個相當繁瑣的人工設計的數據處理流程,之後才能被更高階的 LBS 使用。本文將介紹兩項近期的將深度學習模型引入位置感知計算的嘗試,這兩項研究能有效減少專家的參與。

通過部分可觀測隨機過程實現目標跟蹤(Object Tracking via Partially-observable Stochastic Processes)

論文地址:https://arxiv.org/abs/1602.00991

演示視頻:https://youtu.be/cdeWCpfUGWc

研究背景

這篇 AAAI16 論文提出了一種端到端的目標跟蹤方法,其中一端是從模擬的 2D 雷射掃描器收集到的原始數據,另一端是整個環境狀態(甚至包含被遮擋的物體),如下圖所示:

這個跟蹤問題背後有一個值得提及的關鍵問題,即由於遮擋情況,原始數據只是來自環境的一部分。傳統上一般是用貝葉斯濾波(類似於卡爾曼濾波器)來解決這樣的部分可觀測隨機過程問題,而這又涉及到大量人工設計的狀態表徵,並且還隱含了對模型分布的特定假設或採樣。這篇論文稱:該論文提出了首個端到端的可訓練解決方案,讓機器人智能體可以無監督的方式學習信念狀態表徵以及相應的預測和更新操作;相比於傳統方法,這種方法更有效且更省力。

模型

這個跟蹤問題被放入了一個生成模型框架中,其有一個詳細描述環境動態的隱馬爾可夫過程 h。與此同時,其外觀層 y 會獲取各個目標的位置,並且可被另外一層(傳感器測量層 x)部分觀測,如下圖所示:

該任務的目標就變成了:給定 x 的歷史輸入序列,估計 y 在時刻 t 的條件分布。注意 y 實際上並不是一個馬爾可夫過程,因此隱馬爾可夫模型等方法不能在這裡應用。作為替代,這可以通過遞歸貝葉斯估計來處理,即給定 x 的歷史輸入序列(信念),遞歸式地計算 h 在時刻 t 的條件分布。這種方法不直接估計目標,而是給定信念,將目標作為 y 的條件分布來估計。該論文通過加權了 W_F 和 W_P 的兩個神經網絡來表示最終目標,其中第一個網絡是指從歷史輸入序列到信念的模型,第二個網絡是指從信念到位置(在 t 時的 y)的模型。兩個網絡連結在一起,從而整體上有效地使它們成為了一個前饋循環神經網絡。信念的隱藏狀態表徵是從原始數據中學習的,並且可用作從一個時間步驟傳遞到下一個時間步驟的網絡記憶。這個過濾過程如下圖所示:

更具體而言,該論文使用了一個 4 層的前饋循環網絡,其中使用了卷積運算,每一層之後都有 sigmoid 激活。該網絡的架構如下所示:

無監督訓練

上述模型可以通過最小化目標分布的負對數似然這種常用方式來訓練。但是,由於遮擋,y 的基本真值(ground-truth)數據可能是無法獲取的。該論文提出的網絡訓練方法是不僅要預測下一個時間步驟,還要預測未來更多幾步(比如 n 步),具體做法是丟棄當前時間步驟與當前之後 n 步之間的所有觀察結果(將它們設為 0)。為了避免過擬合,這種觀察丟棄(observation dropout)必須在空間和時間上並且對所有數據集都執行。這讓網絡可以不使用基本真值數據進行訓練,這是一種相對無監督的方式。

結果

訓練集總共包含 10000 個長度為 2000 時間步驟的序列。進行了 50000 次迭代的隨機梯度下降訓練。得到了兩個重要發現。第一,這種無監督訓練得到了幾乎和監督學習一樣的結果,這說明觀察丟棄是有效的。第二,信念層的激活表現出了對不同目標移動模式的適應性表徵。訓練過程參閱下圖,或參看原論文附帶的視頻。

但是,也許由於這是該方向的首個研究,所以該論文沒有提供任何性能表現的量化指標或與已有研究的比較。該論文最後提到,研究者正在將該研究成果延展到更接近現實的數據以及更有難度的機器人任務上。

基於地理空間軌跡的位置預測(Location Prediction based on Geospatial Trajectories)

研究介紹:https://launchpad.ai/blog/tracking

研究背景

Launchpad.AI 最近有篇文章介紹了將長短期記憶(LSTM)用在運輸工作中的方法。對於很多工業和室外應用,GPS 和射頻識別(RFID)跟蹤技術現在已經得到了普遍應用,因為它們能以米級的精度獲取實時的位置信息。但是,解譯地理空間數據以改善操作流程的方法還是一個人們不太了解的主題。該論文提出了一種自動化地理空間異常檢測系統,可通過評估被跟蹤目標是否偏離了預期軌跡來檢測異常。該研究使用了 LSTM 網絡來學習歷史數據以預測未來位置。他們還將該系統應用到了一個真實數據集上,其中包含北京市 28000 輛計程車一個月的軌跡數據。

模型

除了時間戳和計程車對應的位置(經度和緯度),速度、方向和是否載客的狀態也在規範化之後被納入了序列數據之中。然後使用 LSTM 網絡處理這個序列數據。該研究還考慮了目標的身份信息。身份信息(這裡是每位駕駛員獨有的 ID)首先通過嵌入(embedding)進行預處理,然後與 LSTM 輸出融合。在某種程度上講,駕駛員 ID 的語義含義中有兩輛計程車是否具有相似的移動模式的信息。在經過一個密集的全連接層之後,整個網絡會以緯度和經度的形式輸出一分鐘的未來預測。該網絡是用 Keras 實現的,下圖給出了其網絡架構:

結果

訓練完成後的模型在留存的測試數據集上進行了評估。根據該論文的結果,計程車在一分鐘後離起始位置平均 391 米遠,這意味著如果該系統使用當前位置作為預期位置,那麼就會造成 391 米的誤差。使用 5 輛計程車作為訓練集的 LSTM embedding 的最終結果得到了 2076 米的誤差。但是,隨著計程車數量增長至 8000,誤差顯著下降到了 152 米,低於計程車的一分鐘平均移動距離。

簡評

這兩個案例都表明位置感知計算可受益於深度學習:一個是根據原始傳感器數據推斷位置,另一個是直接使用位置數據檢測運營異常。顯然,處理序列數據的深度學習已經非常成熟了,但是其在位置感知計算上的應用還不普遍,可能的原因有:

評估困難。事實上,上述案例更像是概念驗證研究,因為研究者都沒能提出可比較和公平的評估指標來評估他們的研究。缺乏可靠標註的數據集。位置感知計算的基本真值數據(通常是位置)一般難以獲取。比如在第一篇論文中,可能沒辦法記錄真實環境中所有目標的基本真值位置,這使得大規模學習難以實現。時間複雜性。非常類似於語音識別,時間數據序列的最小長度讓地理空間感知具有任意性,而且高度依賴當前狀況。在語音識別和光學字符識別(OCR)領域,目前是通過連接主義時間分類器(CTC)來解決這個問題。這種方法能否延展到位置感知計算領域?還有待探索和研究。

總體而言,目前的位置感知計算的機器學習水平還非常有限;當涉及到數據挖掘和解釋時,還需要大量領域專業知識。這兩個研究案例表明自動學習數據能有效提升當前的位置感知計算,這是一個很有前景的研究方向。

,
同类文章
葬禮的夢想

葬禮的夢想

夢見葬禮,我得到了這個夢想,五個要素的五個要素,水火只好,主要名字在外面,職業生涯良好,一切都應該對待他人治療誠意,由於小,吉利的冬天夢想,秋天的夢是不吉利的
找到手機是什麼意思?

找到手機是什麼意思?

找到手機是什麼意思?五次選舉的五個要素是兩名士兵的跡象。與他溝通很好。這是非常財富,它擅長運作,職業是仙人的標誌。單身男人有這個夢想,主要生活可以有人幫忙
我不怎麼想?

我不怎麼想?

我做了什麼意味著看到米飯烹飪?我得到了這個夢想,五線的主要土壤,但是Tu Ke水是錢的跡象,職業生涯更加真誠。他真誠地誠實。這是豐富的,這是夏瑞的巨星
夢想你的意思是什麼?

夢想你的意思是什麼?

你是什​​麼意思夢想的夢想?夢想,主要木材的五個要素,水的跡象,主營業務,主營業務,案子應該抓住魅力,不能疏忽,春天夢想的吉利夢想夏天的夢想不幸。詢問學者夢想
拯救夢想

拯救夢想

拯救夢想什麼意思?你夢想著拯救人嗎?拯救人們的夢想有一個現實,也有夢想的主觀想像力,請參閱週宮官方網站拯救人民夢想的詳細解釋。夢想著敵人被拯救出來
2022愛方向和生日是在[質量個性]中

2022愛方向和生日是在[質量個性]中

[救生員]有人說,在出生88天之前,胎兒已經知道哪天的出生,如何有優質的個性,將走在什麼樣的愛情之旅,將與生活生活有什么生活。今天
夢想切割剪裁

夢想切割剪裁

夢想切割剪裁什麼意思?你夢想切你的手是好的嗎?夢想切割手工切割手有一個真正的影響和反應,也有夢想的主觀想像力。請參閱官方網站夢想的細節,以削減手
夢想著親人死了

夢想著親人死了

夢想著親人死了什麼意思?你夢想夢想你的親人死嗎?夢想有一個現實的影響和反應,還有夢想的主觀想像力,請參閱夢想世界夢想死亡的親屬的詳細解釋
夢想搶劫

夢想搶劫

夢想搶劫什麼意思?你夢想搶劫嗎?夢想著搶劫有一個現實的影響和反應,也有夢想的主觀想像力,請參閱週恭吉夢官方網站的詳細解釋。夢想搶劫
夢想缺乏缺乏紊亂

夢想缺乏缺乏紊亂

夢想缺乏缺乏紊亂什麼意思?你夢想缺乏異常藥物嗎?夢想缺乏現實世界的影響和現實,還有夢想的主觀想像,請看官方網站的夢想組織缺乏異常藥物。我覺得有些東西缺失了