用於內存洩漏診斷的方法和裝置的製作方法
2023-04-27 21:04:16 1
專利名稱:用於內存洩漏診斷的方法和裝置的製作方法
技術領域:
本發明涉及一種用於垃圾收集語言的內存洩漏診斷的方法和裝置。
背景技術:
在一些程式語言以及相關的運行時間(runtime)中,通常會由應用程式 本身提供一種內存管理功能。對於那不再被程序需要的內存是由程序設計員 來釋放。如果程序不能合理釋放不同的內存將導致內存資源的浪費,即這些 內存將不能被任何其他的程序使用。導致這種內存浪費的程序錯誤通常稱之 為"內存洩漏"。在有些程式語言中,會採用自動內存管理而不是依賴程式設計師 釋放內存。這種自動內存管理在本領域通常稱之為"垃圾收集",就是一種與 程式語言以及其相關的運行時間的實施相關的運行時間系統的主動元件。這
員部分地從釋放內存的管理工作中解脫出來。但是,自動內存管理會產生另 一個問題,就是有些對象保留對部分內存中的數據結構的引用(reference),
動垃圾收集器回收那些不再被使用的內存部分,也導致了 "內存洩漏"。因 此,儘管垃圾收集機制幫助減少了 "內存洩漏"問題,但是後一種內存洩漏 仍舊存在並導致計算機的性能降低,嚴重的時候會導致應用程式的運行佔用 所有的內存並導致計算機崩潰。因此,內存洩漏由於其對計算機的性能造成 巨大影響而削弱了計算機的可獲得性和安全性。
對於支持自動內存管理的運行時間中的內存洩漏,其主要以兩類方式存 在 一類是通過每次執行而快速地創建大量的洩漏或以至於為人所覺察的方 式創建洩漏;另一類是通過每次執行而連續微妙地以至於無法察覺地創建洩 漏。
如何發現和找到那些正在洩漏的對象以及快速找到洩漏的原因是本領域 需要解決的問題。 一個系統的洩漏診斷起來是非常複雜的,尤其是對於那些 每次連續以及較小容量地發生的緩慢洩漏而言是如此。對於在堆上的不明顯
5的增長是非常難以辨識的。通常,在發現洩漏時已經為時已晚,洩漏程序已 經對整個系統造成了嚴重的影響。這對於那種開始很小但是在整個運行時間 段內持續增長的洩漏而言尤其如此。有時,在問題大到足以可注意之前需要 高達幾周的服務時間。識別這些潛在洩漏是非常困難的,尤其是對於不能忍
受多次堆(heap )訪問甚至堆轉儲(dump )的在線系統(live productive system ) 而言是如此,因為這些系統不能忍受由於堆操作需要的執行暫停。儘管現在 存在各種垃圾回收方式並且也各有益處,但是這種內存洩漏對於Java程序而 言依然是一個問題。
目前,現有的一些技術有助於用戶對黑箱進行研究以便確定在運行時間 (runtime)處的根本原因。對診斷內存洩漏,現有技術主要依賴於比較區分 堆快照(snapshot)(堆快照是一種由像節點一樣的類型以及其間的引用構成 的圖(graph))以及根據對象數量的增長來進行診斷。這些技術在每輪垃圾 收集之後監視堆,並且觀察自由空間的向下的鋸齒圖形(內存的使用率曲線 圖)直到程序無法在從堆上獲得空間為止(每次收集的、可供以後使用的內 存越來越少)。這種現有的技術並不能用於在線系統,因為這種堆快照的獲取 和分析會使得具有較大的堆容量的系統暫停幾十秒。對於諸如伺服器的在線 系統而言,這種延遲或暫停會導致超時,從而顯著影響在線應用的表現。基 於上述原因,這種延遲和暫停對於在線系統而言是完全不可接受的。
而且,用於大型應用程式的內存堆往往容量巨大,因此,試圖對堆快照 進行頻繁的比較對這些應用程式的診斷幫助有限,因為洩漏對象並不明顯, 但是如果利用現有技術進行洩漏診斷,應用程式會由於為進行洩漏診斷而頻 繁進行堆快照的比較操作而減慢,這將對服務質量以及用戶的體驗帶來負面
到很大幹擾(perturb)以至於不具有實際價值,尤其是在在線環境下。
現有的內存洩漏的診斷方法對工業應用的效果有限,因為這些現有的方 法通常將基本類型識別為嫌疑類型。例如, 一種現有技術建議使用引用 (reference)來查找負責內存洩漏的有用對象。但是引用不能包含執行語境 信息。被引用的嫌疑對象因為是基本的常見使用類型,可能同時被多個引用 者持有。在這種情況下,人們依然不了解這些引用為什麼會產生以及在何種 條件下洩漏問題會被再現。診斷以及修復是否正確難以進行判別。
在目前的實踐中, 一方面,依賴多次取得全引用圖快照並對其進行引用分析對於大規模在線系統而言成本過於昂貴。另一方面,在發明人的經驗中, 為了診斷內存洩漏,用戶必須尋找可能具有問題的候選數據結構。但是,發 現將要關注的正好的數據結構非常困難。當探尋服務(尤其是大型在線系統) 的引用圖時,噪聲、複雜性以及規模問題會使得引用圖的分析非常困難。當 在長時間運行的系統中診斷緩慢的內存洩漏時,噪聲可能是一個特別的問題。 噪聲影響可能會矮化診斷緩慢洩漏所需的證據直到其運行了很久之後為止。
概括而言,現有技術方案主要集中在以下幾點反覆訪問堆甚至進行堆
轉儲來產生堆快照、在不同的快照之間進行比較以便找到作為洩漏候選的增 長節點、找到嫌疑結構、以及分析引用圖從而找到造成內存被不當持有的引 用者以便隨後進行確認。因此,目前針對內存洩漏路徑所採取的方法通常包
括兩個步驟診斷並確認診斷以及修復洩漏點。但是在診斷和確認診斷之間 存在斷層(gap),現有技術在內存洩漏診斷方面所能提供的幫助有限。 根據以上描述可知,現有的內存洩漏診斷技術存在以下技術問題
1. 效率低下。現有的途徑需要用戶手動將這些高速緩存對象與真正的洩 漏對象區分開。總體而言,這些途徑使得用戶忙於應付關於所創建的各個對 象的眾多低水平的細節,普通用戶很難解釋複雜引用圖以獲得相關問題執行 環境。這些解釋處理需要大量的專門知識。即使對於專家而言,這也通常需 要進行很長時間的分析工作來發現洩漏的根本原因。
2. 堆訪問會對所運行的系統造成的幹擾(perturbation )。這些技術在有 些情況下將使得運行的系統不穩定以至於不具有實際價值,尤其是在在線境 下。獲取引用圖後需要對堆快照執行比較分析,這些工作甚至可以造成具有 較大堆尺寸的系統暫停幾十秒。如前所述,對於伺服器而言,這些延遲或暫 停會導致超時(timeout),並且顯著地改變系統的特性。
3. 基於堆增長進行洩漏分析受到限制。現有的一些工具利用堆的增長和 對堆進行區分來發現內存洩漏,以便發現使得堆增長的對象。儘管堆增長是 有助於判別的有用的參數,但是僅僅使用增長作為一種啟發來發現洩漏依然 存在許多問題。畢竟,增長的對象或類型並不一定就是洩漏並且洩漏也並不 一定就會增長。
4. 基於引用進行的洩漏分析受到限制。僅僅知曉佔支配地位的洩漏對象 的類型,通常是諸如"串型"的低級類型,對解釋為什麼會發生內存洩漏的 幫助有限,這是因為這些串可能被用於多個語境中,甚至可能在相同的數據結構(例如DOM文件)中被用於多種用途。此外由於一個低級洩漏對象可 能同時被多個引用者不當持有,因此很容易在分析引用圖、提取洩漏的原因
時導致迷失。單一的DOM對象包含有成千上萬個對象,並且在其間存在豐 富的引用網絡。如果對架構的實施不了解,就很難獲知要遵循引用路徑中的 那個路徑、獲知何時分析分配調用路徑、或者哪個調用位置是重要的。
5.基於類型分配堆棧進行的洩漏分析受到限制。有些方法能夠通過監視 堆而同時記錄每一個類型對象的分配堆棧,但並不是嫌疑類型的所有實例正 在洩漏,因此實際洩漏路徑趨向被淹沒在所有堆棧之間,並且存儲和分析這 些堆棧需要付出運行時間和運行空間的代價。通常,洩漏位置不是與分配位 置映射,而是與分配函數的調用者相映射。例如,Java資料庫連接(JDBC) 通過由一個類調用的一個代理類被反覆地創建,所述調用的類會忘記調用該 代理類的JDBC釋放函數。這樣,就必須對調用者進行分析。
綜上可見,現有技術現需要進行複雜圖分析以及豐富的程序知識,為洩 漏的確認以及修復提供有限的線索。
本申請的目的在於解決現有技術中存在的上述技術問題。
發明內容
發明人注意到,現有的方法主要集中在內存洩漏的查找,但是很少關注 與洩漏問題直接相關的分配路徑的認識。辨識其上可能發生洩漏的分配路徑 能夠直接獲得與洩漏分析相關的信息,指引用戶跟蹤嫌疑對象分配和使用。
基於以上認識以及為了避免上述現有技術的缺點,本發明提供了 一種能 夠用於活動系統的內存洩漏診斷裝置和方法。
根據本發明的一個方面,提供了一種用於診斷內存洩露的方法,包括 跟蹤應用程式在虛擬機上運行過程中的對象分配,從而獲取並記錄對象的分 配路徑和分配時間;以預定的時間間隔計算每一類對象在其分配路徑的年齡 代數;以及將其上具有高年齡代數對象的分配路徑確定為可能存在內存洩漏 的分配路徑,並報告給用戶以進行分析。
根據本發明的另一個方面,提供了一種診斷內存洩漏的裝置,包括
對象分配跟蹤器件,跟蹤應用程式在虛擬機上運行過程中的對象分配, 從而獲取並記錄對象的分配路徑和分配時間;分配路徑記錄器件,用於記錄 從對象分配跟蹤器件傳送來的每個對象的分配路徑和分配時間;用於應用程
8序的堆,用於存儲從分配路徑記錄器件傳送來的路徑分配的對象信息;分配
路徑讀取器件,用於讀取所述堆中路徑分配的對象信息,並掃描存儲器中存
儲的每個對象的id以及對應的分配路徑信息,以便針對每條分配路徑整理由 它分配的、並且還沒有被回收的對象並根據每個對象的分配時間計算該路徑 所分配同一類對象的年齡代數;分配路徑排序器件,用於根據每條路徑分配 的、並且存活的對象的年齡代數把路徑排序;以及診斷報告器件,用於對從 分配路徑排序器傳送來的分配路徑的排序數據進行分析,並將高排序的分配 路徑確定為可能存在內存洩漏的分配路徑報告給用戶以進行分析。
根據本發明的另一個方面,還提供一種用於診斷內存洩漏的裝置,包括 對象分配跟蹤器件,用於跟蹤應用程式在虛擬機上運行過程中的對象分 配,從而獲取對象的分配路徑和分配時間;分配路徑記錄器件,用於在每個 所分配的對象上打上包含其分配路徑與分配對象的對應關係的標籤;用於應 用程序的堆,用於存儲從分配路徑記錄器件傳送來的路徑分配的對象信息; 分配路徑讀取器件,對每條分配路徑直接按照標籤從所述堆中讀取由它分配 的、並且還沒有被回收的對象,並根據每個對象的分配時間計算該路徑所分 配同一類對象的年齡代數;分配路徑排序器件,用於根據每條路徑分配的、
並且存活的對象的年齡代數把路徑排序;以及診斷報告器件,用於對從分配 路徑排序器傳送來的分配路徑的排序數據進行分析,並將高排序的分配路徑 確定為可能存在內存洩漏的分配路徑報告給用戶進行分析。
下面參照附圖僅作為示例詳細描述本發明的實施例,其中
圖1表示在執行應用程式的過程中用於管理所分配對象的信息的數據結
構;
圖2所示的是本發明所使用的標籤的結構的示意圖。; 圖3所示的是在不同波段上的同類對象之間的調用關係的示意圖; 圖4所示的是提取每個對象的分配路徑以及將所述分配路徑與具體對象 進行綁定的過程示意圖5所示的是不同位置層級的結構以及進行對象聚合的示意圖。 圖6所示的是診斷一個應用程式所造成的內存洩漏的流程圖 圖7所示的是用於診斷內存洩漏的裝置的一個實施例。圖8所示的是用於診斷內存洩漏的裝置的另 一個實施例。
具體實施例方式
現在將參考本發明的示例性實施例進行詳細的描述,在附圖中圖解說明 了所述實施例的示例,其中相同的參考數字始終指示相同的元件。應當理解, 本發明並不限於所公開的示例實施例。還應當理解,並非所述方法和設備的 每個特徵對於實施任一權利要求所要求保護的本發明都是必要的。此外,在
整個公開中,當顯示或描述處理或方法時,方法的步驟可以以任何順序或者 同時執行,除非從上下文中能清楚一個步驟依賴於先執行的另一步驟。此外, 步驟之間可以有顯著的時間間隔。
申請人發現,洩漏的對象通常屬於一種類型,並且該類型的實例在不同 的間隔期間被連續地生成、分配。考慮到這種情形,在本發明的方法中,首 先辨識與這種分配一致的類的類型。隨後,找到創建該類型的實例的路徑。 本發明關注在每一個相對較長的間隔中連續創建的同一類對象。為了實現本 發明的目的,本發明提出了一種數據結構對同一類型的對象分配進行跟蹤, 如圖1所示。每種面向對象的應用程式都包含有不同類型的對象。針對每種 類型的對象,都構建一種便於記錄其分配路徑的列表。這種數據結構中包含 了類的籤名、對象計數、時間計數器以及分配路徑(一個對象的分配路徑是 其分配時刻的堆棧映象)。通過這種數據結構對對象的分配進行管理。
參見圖1,針對同一種類型的對象,在應用程式的過程中可能在不同的 路徑上被分配。因此根據圖l所示的數據結構,針對每條分配路徑進行跟蹤, 利用計數器記錄在該路徑上分配的對象數量,當分配數量超過一定規模的時 候在計時器中記錄相應的時刻。換句話說,計時器中記錄了分配數量連續到 達制定規模的時間間隔長度。。對所述的對象的分配信息的跟蹤,可以通過後
面將結合圖6和7所詳細描述的對象分配跟蹤器件61來進行。對於所跟蹤獲 得這種對象的信息,可以由將結合圖6和7所詳細描述的分配路徑記錄器件 62記錄起來並存儲到相應的存儲器63中或直接發送到應用程式的堆中。
對於所記錄的具有上述數據結構的對象信息,可以採用專門的分配路徑 管理器件來進行管理,也可以在直接將相關的對象信息發送到堆之前對每個 所分配的對象打上獨特的標籤,以便將每個對象(即使是相同類的對象)區 分開來。圖2所示的就是本發明可以使用的這種標籤的形式。針對每個所分配的對象的一個標籤包^"了多個字^殳。就本發明所示的圖2中的實施例而言,
所述標籤結構中的第一欄位是該對象的標識符欄位id,其表示了該對象屬於 哪個波段(band)以及那個組(group),倆者的組合唯一的標誌了該對象所 處的"年齡代數",其中對象的年齡是指從其被分配一直到被釋放的時間,其 年齡代數可以用該對象自分配起直到被回收所經歷的"垃圾回收,,次數或者 該對象存在時間相對於某一預定時間閾值的倍數。在這裡,默認每一次垃圾 回收都會檢索所有在堆中分配內存的對象。第二欄位表示類欄位,表示該對 象屬於那個類,例如圖l中所示的類l、類2、類3......等。第三欄位屬於路
徑欄位,表述該對象位於圖1中所示的哪個路徑上。第四欄位是方法欄位, 該方法欄位並不是一種方法籤名的真實內容,而是一個地址,指向方法籤名 的實際存貯。最後一個欄位是被調用者欄位,被用來尋找分配的路徑。該字 段與第四個欄位結合,可以恢復出分配指定對象的路徑內容。圖3就表示出 了如何基於不同年齡代數的對象標籤,從調用關係欄位和方法欄位恢復出基 本的路徑信息。
下面,本發明將參照圖4對本發明如何跟蹤對象分配以及分配路徑以及 如何在分配過程中計數進行詳細的描述。
圖4所示的是提取每個對象的分配路徑以及將所述分配路徑與具體對象 進行綁定標籤的過程示意圖。在應用程式運行時,對象的分配被跟蹤。對於 類型i的對象,當該對象的總數達到鬮值H時記錄時間Ti,同時將該計數器 值重置為0。當該對象的總數再次達到閾值H時記錄時間Ti+1。如果Ti和Tj+, 之間的差值超過閾值Tt時,該類型i就被識別需要進行下一階段的跟蹤記錄 過程,如果類型i進入下一階段的記錄過程,分配i對象的路徑將被記錄下來 以及在該路徑上分配i類型對象的總數也被記錄。對於由路徑Pi所分配的類 型i的對象,在Pi上的當前層級(tier,層級代表分配研究對象的堆棧位置, 因為堆棧是分層結構的,所以使用層級來標誌堆棧中的位置),在本發明中也 稱之為波段(band),的位置被標籤到對象上。如果Tj和Tw之間的差值小於 閾值Tt時,類型i的計數不變,隨著新實例的分配而增加。當對象的總數在 時間Ti+I處再次達到閾值H時其數量並且Tj和Tj+,之間的差值超過閣值Tt 時,該數量被重置為0,並且採用Tjw的值替代Tj,並且增加Pi上的層級, 以便後面分配的對象將採用下一等級的位置來標籤。如此對Pi上的的每個等 級的位置逐步地執行相同的處理和判斷,以便這些等級將被標籤在對象上。閾值Tt選擇對於在服務期間辨識壽命(lifetime)分布是非常有幫助的。 該默認值被設定為平均GC (垃圾收集)間隔。Nt的選擇被用於安排對象分配 的規模或度量(scale ),這有助於發現用於相對頻繁地分配一種類型對象的路 徑。這種相對頻繁地分配一種類型的對象的分配路徑很可能與持續洩漏相關。 當屬於 一種類型的對象被分配的總數超過閾值Nt時,這種類型的對象被辨識 出來並且其分配路徑必須予以重視。當在固定路徑中分配的對象的數量超過 閾值Nt時,該路徑被辨識出來並通過將其自身與所創建的實例綁定起來而被 記錄。如果達到伐值的時間太短(=1\),新的標籤將被給予被分配的對象。這種綁定間隔導致標記 不同頻帶id和組id的組合的對象之間的分配時間至少長於Tt。換句話說,組 id和頻帶id的組合唯一的標記了不同年齡代數的對象。這種標記方式直接有 助於在堆訪問的同時進行洩漏診斷,並輸出洩漏對象以及直接相關的洩漏路徑。
為了區分不同位置的層級(一個位置的層級表示其位於整個分配路徑上
例如,頻帶O被賦予位於分配路徑的頂部的分配位置,該位置直接創建對象, 而頻帶1則賦予調用頻帶0的位置的分配位置。這樣對診斷洩漏對象以及跟 蹤對象標籤的分配路徑非常有用,該對象標籤將在下面兩部分中引入。組id 被引入以防頻帶的值滿溢當頻帶代表的層級數超過分配路徑的最大深度時, 組id從0開始自增。頻帶值每滿溢一次,組id自增l。組id和頻帶id的組 合對於後面的診斷非常重要。圖5所示的就是這種層級的示意圖。
下面所示的程序代碼表示出了本發明是如何基於圖1中所示的結構來跟 蹤管理對象的分配的,也是對上面的具體描述的一種程序表示。該程序代碼 在Java對象-陂分配時^f皮調用。
New—object
/*Get class signature of the object's class.*/ classSignature = GetClassSignature
/*Find the class index inhashTable, if it's not exist, putitintohashTable.*/ class工ndex = getAndPutClass ( classSignature ) /★Increase the object count of this class.*/ countClass ,'
/*If count of this class > Nt, count this ojbect to it's allocation path.*/ if( objectCount 〉 Mt ){ /*Find allocation path in this class structure, if it's not exist, put it into hashTsble.*/
getAndPutAllocationPath; /*Tag this object with allocation path's band, class index, method of theband and its callee.V
tagObject(allocPathBand, class工ndex, methodOfBand, callee)/ "Increase the object count of this allocation path of this class ,*/ countAllocPath ,-
/*If the allocation path count 〉 Nt and time since last change of allocation path's band larger than Tt,then increase band of the allocation path, and reset its count, and update lastChangeTime*/
if( countOfAllocPath 〉 Nt && time—interval 〉 Tt ) moveToNextBand
}}
以上對對象的分配的跟蹤和記錄進行詳細的描述。這種對各種類型的對 象的分配的跟蹤和記錄是為了便於在進行診斷時發現洩漏對象以及發生洩漏 的路徑。在進行診斷的時候,發現洩漏類以及洩漏的路徑是同時進行的,而 不是分步進行的。基於對對象分配的跟蹤和記錄,下面描述洩漏的診斷。
在進行診斷之前,需要對應用程式的虛擬機的堆進行訪問。經過多次垃 圾回收當前堆中僅保存有存活的對象信息。就本發明而言,包含有所分配對 象的類型、分配時間、分配路徑等信息。這些信息可以以上述與對象綁定的 標籤的形式存在,也可以其他形式存在,例如可以專門設立一種分配路徑管 理器將按來管理每個對象的分配時間以及分配路徑直接的對應關係。
總體而言,首先,將標籤中基於頻帶id和組id的組合相同的對象聚合 (aggregate)成一組。接著從具有最高頻帶的對象從其標籤的最後倆個欄位 中恢復出這些對象的分配路徑。用這種方式找到的組數就是該路徑分配對象 的年齡跨度或者年齡代數。獲取該路徑中的對象分配跨度或代數(span)以 便用於診斷洩漏。採用這種方式,可同時找出洩漏對象以及洩漏路徑。
在較長的運行時間期間,洩漏導致在堆上具有不同年齡的相同類型的對 象的存在。對象的壽命是其倖免的垃圾回收的次數。該跨度計數是一種類型 的所有實例的不同壽命的數量或者代數。較低的跨度計數表示一類的所有實 例在存儲器內已經存在了相同的時間。較高的跨度計數表示該運行的應用程 序正繼續分配同一類新對象而沒釋放其更老的對象,程序通常不傾向於間隔 地分配長時間存活的對象。相反,他們傾向於集中性地分配長時間存活的對 象,或者分配對象只是為了在隨後很短一段時間使用,這些對象隨後一旦其 不再被需要就會立刻被清除。
基於以上理論,存活對象通過其標籤被匯總以便診斷洩漏問題。如在前 面所提到的那樣, 一個標籤包括與分配路徑上的層級相關的位置的頻帶id以
13及與將路徑標籤到對象上的滿溢次數(round)相關的組id。每一次垃圾收集 都會清除清除堆上那些不被引用的、"死亡"的對象。如上面所提到的那樣, 頻帶id以及組id的組合在不同時間間隔(至少間隔Tt)期間被綁定。時間 Tt與垃圾回收的時間間隔相關,能夠用於標識對象的年齡。這樣,標籤中不 同頻帶id以及組id的組合區分了不同年齡的對象。基於以上分析,所有標籤 中擁有相同的頻帶id以及組id組合的對象被分到一組,這樣被一條分配路徑 分配的對象被分到若干組內。分組的數量決定了該路徑分配的對象的年齡代 數。分配最大年齡代數的對象的那些路徑被辨識為候選洩漏路徑。具有這些 候選路徑標籤的對象就是洩漏實例。圖5所示的是該聚合的處理過程。
在進行聚合以及獲知了哪些是嫌疑洩漏類之後,需要採用與將標籤路徑 綁定到對象上的處理相反的處理來確定分配中哪些是洩漏哪些不是洩漏,因 為分配位置以及分配路徑具體內容對於診斷和修復洩漏來說是有很大幫助 的,因此遍歷整個路徑是必須的。為了解決這個問題,就要進行與將標籤路 徑綁定到對象上的處理相反的處理,從標籤中恢復出確切的洩漏路徑。該恢 復過程可見圖3所示。從類型i的對象的最高頻帶為K (K>=1 )處的標籤開 始,標籤的一個欄位(field)是"callee (被調用者)",其引用在頻帶(K-l) 處的方法,被在頻帶K處的方法調用。這樣迭代的恢復出原始分配路徑的各 層方法,所發現的方法鏈條就是分配路徑。也就是說,路徑的發現過程從最 高波段開始進行。
圖6所示的是診斷一個應用程式所造成的內存洩漏的流程圖。首先運行 一個應用程式,並在步驟S601處, 一種如後面將要描述的內存洩漏診斷裝置 隨著應用程式開始運行而開始監測在應用程式的運行時間(runtime)處對象 的分配以及內存的分配。在步驟S602處,內存洩漏診斷裝置中的對象分配跟 蹤器件跟蹤應用程式在虛擬機上運行過程中的對象分配,並針對每一種類型 的對象,獲取該當前對象的類型以及所分配的堆棧,為所有堆棧編碼唯一的 id以及為每個對象賦予一個與一條分配路徑相對應的唯一的id,並將這種對 應關係存儲起來。然後在步驟S603處,將其中包含了該對象的類型id、其堆 棧的id、以及指向頂部方法籤名的指針的標籤與相應的對象綁定在一起。該 頂部方法籤名並不在寄存器中。所有的方法籤名都被編碼並保存在代理中, 這種不同籤名的系列表示了各種分配路徑。因此,與對象綁定的標籤包含了 該對象的分配路徑以及對象的類型。在步驟S604處,將所有對象的標籤保存在一個列表中。具體而言,就是採用如後面所述的分配路徑管理器件來管理 該列表,從而管理列表中的標籤中所包含的數據,即對象的類型id、其堆棧
的id、以及指向頂部方法籤名的指針。在步驟S605處,經過一個預訂的時間 間隔之後,例如經過了自動垃圾回收裝置執行一次自動垃圾回收的預定間隔 之後,用於由對象的類型id以及堆棧的id的id的寄存器被修改以便存儲具 有更高層級或波段的方法籤名,從而使得以後所分配的對象與在該間隔之前 所分配的對象具有不同的年齡代數。所述的時間間隔可以是預定時間間隔, 例如垃圾回收間隔。所述寄存器的改變也可以通過具體的事件來觸發。該具 體的時間可以是具有特定類型和堆棧的對象的總量達到了用戶根據其應用程 序的存儲器使用規模所規定的某種閾值,也可以是某種需要專門關注的事件。 在步驟S606處,用戶需要進行內存洩漏診斷時,通過後面將要描述的分配路 徑讀取器件,從一個存儲器中讀取關於標籤的列表以及位於堆中的存活的分 配對象的信息。隨後在步驟S607中,從所讀取的標籤列表中提取各個標籤, 並將所有存活的分配對象按照標籤聚合曽不同的組。然後在步驟S608處,對 每個具有相同標籤的組中的對象的總量進行排序,並將那些排序高的組中的 對象(即齡年代數較高的對象)所在的分配路徑確定為嫌疑的內存洩漏路徑。 應當理解上述方法為本發明的優選實施例,並非所有步驟對於解決本發明所
除非從上下文中能清楚一個步驟依賴於先執行的另一步驟。此外,步驟之間 可以有顯著的時間間隔。
以上對本發明的內存洩漏的診斷方法進行了詳細的描述。相對於現有技 術而言,這些方法具有以下優點用戶無需製作引用圖並對對象的引用圖進 行分析、通過將分配時間與分配路徑與分配對象的綁定可以直接獲得與洩漏 嫌疑對象對應的分配路徑、有助於修復洩漏,易於發現代碼跟蹤輸入項以及 找到被分配的對象是如何被使用的、尤其是可以同時發現洩漏的對象以及能 夠確定候選分配路徑,並且該候選分配路徑可以僅僅通過一次訪問堆就可以 實現。該方法有助於將用戶從瑣碎的中斷和分析中解脫出來,防止系統進行 多重堆訪問或堆轉儲,因此縮短了診斷的時間。此外,本發明的方法不需要 對現有的虛擬機進行任何修改、不需要對內部GC機制進行任何修改、不需 要對事件監聽的去分配(de-allocation )、甚至不需要考慮對象的移動。
圖7是採用上述方法的裝置的一個實施例。如圖7所示,根據本發明的診斷內存洩漏的裝置700包括對象分配跟 蹤器件701,用於跟蹤應用程式70S在虛擬機712上運行過程中的對象分配, 從而獲耳又對象的分配路徑和分配時間;分配路徑記錄裝置702,用於記錄從 對象分配跟蹤器件701傳送來的每個對象的分配路徑和分配時間;存儲器 703,用於存儲從分配路徑記錄器件702傳送來的與對象相關的分配路徑和分 配時間;分配路徑管理器件704,用於管理存儲器中所存儲的數據,以及為 每個對象賦予一個與一條分配路徑相對應的唯一的id並將這種對應關係以存 儲在存儲器中;用於應用程式的堆709,用於存儲從分配路徑記錄器件702 傳送來的分配對象的信息;分配路徑讀取器件705,用於讀取所述堆中分配 對象的信息,並掃描存儲器中存儲的每個對象的id以及對應的分配路徑信息, 以便針對每條分配路徑整理由它分配的、並且還沒有被回收的對象並根據每 個對象的分配時間計算該路徑所分配同一類對象的年齡代數;分配路徑排序 器件706,用於根據每條路徑分配的、並且存活的對象的年齡代數對分配路 徑進行排序;以及診斷報告器件707,用於對從分配路徑排序器件傳送來的 分配路徑的排序數據進行分析,並將高排序的分配路徑確定為可能存在內存 洩漏的分配路徑報告給用戶進行分析。
圖8是採用上述方法的裝置的另一個實施例。
如圖8所示,根據本發明的診斷內存洩漏的裝置800包括對象分配跟 蹤器件801,用於跟蹤應用程式808在虛擬機812上運行過程中對象的分配, 從而獲取對象的分配路徑和分配時間;分配路徑記錄裝置802,用於在每個 所分配的對象上打上包含其分配路徑與分配時間的對應關係的標籤;用於應 用程序的堆809,用於存儲從分配路徑記錄器件802傳送來分配對象的信息; 分配路徑讀取器件805,針對每條分配路徑直接按照標籤從所述堆中讀取由 它分配的、並且還沒有被回收的對象並根據每個對象的分配時間計算該路徑 所分配同一類對象的年齡代數;分配路徑排序器件806,用於根據每條路徑 分配的、並且存活的對象的年齡代數對分配路徑進行排序;以及診斷報告器 件807,用於對從分配路徑排序器件806傳送來的分配路徑的排序數據進行 分析,並將高排序的分配路徑確定為可能存在內存洩漏的分配路徑報告給用 戶進行分析。
對於上述診斷內存洩漏的裝置700和800,其還可以包括對象壽命管理 器件710以及810以及動態比特碼器件711以及811。對象壽命管理器件710以及810用於按照對象分配時間來直接計算對象的年齡,避免直接將分配時
間放入所述堆中。動態比特碼器件711以及811可使用二進位代碼注入的方
法獲取分配路徑,替換直接讀取運行時堆棧的內容以獲取路徑信息。
本發明的描述是為了示例說明的目的而提供的,而不旨在是徹底無遺漏 的,或者局限於所公開的實施例。很多修改和變更對於本領域的普通技術人 員將是清楚的。選擇這些實施例是為了說明本發明的原理及其實際應用,並 且使得本領域的其他普通技術人員能夠理解本發明,以便實現可能適於其他 預期用途的具有各種修改的各種實施例。
權利要求
1.一種診斷內存洩露的方法,包括跟蹤應用程式在虛擬機上運行過程中的對象分配,從而獲取並記錄對象的分配路徑和分配時間;以預定的時間間隔計算每一類對象在其分配路徑的年齡代數;以及將其上具有高年齡代數對象的分配路徑確定為可能存在內存洩漏的分配路徑,並報告給用戶以進行分析
2. 如權利要求1所述的診斷內存洩露的方法,其中,所述預定的時間間 隔是垃圾回收間隔或對應於特定類型和堆棧的對象的總量達到規定的閾值的 時間。
3. 如權利要求1或2所述的診斷內存洩露的方法,其中,獲取並記錄對 象的分配路徑和分配時間的步驟包括為每個對象賦予一個與分配路徑相對 應的p舉一的id。
4. 如權利要求3所述的診斷內存洩露的方法,其中,以預定的時間間隔 計算每一類對象在其分配路徑其年齡代數的步驟包括基於每個對象的與分 配該對象的分配路徑相對應id,確定其每個對象所屬的分配路徑,並針對每 條分配路徑整理由它分配的、並且還沒有被回收的對象並根據每個對象的分 配時間計算該路徑所分配同一類對象的年齡代數。
5. 如權利要求3所述的診斷內存洩露的方法,其中,將其上具有高年齡 代數對象的分配路徑確定為可能存在內存洩漏的分配路徑的步驟包括根據 每條路徑分配的、並且存活的同類對象的年齡代數對路徑進行排序,以及對 分配路徑的排序數據進行分析,並將高排序的分配路徑確定為可能存在內存 洩漏的分配路徑報告給用戶進行分析。
6. 如權利要求5所述的診斷內存洩露的方法,其中所述跟蹤應用程式在 虛擬機上運行過程中對象的分配採用一種數據結構來進行,該數據結構包含 了對象所屬類的籤名、對象計數、時間計數以及分配路徑。
7. 如權利要求6所述的診斷內存洩露的方法,其中所述為每個對象賦予 一個與一條分配路徑相對應的唯一的id,包括將每個對象的與分配路徑相關 聯的波段id以及組id包含在一種標籤中並將標籤與相應的對象綁定。
8. 如權利要求7所述的診斷內存洩露的方法,其中所述標籤中還可以包含關於對象的類型、路徑、方法以及被調用者的信息。
9. 如權利要求4所述的診斷內存洩露的方法,其中所述以預定的時間間 隔計算每一類對象在其分配路徑其年齡代數從對象所屬的分配路徑的最高波段id開始。
10. 如權利要求4所述的方法,其中還包括在進行所述整理之前進行至少一次垃圾收集。
11. 一種診斷內存洩漏的裝置,包括對象分配跟蹤器件,跟蹤應用程式在虛擬機上運行過程中的對象分配, 從而獲取並記錄對象的分配路徑和分配時間;分配路徑記錄器件,用於記錄從對象分配跟蹤器件傳送來的每個對象的 分配3各徑和分配時間;用於應用程式的堆,用於存儲從分配路徑記錄器件傳送來的路徑分配的 對象信息;分配路徑讀取器件,用於讀取所述堆中路徑分配的對象信息,並掃描存 儲器中存儲的每個對象的id以及對應的分配路徑信息,以便針對每條分配路 徑整理由它分配的、並且還沒有被回收的對象並根據每個對象的分配時間計 算該路徑所分配同一類對象的年齡代數;分配路徑排序器件,用於根據每條路徑分配的、並且存活的對象的年齡 代數把路徑排序;以及進行分析,並將高排序的分配路徑確定為可能存在內存洩漏的分配路徑報告 給用戶以進行分析。
12. 如權利要求11所述的診斷內存洩漏的裝置,其中對象分配跟蹤器件 採用 一種數據結構來進行對象分配的跟蹤,該數據結構包含了對象所述的類 的籤名、對象計數、時間計數以及分配路徑。
13. 如權利要求11或12所述的診斷內存洩露的裝置,其還包括對象壽 命管理器件用於按照對象分配時間來直接計算對象的年齡,避免直接將分配 時間放入所述堆中。
14. 如權利要求11所述的診斷內存洩露的裝置,其還包括動態調碼器, 其可使用二進位代碼注入的方法獲取分配路徑,替換直接讀取運行時堆棧的 內容以獲取路徑信息。
15. —種用於診斷內存洩漏的裝置,包括對象分配跟蹤器件,用於跟蹤應用程式在虛擬機上運行過程中的對象分配,從而獲取對象的分配路徑和分配時間;分配路徑記錄器件,用於在每個所分配的對象上打上包含其分配路徑與 分配對象的對應關係的標籤;用於應用程式的堆,用於存儲從分配路徑記錄器件傳送來的路徑分配的 對象信息;分配路徑讀取器件,對每條分配路徑直接按照標籤從所述堆中讀取由它 分配的、並且還沒有被回收的對象,並根據每個對象的分配時間計算該路徑 所分配同一類對象的年齡代數;分配路徑排序器件,用於根據每條路徑分配的、並且存活的對象的年齡 代數把路徑排序;以及診斷報告器件,用於對從分配路徑排序器傳送來的分配路徑的排序數據 進行分析,並將高排序的分配路徑確定為可能存在內存洩漏的分配路徑報告 給用戶進行分析。
16. 如權利要求15所述的診斷內存洩漏的裝置,其中對象分配跟蹤器件 採用一種數據結構來進行對象分配的跟蹤,該數據結構包含了對象所述的類 的籤名、對象計數、時間計數以及分配路徑。
17. 如權利要求15所述的診斷內存洩露的裝置,其中所述分配路徑記錄 器件通過將標籤與相應的對象綁定來記錄與分配對象相關的信息。
18. 如權利要求17所述的診斷內存洩露的裝置,其中所述標籤中還可以 包含關於對象的類型、路徑、方法以及被調用者的信息。
19. 如權利要求15-19任意一項所述的診斷內存洩露的裝置,其還包括 對象壽命管理器件用於按照對象分配時間來直接計算對象的年齡,避免直接 將分配時間放入所述對象標籤中。
20. 如權利要求19所述的診斷內存洩露的裝置,其還包括動態變碼器, 其可使用二進位代碼注入的方法獲取分配路徑,替換直接讀取運行時堆棧的 內容以獲取路徑信息。
全文摘要
一種診斷內存洩露的方法和裝置。所述方法包括跟蹤應用程式在虛擬機上運行過程中的對象分配,從而獲取對象的分配路徑和分配時間;記錄每個對象的分配路徑和分配時間;為每個對象賦予一個與一條分配路徑相對應的唯一的ID;基於每個對象的與分配該對象的分配路徑相對應ID,確定其每個對象所屬的路徑;針對每條分配路徑整理由它分配的、並且還沒有被回收的對象並根據這些對象的分配時間計算該路徑所分配同一類對象的「年齡代數」;根據每條路徑分配的、並且存活的同類對象的年齡代數對路徑進行排序;以及對分配路徑的排序數據進行分析,排序越高的分配路徑,越有可能是引入內存洩漏。據此,可能存在內存洩漏的分配路徑被挑選、報告給用戶進行分析。本發明還涉及一種執行上述方法的裝置。
文檔編號G06F9/50GK101615143SQ200810131740
公開日2009年12月30日 申請日期2008年6月27日 優先權日2008年6月27日
發明者劉天成, 影 李, 李欣慧, 滕啟明, 瀅 陳 申請人:國際商業機器公司