一種缺陷數據分析方法及利用其縮減軟體測試項目的方法
2023-08-04 05:29:21 3
一種缺陷數據分析方法及利用其縮減軟體測試項目的方法
【專利摘要】本發明提供了一種缺陷數據分析方法及利用其縮減軟體測試項目的方法。本發明的缺陷數據分析方法包括缺陷數據向量空間模型構建、缺陷數據相似度計算、缺陷數據離散化編碼、數據矩陣簡化、染色體集合獲取及負關聯關係提取等步驟。該方法解決了現有負關聯關係分析方法不成熟、效率低、可信度不高的難題,不需要頻繁地對資料庫的訪問,只需要一次對資料庫的訪問即可完成整個分析過程。基於該分析方法,本發明還提供了縮減軟體測試項目的方法,通過對負關聯關係的分析,能夠有效幫助測試人員篩選出與缺陷無關的測試項目,進而提高軟體測試的效率。
【專利說明】一種缺陷數據分析方法及利用其縮減軟體測試項目的方法
【技術領域】
[0001] 本發明涉及數據分析領域,具體涉及缺陷數據分析方法和利用缺陷數據分析來縮 減測試工作量的方法。
【背景技術】
[0002] 軟體測試技術飛速發展,各測評機構通過大量的測試任務,已積累了海量高維度、 高複雜性的軟體缺陷數據。充分利用這些歷史缺陷數據,分析它們之間的關聯關係,可以有 效指導後續的軟體測試工作,提高測試效率、降低測試成本。
[0003] 目前,關於軟體缺陷數據間關聯關係的分析方法中大多數是研究正關聯關係的, 如:Apriori算法及其改進算法、基於遺傳算法的關聯規則挖掘方法、基於神經網絡的關 聯規則挖掘方法等。這些用於挖掘正關聯規則的研究方法已經比較成熟,且簡潔高效,挖 掘效果較好。然而,此類正關聯規則分析方法只能發現那些高頻率、強關聯的顯示模式, 形如X - Y的蘊含式,實際資料庫中還有很多低頻率、強關聯的隱式模式,形如 ιΧ-Υ、的蘊含式,即負關聯關係。負關聯關係可以揭示數據集中哪些項目不 可能一起發生或者較少一起發生,對於軟體測試工作同樣具有重要的指導意義,上述基於 正關聯關係的分析方法無法針對此類關聯關係進行挖掘。
[0004] 較少的負關聯關係研究方法中,其基本思路均為:首先搜索資料庫中所有的頻繁 項集,然後根據興趣度、相關係數等客觀度量標準從頻繁項集中挖掘負關聯規則,此類方法 在搜索頻繁項集時需要頻繁掃描資料庫以獲得候選項集的支持度,因此挖掘效率較低,且 僅僅依靠支持度-置信度框架約束頻繁項集會造成候選項集過多,導致負項目的頻繁項集 數量爆炸問題,從而產生過多冗餘規則,使得挖掘出來的負關聯關係可信度不高。
【發明內容】
[0005] 本發明要解決的技術問題是提供一種用於分析軟體缺陷數據之間的負關聯關係 的方法,解決了現有負關聯關係分析方法不成熟、效率低、可信度不高的難題。並且,本發明 利用該缺陷數據分析方法能夠縮減軟體測試項目,以便提高軟體測試效率。
[0006] 具體而言,本發明提供了一種軟體缺陷數據分析方法,其特徵在於,包括以下步 驟:
[0007] 步驟1、讀取軟體缺陷資料庫,從軟體缺陷資料庫中提取軟體缺陷的相關特徵屬 性,並分別將這些特徵屬性進行離散化編碼,建立軟體缺陷數據向量空間模型;
[0008] 步驟2、根據軟體缺陷數據的向量空間模型,引入模糊等價矩陣計算不同軟體缺陷 數據之間的相似度,並且,提取相似度值介於預定的上、下邊界閾值之間的相關缺陷數據作 為分析對象,對於每個分析對象,形成負關聯規則的初始前件和後件;
[0009] 步驟3、將所述步驟2獲得的相關缺陷數據離散化編碼,並創建數據矩陣;
[0010] 步驟4、簡化數據矩陣;
[0011] 步驟5、根據簡化的數據矩陣生成初始染色體種群,進行遺傳操作,獲得具有強關 聯關係的染色體集合;
[0012] 步驟6、根據預定的支持度和置信度的閾值,對步驟5中所獲得的染色體集合中的 每個染色體進行判斷,以便從所述染色體集合中提取出各軟體缺陷的負關聯關係。
[0013] 在一種優選實現方式中,計算軟體缺陷數據之間的相似度的步驟包括:
[0014] 對所述向量空間模型進行歸一化處理;
[0015] 構建模糊相似矩陣;
[0016] 將所述模糊相似矩陣改造為模糊等價矩陣。
[0017] 在另一種優選實現方式中,所述步驟4中的簡化是根據頻繁項集的性質及負關聯 規則的定義進行的。
[0018] 在另一種優選實現方式中,所述步驟5包括根據負關聯關係的特點設計適應度函 數、選擇算子、交叉算子、變異算子。
[0019] 在另一種優選實現方式中,所述步驟4中的簡化是基於頻繁項閾值而進行的。
[0020] 在另一種優選實現方式中,在遺傳操作中,所選擇的適應度函數為:
[0021]
【權利要求】
1. 一種軟體缺陷數據分析方法,其特徵在於,包括以下步驟: 步驟1、讀取軟體缺陷資料庫,從軟體缺陷資料庫中提取軟體缺陷的相關特徵屬性,並 分別將這些特徵屬性進行離散化編碼,建立軟體缺陷數據向量空間模型; 步驟2、根據軟體缺陷數據的向量空間模型,引入模糊等價矩陣計算不同軟體缺陷數據 之間的相似度,並且,提取相似度值介於預定的上、下邊界閾值之間的相關缺陷數據作為分 析對象,對於每個分析對象,形成負關聯規則的初始前件和後件; 步驟3、將所述步驟2獲得的相關缺陷數據離散化編碼,並創建數據矩陣; 步驟4、簡化數據矩陣; 步驟5、根據簡化的數據矩陣生成初始染色體種群,進行遺傳操作,獲得具有強關聯關 系的染色體集合; 步驟6、根據預定的支持度和置信度的閾值,對步驟5中所獲得的染色體集合中的每個 染色體進行判斷,以便從所述染色體集合中提取出各軟體缺陷的負關聯關係。
2. 根據權利要求1所述的軟體缺陷數據分析方法,其特徵在於,計算軟體缺陷數據之 間的相似度的步驟包括: 對所述向量空間模型進行歸一化處理; 構建模糊相似矩陣; 將所述模糊相似矩陣改造為模糊等價矩陣。
3. 根據權利要求1所述的軟體缺陷數據分析方法,其特徵在於,所述步驟4中的簡化是 根據頻繁項集的性質及負關聯規則的定義進行的。
4. 根據權利要求1所述的軟體缺陷數據分析方法,其特徵在於,所述步驟5包括根據負 關聯關係的特點設計適應度函數、選擇算子、交叉算子、變異算子。
5. 根據權利要求1所述的軟體缺陷數據分析方法,其特徵在於,所述步驟4中的簡化是 基於頻繁項閾值而進行的。
6. 根據權利要求1所述的軟體缺陷數據分析方法,其特徵在於,在遺傳操作中,所選擇 的適應度函數為: i
其中,N為軟體配置項的個數,小表示相關度,PxY/^t、表示四種關聯形 式的發生次數,X表示規則前件中的缺陷,Y表示規則後件的缺陷,Px+表示規則前件X發生 的次數,即為PXY與/Vf之和,P+Y表示規則後件Y發生的次數,即為Pxy與/^xr之和。
7. -種利用軟體缺陷數據分析縮減軟體測試項目的方法,所述方法包括: 利用根據權利要求1所述的方法對軟體缺陷庫中的數據進行分析並提取出負關聯規 則; 根據提取結果調整後續測試工作,刪減不易發生缺陷測試項的測試方案及用例,具體 調整過程包括: (1) 對於X-iY形式的負關聯規則,當X缺陷所在測試項完成且X缺陷發生時,則刪 減針對Y缺陷測試項的用例; (2) 對於形式的負關聯規則,當X缺陷所在測試項完成且未發生X缺陷時,則 刪減針對Y缺陷測試項的用例; (3) 對於形式的負關聯規則,當X缺陷所在測試項完成且未發生X缺陷時,應 增強針對Y缺陷測試項的用例, 其中,X表示所提取的負關聯規則中規則前件的缺陷,Y表示規則後件的缺陷。
【文檔編號】G06N3/12GK104281525SQ201410589991
【公開日】2015年1月14日 申請日期:2014年10月28日 優先權日:2014年10月28日
【發明者】萬琳, 王欽釗, 範秋靈, 李小龍, 張威 申請人:中國人民解放軍裝甲兵工程學院