新四季網

基於互信息的完全加權課程正負關聯模式挖掘方法及系統的製作方法

2023-06-04 06:44:51 3

基於互信息的完全加權課程正負關聯模式挖掘方法及系統的製作方法
【專利摘要】一種基於互信息的完全加權課程正負關聯模式挖掘方法及其挖掘系統,利用教育數據預處理模塊進行預處理,構建學生信息庫和課程項目庫;利用完全加權課程項集生成模塊產生課程完全加權候選k-項集(k≥1),根據候選項集的k-權值閾值或支持度產生課程完全加權頻繁項集和負項集;利用完全加權課程正負關聯規則生成模塊根據其項集互信息和置信度從頻繁項集和負項集中挖掘課程完全加權課程強正負關聯規則模式;完全加權課程關聯規則模式顯示模塊將挖掘出的課程正負關聯模式顯示給用戶。本發明方法挖掘時間效率比對比方法的高,其挖掘時間明顯減少,能挖掘出更合理的課程正負關聯模式,其模式可為教學改革和教務管理、教育決策提供科學依據。
【專利說明】基於互信息的完全加權課程正負關聯模式挖掘方法及系統

【技術領域】
[0001] 本發明屬於教育數據挖掘領域,具體是一種基於互信息的完全加權課程正負關聯 模式挖掘方法及其挖掘系統,適用於教育數據課程正負關聯模式發現,運用於高校教務管 理系統,可以擴展教務管理功能,其關聯模式可以有助於教師改善和調整教學方法,提高教 學質量,同時,可以幫助學生提高學習效果。

【背景技術】
[0002] 當前,常見的教育數據課程關聯規則挖掘方法有無加權關聯模式挖掘方法、加權 關聯規則挖掘方法和完全加權關聯規則挖掘方法。教育數據無加權關聯規則挖掘方法 是傳統的關聯規則挖掘方法在教育信息化領域的具體應用。該方法的特點是各個項目 按平等一致的方式處理,只考慮項目頻度,其缺陷是:在挖掘時只考慮課程的選修關聯, 沒有考慮課程之間具有不同的重要性,更沒有考慮學生選修課程後的教學效果(即課程 考試成績)。典型的教育數據無加權關聯規則挖掘方法是Apriori方法(R.Agrawal,T. Imielinski, A. Swami. Mining association rules between sets of items in large database[C]. In Proceeding of 1993 ACM SIGM0D International Conference on Management of Data, Washington D. C.,1993,(5) : 207-216.)及其改進方法(李 忠譁,王鳳利,何丕廉.關聯規則挖掘在課程相關分析中的應用[J].河北農業大學學 報,2010,33(3):116-119.董輝.基於興趣度的高職課程關聯規則挖掘[J].吉首大學學 報(自然科學版),2012, 33(3) :41-46.)。針對傳統關聯規則挖掘的缺陷,教育數據加權關 聯規則挖掘方法不僅考慮課程的選修關聯,還給每門課程賦予一定的權值,以體現課程之 間具有不同的重要性。典型的教育數據加權關聯規則挖掘方法有Cai等提出的加權關聯規 則挖掘方法(C. H. Cai, A. da, W. C. Fu,et al. Mining Association Rules with Weighted Items [C]//Proceedings of IEEE International database Engineering and Application Symposiums, 1998: 68-77.)及其改進方法(劉建偉,張穎?基於加權關聯 規則算法的學生成績數據挖掘研究[J].福建教育學院學報,2012 (3) : 123-125.)。教育數 據加權關聯規則挖掘方法的缺陷是:只考慮課程之間的重要性,沒有考慮課程考試成績的 影響。針對上述缺陷,教育數據完全加權關聯規則挖掘方法引入項目權值,考慮了考慮學生 所選修課程的教學效果,即考慮課程考試成績,其典型的完全加權關聯規則挖掘方法是譚 義紅等提出的向量空間模型中完全加權關聯規則的挖掘方法(譚義紅,林亞平.向量空間 模型中完全加權關聯規則的挖掘[J].計算機工程與應用,2003(13) :208-211.)以及面向 查詢擴展的矩陣加權關聯規則挖掘方法MWARM(黃名選,嚴小衛,張師超.基於矩陣加權 關聯規則挖掘的偽相關反饋查詢擴展[J].軟體學報,2009,20 (7) : 1854-1865.)。當前,完 全加權關聯規則挖掘方法在教育數據分析中的典型應用是餘如等(餘如,黃麗霞,黃名 選.教育信息化中課程考試成績數據關聯模式的發現.計算機與現代化,2014(2): 10-14. )提出的課程成績數據關聯模式發現方法,獲得了顯著的效果。現有的教育數據完全加權關 聯規則挖掘方法的缺陷是:現有的方法只能挖掘完全加權正關聯規則模式,沒有解決完全 加權負關聯模式挖掘問題,另外,現有方法其所挖掘的關聯模式數量仍然很龐大,增加用戶 選擇所需模式的難度,無趣的、虛假的和無效的關聯模式還很多,很難將其技術上升到應用 層面。
[0003] 針對上述問題,本發明提一種新的一種基於互信息的完全加權課程正負關聯模式 挖掘方法及系統。該發明方法克服了現有完全加權模式挖掘方法的不足,不僅能挖掘完全 加權課程正負關聯規則模式,還能夠有效地減少無趣的和無效的課程關聯模式出現,其課 程候選項集和挖掘時間明顯減少,提高了挖掘效率,其課程關聯規則模式更接近實際,可為 教學改革和教育管理、決策提供科學的依據,在教育信息化教務數據分析與挖掘領域具有 重要的應用價值和廣闊的應用前景。


【發明內容】

[0004] 本發明的目的在於,針對教育數據課程正負關聯模式挖掘進行深入探索,提出一 種基於互信息的完全加權課程正負關聯模式挖掘方法及其挖掘系統,應用於教育數據挖掘 領域,為教育數據課程正負關聯模式挖掘與分析提供新的挖掘方法,通過課程正負關聯規 則模式分析發現教育領域潛在的教育、教學規律和教育發展趨勢,提高任課教師提高教學 質量和學生的學習效果。
[0005] 本發明所採取的技術方案是:一種基於互信息的完全加權課程正負關聯模式挖掘 方法,包括如下步驟: (1)教育數據預處理:對於待處理的教育數據,提取學生課程信息及其成績,將課程當 作項目,課程成績當作項目權值,課程權值規範化為〇至1之間,構建學生信息庫和課程項 目庫。
[0006] (2)挖掘課程完全加權頻繁1-項集A和負1-項集:從課程項目庫中提取課程候 選1-項集G,累加q的項集權值,計算其支持度(q),與最小支持度閾值ms比較,從 G中挖掘課程完全加權頻繁1-項集乙和負1-項集M,乙加入課程頻繁項集集合ci/Y&M 加入課程負項集集合候選1-項集q支持度(q)公式如下:

【權利要求】
1. 一種基於互信息的完全加權課程正負關聯模式挖掘方法,其特徵在於,包括如下步 驟: (1) 教育數據預處理:對於待處理的教育數據,提取學生課程信息及其成績,將課程當 作項目,課程成績當作項目權值,課程權值規範化為O至1之間,構建學生信息庫和課程項 目庫; (2) 挖掘課程完全加權頻繁1-項集Z1和負1-項集:從課程項目庫中提取課程候選 1-項集G,累加C1的項集權值,計算其支持度Ci爾7 (G),與最小支持度閾值比較,從C1 中挖掘課程完全加權頻繁1-項集乙和負1-項集Ar1 ,Z1加入ci/YS,M加入 (3) 挖掘有趣的完全加權課程頻繁i-項集Zi和負i-項集% (所述的i> 2),包括以 下(3. 1)步至(3. 6)步: (3. 1)計算完全加權課程項集的i-權值閾值,並與其課程項集的項集 權值比較,可得到課程負i_項集,並加入課程負項集集合中,即若課程項集的項集 權值小於其i_權值閾值,則該課程(i-1)-項集的後續i_項集為完全加權課程負項集; (3. 2)將上述(3. 1)步中其課程(i-Ι)-項集的項集權值大於或者等於其i-權值閾值 的課程候選(i-Ι)-項集進行Apriori連接生成課程候選i_項集G; (3. 3)若課程候選i_項集G不為空集,則轉入如下(3.4)步,否則,退出(3)步,轉入 ⑷步; (3. 4)累加課程候選i_項集G的項集權值; (3. 5)對於課程候選i_項集中,計算除了(3. 1)步獲得的負項集以外的項集支持度,若 其支持度大於或等於最小支持度閾值,則得到完全加權課程頻繁i_項集,並加入課程頻繁 項集集合中,否則,得到完全加權課程負i_項集,並加入課程負項集集合中; (3.6)變量i加1後,繼續循環(3. 1)步至(3.6)步,直到G為空集即退出(3)步,轉 入⑷步; (4) 從課程頻繁項集集合中挖掘完全加權課程正負關聯規則模式,包括以下(4. 1)步 至(4. 6)步: (4. 1)從課程頻繁項集集合中取出完全加權課程頻繁項集4,求出Zi的所有真子集; (4. 2)從Zi的真子集集合中任意取出兩個真子集J7和厶,當J7和厶的支持度大於或等 厶=4,計算完全加權課程頻繁項集(八4)的互信息厶); (4. 3)若課程頻繁項集(/,,心)的互信息心)>0,並且J7 - 4和,J7 -,厶 的置信度大於或者等於最小置信度閾值《C,則挖掘出完全加權課程強關聯規則J7 -厶和 強負關聯規則一?- 一1心; (4. 4)若課程頻繁項集(/,,心)的互信息心)〈0,並且J7 -,厶和,J7 -厶 的置信度大於或者等於最小置信度閾值則挖掘出完全加權課程強負關聯規則-η厶 和一1T7 -心; (4. 5)繼續(4. 2)步驟,當課程頻繁項集Zi的真子集集合中每個真子集都被取出一 次,而且僅能取出一次,則轉入步驟(4.6)步; (4. 6)繼續(4. 1)步驟,當課程頻繁項集集合中每個頻繁項集Zi都被取出一次,而且 僅能取出一次,則(4)步運行結束,轉入(5)步; (5)從完全加權課程負項集集合中挖掘有效的完全加權課程負關聯規則模式,包括以 下(5. 1)步至(5. 6)步: (5. 1)從課程負項集集合中取出課程負項集%,找出%的所有真子集; (5. 2)從馬的真子集集合中任意取出兩個真子集J7和厶,當J7和厶的支持度大於或等 /^Vi,計算完全加權課程負項集(J,,4)的互信息厶); (5. 3)若課程負項集(J7, 4)的互信息Cii/Π/,,4) >0,並且,J7 -,厶的置信度大於 或者等於最小置信度閾值《C,則挖掘出完全加權課程強負關聯規則IJ7 -η厶; (5. 4)若課程負項集(J7,心)的互信息ciJ/n/,,4)〈0,並且J7 -,厶和,J7 - 4的 置信度大於或者等於最小置信度閾值《C,則挖掘出完全加權課程強負關聯規則/, - ^4和 ,I1 - 1 2 ·, (5. 5)繼續(5. 2)步驟,當課程負項集M的真子集集合中每個真子集都被取出一次, 而且僅能取出一次,則轉入步驟(5. 6)步; (5. 6)繼續(5. 1)步驟,當課程頻繁項集集合中每個負項集%都被取出一次,而且僅 能取出一次,則(5)步運行結束; 至此,基於互信息的完全加權課程正負關聯模式挖掘結束; 所述的as為最小支持度閾值,為最小置信度閾值。
2. -種適用於權利要求1所述的基於互信息的完全加權課程正負關聯模式挖掘系統, 其特徵在於,包括以下4個模塊 : 教育數據預處理模塊:該模塊提取學生課程信息及其成績,將課程成績權值規範化為 0至1之間,將待處理的教育數據進行預處理後構建學生信息庫和課程項目庫; 完全加權課程項集生成模塊:該模塊從學生信息庫和課程信息庫挖掘完全加權課程候 選1-項集,從i-項集(i> 2)起,計算完全加權課程項集的i-權值閾值,並與其 課程項集的項集權值比較,可得到課程負i-項集,然後,課程候選項集通過 Apriori連接生成完全加權課程候選i-項集,累加課程候選i_項集C1i的項集權值,計算其 支持度,若其支持度大於或等於最小支持度閾值,則得到完全加權課程頻繁i_項集,否則, 得到完全加權課程負i_項集,直到課程候選/_項集G不為空集即結束項集挖掘; 完全加權課程正負關聯規則生成模塊:該模塊生成課程頻繁項集和負項集的真子集, 計算課程關聯規則前件和後件的互信息和置信度,根據其互信息的值以及最小置信度閾 值,從完全加權課程頻繁項集和負項集中挖掘完全加權課程強正負關聯規則模式; 完全加權課程關聯規則模式顯示模塊:該模塊將完全加權課程正負關聯規則模式顯示 給用戶,供教育工作者或者教務人員分析和使用。
3. 根據權利要求2所述的挖掘系統,其特徵在於,所述的完全加權課程項集生成模塊 包括以下3個模塊: 完全加權課程候選項集生成模塊:該模塊從課程項目庫和學生信息庫挖掘完全加權課 程候選1-項集,從i_項集(i> 2)起,課程候選(i-Ι)-項集通過Apriori連接生成課程 候選i_項集; 完全加權課程頻繁項集生成模塊:該模塊計算候選i-項集支持度,若其支持度大於或 者等於支持度閾值,則就得到完全加權課程頻繁項集; 完全加權課程負項集生成模塊:該模塊計算完全加權課程(i-ι)-項集的i-權值閾值, 與其課程(i-ι)-項集的項集權值比較,可得到完全加權課程負i-項集,對餘下的課程候選 i-項集,計算其支持度,若其支持度小於最小支持度閾值,則就得到完全加權課程負項集。
4. 根據權利要求2所述的挖掘系統,其特徵在於,所述的完全加權課程正負關聯規則 生成模塊包括以下2個模塊: 來自課程頻繁項集的完全加權課程正負關聯規則生成模塊:該模塊生成課程頻繁項集 的真子集,計算課程關聯規則前項和後項的互信息和置信度,根據其互信息的值以及最小 置信度閾值,從完全加權課程頻繁項集中挖掘完全加權課程強正負關聯規則模式; 來自課程負項集的完全加權課程負關聯規則生成模塊:該模塊生成課程負項集的真子 集,計算課程關聯規則前項和後項的互信息和置信度,根據其互信息的值以及最小置信度 閾值,從完全加權課程負項集中挖掘完全加權課程強正負關聯規則模式。
5. 根據權利要求2-4中任一項所述的挖掘系統,其特徵在於,所述的挖掘系統中的支 持度閾值,置信度閾值,由用戶輸入。
【文檔編號】G06F17/30GK104239536SQ201410486031
【公開日】2014年12月24日 申請日期:2014年9月22日 優先權日:2014年9月22日
【發明者】黃名選, 蘭慧紅 申請人:廣西教育學院

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀