基於數據挖掘的大學生選課心理調查研究平臺及方法
2023-07-29 11:13:51
專利名稱:基於數據挖掘的大學生選課心理調查研究平臺及方法
技術領域:
本發明涉及大學生選課心理調查研究技術領域,屬於計算機輔助應用領域。
背景技術:
當前是信息技術的時代,大部分高校都完成了管理信息化及網絡化,特別是教務 處等部門都存有大量學生與課程的信息。隨著高校開設了越來越多的選修課,長期觀察表 明,學生選課心理具有一定的規律性,教務管理人員如果能夠獲取這些規律,便於合理調整 課程設置,減少教學資源的浪費,而且學生工作部門能及時把握具體學生群的學風學情信 息。但目前高校的信息系統尚不能用於大學生選課心理規律研究。目前,對學生選課心理的研究方式是一般由經驗豐富的研究專家採用計算機統計 調查數據,為便於歸類,一般問卷涉及的問題項數量較小,且分析容易受研究者主觀因素影 響較多,從而影響到結論的客觀性和精確性;同時,實施調查數據來源於紙質問卷調查後手 工轉換為電子文檔,工作效率低下;而在組織問捲髮放到收回過程中,難以保證以足夠的精 力跟蹤監督一個個具體的答題行為,實踐中存在一人代替多人答題、敷衍了事地亂答現象, 造成廢卷多、調查數據質量不高,成為後繼研究工作的障礙;而且這種研究方式繁瑣、周期 長。因此,該方法不利於推廣到日常的教務實踐。隨著網絡技術的發展,網站調查技術成為替代紙質問卷調查採集數據的新方法, 對被調查對象的身份識別普遍採用鎖定用戶的註冊方式,或鎖定IP位址兩種方式,但在進 行大學生選課心理網站調查時,前者操作繁瑣,浪費調查實施時間,後者雖然操作簡單,但 同前者一樣都不能鎖定實際答題人,存在一人可以反覆答卷的可能,失去一人只作答一次 的約束。本發明適合於高校大學生選課心理調查及研究工作,也適合相似性工作,得到的 規律結論受研究者主觀影響較小。特別的,通過調整問卷設計,可以適合不同課程的選課心
理調查。
發明內容
本發明的目的是為了克服目前技術中的上述不足。本發明基於數據挖掘的大學生 選課心理調查研究平臺採用B/S模式,由3個部分組成,即問卷管理子系統、信息採集子系 統和信息處理子系統,主要實現調查數據的採集和處理兩大功能。平臺的系統結構框圖見
圖1。問卷管理子系統有3個功能模塊問卷導入模塊用於將系統外部的選修課調查問 卷文檔(所有問題及對應答案單選項)導入;問卷製作模塊是在利用系統本身創建新的選 修課調查問卷;問卷修訂模塊可將廢棄的問卷刪除掉和對現有的問卷進行修改,三個模塊 均能實現對選修課問卷的網頁預覽。信息採集子系統有2個功能模塊,完成調查數據的採集功能外部調查結果導入 模塊用於紙質問卷調查匯集的調查記錄集表文檔導入到資料庫伺服器;問卷調查模塊用於網站問卷調查並將文字信息轉為便於計算機處理的統一數據格式的調查記錄集表存入學 生選課調查問卷答案資料庫伺服器。採用網站問卷調查形式時,可以組織被調查學生群體 在固定區域、規定時間段,只需憑自己清楚的個人信息學號和身份證號便迅速可登陸調查 系統,以此既可識別實際的答卷人,也方便學生不用花費太多時間配合完成調查任務。而同 時掌握其他同學學號和身份證號因涉及個人隱私,故替別人作答可能性可大大減少;在數 據庫中設置標識限制每位學生只能作答一次,避免同一學生反覆答題現象;系統中設提示 功能可減少未作答完畢就提交的現象,降低胡亂作答的可能性。採用網站調查方式可以大 大降低大學生選修課問卷調查工作的勞動強度,減少廢卷,迅速歸集原始調查記錄集數據。信息處理子系統有2個功能模塊,具有對原始調查記錄集數據進行整理和清洗 後,完成調查數據的處理功能簡單統計模塊可以將資料庫中的某一問卷的調查記錄集表 輸出到Excel中,進行簡單統計分析;數據挖掘模塊可對具體的數據記錄表進行數據挖掘, 尋找隱藏在大量的學生答卷信息記錄數據中的、能夠體現學生選課的規則集。數據挖掘算 法有多種選擇,本發明採用ID3算法生成決策樹,並從該樹提取規則(可對決策樹進行剪 枝)。本系統中某門課程所有學生答卷信息的調查記錄集數據可看成一張決策表,由條 件屬性和決策屬性構成,條件屬性(Ci)對應問題項,決策屬性(D)對應學生最終的選課決 定,每條記錄對應的是每份問卷對應的答案和選課決定。其中,表示第i個學生其第j 個問題項的選項,Di代表第i個學生的對某調查課程的選課決定。決策表模型如下
序號C1CnD1XnXlnD1mXmlXmnDm設S是m個訓練數據樣本的集合,一個數據樣本即為一條記錄,所有屬性值均為離 散型。該算法選擇使信息增益率(^airuratio(Ci)最大的屬性Ci作為分枝屬性,這種方法使 生成的決策樹平均深度較小,從而有較快的分類速度。條件屬性Ci中信息增益率定義,見 公式(I)0 Gain(Ci)為條件屬性Ci的信息增益,計算見公式(5)。Split(Ci)為其分裂熵, 計算見公式(6)。Gainjatio(Ci) = Gain(Ci)ZSplit(Ci),i = 1,...,n (1)假定決策屬性D具有X個不同取值(本發明中X = 3,其中1代表「棄選」,2代表 「試聽」,3代表「必選」),該屬性的不同值將數據樣本集合分為X個不同類,Sj是其中的同 種類型樣本數,ν= 1,…,X。Pv是任意樣本屬於Sv的概率。計算見公式O)。對一個給 定的訓練數據樣本集分類所需的期望信息由見公式(3)。Pv= I Sv I/m(2)
χ/(51, 』…, ) = -Σ 屍νIog2Pv(3)
設條件屬性Ci具有Y個不同值,則S可被劃分為Y個子集,其中|s」在該條件屬 性中具有相同的值…的樣本數,則在條件屬性Ci的熵或信息期望計算見公式0)。其在該 屬性分枝上將獲得的信息增益,見公式(5)。熵值越小,子集劃分的純度越高,對於給定的子 集Sp Svj為在條件屬性值為…時的子集。
γ
權利要求
1.一種基於數據挖掘算法的大學生選課心理研究工作平臺,其特徵在於平臺採用B/S 模式,由3個子系統組成問卷管理子系統有3個功能模塊問卷導入模塊用於將系統外部的選修課調查問卷文 檔(所有問題及對應答案單選項)導入;問卷製作模塊是在利用系統本身創建新的選修課 調查問卷;問卷修訂模塊可將廢棄的問卷刪除掉和對現有的問卷進行修改,三個模塊均能 實現對選修課問卷的網頁預覽;信息採集子系統有2個功能模塊,完成調查數據的採集功能外部調查結果導入模塊 用於紙質問卷調查匯集的調查記錄集表文檔導入到資料庫伺服器;問卷調查模塊用於網站 問卷調查並將文字信息轉為便於計算機處理的統一數據格式的調查記錄集表存入學生選 課調查問卷答案資料庫伺服器;信息處理子系統有2個功能模塊,具有對原始數據進行整理和清洗後,完成調查數據 的處理功能簡單統計模塊可以將資料庫中的某一問卷的調查記錄集表輸出到^ccel中, 進行簡單統計分析;數據挖掘模塊可對具體的數據記錄表進行數據挖掘,尋找隱藏在大量 的學生答卷信息記錄數據中的、能夠體現學生選課的規則集。
2.一種基於數據挖掘算法的大學生選課心理研究工作方法,其特徵在於以下具體步驟(1)問卷製作。將該課程問卷文檔分為問題項和對應答案選項兩部分分別存入問卷數 據庫。問題項對應於決策表中的條件屬性項和決策項;而對應的答案選項表示為屬性項的 值,為便於數據處理,屬性值用對應的數字表示;(2)問卷修訂。在實施調查前,可對問卷進行修改,增加或減少問題項及答案項,修改有 關文字內容,也可刪除無用或廢棄的問卷;(3)問卷調查。教務人員在調查前,將所要調查的學生群體信息表導入到平臺的學生數 據庫中。當學生參加網站選課問卷調查時,便可根據自己的學號作為用戶名,身份證號作為 密碼,登錄問卷答題系統,進行答卷,一旦提交答卷,將在資料庫中被標識,以此為條件,該 生將無法再次答卷,確保每個學生只能作答一次;(4)數據清洗。由計算機自動識別答案選項不完整的調查記錄,並將其從調查記錄集中 刪除;也可根據步驟6分析得出的顯然不合邏輯的規則,刪除對應的調查記錄;(5)生成決策樹。由計算機對一個調查記錄集運行數據挖掘算法,生成原始決策樹。 將數字表達的決策樹映射為研究者能看明白的文字表達形式,並可根據研究者需要輸入SD 和CD的值,這兩個值的範圍為0-100%,修剪決策樹,得到數量較少的、文字表達的規則集;(6)對得到的規則集進行評價,如果發現明顯不合邏輯的規則,則返回步驟4;如果沒 有發現明顯不合邏輯的規則,則將該規則集保存在規則資料庫中,並可輸出文字表達的規 則集文檔,供日後方便評閱。
3.如權利要求2所述的數據挖掘算法,其特徵在於步驟5中,決策樹的產生核心計算公 式是信息增益率(^airuratio(Ci)計算和可信度(CD)和支持度(SD)設置。決策樹的產生 可以單獨根據信息增益率產生,也可與可信度和支持度組合。
全文摘要
本發明公開了一種基於數據挖掘算法的大學生選課心理研究工作平臺及方法。該平臺採用B/S模式,由問卷管理子系統、信息採集子系統和信息處理子系統3個子系統組成,其中問卷管理子系統由問卷導入、問卷製作和問卷修訂3個模塊組成;信息採集子系統由問卷調查、外部調查結果導入2個模塊組成;信息處理子系統由簡單統計、數據挖掘2個模塊組成。其方法是利用平臺進行問卷準備,實施網站調查採集調查記錄集數據,提取大學生選課心理規則。本發明適應教務和教研工作的電子化、網絡化和智能化的發展趨勢,便於大學生選課管理及研究工作質量的改善和效率的提高。
文檔編號G06F17/30GK102122294SQ20111003659
公開日2011年7月13日 申請日期2011年1月29日 優先權日2011年1月29日
發明者姚文銳, 李偉, 秦鋒, 紀濱, 馬麗 申請人:安徽工業大學