- 相關(guān)推薦
數據挖掘技術(shù)在機房信息管理的運用論文
1、大數據概述
大數據用來(lái)描述和定義信息爆炸時(shí)代所產(chǎn)生的海量數據,它是計算機和互聯(lián)網(wǎng)互相結合的產(chǎn)物,計算機實(shí)現了信息的數字化,互聯(lián)網(wǎng)實(shí)現了信息的網(wǎng)絡(luò )共享化。隨之興起的則是從海量數據中挖掘預測出對人類(lèi)行為有效的方法和結果,即數據挖掘技術(shù)[1]。數據挖掘(Datamining)指從大量的數據中通過(guò)算法搜索隱藏于其中的信息的過(guò)程,是一門(mén)跨多個(gè)領(lǐng)域的交叉學(xué)科,通常與人工智能、模式識別及計算機科學(xué)有關(guān),并通過(guò)統計、在線(xiàn)分析處理、情報檢索、機器學(xué)習、專(zhuān)家系統(依靠過(guò)去的經(jīng)驗法則)和模式識別等諸多方法來(lái)實(shí)現上述目標。其特點(diǎn)為:海量數據尋知識、集成變換度量值、分析模式評效果、圖形界面來(lái)展示[2]。
2、大數據時(shí)代下的高校機房現狀
順應時(shí)代潮流的發(fā)展,各高校都開(kāi)設有計算機專(zhuān)業(yè),非計算機專(zhuān)業(yè)也在大一或大二時(shí)期開(kāi)設公共計算機課程,計算機成為教育領(lǐng)域內不可或缺的教學(xué)設備,隨著(zhù)高校的進(jìn)一步擴招,教育事業(yè)的不斷更新發(fā)展,學(xué)校的機房建設也隨之增多,其任務(wù)由原來(lái)的面向計算機專(zhuān)業(yè)發(fā)展到面向全校的所有專(zhuān)業(yè)開(kāi)設公共計算機教學(xué)、承擔各種計算機考試等多項任務(wù)。因此機房管理系統在日常教學(xué)和考試任務(wù)中積累了海量數據,一般這些數據都保存在主服務(wù)器上僅供查詢(xún)使用[3]。利用數據挖掘技術(shù),對學(xué)校機房信息管理系統所積累的大量學(xué)生上機數據進(jìn)行深入分析與挖掘,將挖掘得到的預測結果輔助學(xué)生成績(jì)管理決策,能合理利用機房資源,提高學(xué)生成績(jì)管理質(zhì)量。本文利用關(guān)聯(lián)規則,從現有的機房信息管理系統中收集到的海量學(xué)生上機記錄數據中挖掘出隱藏在數據中的學(xué)生上機規律和上機效率,進(jìn)而預測學(xué)生的期末考試成績(jì),提前告知,學(xué)生可以在隨后的學(xué)習中通過(guò)人為干預學(xué)習過(guò)程:比如挖掘預測出某生成績(jì)將會(huì )較差,則可以在其后的學(xué)習中調整學(xué)習方式和學(xué)習態(tài)度,以修正期末考試結果,提高學(xué)習效率和考試通過(guò)率,為以后的就業(yè)做好鋪墊,因此不管是對于當前利益還是長(cháng)遠利益,都有深遠的意義。
3、數據挖掘階段
1)定義問(wèn)題:明確數據挖掘的預期目標。本次挖掘目標旨在從海量機房學(xué)生登錄信息中找出能預測成績(jì)的相關(guān)規則。
2)數據準備:提取數據挖掘的目標數據集,并進(jìn)行預處理[4]。本次挖掘數據對象為吉首大學(xué)設備中心六樓公共計算機機房的學(xué)生上機信息表,并檢查數據的有效性、一致性、完整性,并去除噪聲,進(jìn)行預處理。
3)數據挖掘:根據上個(gè)步驟所提取數據的特點(diǎn)和類(lèi)型選擇相應合適的算法,并在預處理過(guò)的數據集上進(jìn)行數據挖掘。根據問(wèn)題定義,本次選擇關(guān)聯(lián)規則算法Apriori算法,進(jìn)行關(guān)聯(lián)規則發(fā)現并預測。
4)分析挖掘結果:解釋評價(jià)數據挖掘的結果,并將其轉換成能被用戶(hù)所理解的規則。
5)運用規則:通過(guò)分析挖掘結果,可以適當進(jìn)行人工干預,修正學(xué)習行為,使得最終結果達到理想學(xué)習效率。
4、數據挖掘在機房管理系統中的應用
4.1關(guān)聯(lián)規則算法
Apriori算法采用逐層搜索的迭代方法,不需要復雜的理論推導,易于實(shí)現,是利用挖掘布爾關(guān)聯(lián)規則頻繁項集的一種算法;舅枷胧牵菏紫日页鏊械念l集,這些項集出現的頻繁性至少和預定義的最小支持度一樣。然后由頻集產(chǎn)生強關(guān)聯(lián)規則,這些規則必須滿(mǎn)足最小支持度和最小可信度。然后使用第1步找到的頻集產(chǎn)生期望的規則,產(chǎn)生只包含集合的項的所有規則,其中每一條規則的右部只有一項,這里采用的是中規則的定義。一旦這些規則被生成,那么只有那些大于用戶(hù)給定的最小可信度的規則才被留下來(lái)[5]。
4.2關(guān)聯(lián)結果分析
以吉首大學(xué)實(shí)驗室與設備管理中心為例,吉首大學(xué)實(shí)驗室與設備管理中心下設置的公共計算機實(shí)驗教學(xué)中心,負責學(xué)校公共計算機實(shí)驗室建設與管理,組織實(shí)施公共計算機實(shí)驗教學(xué)與開(kāi)放,完成基于計算機平臺進(jìn)行的計算機等級考試、普通話(huà)測試、各類(lèi)社會(huì )化考試等測試工作。其中承擔公共計算機教學(xué)的機房共有7間,每個(gè)機房平均配置95臺學(xué)生用計算機和一臺教師教學(xué)用計算機,每臺電腦上都安裝有奧易機房管理軟件,學(xué)生每次上機都必須通過(guò)奧易軟件登錄界面輸入自己的學(xué)號和密碼才能進(jìn)入系統使用計算機,從而收集到學(xué)生的上機登錄時(shí)間、離開(kāi)時(shí)間,教師端可以利用奧易軟件對任意學(xué)生電腦端進(jìn)行調換、抓屏、控制屏幕、考試、答疑等操作,所有數據存儲在機房管理端的后臺數據庫中,通過(guò)調用后臺數據庫中的學(xué)生上機情況數據,進(jìn)行挖掘分析。由于數據量龐大,所以采用從起始順序抽樣的方法,抽取出2015年11月5日的部分學(xué)生上機的相關(guān)數據,去除不完整、不一致、有缺失的數據,進(jìn)行預處理,為達到預測挖掘目標提供正確的數據源。表1中的數據前六列是從奧易軟件后臺數據庫中提取到的原始數據,我們設置第二、三、五列數據與學(xué)習情況有關(guān)聯(lián)。將這些數據存在于整合表中,剔除學(xué)號異常的記錄,即只要是學(xué)號異常,強制設定其上機情況為較差(異常學(xué)號學(xué)生,應為重修生,是學(xué)習重點(diǎn)關(guān)注對象),為了方便系統分析,將關(guān)聯(lián)整合后的數據轉化為布爾類(lèi)型。登錄時(shí)間:S1:10:00;S2:遲到五分鐘;S3:遲到十分鐘;S4:遲到十分鐘以上。學(xué)號:N1:正常學(xué)號;N2:異常學(xué)號。下課時(shí)間:E1:正常下課時(shí)間;E2:提前五分鐘下課;E3:提前五至十分鐘下課;E4:提前十分鐘以上下課。利用關(guān)聯(lián)算法產(chǎn)生頻繁項集情況分析Q:Q1:優(yōu)秀;Q2:良好;Q3:一般;Q4:較差。利用Apriori算法挖掘關(guān)聯(lián)規則,可以得到學(xué)生上機情況規律:S1,E1→Q1;(S2,E2)/(S1,E2)→Q2/Q3;S4,E4→Q4評價(jià)結果:按照正常上課時(shí)間上機并且堅持不早退的同學(xué)學(xué)習情況為優(yōu)秀;上課準時(shí)但是提前五分鐘之內下課的同學(xué)學(xué)習情況為良好;上課遲到五分鐘以?xún)惹蚁抡n也提前五分鐘的同學(xué)學(xué)習情況為一般;上課遲到十分鐘以上并且下課早退十分鐘以上的同學(xué)學(xué)習評估為較差。如果利用關(guān)聯(lián)算法得出某個(gè)學(xué)生的學(xué)習情況有三次為較差,就啟動(dòng)成績(jì)預警,提示并干預該生以后的上機學(xué)習,督促其學(xué)習態(tài)度,提高學(xué)習效率,以避免期末考試掛科現象。
5、結束語(yǔ)
借數據挖掘促進(jìn)治理主體多元化[6],借關(guān)聯(lián)分析實(shí)現決策科學(xué)化[7].,本文利用關(guān)聯(lián)規則思路和算法,將吉首大學(xué)設備中心機房中存在的大量學(xué)生上機情況數據進(jìn)行分析挖掘,嘗試從學(xué)生上機相關(guān)數據中預測其學(xué)習情況,并根據預測結果有效提示學(xué)生的期末考試成績(jì)走向,引導該生在隨后的學(xué)習應該更加有效,以達到避免出現最壞結果,從而提高期末考試通過(guò)率。
參考文獻:
[1]李濤,曾春秋,周武柏,等.大數據時(shí)代的數據挖掘——從應用的角度看大數據挖掘[J].大數據,2015(4):57-80.
[2]王夢(mèng)雪.數據挖掘綜述[J].軟件導刊,2013(10):135-137.
[3]袁露,王映龍,楊珺.關(guān)于高校計算機機房管理與維護的探討[J].電腦知識與技術(shù),2013(18):4334-4335.
[4]李明江,唐穎,周力軍.數據挖掘技術(shù)及應用[J].中國新通信,2012(22):66-67+74.
[5]胡文瑜,孫志揮,吳英杰.數據挖掘取樣方法研究[J].計算機研究與發(fā)展,2011(1):45-54.
[6]黃夢(mèng)橋,李杰.因素挖掘法在投資學(xué)課程中的教學(xué)實(shí)踐[J].吉首大學(xué)學(xué)報:自然科學(xué)版,2015(4):80-83.
[7]尹鵬飛,歐云.基于決策樹(shù)算法的銀行客戶(hù)分類(lèi)模型[J].吉首大學(xué)學(xué)報:自然科學(xué)版,2014(5):29-32.
【數據挖掘技術(shù)在機房信息管理的運用論文】相關(guān)文章:
旅游管理下數據挖掘運用論文11-18
數據挖掘技術(shù)在飯店營(yíng)銷(xiāo)中的運用03-28
旅游管理下數據挖掘運用論文6篇11-18
臨床醫學(xué)中數據挖掘技術(shù)的運用分析11-29
數據挖掘理論在數據采集中的運用03-16
電商網(wǎng)站設計中網(wǎng)絡(luò )數據挖掘技術(shù)的運用11-15
大數據技術(shù)在移動(dòng)通信網(wǎng)絡(luò )優(yōu)化的運用論文06-09
數據挖掘的論文參考文獻10-14
數據挖掘技術(shù)在CRM中的應用03-22