淺析數據挖掘技術(shù)在企業(yè)職工培訓中的應用論文
從現狀看,數據挖掘范疇內的技術(shù),慣常用于金融、大規模特性的商業(yè)之中。然而,企業(yè)預設的職員培訓,較少采納這一技術(shù)。對于搜集得來(lái)的培訓信息,仍停留于建構某一數據庫、單一情形下的數據查驗。數據信息特有的決策價(jià)值,沒(méi)能充分被發(fā)覺(jué)。本文依循數據挖掘的本源原理,創(chuàng )設了新穎情形下的數據庫。采納挖掘手段,予以深入調研。數據挖掘得來(lái)的適宜結論,能為后續時(shí)段的培訓規劃,提供最佳指引。
1新穎技術(shù)的特性
搜集得來(lái)的初始數據通常數目偏多,數據表征出來(lái)的不完整傾向應當被注重。原初的數據夾帶著(zhù)噪聲,且帶有模糊特性及隨機特性。數據挖掘依托著(zhù)的手段,是從搜集得來(lái)的最初數據以?xún)忍釤挸鰸摬刂?zhù)的、不被知曉的、帶有高層級價(jià)值這樣的信息、關(guān)聯(lián)著(zhù)的知識等。慣用的挖掘方式包含關(guān)聯(lián)規則、建構好的決策樹(shù)、神經(jīng)網(wǎng)絡(luò )及特有的貝葉斯、建構的粗糙集、對應著(zhù)的模糊集、挖掘流程內的聚類(lèi)分析。細分出來(lái)的挖掘步驟整合了初始時(shí)段的數據預備、數值的選取、預處理特有的流程、側重的挖掘流程、模型更替及轉變、后續時(shí)段的挖掘評價(jià)。
數據挖掘概念。數據挖掘是從大量的、不完整的、有噪聲的、模糊的和隨即的數據中,提取隱含在其中的、人們事先不知道的、潛在的和有價(jià)值的信息和知識的過(guò)程。數據挖掘的技術(shù)最常用的數據挖掘技術(shù)主要有決策樹(shù)、關(guān)聯(lián)規則、貝葉斯、神經(jīng)網(wǎng)絡(luò )、聚類(lèi)分析、模糊集和粗糙集等。數據挖掘的步驟數據的挖掘過(guò)程主要包括5個(gè)階段:數據準備、數據選擇、數據預處理、數據挖掘、轉換模型及模式評價(jià)。
2構建數據庫
數據挖掘特性的新穎技術(shù)不能脫離建構起來(lái)的數據庫。它能從數目偏多的信息之內提煉得來(lái)可用的數值。職員培訓特有的領(lǐng)域以?xún),數據庫可以歸整在冊范疇的一切職員,對于獲取到的關(guān)聯(lián)結果予以辨識解析。數據庫存留著(zhù)的信息之內涵蓋基礎數據、培訓得來(lái)的真正結果。
2. 1擬定物理框架
職員培訓特有的數據庫,應設定適宜情形下的物理模型。擬定好的物理模型是數據特有的存留方式、多層級的數據組織。例如:某企業(yè)篩選出來(lái)的數據庫,帶有關(guān)系型這樣的特性。搭配的管理系統設定成SQL架構下的server。
2. 2擬定概念模型
職員培訓關(guān)涉的概念模型能夠明晰預設的系統界限,擬定根本主題。數據庫涵蓋著(zhù)的根本信息是職員固有的自身信息、這一時(shí)段的培訓成績(jì)。歸整好的這些信息凸顯了單一性,但又潛藏著(zhù)某些關(guān)聯(lián)。采納數據倉庫,提煉并歸整這樣的數值,以便提煉得來(lái)決策依憑的可用信息。依循細分出來(lái)的職員特性、建構的主題,把總體范疇內的培訓結果,分成多個(gè)層級,并歸入數據庫。
3選出來(lái)的運用實(shí)例
3. 1采納的關(guān)聯(lián)規則
依循的評判指標,是體系架構中的置信度、對應著(zhù)的支持度。必備的概率信息包含物品集特有的出現頻次。最小數值的支持度表征著(zhù)篩選出來(lái)的這一項目,在統計之中凸顯了最低層級的重要價(jià)值。最小數值的置信度表征著(zhù)設定好的這類(lèi)規則,凸顯了不可靠的傾向。采納關(guān)聯(lián)規則,建構精準模型,以便解析某一時(shí)段的培訓狀態(tài)。
3. 2采納的模型
抽取出來(lái)的數值涵蓋固有的職員信息、測試得來(lái)的成績(jì)等。采納預設的規則,操作這些數值。這樣做能夠明晰數值潛藏著(zhù)的彼此關(guān)聯(lián),抽取得來(lái)的字段含有單位稱(chēng)呼、職員個(gè)體姓名、微機處理特有的等級。
3. 3具體的挖掘步驟
預處理特有的時(shí)段中,為了辨識設定好的關(guān)聯(lián)規則,對于初始數據予以概念化。采納A這樣的符號來(lái)表征職員固有的年齡。這種情形之下,A (1)特有的信J息,表T年齡沒(méi)能達到25歲;A (2)表征著(zhù)年齡涵蓋在25歲至35歲;A (3)表征著(zhù)年齡超出了35歲。采納H這一符號,表明測試特有的通過(guò)狀態(tài)。H (1)涵蓋著(zhù)沒(méi)能通過(guò)的職員,H (2)涵蓋著(zhù)通過(guò)的職員。經(jīng)山離散化特有的處理以后,得來(lái)最終結果。
3. 4后續的挖掘步驟
在測試之中,職員特有的通過(guò)人數,總和5910;沒(méi)能通過(guò)的人數,總和1810。沒(méi)能通過(guò)的概率,占到了22%。采納預定的關(guān)聯(lián)規則來(lái)挖掘這樣的數據。體系范疇內的每類(lèi)行為都設定了這一規則。這就表明輸入數值及對應著(zhù)的輸出之間帶有偏強的關(guān)聯(lián)。
3. 5解析得來(lái)的結論
數據特有的重要性,也即興趣度,能夠辨識頻繁項、設定好的規則等。依循降序排列可以獲取明晰的規則列表。例如某次解析得來(lái)這種結論:年齡超出50這樣的職員、工齡超出25這樣的職員或者高級別范疇內的職員通過(guò)培訓概率還是偏大的。與此同時(shí),學(xué)歷層級偏低的職員,通過(guò)等級與特有的學(xué)歷,凸顯了相關(guān)的傾向,這樣的對應符合慣常的認知。
由此可見(jiàn),學(xué)歷層級偏低這樣的職員在接納新認知時(shí)能力是偏弱的。針對企業(yè)以?xún)鹊倪@類(lèi)職員,在接續的培訓之中應多加注重。設定出來(lái)的培訓形式,應符合帶有差異特性的職員群體;劃分的培訓時(shí)段應傾向于認知偏弱的職工。例如:可以添加課時(shí),調整預設的培訓時(shí)段,保障體系以?xún)鹊倪@些職員,能參與擬定好的培訓規劃。此外,對于接納能力偏強這樣的職工,可適當縮減原有的課時(shí),縮減設定好的多樣科目。這樣做可縮減耗費掉的培訓經(jīng)費,并創(chuàng )設最優(yōu)情形下的整體效益。離散化情形下的數值處理驗證了歸結出來(lái)的這一結論。
4結語(yǔ)
數據庫建構依循的根本原理不能脫離數據挖據。企業(yè)培訓之中,借助挖掘得來(lái)的多重信息,能夠解析各時(shí)段的培訓成果。連續值固有的屬性,在設定好的挖掘流程內得以離散化,這就為接續的深入挖掘提供了基礎。調整擬定好的培訓規劃,確保預設的新規劃,符合職員培訓特有的真實(shí)狀態(tài)。
【淺析數據挖掘技術(shù)在企業(yè)職工培訓中的應用論文】相關(guān)文章:
數據挖掘技術(shù)在Web信息檢索中的應用研究論文12-01
數據挖掘在電力企業(yè)中的應用論文12-13
數據挖掘技術(shù)的教學(xué)輔助系統應用論文03-16
數據挖掘技術(shù)在就業(yè)指導的應用論文02-27
數據挖掘在現代遠程教育中的應用論文11-22
數據挖掘技術(shù)在高校學(xué)生成績(jì)分析中的應用研究論文03-15
網(wǎng)絡(luò )編碼中數據通信技術(shù)的應用論文03-17
油田井場(chǎng)監測中數據通信技術(shù)的應用論文03-16
- 相關(guān)推薦