激情欧美日韩一区二区,浪货撅高贱屁股求主人调教视频,精品无码成人片一区二区98,国产高清av在线播放,色翁荡息又大又硬又粗视频

軟件工程數據挖掘存在的挑戰與解決方案

時(shí)間:2024-08-16 19:24:12 計算機軟件畢業(yè)論文 我要投稿
  • 相關(guān)推薦

軟件工程數據挖掘存在的挑戰與解決方案

  軟件工程數據挖掘工作的最后階段是將獲取的挖掘信息呈現給所需用,下面是小編搜集的一篇關(guān)于軟件工程數據挖掘問(wèn)題探究的論文范文,歡迎閱讀借鑒。

軟件工程數據挖掘存在的挑戰與解決方案

  1 引言(Introduction)

  數據挖掘技術(shù)既是在海量的數據當中將需求信息挖掘出來(lái)的過(guò)程[1].軟件工程數據挖掘則是數據挖掘技術(shù)在軟件工程領(lǐng)域的重要應用[2].軟件工程數據挖掘技術(shù)可以有效地提高軟件的開(kāi)發(fā)效率,增強軟件的穩定性以及可用性,隨著(zhù)軟件工程數據挖掘技術(shù)的不斷提升,其應用范圍更加的廣泛[3].因此,對其的研究工作不僅具有重要的學(xué)術(shù)價(jià)值,更具有重大的實(shí)際應用價(jià)值。本文重點(diǎn)探索軟件工程數據挖掘技術(shù)面臨的挑戰以及將來(lái)的發(fā)展趨勢。

  2 軟件工程數據挖掘(Software engineering datamining)

  (1)軟件工程數據挖掘的必要性

  軟件工程數據主要是指在軟件開(kāi)發(fā)階段積累的相關(guān)數據,其中包括軟件的可行性分析以及需求分析文本,軟件的注釋或者代碼等等。這些信息是軟件開(kāi)發(fā)者獲取軟件相關(guān)數據的唯一來(lái)源。隨著(zhù)軟件研發(fā)技術(shù)以及規模的不斷提升,其中包括的軟件工程數據也是成指數性增長(cháng)。例如:Linux操作系統軟件,其僅代碼一項就超過(guò)了500萬(wàn)行。這在無(wú)形中增加了軟件開(kāi)發(fā)者獲取軟件相關(guān)數據的難度。因此,借助于數據挖掘技術(shù)的軟件工程信息搜索技術(shù)是十分必要的。

  (2)軟件工程數據挖掘任務(wù)及其過(guò)程

  一般來(lái)講,軟件工程的數據挖掘工作主要包括:

  a.軟件數據的預處理。這一過(guò)程主要是將未曾加工的數據變?yōu)楸阌谕诰虺鰜?lái)的形式。其主要涉及到不同來(lái)源以及格式數據的融合,進(jìn)而轉化成為統一格式的數據。選取數據挖掘任務(wù)有關(guān)的數據記錄,并對數據中的噪音以及重復值進(jìn)行清理。目前,數據挖掘的預處理技術(shù)主要采用的是LSA、PLSA、LDA等。

  b.數據挖掘。這一過(guò)程主要是要將海量數據中能夠反映出軟件本質(zhì)或者規律的信息搜取出來(lái)。其中運用了大量的算法。輸入的是結構規整的數據,而將關(guān)聯(lián)、分類(lèi)等信息模式進(jìn)行輸出,這些信息模式與挖掘任務(wù)有關(guān)。

  c.結果評估。這一過(guò)程的目的就是要是用戶(hù)獲得有用的信息。主要包括提出信息質(zhì)量不高的部分結果數據,以及將計算機處理以及理解的信息模式轉換成為用戶(hù)能夠理解的信息模式,并傳遞給用戶(hù)。

  2 軟件工程數據挖掘存在的挑戰(Challenge ofsoftware engineering data mining)

  (1)軟件工程數據復雜度高

  目前的軟件工程數據主要包括結構化和非結構化兩類(lèi)數據。其中,結構化數據主要涉及到軟件的版本相關(guān)信息以及缺陷報告等。非結構化數據主要包括一些軟件代碼、文檔等。這兩類(lèi)數據不能采取同一種算法,但是兩類(lèi)數據之間卻又存在著(zhù)諸多相關(guān)性。因此,在數據挖掘算法開(kāi)發(fā)上,要充分的考慮到兩類(lèi)數據的復雜聯(lián)系,無(wú)形中增加了不小的難度。

  (2)分析方法并非傳統模式

  軟件工程數據挖掘工作的最后階段是將獲取的挖掘信息呈現給所需用戶(hù)。在傳統的數據挖掘應用過(guò)程中,例如:銀行或者電子商務(wù),都是將其轉化為文字或者圖表的形式。但是,軟件開(kāi)發(fā)者所需的信息并沒(méi)有如此簡(jiǎn)單。其囊括了編程模板、缺陷定位等客戶(hù)信息。因此,這對數據挖掘技術(shù)提出了更高要求。

  (3)數據挖掘結果評價(jià)標準不一

  數據挖掘技術(shù)在很多行業(yè)都已經(jīng)廣泛應用,并且,在結果表示以及評價(jià)標準制定等方面較為成熟,但是,在軟件工程數據挖掘領(lǐng)域卻不是這樣。軟件開(kāi)發(fā)者需要獲取的信息不僅詳細而且極為復雜,同時(shí),信息的表示方法也不盡相同,這樣一來(lái),為信息對比增加了不小的難度,因此,很難對數據挖掘結果進(jìn)行定量準確分析。

  3 軟件工程數據挖掘問(wèn)題的解決方案(Solution ofsoftware engineering data mining)

  (1)數據復雜性解決方法

  軟件工程數據的復雜性主要包括三方面:

  a.數據的類(lèi)型相對復雜。關(guān)于這一類(lèi)型,目前一些學(xué)者提出可以從軟件程序的結構圖以及文本數據等方面進(jìn)行信息挖掘。

  b.數據間聯(lián)系復雜。這一類(lèi)型可以利用算法的改進(jìn),增強發(fā)現數據之間聯(lián)系能力來(lái)提升數據挖掘結果的準確程度,例如:社會(huì )網(wǎng)絡(luò )分析法比較適用于尚未存在大量研究工作的領(lǐng)域。

  c.數據中存在噪音或缺失。這一類(lèi)型可以采用類(lèi)似于半監督學(xué)習的方法以達到有效控制因數據缺失所帶來(lái)的不良影響程度。

  總而言之,通過(guò)數據挖掘算法的不斷改進(jìn),能夠有效地解決數據復雜性問(wèn)題。

  (2)非傳統分析的解決方法

  相對于文字、圖表等信息形式,軟件開(kāi)發(fā)者往往更需要軟件使用范例。目前,很多研究成果會(huì )涉及到軟件使用例程以及編程規則等。同時(shí),在軟件工程當中,程序可視化作為一種信息表示方法正在逐漸成為趨勢,其與數據挖掘技術(shù)相結合,將會(huì )極大的滿(mǎn)足更多的非傳統分析需求。

  (3)挖掘結果評估問(wèn)題解決方法

  傳統的評估體系很難在軟件工程數據挖掘中應用。為了解決這一問(wèn)題,一些研究者試圖利用缺陷檢測效果評估法進(jìn)行挖掘數據評價(jià),但是,這種方法有點(diǎn)以偏概全的嫌疑。還有一些學(xué)者采用用戶(hù)體驗評價(jià)方法,但是在用戶(hù)較少的情況下,結果評價(jià)的客觀(guān)性不足。軟件工程領(lǐng)域無(wú)論是理論研究還是實(shí)際應用,其服務(wù)對象始終都是人,由此可見(jiàn),軟件工程數據挖掘的結果評價(jià)方法會(huì )越來(lái)越貼近人類(lèi)心理學(xué)以及管理學(xué)中的分析方法。

  4 軟件工程數據挖掘的發(fā)展趨勢(Developmenttrend of software engineering data mining)

  (1)基于現有問(wèn)題,開(kāi)法高性能挖掘算法

  a.軟件工程數據的檢索由精確的關(guān)鍵詞檢索向模糊檢索、甚至不受格式限制的自然語(yǔ)言檢索發(fā)展,檢索返回的內容從簡(jiǎn)單的語(yǔ)句向完整的文檔發(fā)展。

  b.缺陷檢測工具從僅能夠檢測缺陷的原因向更加復雜、范圍更加廣泛的缺陷發(fā)展。

  c.用人類(lèi)自然語(yǔ)言表達行為方法及軟件行為的模型將更加豐富,對應的表達能力也會(huì )大幅度提升。

  (2)提出更為復雜的問(wèn)題及其解決方法。

  a.將研究基于數據挖掘技術(shù)的軟件結構分析方法。

  b.將研究軟件行為的評價(jià)方法和惡意軟件檢測方法。

  c.通過(guò)數據挖掘方法定量分析、評估與預測軟件的穩定性,從而指導軟件的開(kāi)發(fā)和維護。

  d.進(jìn)一步發(fā)現數據之間的關(guān)系,綜合利用多方面的數據源進(jìn)行挖掘。

  (3)高效預處理,改進(jìn)挖掘算法

  研究更高效的數據預處理方法,最主要研究特征提取和數據降維方法;推進(jìn)異構數據的管理和整合技術(shù),如數據融合、數據空間等,以及分布式數據的并行處理技術(shù)。

  (4)引入新的軟件工程理念,指導數據挖掘工作

  隨著(zhù)計算機網(wǎng)絡(luò )技術(shù)的不斷發(fā)展,軟件開(kāi)發(fā)工作逐漸呈現出了高效化、智能化,網(wǎng)絡(luò )化特征。這些更是成為軟件開(kāi)發(fā)人以及數據的基本特征。正因為如此,軟件模塊的開(kāi)發(fā)工作更加趨向于功能性以及可重用性。這樣發(fā)展趨勢勢必會(huì )導致軟件工程數據挖掘技術(shù)研究方向的改變。利用數據挖掘技術(shù)采集、整合網(wǎng)絡(luò )數據,獲得信息的方法;以及利用數據挖掘工具設計軟件重用的規范和模式,以輔助可重用模塊的開(kāi)發(fā)。

  5 結論(Conclusion)

  隨著(zhù)計算機技術(shù)的快速發(fā)展,人們的生活也逐漸的進(jìn)入到了網(wǎng)絡(luò )化時(shí)代。各種應用軟件的開(kāi)發(fā)速度之快令人震驚,而這也對軟件工程數據挖掘工作提出了更多、更高的要求。本文首先對軟件工程數據挖掘技術(shù)的相關(guān)概念進(jìn)行分析,然后,對其遇到的挑戰和應對措施進(jìn)行探索,最后,研究其未來(lái)的發(fā)展趨勢。希望能夠為有關(guān)的研究工作者提供一些參考性的建議。

  參考文獻(References)

  [1] 毛澄映,盧炎生,胡小華。數據挖掘技術(shù)在軟件工程中的應用綜述[J].計算機科學(xué),2009(05):1-6.

  [2] 李新,張曉靜,米燕濤。軟件開(kāi)發(fā)過(guò)程中的數據挖掘[J].石家莊職業(yè)技術(shù)學(xué)院學(xué)報,2007(02):31-33.

  [3] 趙志升,羅德林,李海英。數據挖掘技術(shù)與應用[J].河北北方學(xué)院學(xué)報(自然科學(xué)版),2006(06):63-66.

【軟件工程數據挖掘存在的挑戰與解決方案】相關(guān)文章:

數據挖掘理論在數據采集中的運用07-11

數據挖掘的論文參考文獻10-14

數據挖掘論文參考文獻09-16

數據挖掘在CRM中的應用分析06-09

基于聚類(lèi)分析的數據挖掘方法06-27

數據挖掘技術(shù)在CRM中的應用09-20

關(guān)于數據挖掘論文參考文獻06-11

基于數據挖掘的成績(jì)分析系統10-10

旅游管理下數據挖掘運用論文09-27

基于數據挖掘技術(shù)的交叉銷(xiāo)售分析09-27

激情欧美日韩一区二区,浪货撅高贱屁股求主人调教视频,精品无码成人片一区二区98,国产高清av在线播放,色翁荡息又大又硬又粗视频