軟件工程大學(xué)生畢業(yè)設計論文
軟件工程數據挖掘技術(shù)對計算機軟件的開(kāi)發(fā),用戶(hù)的完美體驗都有著(zhù)重要的意義,所以以后軟件挖掘技術(shù)還會(huì )繼續的發(fā)展下去,要完成軟件工程數據挖掘技術(shù)的完善,接下來(lái)是小編為您整理的軟件工程大學(xué)生畢業(yè)設計論文,希望對您有所幫助。
【摘要】隨著(zhù)改革的開(kāi)放,科技的飛速發(fā)展,科技的發(fā)展速度已經(jīng)超過(guò)了人們的腳步,近年來(lái),我們國家的計算機技術(shù)越來(lái)越成熟,計算機軟件也越來(lái)越廣泛,人們從前獲取計算機軟件信息的方法是手動(dòng)獲取,但手工獲取的信息量是有一定限度的,不能滿(mǎn)足現代軟件的需求,所以,為了解決這個(gè)問(wèn)題,本文著(zhù)重于軟件工程數據挖掘的研究進(jìn)展。分別從幾個(gè)不同的方面對軟件工程數據挖掘研究進(jìn)行了探討。
【關(guān)鍵詞】軟件工程;數據挖掘;數據表示;數據預處理;機器學(xué)習
1前言
軟件工程的數據挖掘指的是在大量的數據中發(fā)現有用的信息。因為軟件工程的發(fā)展前景很廣闊,而且軟件工程數據挖掘是軟件開(kāi)發(fā)不可或缺的一部分,所以現在在軟件工程領(lǐng)域以及一些相關(guān)領(lǐng)域內軟件工程數據挖掘的研究非;馃,人們都爭取盡量提高軟件工程數據挖掘的速度,有用信息比率,以及智能識別等。從而讓軟件工程更具特色,為人們提供更大的便利。
2基本概念與技術(shù)挑戰
2.1基本概念
軟件工程在軟件開(kāi)發(fā)過(guò)程中會(huì )累計很多的數據,包括文檔數據,測試數據以及用戶(hù)數據和用戶(hù)反饋數據,軟件工程的開(kāi)發(fā)者為了獲取軟件的信息就要使用這些數據,但是軟件工程開(kāi)發(fā)的軟件越來(lái)越大,軟件工程的數據量不再是手工可以處理的數量級,而且及其復雜,所以人們使用傳統的方法來(lái)收集數據是非常困難的,基本上是不可能的,所以人們必須研究快速處理數據的方法,也就是軟件工程數據挖掘技術(shù)。
2.2軟件工程開(kāi)發(fā)的過(guò)程及其相關(guān)信息
軟件工程開(kāi)發(fā)時(shí)所需要的最重要的一條基本原則就是軟件工程學(xué),軟件工程學(xué)講的就是軟件工程開(kāi)發(fā)。軟件工程開(kāi)發(fā)的基本步驟如下,首先進(jìn)行可行性分析,需求分析,開(kāi)發(fā)者需要先進(jìn)性調研,來(lái)確定用戶(hù)對軟件功能的需求,在確定了大致的軟件開(kāi)發(fā)方向之后,開(kāi)發(fā)者開(kāi)始編寫(xiě)軟件代碼,然后根據代碼的測試進(jìn)行修改完善,在軟件公布之后要持續地為軟件進(jìn)行維護,升級。在軟件的開(kāi)發(fā)階段,每個(gè)開(kāi)發(fā)者都不完全了解整個(gè)開(kāi)發(fā)的過(guò)程,同時(shí)又不知道軟件的'整體信息,所以這些開(kāi)發(fā)者如果缺少這些信息,他們就會(huì )無(wú)法進(jìn)行繼續開(kāi)發(fā),從而導致停工。
2.3軟件工程的數據挖掘過(guò)程與任務(wù)
軟件工程數據挖掘主要有三項任務(wù),第一步是對數據進(jìn)行預處理,第二步是對數據進(jìn)行挖掘,第三步是對挖掘的結果進(jìn)行分析。①數據預處理,待挖掘的大量數據混雜在了一起,它們的格式和形式是否適合進(jìn)行數據挖掘,是否符合當前任務(wù)的數據特征,這些都是未知的,需要對其進(jìn)行預處理,預處理就是將大量的數據進(jìn)行改造,使其都變成適合進(jìn)行挖掘的形式,并且變成符合任務(wù)的數據,整個(gè)數據挖掘過(guò)程中,預處理是最費時(shí)費力的過(guò)程,主要的手段是將數據向量化和將數據降維處理。②數據的挖掘,數據的挖掘其實(shí)就是對預處理之后的數據進(jìn)行整體探索,找到其中一些有用的信息,所謂有用的信息,指的就是反應本質(zhì)的數據,還有比如一些具有一定的規律的數據,將這些數據找出來(lái)就是軟件工程數據挖掘的目的,數據的挖掘主要分為幾種,又頻繁序列的整理,關(guān)聯(lián)規則的整理,還有對數據進(jìn)行分類(lèi)等。③軟件工程數據挖掘的結果分析,結果分析像是對一項工程進(jìn)行檢測驗收一樣,對挖掘之后的數據信息進(jìn)行檢測,將有用的信息展示出來(lái),也就完成了整個(gè)軟件工程數據挖掘過(guò)程,這些挖掘之后的數據很有價(jià)值,對計算機軟件和客戶(hù)的使用效果而言有著(zhù)重要的意義。
3軟件工程數據挖掘面臨的挑戰
因為軟件工程的數據與其他的普通數據不同,所以軟件工程數據的處理有著(zhù)很大的困難,其困難主要有三個(gè)方面:①軟件工程的數據復雜化;②軟件工程的數據處理非傳統;③對于軟件工程數據挖掘的結果分析的標準非常嚴格。
3.1數據復雜化
軟件工程的數據主要分為兩大類(lèi):①結構化數據;②非結構化數據了。首先結構化的數據主要由缺陷報告和版本信息組成,而非結構化的數據則是由代碼和文檔組成。這兩類(lèi)數據不能使用同一種算法進(jìn)行計算,但是這兩類(lèi)數據之間又包含者重要的對應關(guān)系,比如一個(gè)版本信息中對應包含著(zhù)一定的文檔,而一個(gè)代碼中又有著(zhù)缺陷報告,這種糾纏不清的關(guān)系讓人們很難對其進(jìn)行整體分析,所以人們?yōu)榱嗽跀祿诰驎r(shí)將這兩種數據同時(shí)挖掘出來(lái),必須開(kāi)發(fā)與之對應的新型算法,這樣才能保證不漏掉很多有著(zhù)復雜關(guān)系的結構化數據和非結構化數據。
3.2非傳統分析
上文提到,軟件工程數據挖掘的過(guò)程最后的步驟就是對挖掘之后的數據信息進(jìn)行分析評估,而數據的處理結果最終要交到客戶(hù)手中,對于客戶(hù)的各種不同的數據需求,開(kāi)發(fā)者要將挖掘之后的數據進(jìn)行格式上的轉變,這樣大大地降低了軟件工程數據挖掘的效率,而且往往客戶(hù)要求的信息遠遠不止一種信息,有時(shí)還會(huì )需要具體的事例,編程的代碼,缺陷的報告等等信息,所以,軟件工程數據挖掘技術(shù)還需要進(jìn)行新的完善,將要提交的信息進(jìn)行歸類(lèi),改變格式化,以及對各種需求都要滿(mǎn)足而且保證效率的技術(shù),做到讓客戶(hù)對數據挖掘結果滿(mǎn)意,開(kāi)發(fā)者還能從中獲取最大利益的技術(shù)。3.3數據挖掘結果的評價(jià)標準在從前,傳統的數據挖掘技術(shù)有著(zhù)完善的對結果的分析標準,而現在,面對海量的軟件工程數據,這套規定已經(jīng)不再適用,對于不同的數據挖掘結果,對應著(zhù)不同的數據結果分析評價(jià)標準,每個(gè)評價(jià)標準之間并沒(méi)有太多的聯(lián)系,這就需要開(kāi)發(fā)者對不同類(lèi)型的數據挖掘結果制定不同的分析標準,同時(shí)也需要滿(mǎn)足客戶(hù)的要求,開(kāi)發(fā)者要對數據的結果有著(zhù)獨特的理解,才能對其結果是否滿(mǎn)足要求,挖掘的是否成功,這些不定量的問(wèn)題進(jìn)行透徹的了解?偠灾,軟件工程數據挖掘最終還是為了獲取信息,所以,整個(gè)軟件工程數據挖掘的結果是否將問(wèn)題完美的解決的標準還是最終的數據是否滿(mǎn)足要求,所以,上述挑戰將會(huì )對數據挖掘的結果造成影響,為了解決這些問(wèn)題,人們還需要開(kāi)發(fā)新的技術(shù),最終達到軟件工程數據挖掘技術(shù)的完善。
4對軟件工程數據挖掘的展望
軟件工程數據挖掘技術(shù)對計算機軟件的開(kāi)發(fā),用戶(hù)的完美體驗都有著(zhù)重要的意義,所以以后軟件挖掘技術(shù)還會(huì )繼續的發(fā)展下去,要完成軟件工程數據挖掘技術(shù)的完善,要做到以下幾點(diǎn):①對已經(jīng)發(fā)現的數據挖掘問(wèn)題進(jìn)行開(kāi)發(fā),就比如結構化數據與非結構化數據的捏合整理,這正是人們一直都沒(méi)做到的重點(diǎn)難點(diǎn),要攻破這一難關(guān),人們必須在計算結構化與非結構化數據挖掘時(shí)舍棄傳統的數據算法,開(kāi)發(fā)新的適合這兩數據的算法,這樣才能一步到位將結構化數據與非結構化數據一起運算出來(lái)。②對將要面臨的軟件工程數據挖掘技術(shù)的難題進(jìn)行預案,對于這些問(wèn)題要做好準備,開(kāi)發(fā)者要豐富自己的知識面,以免今后遇到問(wèn)題時(shí)不知道怎么辦。比如惡意程序,黑客病毒的處理,這些在未來(lái)將會(huì )越來(lái)越多,也就需要開(kāi)發(fā)者對其做好先前的準備,從而在問(wèn)題來(lái)臨的時(shí)候迎刃而解。
5結束語(yǔ)
隨著(zhù)人們對事物的追求便利,軟件工程的應用越來(lái)越廣泛,所以,對于軟件工程中的最重要部分軟件工程數據挖掘技術(shù)也要大力發(fā)展,現在有很多軟件工程數據挖掘技術(shù)正在興起。相信隨著(zhù)研究的不斷深入,軟件工程數據挖掘工具將會(huì )越來(lái)越實(shí)用化、智能化,乃至實(shí)現真正的自動(dòng)軟件挖掘。
參考文獻
[1]李新,張曉靜,米燕濤.軟件開(kāi)發(fā)過(guò)程中的數據挖掘[J].石家莊職業(yè)技術(shù)學(xué)院學(xué)報,2012(02):10~12.
[2]趙麗坤,陳立文,張國宗.基于數據挖掘技術(shù)的軟件項目管理體系[J].經(jīng)營(yíng)與管理,2012(12):34~35.
[3]鄒文東,張立厚.數據挖掘在水環(huán)境分析信息化中的應用[J].圖書(shū)館論壇,2006(05).
【軟件工程大學(xué)生畢業(yè)設計論文】相關(guān)文章:
軟件工程畢業(yè)設計論文10-12
大學(xué)生畢業(yè)設計論文致謝01-10
大學(xué)生畢業(yè)設計論文致謝08-07
工科畢業(yè)設計論文11-27
旅游畢業(yè)設計論文11-17
游戲畢業(yè)設計論文10-19