- 相關(guān)推薦
關(guān)于理工類(lèi)開(kāi)題報告范文
題目:聚類(lèi)算法研究及其在IDS中的應用
一、論文的研究?jì)热?/strong>
論文的研究?jì)热莅▋蓚(gè)方面:一是研究新的高效的聚類(lèi)算法;一是把已有的聚類(lèi)算法或論文提出的新算法和入侵檢測技術(shù)相結合,從而提出一個(gè)好的入侵檢測模型。具體的研究?jì)热莅ㄒ韵聨讉(gè)點(diǎn):
第一、針對聚類(lèi)算法的研究問(wèn)題:
1、如何提高算法的可擴展性
許多聚類(lèi)算法在小于200個(gè)數據對象的小數據集上是高效率的,但是無(wú)法處理一個(gè)大規模數據庫里的海量對象,F有的聚類(lèi)算法只有極少數適合處理大數據集,而且只能處理數值型數據對象,無(wú)法分析具有類(lèi)屬性的數據對象。
2、如何處理離群點(diǎn)
在實(shí)際應用中,估計數據集中的離群點(diǎn)可能是非常困難的,很多算法通常丟棄增長(cháng)緩慢的簇,這樣的簇趨向于代表離群點(diǎn)。然而在某些應用中,用戶(hù)可能對相對較小的簇比較感興趣,比如入侵檢測中,這些小的簇可能代表異常行為,那么我們需要考慮在對算法影響更小的前提下,如何更好的處理這些離群點(diǎn)。
3、研究適合具有類(lèi)屬性數據的聚類(lèi)算法的有效性
對聚類(lèi)分析而言,有效性問(wèn)題通?梢赞D換為最佳類(lèi)別數K的決策。而目前有關(guān)聚類(lèi)算法的有效性分析,大都集中在對數值數據的聚類(lèi)方式分析上。對于具有類(lèi)屬性的數據聚類(lèi),還沒(méi)有行之有效的分析方法。
第二、針對聚類(lèi)算法在IDS應用中的研究問(wèn)題:
1、如何結合聚類(lèi)技術(shù)和入侵檢測技術(shù)取得更好的效果
很多的聚類(lèi)算法都已經(jīng)和IDS應用環(huán)境結合起來(lái)了,很多研究者對前人提出的算法作出改進(jìn)后,應用到IDS系統中去,或者提出一個(gè)全新的算法來(lái)適應IDS的要求。隨著(zhù)聚類(lèi)技術(shù)的不斷發(fā)展,聚類(lèi)技術(shù)在入侵檢測中的應用將是一個(gè)很有前景的工作。我們需要把更好的聚類(lèi)技術(shù)成果應用到入侵檢測中。
2、利用聚類(lèi)技術(shù)處理入侵檢測中的頻繁誤警
雖然入侵檢測是重要的安全措施,然而它常常觸發(fā)大量的誤警,使得安全管理員不堪重負,事實(shí)上,大量的誤警是重復發(fā)生并且頻繁發(fā)生的,可以利用聚類(lèi)技術(shù)來(lái)尋找導致IDS產(chǎn)生大量誤警的本質(zhì)原因。
二、學(xué)位論文研究依據
學(xué)位論文的選題依據和研究意義,以及國內外研究現狀和發(fā)展趨勢
聚類(lèi)分析研究已經(jīng)有很長(cháng)的歷史,其重要性及其與其他研究方向的交叉特性已經(jīng)得到了研究者的充分肯定。對聚類(lèi)算法的研究必將推動(dòng)相關(guān)學(xué)科向前發(fā)展。另外,聚類(lèi)技術(shù)已經(jīng)活躍在廣泛的應用領(lǐng)域。作為與信息安全專(zhuān)業(yè)的交叉學(xué)科,近年來(lái),聚類(lèi)算法在入侵檢測方面也得到大量的應用。然而,聚類(lèi)算法雖取得了長(cháng)足的發(fā)展,但仍有一些未解決的問(wèn)題。同時(shí),聚類(lèi)算法在某些應用領(lǐng)域還沒(méi)有充分的發(fā)揮作用,聚類(lèi)技術(shù)和入侵檢測技術(shù)結合得還不夠完善。在這種背景下,我們認為,論文的選題是非常有意義的。
本論文研究的內容主要包括兩個(gè)方面:聚類(lèi)算法的研究以及聚類(lèi)算法在入侵檢測中的應用。下面從兩個(gè)方面闡述國內外這兩個(gè)方面的發(fā)展現狀和趨勢:
前人已經(jīng)提出很多聚類(lèi)算法,然而沒(méi)有任何一種聚類(lèi)算法可以普遍適用于揭示各種多維數據集所呈現出來(lái)的多種多樣的結構,根據數據在聚類(lèi)中的積聚規則以及應用這些規則的方法,可以將聚類(lèi)算法分為以下幾種:
1。劃分聚類(lèi)算法
劃分聚類(lèi)算法需要預先指定聚類(lèi)數目或聚類(lèi)中心,通過(guò)反復迭代運算,逐步降低目標函數的誤差值,當目標函數收斂時(shí),得到最終的聚類(lèi)結果,劃分聚類(lèi)算法典型代表是k—means算法[1]和k—modoids算法。這些算法處理過(guò)程簡(jiǎn)單,運行效率好,但是存在對聚類(lèi)數目的依賴(lài)性和退化性。迄今為止,許多聚類(lèi)任務(wù)都選擇這兩個(gè)經(jīng)典算法,針對k—means及k—modoids的固有弱點(diǎn),也出現了的不少改進(jìn)版本。
2。層次聚類(lèi)算法
又稱(chēng)樹(shù)聚類(lèi)算法,它使用數據的聯(lián)接規則,透過(guò)一種層次的架構方式,反復將數據進(jìn)行分裂和聚合,以形成一個(gè)層次序列的聚類(lèi)問(wèn)題解。由于層次聚類(lèi)算法的計算復雜性比較高,所以適合于小型數據集的聚類(lèi)。20xx年,Gelbard等人有提出一種新的層次聚合算法,稱(chēng)為正二進(jìn)制方法。該方法把待分類(lèi)數據以正的二進(jìn)制形式存儲在二維矩陣中,他們認為,將原始數據轉換成正二進(jìn)制會(huì )改善聚類(lèi)結果的正確率和聚類(lèi)的魯棒性,對于層次聚類(lèi)算法尤其如此。Kumar等人[9]面向連續數據提出一種新的基于不可分辨粗聚合的層次聚類(lèi)算法,既考慮了項的出現次序又考慮了集合內容,該算法能有效挖掘連續數據,并刻畫(huà)類(lèi)簇的主要特性。
3;诿芏取W(wǎng)格的聚類(lèi)算法
與傳統的聚類(lèi)方法不同:基于密度的聚類(lèi)算法,通過(guò)數據密度來(lái)發(fā)現任意形狀的類(lèi)簇;基于網(wǎng)格的聚類(lèi)算法,使用一個(gè)網(wǎng)格結構,圍繞模式組織由矩形塊劃分的值空間,基于塊的分布信息實(shí)現模式聚類(lèi),基于網(wǎng)格的聚類(lèi)算法常常與其他方法相結合,特別是與基于密度的聚類(lèi)方法相結合;诰W(wǎng)格和密度的聚類(lèi)方法在以空間信息處理為代表的眾多領(lǐng)域有著(zhù)廣泛的應用。特別是伴隨著(zhù)近來(lái)處理大規模數據集、可伸縮的聚類(lèi)方法的開(kāi)發(fā),它在空間數據挖掘研究子域日趨活躍。
【理工類(lèi)開(kāi)題報告】相關(guān)文章:
開(kāi)題報告格式及開(kāi)題報告的寫(xiě)法03-21
開(kāi)題報告03-02
開(kāi)題報告的格式03-26
工程開(kāi)題報告11-16
德育開(kāi)題報告12-08
開(kāi)題報告樣板03-10
開(kāi)題報告的范文11-15
開(kāi)題報告的樣本03-22
個(gè)人開(kāi)題報告11-27