- 相關(guān)推薦
空間數據挖掘技術(shù)研究分析
摘要:隨著(zhù)空間數據采集技術(shù)的飛速發(fā)展,復雜多樣的空間數據日益膨脹,迫切需要更新數據挖掘的知識和方法。文章從空間數據挖掘的基本概念出發(fā),闡述了空間數據挖掘的類(lèi)型與過(guò)程,介紹了空間數據挖掘在GIS中的應用,分析了當前空問(wèn)數據挖掘面臨的問(wèn)題,并對空間數據挖掘技術(shù)的發(fā)展進(jìn)行了展望。
關(guān)鍵詞:空間數據挖掘;地理信息系統;研究分析
隨著(zhù)數據采集技術(shù)的成熟和普及,大量的空間數據通過(guò)遙感、地理信息系統、多媒體系統、醫學(xué)和衛星圖像等多種形式匯集成龐大而豐富的信息源。面對龐雜、繁多的數據類(lèi)型,空間數據挖掘技術(shù)應運而生,并在地理信息系統、遙感勘測、圖像處理、交通管理、環(huán)境研究等領(lǐng)域得到廣泛應用。
1 空間數據挖掘研究概述
空間數據挖掘(spatial Data Mining,簡(jiǎn)稱(chēng)SDM),是指從空間數據庫中提取用戶(hù)感興趣的空間模式、普遍關(guān)系、數據特征的過(guò)程?臻g數據挖掘技術(shù)綜合數據挖掘技術(shù)與空間數據庫技術(shù),可用于對空間數據的理解、空間關(guān)系和空間與非空間關(guān)系的發(fā)現、空間知識庫的構造以及空間數據庫的重組和查詢(xún)的優(yōu)化等,其根本目標是把大量的原始數據轉換成有價(jià)值的知識,發(fā)現大量的地學(xué)信息中所隱含的規則。
空間數據挖掘是計算機技術(shù)、數據庫應用技術(shù)和管理決策支持技術(shù)等多學(xué)科交叉發(fā)展的新興邊緣學(xué)科,一般來(lái)說(shuō),空間數據挖掘可分成空間分類(lèi)、空間聚類(lèi)、空間趨勢分析和空間關(guān)聯(lián)規則四類(lèi)?臻g分類(lèi)的目的是在空間數據庫對象的空間屬性和非空間屬性之間發(fā)現分類(lèi)規則,是近年來(lái)空間數據挖掘領(lǐng)域中比較活躍的一個(gè)方向,常用的方法是決策樹(shù)?臻g聚類(lèi)是在一個(gè)比較大的多維數據集中根據距離的度量找出簇或稠密區域,目前提出的空間聚類(lèi)方法有基于分割的方法、基于層次的方法、基于密度的方法和基于棚格的方法?臻g趨勢分析指離開(kāi)一個(gè)給定的起始對象時(shí)非空間屬性的變化情況,例如,當離城市中心越來(lái)越遠時(shí)經(jīng)濟形勢的變化趨勢,空間趨勢分析需要使用回歸和相關(guān)的分析方法?臻g關(guān)聯(lián)規則是指空間鄰接圖中對象之間的關(guān)聯(lián),空間關(guān)聯(lián)挖掘多采用逐步求精的優(yōu)化思想,即首先用一種快速的算法粗略地對初始空間數據庫進(jìn)行一次挖掘,然后再在裁剪過(guò)的數據庫上用代價(jià)高的算法進(jìn)行進(jìn)一步精化挖掘。
空間數據挖掘過(guò)程一般可分為數據篩選(消除原始數據的噪聲或不一致數據)、數據集成(將多種數據源組合在一起)、數據選擇(根據用戶(hù)的要求從空間數據庫中提取與空間數據挖掘相關(guān)的數據)、數據變換(將數據統一成適合挖掘的形式)、空間數據挖掘(運用選定的知識發(fā)現算法,從數據中提取用戶(hù)所需的知識)、模式評估(根據某種興趣度度量并識別表示知識的真正有趣的模式),知識表示(使用可視化技術(shù)和知識表示技術(shù),向用戶(hù)提供挖掘的知識)等階段(見(jiàn)圖1)?臻g數據挖掘實(shí)際上是一個(gè)“人引導機器,機器幫助人”的交互理解數據的過(guò)程。
2 空間數據挖掘在GIS中的應用
空間數據挖掘技術(shù)與地理信息系統(GIS)的結合具有非常廣泛的應用空間。數據挖掘與GIs集成具有三種模式:其一為松散耦合式,也稱(chēng)外部空間數據挖掘模式,這種模式基本上將GIS當作一個(gè)空間數據庫看待,在G IS環(huán)境外部借助其它軟件或計算機語(yǔ)言進(jìn)行空間數據挖掘,與GIS之間采用數據通訊的方式聯(lián)系。其二為嵌入式,又稱(chēng)內部空間數據挖掘模式,即在GIs中將空間數據挖掘技術(shù)融合到空間分析功能中去。第三為混合型空間模型法,是前兩種方法的結合,即盡可能利用GIS提供的功能,最大限度的減少用戶(hù)自行開(kāi)發(fā)的工作量和難度,又可以保持外部空間數據挖掘模式的靈活性。
利用空間數據挖掘技術(shù)可以從空間數據庫中發(fā)現如下幾種主要類(lèi)型的知識:普遍的幾何知識、空間分布規律、空間關(guān)聯(lián)規律、空間聚類(lèi)規則、空間特征規則、空間區分規則,空間演變規則、面向對象的知識。目前,這些知識已比較成熟地應用于軍事、土地、電力、電信、石油和天然氣、城市規劃、交通運輸、環(huán)境監測和保護、110和1 20快速反應系統等資源管理和城市管理領(lǐng)域。在市場(chǎng)分析、企業(yè)客戶(hù)關(guān)系管理、銀行保險、人口統計、房地產(chǎn)開(kāi)發(fā)、個(gè)人位置服務(wù)等領(lǐng)域也正得到廣泛關(guān)注與應用,實(shí)際上,它正在深入到人們工作和生活的各個(gè)方面。
3 空間數據挖掘面臨的問(wèn)題
(1) 多數空間數據挖掘算法是由一般的數據挖掘算法移植而來(lái),并沒(méi)有考慮空間數據存儲、處理及空間數據本身的特點(diǎn)?臻g數據不同于關(guān)系數據庫中的數據,它有其特有的空間數據訪(fǎng)問(wèn)方法,因而傳統的數據挖掘技術(shù)往往不能很好地分析復雜的空間現象和空間對象。
(2) 空間數據挖掘算法的效率不高,發(fā)現模式不精練。面對海量的數據庫系統,在空間數據挖掘過(guò)程中出現不確定性、錯誤模式的可能性和待解決問(wèn)題的維數都很大,不僅增大了算法的搜索空間,也增加了盲目搜索的可能性。因而必須利用領(lǐng)域知識發(fā)現、去除與任務(wù)無(wú)關(guān)的數據,有效地降低問(wèn)題的維數,設計出更有效的知識發(fā)現算法。
(3) 沒(méi)有公認的標準化空間數據挖掘查詢(xún)語(yǔ)言。數據庫技術(shù)飛速發(fā)展的原因之一就是數據庫查詢(xún)語(yǔ)言的不斷完善和發(fā)展,因此,要不斷完善和發(fā)展空間數據挖掘就必須發(fā)展空間數據挖掘查詢(xún)語(yǔ)言。為高效的空間數據挖掘奠定基礎。
(4) 空間數據挖掘知識發(fā)現系統交互性不強,在知識發(fā)現過(guò)程中很難充分有效地利用領(lǐng)域專(zhuān)家知識,用戶(hù)不能很好掌控空間數據挖掘過(guò)程。
(5) 空間數據挖掘方法和任務(wù)單一,基本上都是針對某個(gè)特定的問(wèn)題,因而能夠發(fā)現的知識有限。
(6) 空間數據挖掘與其他系統的集成不夠,忽視了GIS在空間知識發(fā)現過(guò)程中的作用。一個(gè)方法和功能單一的空間數據挖掘系統的適用范圍必然受到很多限制,目前開(kāi)發(fā)的知識系統僅局限于數據庫領(lǐng)域,如果要在更廣闊的領(lǐng)域發(fā)現知識,知識發(fā)現系統就應該是數據庫、知識庫、專(zhuān)家系統、決策支持系統、可視化工具、網(wǎng)絡(luò )等多項技術(shù)集成的系統。
上述問(wèn)題使得從空間數據庫中提取知識比從傳統的關(guān)系數據庫中提取知識更為困難,這給空間數據挖掘研究帶來(lái)了挑戰。因此,空間數據挖掘在未來(lái)的發(fā)展中,還有很多理論和方法有待深入研究。
4 空間數據挖掘的發(fā)展趨勢
(1)空間數據挖掘算法和技術(shù)的研究?臻g關(guān)聯(lián)規則挖掘算法、時(shí)間序列挖掘技術(shù)、空間同位算法、空間分類(lèi)技術(shù)、空間離群算法等是空間數據挖掘研究的熱點(diǎn),同時(shí)提高空間數據挖掘算法的效率也很重要。
(2) 多源空間數據的預處理?臻g數據內容包括數字線(xiàn)劃數據、影像數據、數字高程模型和地物的屬性數據,由于其本身的復雜性與數據采集的困難,空間數據中不可避免地存在著(zhù)空缺值、噪聲數據及不一致數據,多源空間數據的預處理就顯得格外重要。
(3)其他各種空間數據挖掘及其相關(guān)技術(shù)研究。如網(wǎng)絡(luò )環(huán)境下的空間數據挖掘、可視化數據挖掘、柵格矢量-體化空間數據挖掘、背景知識概念樹(shù)的自動(dòng)生成、基于空間不確定性(位置、屬性、時(shí)問(wèn)等) 的數據挖掘、遞增式數據挖掘、多分辨率及多層次數據挖掘、并行數據挖掘、遙感圖像數據庫的數據挖掘、多媒體空間數據庫的知識發(fā)現等。
5 小結
空間數據挖掘可從大型空間數據庫中提取感興趣和規律性的知識,可用于理解空間數據、發(fā)現空間數據與非空間數據的關(guān)系、建立空間知識庫、優(yōu)化查詢(xún),重組空間數據庫等,空間數據挖掘技術(shù)在廣度和深度上的不斷進(jìn)步, 也將使GIs集成系統朝著(zhù)智能化、網(wǎng)絡(luò )化、全球化與大眾化的方向發(fā)展?梢灶A見(jiàn),空間數據挖掘不僅會(huì )促進(jìn)空間科學(xué)、計算機科學(xué)的發(fā)展,而且必將增強人類(lèi)認識世界、改造世界的能力,從而更好地服務(wù)人類(lèi)社會(huì )。
【空間數據挖掘技術(shù)研究分析】相關(guān)文章:
基于聚類(lèi)分析的數據挖掘方法03-08
數據挖掘在CRM中的應用分析03-22
基于數據挖掘技術(shù)的交叉銷(xiāo)售分析12-08
基于顧客價(jià)值的需求,流動(dòng)網(wǎng)挖掘策略分析01-11
臨床醫學(xué)中數據挖掘技術(shù)的運用分析11-29
主流空間數據庫引擎技術(shù)分析和優(yōu)化方法研究03-12
淺論挖掘機液壓系統故障分析及解決措施03-08