- 相關(guān)推薦
地理信息數據錄入的數據質(zhì)量控制研究
【摘要】 隨著(zhù)地理信息技術(shù)的發(fā)展,針對空間數據庫的應用越來(lái)越廣泛,空間數據庫中的數據源包括各種異構的可操作的數據庫及其他數據。數據源中可能包含地形圖數據、管線(xiàn)數據、氣象數據、人口數據、噪聲數據、重復數據和不一致數據。以上數據的生產(chǎn)過(guò)程和質(zhì)量,常常只是對數據的生產(chǎn)者來(lái)說(shuō)是透明的,而對數據的使用者卻不透明,這樣必然導致數據生產(chǎn)過(guò)程中大量的重復采集數據的工作。為防止造成大量的人力、物力等資源的浪費,關(guān)于數據共享的研究成為現代GIS技術(shù)的熱點(diǎn)問(wèn)題,然而這些地理信息數據要實(shí)現在網(wǎng)絡(luò )上共享,就要解決目前地理信息數據不同格式集成的問(wèn)題,更進(jìn)一步說(shuō),數據的質(zhì)量問(wèn)題是實(shí)現集成的根本因素,因此,地理信息數據共享問(wèn)題的研究與地理信息數據的質(zhì)量有直接關(guān)系。所以實(shí)現地理數據集成的首要問(wèn)題是控制地理信息數據的質(zhì)量。論文本著(zhù)精簡(jiǎn)實(shí)用的原則,設計面向對象約束條件的數據特征模型來(lái)對不同格式的原始數據進(jìn)行質(zhì)量檢查和質(zhì)量加強。這個(gè)面向對象的數據質(zhì)量檢查模型,可以通過(guò)對要素關(guān)系、行為和有效規則的定義來(lái)實(shí)現對現實(shí)世界系統更好地表達和描述。它必須對任何兩個(gè)特征之間所具備的聯(lián)系、每個(gè)特征所允許的聯(lián)系的個(gè)數,任何需要的屬性數值或者幾何約束和特征操作,以及各種有效法則,比如屬性域、應用語(yǔ)義關(guān)系和拓撲幾何關(guān)系規則等等。然后利用ESRI公司的Geodatabase這種已有的能夠支持特征關(guān)系、行為和規則定義的高級特征模型來(lái)演示這種面向對象思想的數據檢查模型是如何對不同格式的原始地理數據質(zhì)量進(jìn)行控制檢查和約束加強。為了實(shí)現這種基于對數據屬性設定約束條件思想的的表達以及原有的仍然有效的歷史地理數據的集成、共享,本論文把數據質(zhì)量檢查模型內部的基本幾何元素、屬性域、關(guān)系類(lèi)以及拓撲關(guān)系類(lèi)用GML模式進(jìn)行了編碼。這也為能夠把海量原始地理空間數據(數據庫文件或文檔)進(jìn)一步用編程語(yǔ)言轉換成GML文檔提供了檢驗標準。在轉換到GML這種能表達各種數據,并且可以在數據庫間非常容易進(jìn)行交換的格式后,海量原始地理信息數據也就實(shí)現了最大意義上的地理數據的集成和共享。
【Abstract】 Along with the development of GIS, more and more data are produced. But magnanimous historical Geo-data and new-produced Geo-data are being wasted without efficient disposal and using. Because there are relative obturating among technologies of different GIS and different requests on Geo-data from different specialties, the spatial data produced by different departments with individual method is stored in different medium . As we all know, if we want to realize the real data sharing, we must solve the bottle-neck problem of data integration .In addition, there is another key factor as Geo-data quality which can influence the realization of Geo-data sharing. As a result, the research of Geo-data sharing has something to do with the quality of spatial data. So we must ensure the quality of Geo-data before we integrate and share the Geo-data.The reliability of the historical Geo-data which is mostly produced by digitalization usually is unknown to the users because the original material and relative information may not be available to users. this paper designs the constraint-based Data quality check model which includes three parts: attribute domain, relationship class and topology class.Then, select Geodatabase that can support relationships, behaviors and validation rules to demonstrate how the constraint-based AFM check and control the Geo-data application quality .In this paper, different validation rules are used to check and control the quality of Geo-data. In addition, GML Schema-based spatial data is the important approach for integrating and sharing spatial data and the use of GML is useful for the realization of distributed GIS in addition to the key technology for solving WebGIS problem.
【關(guān)鍵詞】 約束條件; 數據質(zhì)量檢查模型; 數據集成; 共享; GML模式
【Key words】 CONSTRAINED CONDITION; DATA QUALITY CHECK MODEL; DATA INTEGRATION; SHARING; GEOGRAPHY MARKUP LANGUAGE SCHEMA
地理信息數據錄入的數據質(zhì)量控制研究
摘要 5-6
ABSTRACT 6
1 地理信息系統發(fā)展現狀 9-17
1.1 論文選題背景和研究意義 9-14
1.1.1 國內外空間基礎數據庫組成及應用現狀 9-10
1.1.2 地理數據是GIS 系統的關(guān)鍵因素 10
1.1.3 不斷積累增加的海量地理數據 10-12
1.1.4 數據格式轉換模式中的質(zhì)量約束與加強 12-13
1.1.5 空間基礎數據共享平臺建設 13-14
1.2 研究的主要目的和內容 14-15
1.2.1 研究的主要目的 14
1.2.2 論文的主要內容 14-15
1.3 實(shí)現方法 15-17
1.3.1 從現實(shí)世界抽象到地理要素集合的數字化轉換模型 15
1.3.2 從基于約束的數據模型研究到設計數據質(zhì)量檢查模型 15
1.3.3 通過(guò)Geodatabase 定義屬性域及規則來(lái)檢查和加強空間數據質(zhì)量 15-16
1.3.4 用GML Schema 表達數據模型 16-17
2 數據質(zhì)量檢查模型的研究背景和現狀 17-25
2.1 數據模型 17-19
2.1.1 數據模型概述 17
2.1.2 現代GIS 發(fā)展對數據模型提出新的要求 17-19
2.2 基于約束規則數據模型的提出 19-21
2.2.1 早期的Coverage 模型 19-20
2.2.2 ESRI 的Geodatabase 20-21
2.3 地理數據質(zhì)量的描述 21-23
2.3.1 數據質(zhì)量的決定意義 21-22
2.3.2 關(guān)于地理數據質(zhì)量的描述框架 22-23
2.4 傳統的數據質(zhì)量檢查和控制措施 23-25
2.4.1 傳統GIS 數據的質(zhì)量檢查和控制措施 23
2.4.2 傳統GIS 數據的質(zhì)量檢查控制方法的弊端 23-25
3 地理數據質(zhì)量檢查模型的設計和應用 25-42
3.1 數據檢查模型的設計 25-35
3.1.1 屬性的定義 25-27
3.1.2 關(guān)系類(lèi)的定義 27-30
3.1.3 拓撲關(guān)系類(lèi)的定義 30-35
3.2 GEODATABASE在地理數據質(zhì)量檢查和加強中的應用 35-42
3.2.1 屬性數據質(zhì)量檢查和控制 35-37
3.2.2 利用拓撲關(guān)系規則來(lái)檢查和控制空間數據的空間分布正確性 37-42
4 用GML SCHEMA 實(shí)現數據檢查模型 42-58
4.1 XML 概述 43-44
4.1.1 XML 技術(shù) 43
4.1.2 XML 對萬(wàn)維網(wǎng)空間數據技術(shù)產(chǎn)生的影響 43-44
4.2 GML 概述 44-45
4.2.1 GML 的優(yōu)勢 44-45
4.2.2 GML 模型 45
4.3 數據檢查模型中基本幾何要素的GML 模式編碼 45-51
4.3.1 數據檢查模型中基本幾何要素的編碼 45-49
4.3.2 特征編碼 49-51
4.4 數據檢查模型的GML 表達 51-58
4.4.1 屬性域約束的GML 編碼 51
4.4.2 關(guān)系類(lèi)約束的GML 編碼 51-55
4.4.3 拓撲關(guān)系類(lèi)的GML 編碼 55-58
5 結論與展望 58-61
5.1 論文結論 58-59
5.2 展望 59-61
參考文獻 61-63
致謝 63
【地理信息數據錄入的數據質(zhì)量控制研究】相關(guān)文章:
探討元數據的地理信息服務(wù)方式03-02
淺談圖書(shū)館館藏書(shū)目數據的質(zhì)量控制11-27
JDBC數據庫編程的研究03-15
基于GPS的船舶數據模擬系統的研究03-07
對數據通信技術(shù)的研究03-19