- 相關(guān)推薦
關(guān)于XML的介紹
什么是XML?XML介紹
什么是XML?XML 開(kāi)發(fā)者們會(huì )告訴你,事實(shí)上XML并不是一種語(yǔ)言,而是一種用來(lái)定義其它語(yǔ)言的系統?赡苣阋呀(jīng)聽(tīng)過(guò),或許甚至自己嘗試過(guò)一些這樣的語(yǔ)言??比如微軟為推(push)技術(shù)所推出的頻道定義格式(Channel Definition Format)。W3C是互連網(wǎng)上一些公用標準的開(kāi)發(fā)者,他推出了一系列和XML相關(guān)的標準和草案。他們把XML描敘成“一種用來(lái)表達結構化數據的通用語(yǔ)法”。所謂結構化數據是指被標簽(tags)定義了其內容,意義和用法的數據。例如,在HTML的定義中,標簽所定義的文本,將會(huì )用一種特定的字體和大小所顯示出來(lái)。一個(gè)XML標簽會(huì )明確的確定一種信息: 標簽可能表示的是文檔的作者,而則可能包含了產(chǎn)品的價(jià)格。與HTML中標簽所不同的是:XML標簽的含義是自定義的,如果你愿意,可以用來(lái)表示作者信息,而用來(lái)表示產(chǎn)品價(jià)格。雖然這看起來(lái)會(huì )很別扭,但絕對是正確的。通過(guò)分離結構和數據,一份XML文檔能夠一經(jīng)寫(xiě)出,就能應用在多種不同的用途:在計算機屏幕上顯示出來(lái),或者顯示在手機屏幕上,又或者被轉到為盲人設計的語(yǔ)音設備上,等等,諸多功用,不一而足。它幾乎能夠工作在任何可能的通訊設備上。這時(shí)候,一個(gè)XML文檔的作用,已經(jīng)遠遠超出了當初你所以為的那樣,僅僅是用來(lái)顯示內容的簡(jiǎn)單文檔了。這樣,XML就能夠在除了互連網(wǎng)的其它地方也能夠一展身手。在一些大型的文檔制作商中,SGML是他們用了很多年的語(yǔ)言www.diannao114.cn,但是它實(shí)在是太復雜了,僅僅是定義就有400多頁(yè)。XML的出現也為他們創(chuàng )造了一些契機。事實(shí)上XML是SGML的一個(gè)精簡(jiǎn)了的子集,SGML的大部分工作都可以由XML來(lái)完成,而XML比起SGML來(lái)卻是簡(jiǎn)單了許多。當然,平臺無(wú)關(guān)的XML最初是為Web所設計的,它也將在在Web上產(chǎn)生最大的影響。DOM(Domument Object Model)是一個(gè)編程接口,他定義了在一個(gè)文檔中如何進(jìn)行數據存取的機制。XML能夠為Web所做的,很大程度上取決于它是如何同DOM(文檔對象模型)進(jìn)行交互。使用DOM,程序員可以用一種標準的方法來(lái)動(dòng)態(tài)的操作文檔的內容和相關(guān)的一些屬性。換句話(huà)說(shuō),程序員可以讓在一個(gè)瀏覽器的文檔對象樹(shù)中的一段內容進(jìn)行一些特定的動(dòng)作。例如:當把鼠標移到一小段文字上面時(shí),它會(huì )改變顏色。網(wǎng)景的Navigator和微軟 Internet Explorer都定義了個(gè)不相容的DOM,但是這兩個(gè)公司都宣布在他們下一個(gè)版本的瀏覽器中會(huì )支持W3C的標準DOM。這會(huì )給程序員帶來(lái)很多的方便。
什么是XML?列舉一下你所了解的XML技術(shù)及其應用
答:XML即可擴展標記語(yǔ)言。eXtensibleMarkupLanguage.標記是指計算機所能理解的信息符號,通過(guò)此種標記,計算機之間可以處理包含各種信息的文章等。如何定義這些標記www.diannao114.cn,即可以選擇國際通用的標記語(yǔ)言,比如HTML,也可以使用象XML這樣由相關(guān)人士自由決定的標記語(yǔ)言,這就是語(yǔ)言的可擴展性。XML是從SGML中簡(jiǎn)化修改出來(lái)的。它主要用到的有XML、XSL和XPath等。
Android 創(chuàng )建與解析XML(一)—— 概述Android 創(chuàng )建與解析XML(一)—— 概述
Android 是最常用的智能手機平臺,XML 是數據交換的標準媒介,Android 中可以使用標準的XML生成器、解析器、轉換器 API,對 XML 進(jìn)行解析和轉換。
XML,相關(guān)有DOM、SAX、JDOM、DOM4J、Xerces、JAXP等一堆概念,但是很多人總是會(huì )弄混他們之間的關(guān)系,這對我們理解XML文件的創(chuàng )建和解析很不利。要挑選一個(gè)適合在A(yíng)ndroid平臺上使用的XML解析方案,我們還是得先把這些概念厘清。
XML基本概念DOM(Document Object Model,文檔對象模型)和SAX(Simple API for XML,簡(jiǎn)單XML應用接口),是JAXP(Java API for XML Processing,Java XML處理的應用接口)定義的2種不同的對XML文檔進(jìn)行分析、處理的方法。
DOM方法是用標準對象模型表示 XML 文檔;SAX方法則使用事件模型來(lái)處理程序來(lái)處理XML。
JAXP完成了對SAX、DOM的包裝,它向應用程序提供針對DOM的DocumentBuilderFactory、 DocumentBuilder;以及針對SAX的SAXParserFactory、SAXParser抽象工廠(chǎng)類(lèi)。在Jave SE中JAXP對應javax.xml.parsers包,DOM對應org.w3c.dom,SAX對應org.xml.sax。
Xerces首先繼承并實(shí)現了javax.xml.parser包內的SAXParser、SAXParserFactory、DocumentBuilder、DocumentBuilderFactory等抽象類(lèi),并提供了JAXP中所定義的DOM、SAX(以及StAX,后面會(huì )介紹)這些XML解析方法的實(shí)現和相應的Parser。JDOM和DOM4J,是因為有人覺(jué)得W3C的DOM標準API太過(guò)難用而著(zhù)手開(kāi)發(fā)的替代API,它們和JAXP一樣都是對DOM、SAX的封裝,不過(guò)JDOM、DOM4J做了更多的事情,相當于上面提到JAXP接口+Xerces DOM實(shí)現部分。JDOM并沒(méi)有自己開(kāi)發(fā)Parser,所以還是需要利用Xerces的Parser部分,而DOM4J自帶一個(gè)名為Alfred2的Parser,當然也可以使用Xerces的Parser?雌饋(lái)JAXP具備更好的可移植性,即我們可以通過(guò)修改配置文件切換不同的DOM實(shí)現和SAX、DOM Parser,JDOM、DOM4J雖然也可以切換Parser,但是DOM實(shí)現是無(wú)法切換的。(參考: Java XML API 漫談 和 JAXP全面介紹)
XML創(chuàng )建與解析
XML創(chuàng )建主要四種方式:Dom、Sax、Pull、Dom4j
XML解析主要四種方式:Dom、Sax、Pull、Dom4j
其中,利用Dom、Sax、Pull、Dom4j創(chuàng )建的標準XML格式文件,可以由任何一種Dom、Sax、Pull、Dom4j解析方式進(jìn)行解析。
Android中解析XML
DOM解析器,是通過(guò)將XML文檔解析成樹(shù)狀模型并將其放入內存來(lái)完成解析工作的,然后對文檔的操作都是在這個(gè)樹(shù)狀模型上完成的。這個(gè)在內存中的文檔樹(shù)將是文檔實(shí)際大小的幾倍。這樣做的好處是結構清晰、操作方便,而帶來(lái)的麻煩就是極其耗費系統資源。SAX解析器,正好克服了DOM的缺點(diǎn),分析能夠立即開(kāi)始,而不是等待所有的數據被處理。而且,由于應用程序只是在讀取數據時(shí)檢查數據,因此不需要將數據存儲在內存中,這對于大型文檔來(lái)說(shuō)是個(gè)巨大的優(yōu)點(diǎn)。事實(shí)上,應用程序甚至不必解析整個(gè)文檔,它可以在某個(gè)條件得到滿(mǎn)足時(shí)停止解析。
DOM與SAX比較
下面的表格列出了SAX和DOM在一些方面的對照:
SAXDOM順序讀入文檔并產(chǎn)生相應事件,可以處理任何大小的XML文檔在內存中創(chuàng )建文檔樹(shù),不適于處理大型XML文檔。只能對文檔按順序解析一遍,不支持對文檔的隨意訪(fǎng)問(wèn)?梢噪S意訪(fǎng)問(wèn)文檔樹(shù)的任何部分,沒(méi)有次數限制。只能讀取XML文檔內容,而不能修改可以隨意修改文檔樹(shù),從而修改XML文檔。開(kāi)發(fā)上比較復雜,需要自己來(lái)實(shí)現事件處理器。易于理解,易于開(kāi)發(fā)。對開(kāi)發(fā)人員而言更靈活,可以用SAX創(chuàng )建自己的XML對象模型。已經(jīng)在DOM基礎之上創(chuàng )建好了文檔樹(shù)。通過(guò)對SAX和DOM的分析,它們各有自己的不同應用領(lǐng)域:
SAX適于處理下面的問(wèn)題:對大型文檔進(jìn)行處理。只需要文檔的部分內容,或者只需要從文檔中得到特定信息。想創(chuàng )建自己的對象模型的時(shí)候。DOM適于處理下面的問(wèn)題:
需要對文檔進(jìn)行修改需要隨機對文檔進(jìn)行訪(fǎng)問(wèn),例如XSLT解析器。
DOM和SAX的應用場(chǎng)景
1、數據修改:如果打算對數據作出更改并將它輸出為 XML,那么在大多數情況下,DOM 是適當的選擇。并不是說(shuō)使用 SAX 就不能更改數據,但是該過(guò)程要復雜得多,因為您必須對數據的一份拷貝而不是對數據本身作出更改。
2、數據容量: 對于大型文件,SAX 是更好的選擇。
3、數據使用:如果只有數據中的少量部分會(huì )被使用,那么使用 SAX 來(lái)將該部分數據提取到應用程序中可能更好。 另一方面,如果您知道自己以后會(huì )回頭引用已處理過(guò)的大量信息,那么 SAX 也許不是恰當的選擇。
4、速度要求: SAX 實(shí)現通常要比 DOM 實(shí)現速度更快;谏厦娴姆治,在基于A(yíng)ndroid系統的內存和CPU資源比較有限的手持設備上,只要我們不需要修改XML數據或者隨機的訪(fǎng)問(wèn)XML數據,SAX盡管可能需要更多的編碼工作,但是為了更小的內存和CPU消耗,還是值得的。另外,Android SDK中已經(jīng)包含了JAXP對應的javax.xml.parsers包,SAX對應org.xml.sax,DOM對應的org.w3c.dom包,加上Android還提供了android.sax這樣的包來(lái)方便SAX Handle的開(kāi)發(fā),基于JAXP和SAX這樣的標準方法來(lái)開(kāi)發(fā)不僅復雜度不高,即使出現問(wèn)題在討論組中尋求解決方案也是比較容易的。(參考: 使用 SAX 處理 XML 文檔 和 DOM SAX JAXP DOM4J JDOM xerces解析器)Android中解析XML實(shí)現
基于上面的分析,采用JAXP+SAX的方案是我比較看好的。我們首先需要又一個(gè)SAXParserFactory的實(shí)例,然后從工廠(chǎng)中得到一個(gè)SAXParser實(shí)例,進(jìn)而獲取一個(gè)XMLReader;接下來(lái)新建一個(gè)Handler類(lèi)繼承自SAX Helpler的DefaultHandler,并實(shí)現startDocument()、startElement()、endElement()以及endDocument()等方法,并把這個(gè)Handler作為XMLReader的Content Handler;最后以帶解析的XML文檔為參數調用XMLReader的parse方法即可。具體的代碼參考:Android 上使用 XML 和 Android 3.0 平臺上創(chuàng )建和解析 XML
1、Android系統中的DOM和SAX實(shí)現Android SDK中包含了JAXP對應javax.xml.parsers包,SAX對應的org.xml.sax,DOM對應的org.w3c.dom包,所以我們就已經(jīng)有了XML解析所需的JAXP——對SAX和DOM的封裝(抽象類(lèi))以及SAX和DOM接口類(lèi),但是對于JAXP抽象類(lèi)的實(shí)現,以及DOM和SAX接口類(lèi)的實(shí)現在哪里呢?是和Java SE 5.0一樣用了Xerces嗎? 不!通過(guò)查看Android 1.5的源代碼,我看到這部分的代碼來(lái)自Apache Harmony這個(gè)開(kāi)源的Java SE實(shí)現,位于./dalvik/libcore/xml/src/main/java/org/apache/harmony/xml目錄。這里包含有一個(gè)完整的DOM實(shí)現(dom目錄),對于javax.xml.parser下的抽象類(lèi)的實(shí)現(parser目錄),以及對于SAX接口類(lèi)的實(shí)現(除此以外還包括對XMLPullParser接口的實(shí)現)。2、XmlPull 和 KXML2XmlPull解析器,提供了資源有限的環(huán)境(如J2ME)應用使用的XML解析API,XPP提供了非常簡(jiǎn)單的接口——包含一個(gè)接口、一個(gè)異常、一個(gè)建立解析器的factory。它采用了類(lèi)似JAXP的工廠(chǎng)模式,把接口設計和實(shí)現分離,KXML2就是一個(gè)為J2ME環(huán)境優(yōu)化的一個(gè)實(shí)現。在A(yíng)ndroid SDK中,已經(jīng)包含了XmlPull(org.xmlpull.v1包)以及它的一個(gè)AddOn——SAX2 Driver——它使得我們可以通過(guò)SAX2的API來(lái)操縱XmlPull Parser。另外,通過(guò)sourcecode,我們可以看到Android SDK中的XmlPull的實(shí)現是KXML2,位于./dalvik/libcore/xml/src/main/java/org/kxml2目錄。Apache Harmony的目錄中同樣有一個(gè)ExpatPullParser類(lèi)實(shí)現了XMLPullParser接口,但是卻沒(méi)有XmlSerializer接口的實(shí)現,所以只能說(shuō)Android中的Harmony也部分實(shí)現了XmlPull API。XmlPull+KXML2是下一步我要實(shí)踐的方案,到時(shí)候還得學(xué)習一下如何“公平”的比較兩者的性能。3、StAX盡管Android中還沒(méi)有提供相應的支持,但是Streaming API for XML (StAX) 作為用Java語(yǔ)言處理 XML的最新標準,無(wú)論從性能還是可用性上都有出色的表現。它不僅提供了一個(gè)快捷、易用、占用內存少的 XML 解析器,它還提供了過(guò)濾器接口,允許程序員向應用程序業(yè)務(wù)邏輯隱藏不需要的文檔細節。感興趣的朋友可以看一看下面的文章。
使用 StAX 解析 XML,第 1 部分: Streaming API for XML (StAX) 簡(jiǎn)介
使用 StAX 解析 XML,第 2 部分: 拉式解析和事件
使用 StAX 解析 XML,第 3 部分: 使用定制事件和編寫(xiě) XML
XML的國際化問(wèn)題
XML的國際化問(wèn)題XML的出現,使得網(wǎng)站的國際化變得空前的容易。和Java一樣,XML也是使用的Unicode(ISO 10646)作為其編碼標準,這是的網(wǎng)站建設者們能夠很容易的寫(xiě)出各國的文字和符號,而不必過(guò)多的擔心亂碼的問(wèn)題。Unicode 包括了所有的ASCII字符,以及簡(jiǎn)體中文,繁體中文,日文,韓文,希臘文等等。在XML中甚至可以允許有混合的編碼出現,例如,一個(gè)顯示中文的網(wǎng)頁(yè)可以引用一個(gè)德文的單詞,而不必擔心出現亂碼。開(kāi)發(fā)者不需要專(zhuān)門(mén)為了Unicode而在去學(xué)習什么新的東西,網(wǎng)頁(yè)一經(jīng)寫(xiě)好后,在客戶(hù)端的瀏覽器中顯示時(shí),瀏覽器會(huì )自動(dòng)的使用合適的字符集把網(wǎng)頁(yè)顯示出來(lái)。
XML對于超鏈接有那些改進(jìn)?
XML對于超鏈接有那些改進(jìn)?XML對HTML的超鏈接做了一些改進(jìn),增加了一些特性,包括能夠建立“智能”鏈接,可以省去不少手工編寫(xiě)JavsScript的麻煩。在XML中,鏈接是作為一個(gè)對象出現的,可以向操作任何的其它對象那樣,對超鏈接進(jìn)行方便的操作。原來(lái)的關(guān)于鏈接的的標準??XLL,XML鏈接語(yǔ)言(XML Linking Language)現在被分為兩種新的標準:Xpointer和XLink.Xpointer:在HTML中,可以通過(guò)書(shū)簽鏈接到一個(gè)頁(yè)面的任何地方。通過(guò)Xpointer你將能夠“尋址到(address to)”(而不是“鏈接到(link to)”)其他頁(yè)面的任何一部分的內容。顯然的,這對于在文檔引用方面是非常有用的。Xlink:當用戶(hù)點(diǎn)擊了HTML中的一個(gè)超鏈接后,當前的網(wǎng)頁(yè)被一個(gè)新的網(wǎng)頁(yè)所替代。Xlink能夠讓W(xué)eb開(kāi)發(fā)者為鏈接這個(gè)對象添加一些動(dòng)作(behaviors)。例如:在現在你必須用JavaScript來(lái)實(shí)現把鏈接的網(wǎng)頁(yè)在一個(gè)新的窗口中顯示出來(lái),但Xlink通過(guò)給鏈接對象添加了一些行為,實(shí)現彈出窗口容易到只是簡(jiǎn)單的調用對象的方法而已。其他的一些有用的應用,像彈出的警告對話(huà)框,需要用戶(hù)做出確認的對話(huà)框等等,通過(guò)Xlink的對象機制都可以很容易地實(shí)現。但現在,我們還都必須求助于腳本編程采能夠解決。對于一系列相關(guān)的鏈接,XML能夠讓W(xué)eb開(kāi)發(fā)者創(chuàng )建擴展鏈接(Extended Links)來(lái)方便的實(shí)現像www.webring.com這樣的網(wǎng)站或網(wǎng)頁(yè),把一些相同主題的網(wǎng)頁(yè)自動(dòng)的鏈接在一起,F在實(shí)現這個(gè)功能需要使用到CGI腳本,但是擴展鏈接將提供標準的方法來(lái)建立資源之間的關(guān)聯(lián),F在還有一些問(wèn)題需要得到進(jìn)一步的討論,特別是在“行為”機制方面還有一些工作要作。但這并不妨礙在不久的將來(lái),Xpinter和Xlink作為新的標準被廣泛使用。
【XML的介紹】相關(guān)文章:
XML認證元素類(lèi)型聲明05-28
關(guān)于IBM XML認證考試的要點(diǎn)01-13
XML語(yǔ)言在網(wǎng)頁(yè)中有哪些應用07-25
用Java如何處理XML數據10-22
關(guān)于XML方面的面試題及答案05-30
關(guān)于XML技術(shù)在數據交換中的應用09-28
自我介紹與介紹別人的禮儀08-28
葉公好龍的英文介紹08-20
話(huà)劇術(shù)語(yǔ)介紹05-04