用JAVA和XML構建分布式系統

本文將用研究在不同計算機之間通訊與處理XML數據的分布式系統的構建方法,主要是運行在不同的虛擬機上的JAVA應用之間的XML通訊。
XML通訊
萬維網協會(World Wide Web Consortium, W3C)在XML規范中定義了XML的語法和語義。為了處理XML數據,XML文檔必須經過解析。W3C定義了文檔對象模型(DOM),它是應用程序員處理XML數據的接口。DOM已經有包括JAVA在內的許多語言的實現。JAVA應用程序可以通過DOM API來訪問XML數據。XML解析器將產生XML文檔的DOM表示。
![]() |
圖1說明了處理XML文檔的JAVA分布式應用的簡單模型。這個模型假設數據可以從諸如關系數據庫之類的數據源得到。JAVA代碼處理數據并最終產生DOM表示,這些代碼表示為圖中的處理器。
處理器代碼將DOM代表的XML數據傳給發送者。發送者是與接收者進行XML數據通訊的JAVA代碼。接收者JAVA代碼來接受XML數據,產生DOM表示的數據并把它傳送給另一個處理器。簡而言之,發送者和接收者抽象了DOM表示的XML數據的通訊。
發送者和接收者不是在同一個JAVA虛擬機上執行的。他們是通過分布式系統的構件來相連的。無論是接收者還是發送者都既是客戶端又是服務器端,兩者的數據傳輸都是雙向的。
Xbeans
就像將要看到的一樣,在本文中描述的發送者和接收者的三種實現方法都都是通過Xbeans來實現。Xbeans是一種接受XML數據作為輸入,處理這個輸入然后向下一個Xbeans輸出XML結果的軟件構件。Xbeans的輸入輸出都是XML的DOM文檔,亦即傳送給Xbeans的不是需要XML解析器解析的字符串,而是通過W3C的標準DOM API解析成了文檔對象。圖2說明了一個Xbeans。
![]() |
Xbeans是JavaBeans,支持封裝、重用、連接和客戶化Java代碼。通過適當的一些Xbeans和JavaBeans的設計工具,我們就能編很少的代碼構建非常有用的分布式應用。 Xbeans從IBM的XML的JAVA開發工具包而來,在其上作了少量修改以便更適合分布式的應用。Xbeans能夠從www.Xbeans.org的開放源碼項目中免費獲得。
實現發送方和接收方
下面將介紹用JAVA實現發送者和接收者的三種不同的方法。然后對每種方法作一個簡單的分析。
方法一:用標準的web 服務器
這種方法將只是簡單的將XML作為文本發送給遠程計算機上的web服務器。發送方必須將DOM表示的XML轉化為文本來與接收方進行通訊。然后,接受方必須將文本還原為DOM表示,如圖3:
![]() |
以下代碼段用HTTP來實現發送者。這里用到了IBM Java開發包中的DOMWriter類來實現DOM表示到文本XML表示的轉換。
public void documentReady(DOMEvent evt) throws XbeansException { try { URL receiver = new URL (getRemoteURL ()); URLConnection receiverConnection = receiver.openConnection(); receiverConnection.setDoOutput(true); file://向發送者打開一個輸出流然后發送文本形式的XML數據 OutputStream out = receiverConnection.getOutputStream(); DOMWriter writer = new DOMWriter(); writer.setPrintWriter(new PrintWriter(out)); writer.documentReady( new com.ibm.xml.xpk4j.dom.DOMEvent( this,evt.getDocument())); out.close(); // 為結果打開一個輸入流 BufferedReader in = New BufferedReader( new InputStreamReader(receiverConnection.getInputStream())); // 處理結果:"OK" 表示成功;"Exception" 表示輸入流串行化異常 ... in.close(); } catch (Throwable e) { e.printStackTrace(System.err); } } |
注意到以上的documentReady()方法用remoteURL屬性得到服務器上的CGI腳本的URL。為了與HTTP兼容,CGI腳本類用字符串"Content-type: text/html"封裝接收者的輸出。這個腳本然后調用服務器上的the receiverMain()方法。 Main()函數只是簡單的實例化接收者然后調用其receiveDocument()方法。
import org.xbeans.communication.stdio.receiver.*; public class receiverMain { static Bean theReceiver = new Bean(); public static void main(String[] args) { theReceiver.receiveDocument(); } } |
最后receiveDocument()方法的代碼段將重新生成DOM表示以便進一步處理。這里用到了IBM的XML解析器。
DOMParser parser = new DOMParser(); // 構造解析器 try { // 調用解析器 parser.parse(new InputSource(System.in)); } catch (Throwable e) { throw new XbeansException("","receiver","io error parsing incoming document", "io error parsing incoming document "+e); } file://將文檔傳向下一個bean DOMListener.documentReady(new DOMEvent(this,parser.getDocument())); |
方法二:通過JAVA遠程方法調用串行化文檔
這個方法通過JAVA遠程方法調用(JAVA RMI)和DOM串行化(serialization)來從發送者向接收者傳輸XML DOM 文檔。如圖4:
![]() |
以下代碼用JAVA遠程方法調用實現發送方與接受方的通訊.
public void documentReady(DOMEvent evt) throws XbeansException { if (DOMListener==null) { try { DOMListener = (DOMListener)Naming.lookup(getReceiverName()); } catch (Exception e) { throw new XbeansException( evt.getDocument().getNodeName(), "sender", "error obtaining remote receiver", "The name may be wrong or the network may be down."); } } DOMListener.documentReady(evt); } |
以下是接受方的JAVA 遠程方法調用的實現。setName()方法將接受這傳送給RMI注冊(registry),documentReady()方法僅僅將接收到的文檔傳送給下一個組件。
public void setReceiverName(String newName) { try { if (receiverName!=null) Naming.unbind(receiverName); receiverName = newName; Naming.rebind(receiverName, this ); } catch( Exception e ) { System.out.println( e ); } } public void documentReady(Document incomingDocument) throws RemoteException, XbeansException { if (DOMListener==null) { throw new XbeansException(incomingDocument.getNodeName(),"rmiReceiver", "next component not established", "The component needs to be configured."); } DOMListener.documentReady(new DOMEvent(this,incomingDocument)); } |
方法三:CORBA-IIOP
第三方法用CORBA-IIOP(CORBA over Internet Inter-ORB Protocol)來傳輸數據。對象管理組織(OMG)正在建議擴展接口定義語言(IDL)將XML數據類型包括進去。這樣,將來CORBA產品將能傳輸XML數據。如圖5所示:
![]() |
以下的OMG IDL給出了發送者和接收者CORBA實現的接口。
exception RemoteReceiverException { string remoteIdentifier; string documentName; string componentName; string message; string moreMessage; }; typedef sequence interface XMLReceiver { void documentReady(in byteArray serializedDocument) raises(RemoteReceiverException); }; |
以下代碼用JAVA串行化DOM和CORBA實現發送者。
public void documentReady(DOMEvent evt) throws XbeansException { Document documentToSend = evt.getDocument(); try { ByteArrayOutputStream bastream = new ByteArrayOutputStream(); ObjectOutputStream p = new ObjectOutputStream(bastream); p.writeObject(documentToSend); p.flush(); org.omg.CORBA.ORB orb = org.omg.CORBA.ORB.init( new String[0], System.getProperties()); XMLReceiver receiver = urlToObject(orb,getReceiverURL()); receiver.documentReady(bastream.toByteArray()); } catch (RemoteReceiverException rre) { throw new XbeansException(rre.remoteIdentifier, rre.documentName, rre.componentName, rre.message,rre.moreMessage); } catch (Throwable e) { throw new XbeansException("","sender", "error sending document "+e, "error sending document "+e); } } |
以下代碼用JAVA串行化DOM和CORBA實現接收者。
public void documentReady(byte[] serializedDocument)throws RemoteReceiverException { // 反串行化字節流 ByteArrayInputStream bais = new ByteArrayInputStream(serializedDocument); Document theDocument; try { ObjectInputStream ois = new ObjectInputStream(bais); theDocument = (Document)ois.readObject(); } catch(Throwable e) { throw new RemoteReceiverException(corbaName,"incoming document","receiver", "error deserializing document","error deserializing document"+e); } try { file://將文檔傳向監聽者 local.DOMListener.documentReady(new DOMEvent(this,theDocument)); } catch (XbeansException xbe) { throw new RemoteReceiverException( xbe.remoteIdentifier(), xbe.documentName(),xbe.componentName(), xbe.message(),xbe.moreMessage()); } } |
分析
下表總結了各種方法的優(+)缺(-)點:
WEB服務器 | 串行化的DOM | RMI | CORBA |
空間 | + | - | - |
時間 | + | - | - |
應用基礎 | + | - | - |
編程和執行模型 | - | + | + |
互操作性 | + | - | + |
測試表明,純文本表示的XML要比DOM串行化表示性能更好。同時,解析DOM和文本所用的時間也要比用JAVA直接串行化和法串行化所用的時間少。
標準的web服務器方式的優勢是其應用基礎要廣泛許多。CGI腳本能夠在絕大多數web服務器上運行,而且,接受方能夠很容易的通過URL標識。而對于RMI,則需要RMI注冊。CORBA的解決辦法則需要在服務器上安裝對象請求代理(Object Request Broker,ORB ),而且,CORBA發送者的實現使用的是一個URL的命名模式而不是接收者的CORBA對象引用,用一個字符串與一個URL相聯系,然后在客戶端轉化。
CORBA 和RMI支持JAVA 客戶端到JAVA服務器的解決方案。沒有CGI腳本也不需要從標準輸入中讀取編碼異常。而且,不需要在發送者每次用XML通訊時都啟動一個JAVA虛擬機。他們兩則均支持接收者的自動激活。
JAVA RMI方式只能在JAVA代碼之間工作,對于web服務器包括CORBA理論上能在任何編程語言之間通訊。對于JAVA串行化的DOM來說,即便是客戶端和服務器端均需要是JAVA代碼的要求不是問題,它還存在另外一個困難,即JAVA串行化要求客戶端和服務器運行的是相同的DOM實現。
結論
正如上面所述,有許多方法可以實現在JAVA分布式應用中發送XML數據,每一種方法的性能和互操作性都是不同的。重要的是應該把XML通訊從分布式應用邏輯中抽取出來。也就是,實現發送和接受XML的代碼應和應用邏輯的代碼中分離出來。通過把代碼打包成軟件組件,就能夠改變發送方和接受方的代碼而不會影響到應用其余實現。
資源連接
XML 規范: http://w3c.org/xml
OMG擴展IDL包括XML數據類型的參考規范:
http://www.omg.org/techprocess/meetings/schedule/XML_Value_RFP.html
文檔對象模型: http://www.w3c.org/DOM
Xbeans 開放源碼項目: http://www.xbeans.org/