SQL Server 2000使得以XML導出數據變得更加簡單,但在SQL Server 2000中導入XML數據并對其進行處理則有些麻煩。
如果你參考Books Online(BOL),你會發現有相關的條目,包括OPENXML以及 OPENROWSET。所有的這些例子都支持將XML文本作為已經聲明的變量,這對于經常處理文本的用戶來說非常方便,但對于希望在開發中讀取XML文件并進行相應處理的開發人員來說就不是這樣了。處理這樣的問題,或許最好從內到外來對其進行分析。
OPENXML是一個rowset函數(即返回一個rowset),它的工作方式類似于rowset函數OPENQUERY和OPENROWSET。使用OPENXML可以對XML數據執行JOINs操作而無需首先導入數據。你還可以將其同INSERT、SELECT、UPDATE以及DELETE等操作聯合使用。
然而,要使用OPENXML,你必須執行兩項OPENQUERY和OPENROWSET并不需要的任務。這兩項任務需要兩個系統存儲進程。
第一個是sp_xml_preparedocument,它將讀取特定的XML文本并將其內容提取到內存中。其語法如下:
|
具體參數如下:
@hdoc:指向某內存區域的句柄(從作用上看等同于一個指針),相關數據存放在這里。注意這是一個輸出變量,當該進程運行后,該變量將包含指向XML文件內容在內存地址的句柄。由于你需要在隨后使用此結果,因此要確保對其進行保存;
@xmltext:實際上你所希望處理的XML文本;
@xml_namespaces:為了正常操作你的XML數據所需要的任何名字空間索引(namespace references)。注意在這里出現的任何URL都需要用尖括號(<>)括起來;
假設所傳遞的這些參數都有效,并且XML文檔存在,那么你的XML數據就會被存放到內存中去。現在你就可以調用sp_xml_preparedocument,傳遞存放有XML文件的變量,然后執行OPENXML。語法如下:
|
注意:在本文中沒有足夠的文字來描述OPENXML所接收的參數。請參閱BOL以獲取更多信息。在Transact-SQL Reference中查找OPENXML。
現在我們已經到達了最后的步驟。所有剩下的工作就是導入一個實際的XML文件到SQL并進行處理(很奇快為什么所有的BOL示例都沒有涉及到這一關鍵的部分)。
(我必須感謝我的同事Billy Pang所給予的幫助。他幫助我解決這個問題,并給出了代碼——盡管出于本文需要我對代碼進行了裁減。謝謝Billy!)
基本的技巧是,將文件逐行按文本讀取。然后把所有讀取的行連接為一個大的VARCHAR變量。最后,將變量傳遞給前面所說的代碼。
以下就是讀取文件并將其內容存放到某變量的代碼:
|
現在在變量@FileContents變量中你已經獲得了文件的全部內容。所需要做的只是將變量通過@xmltext參數傳遞給sp_xml_preparedocument,然后再調用OPENXML。
有了這種解決辦法,對XML文檔進行各種處理就成為了可能。你可以將XML文檔同SQL表格連接在一起而無需導入數據,然后對這些數據進行INSERT、PDATE和DELETE等任何操作。