DB2J2EE開發成本收益分析(二)
探究一下使用聯合數據庫管理系統技術開發需要整合來自不同數據源的servlet的優點和缺點。實際上必須做的就是設計、編碼并測試一系列的servlet,這些servlet需要在有聯合數據庫管理系統或者沒有的情況下執行相同的功能。
環境建立
構建幾個servlet,使用下面的軟件工作:
· WebSphere Studio, 包括一個WebSphere Application Server 5測試環境在內
· Oracle數據庫管理系統和相關的客戶軟件
· DB2數據庫管理系統和相關的客戶軟件
· Microsoft Excel電子表格
· Sun微系統JDBC/ODBC驅動程序(用于Java訪問Excel)
· DB2 Information Integrator(早期發行版本)和相關的客戶軟件
圖1圖解了我們全部的軟件體系結構。你可以看到,WebSphere Studio平臺被配置來與DB2 Information Integrator一起工作,DB2 Information Integrator也已被配置來訪問DB2 Universal Database ( UDB)、Oracle和Excel數據源。這個配置描述了本地數據訪問環境。

圖1、用于工程的軟件體系結構
應用程序方案
用于工作的業務方案包括了多個虛構的銷售公司的兼并案例。假定新的統一公司需要開發它的關鍵的業務數據的一個整合形式,這些數據以不同的格式保存在不同的系統上。此外,因為應用程序應該比兼并先期開發并需要支持,所以把數據留在本地平臺這很重要。 這個業務需要使得一個好的案例能夠反映支持需要跨這些不同的數據源的新應用程序的聯合數據庫管理系統技術的價值。
數據
使用TPC-H數據的子集用于工作和分布在多個數據源上的數據,來模擬一種多個零件分銷商組成一個單一的公司的情況。在我們的實例中,這些數據源包含DB2 UDB和Oracle數據庫管理系統,以及Excel電子表格。指定的TPC-H表是PART、PARTSUPP、SUPPLIER、NATION、CUSTOMER、ORDERS。對于不熟悉TPC-H數據庫的讀者,圖二中給出這些表的結構以及它們彼此之間如何關聯。 要獲取詳細信息,請參閱 http://www.tpc.org.

圖2我們用于我們工程的TPC-H數據庫模式子集。星號("*")指主鍵。
分布數據以便跨不同的數據源使用眾多的零件、供應商和客戶數據。我們這么做的原因是不同的分銷商可能共享相同的客戶、供應者和產品報價。比如說,雖然某個業務合作者可能從多于一個的分銷商處訂購零件,但是公司不會把相同的定單發到每個分銷商處。 這樣,雖然一些CUSTOMER信息在不同的數據源間是重復的,還是要指定用于這些客戶的ORDERS為not。
注意,雖然我們使用TPC-H模式的一部分用于我們的工作,但是我們不嘗試實現任何TPC標準檢查程序。我們選擇實現我們認為能夠反映我們工作的查詢。在下一節我們將詳細討論這個問題。