行業(yè)背景
數(shù)據(jù)整合方案是數(shù)據(jù)整合的研究重點(diǎn),而數(shù)據(jù)倉庫整合方案是其中較為成熟的一種方案。隨著數(shù)據(jù)整合技術(shù)的發(fā)展,數(shù)據(jù)整合逐漸從單一的技術(shù)模式向流程、規(guī)則、方法等的綜合模式演進(jìn),并且還衍生出了多種綜合類型數(shù)據(jù)整合方案。今天主要給大家介紹下倉庫整合解決方案,下面一起來看看吧。
數(shù)據(jù)倉庫整合方案
數(shù)據(jù)倉庫(Data Warehouse)是一個面向主題的(Subject Oriented)、集成的(Integrate)、相對穩(wěn)定的(Non-Volatile)、反映歷史變化(Time Variant)的數(shù)據(jù)集合,用于支持管理決策。從數(shù)據(jù)倉庫的建立過程來看,數(shù)據(jù)倉庫是一種面向主題的整合方案,因此 首頁先應(yīng)該根據(jù)具體的主題進(jìn)行建模,然后根據(jù)數(shù)據(jù)模型和需求從多個數(shù)據(jù)源加載數(shù)據(jù)。由于不同數(shù)據(jù)源的數(shù)據(jù)結(jié)構(gòu)可能不同,因而在加載數(shù)據(jù)之前要進(jìn)行數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)整合,使得加載的數(shù)據(jù)統(tǒng)一到需要的數(shù)據(jù)模型下,即根據(jù)匹配、留存等規(guī)則,實(shí)現(xiàn)多種數(shù)據(jù)類型的關(guān)聯(lián)。這種方式的主要問題是當(dāng)數(shù)據(jù)更新頻繁時會導(dǎo)致數(shù)據(jù)的不同步,即使定時運(yùn)行轉(zhuǎn)換程序也只能達(dá)到短期同步,這種整合方案不適用于數(shù)據(jù)更新頻繁并且實(shí)時性要求很高的場合。
數(shù)據(jù)倉庫整合有哪些好處?
1.底層數(shù)據(jù)結(jié)構(gòu)的透明:為數(shù)據(jù)訪問(消費(fèi)應(yīng)用)提供了統(tǒng)一的接口,消 費(fèi)應(yīng)用無需知道:數(shù)據(jù)在哪里保存;源數(shù)據(jù)庫支持那種方式的訪問(XQuery,SQL);數(shù)據(jù)的物理結(jié)構(gòu);網(wǎng)絡(luò)協(xié)議等。
2.性能和擴(kuò)展性:數(shù)據(jù)整合把數(shù)據(jù)集成和數(shù)據(jù)訪問分成了兩個過程,因此 訪問時數(shù)據(jù)已經(jīng)處于準(zhǔn)備好的狀態(tài). 3.提供真正的單一數(shù)據(jù)視圖,數(shù)據(jù)視圖data view這個概念大家很容易理解, 數(shù)據(jù)整合(Data Consolidation)的優(yōu)勢是經(jīng)過了數(shù)據(jù)校驗(yàn)和數(shù)據(jù)清理,你看到的數(shù)據(jù)更加真實(shí),準(zhǔn)確,可靠
4.可重用性好:由于有了實(shí)際的物理存儲,數(shù)據(jù)可以為各種應(yīng)用提供可重 用的數(shù)據(jù)視圖,而不用擔(dān)心底層實(shí)際的數(shù)據(jù)源的可用性。
5.數(shù)據(jù)管控能力加強(qiáng): 管控是SOA里面重要的概念。數(shù)據(jù)整合(Data Consolidation)的優(yōu)勢是數(shù)據(jù)規(guī)則可以在數(shù)據(jù)加載,轉(zhuǎn)換中實(shí)施,保證了數(shù)據(jù)管控。