通常意義上講,大數(shù)據(jù)(Big Data)包括海量交易數(shù)據(jù)(結(jié)構(gòu)化數(shù)據(jù))和海量交互數(shù)據(jù)集(非結(jié)構(gòu)化數(shù)據(jù))在內(nèi)的所有數(shù)據(jù)集,其規(guī)模(PB級別)或復(fù)雜程度超出了常用技術(shù)按照合理的成本和時限捕捉、管理及處理這些數(shù)據(jù)集的能力。
傳統(tǒng)的企業(yè)用戶的海量數(shù)據(jù)分析處理系統(tǒng)目前絕大多數(shù)都采用高性能主機(jī)+高端存儲的Shared-Everything架構(gòu),隨著數(shù)據(jù)來源的極大豐富和數(shù)據(jù)量的急劇增加,傳統(tǒng)的系統(tǒng)架構(gòu)已顯露出技術(shù)瓶頸和成本性價比的問題,簡而言之,不僅實現(xiàn)成本高昂且更關(guān)鍵在于無法解決客戶所關(guān)心的問題。而與此同時,互聯(lián)網(wǎng)公司等新興行業(yè)普遍采用的分布式Shared-Nothing大數(shù)據(jù)處理架構(gòu)已經(jīng)證明了大數(shù)據(jù)分析處理行業(yè)可以有著完全不同的演進(jìn)方向。
通常意義上講,大數(shù)據(jù)(Big Data)包括海量交易數(shù)據(jù)(結(jié)構(gòu)化數(shù)據(jù))和海量交互數(shù)據(jù)集(非結(jié)構(gòu)化數(shù)據(jù))在內(nèi)的所有數(shù)據(jù)集,其規(guī)模(PB級別)或復(fù)雜程度超出了常用技術(shù)按照合理的成本和時限捕捉、管理及處理這些數(shù)據(jù)集的能力。
傳統(tǒng)的企業(yè)用戶的海量數(shù)據(jù)分析處理系統(tǒng)目前絕大多數(shù)都采用高性能主機(jī)+高端存儲的Shared-Everything架構(gòu),隨著數(shù)據(jù)來源的極大豐富和數(shù)據(jù)量的急劇增加,傳統(tǒng)的系統(tǒng)架構(gòu)已顯露出技術(shù)瓶頸和成本性價比的問題,簡而言之,不僅實現(xiàn)成本高昂且更關(guān)鍵在于無法解決客戶所關(guān)心的問題。而與此同時,互聯(lián)網(wǎng)公司等新興行業(yè)普遍采用的分布式Shared-Nothing大數(shù)據(jù)處理架構(gòu)已經(jīng)證明了大數(shù)據(jù)分析處理行業(yè)可以有著完全不同的演進(jìn)方向。









