岳能科技在東北大學(xué)大數(shù)據(jù)聯(lián)合實(shí)驗(yàn)中心,基于新能源企業(yè)的海量數(shù)據(jù)及數(shù)據(jù)特性搭建Hadoop及Spark框架的大數(shù)據(jù)處理平臺(tái),為新能源企業(yè)提供基于大數(shù)據(jù)的精準(zhǔn)的數(shù)據(jù)分析、數(shù)據(jù)決策服務(wù)。
大數(shù)據(jù)平臺(tái)優(yōu)勢(shì):
根據(jù)業(yè)務(wù)需求彈性伸縮,彈性擴(kuò)展資源
可線性擴(kuò)充存儲(chǔ)容量或提高處理性能,只需要簡(jiǎn)單地向集群中增加機(jī)器。有效解決企業(yè)由于數(shù)據(jù)增長(zhǎng)導(dǎo)致的處理性能緩慢或頻繁遷移數(shù)據(jù)的問題。
實(shí)時(shí)存儲(chǔ)引擎
采用列式數(shù)據(jù)庫(kù)實(shí)時(shí)存儲(chǔ)海量數(shù)據(jù),支持實(shí)時(shí)數(shù)據(jù)查詢、歷史數(shù)據(jù)查詢等API接口。
統(tǒng)一數(shù)據(jù)處理平臺(tái)
基于YARN資源管理框架,可在同一份數(shù)據(jù)集上運(yùn)行多種并行計(jì)算,實(shí)時(shí)流處理、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等,滿足企業(yè)多部門數(shù)據(jù)和計(jì)算資源統(tǒng)一管理的需求。
實(shí)時(shí)流數(shù)據(jù)處理和分析
分布式實(shí)時(shí)流處理引擎提供強(qiáng)大的流計(jì)算表達(dá)能力,可支持復(fù)雜的實(shí)時(shí)處理邏輯,滿足企業(yè)實(shí)時(shí)報(bào)警,實(shí)時(shí)展示等應(yīng)用需求。
高速數(shù)據(jù)分析
基于Spark平臺(tái),滿足數(shù)據(jù)交互式分析和挖掘需求。
機(jī)器學(xué)習(xí)算法庫(kù)
回歸算法、聚類算法、關(guān)聯(lián)規(guī)則、屬性篩選、推薦算法
超高性價(jià)比
采用普通商用服務(wù)器構(gòu)建集群,最大程度降低成本。
數(shù)據(jù)源

數(shù)據(jù)探索

數(shù)據(jù)處理

分析建模

評(píng)估

部署