微軟SQL Server增加對Hadoop的支持 |
發(fā)布時(shí)間: 2012/7/28 13:48:28 |
在海量數(shù)據(jù)時(shí)代的大趨勢下,微軟增加了SQL Server大規(guī)模數(shù)據(jù)處理和并行數(shù)據(jù)倉庫平臺對開源Hadoop框架的支持。根據(jù)本周SQL Server團(tuán)隊(duì)的官方博客消息,配合微軟數(shù)據(jù)倉庫和Hadoop連接器的社區(qū)技術(shù)預(yù)覽版也將會很快面世。 海量數(shù)據(jù)主要來源于企業(yè)中日益增長的數(shù)據(jù),特別是Web流量等。微軟在其博客上表示“我們的客戶一直要求我們幫助其存儲、管理并分析結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),特別是在Hadoop環(huán)境中存儲的數(shù)據(jù)。” 微軟表示,隨著新連接工具的出現(xiàn),客戶將能夠在Hadoop、SQL Server和并行數(shù)據(jù)倉換環(huán)境下相互交換數(shù)據(jù)。 Hadoop是一個(gè)分布式系統(tǒng)基礎(chǔ)架構(gòu),由Apache基金會開發(fā)。是原Yahoo員工Doug Cutting根據(jù)Google發(fā)布的學(xué)術(shù)論文研究而來,并以Google開發(fā)的MapReduce編程模型為基礎(chǔ)。 圍繞Hadoop的越來越多的商業(yè)生態(tài)系統(tǒng)漸漸出現(xiàn),例如Cloudera公司就提供相關(guān)服務(wù)和專業(yè)的分布式框架。Forrester研究分析員James Kobielus表示鑒于數(shù)據(jù)倉庫商(如EMC和Teradata)已經(jīng)可以開始采用Hadoop,所以說微軟此舉是明智的。他補(bǔ)充說“越來越多的企業(yè)正在運(yùn)行Hadoop集群,他們希望能夠?qū)⑦@些系統(tǒng)中的數(shù)據(jù)發(fā)送到數(shù)據(jù)倉庫系統(tǒng)”。 但現(xiàn)在還沒有哪家廠商可以提供整套Hadoop服務(wù)。其中包括分布式、Hadoop相關(guān)項(xiàng)目的連接器(例如Cassandra數(shù)據(jù)庫)模塊化工具和其他組件等。 點(diǎn)擊查看大圖 毫無疑問,微軟像其他的廠商一樣,已經(jīng)正式提出Hadoop的計(jì)劃,但還沒有將發(fā)展的路線圖公布于眾。同時(shí)微軟支持Hadoop并沒有影響他們自己的研究項(xiàng)目。上個(gè)月微軟發(fā)布了Daytona項(xiàng)目,微軟描述該項(xiàng)目是一個(gè)“運(yùn)行在Windows Azure上的MapReduce”。主要是為了支持?jǐn)?shù)據(jù)分析和人工智能算法?芍С?jǐn)U展幾百服務(wù)器內(nèi)核并分析分布式數(shù)據(jù)。 最近,微軟宣布他們已經(jīng)發(fā)布了并行數(shù)據(jù)倉庫設(shè)備的第二次更新,此次功能的更新兼顧軟件組件和硬件組件。包括新的第三方BI(商業(yè)智能)連接器和SAP、Informatica以及Microstrategy提供的數(shù)據(jù)集成工具。此外,微軟表示基于戴爾硬件的并行數(shù)據(jù)倉庫的版本已經(jīng)有售,每TB的最低價(jià)格為1.2萬美元。 本文出自:億恩科技【mszdt.com】 服務(wù)器租用/服務(wù)器托管中國五強(qiáng)!虛擬主機(jī)域名注冊頂級提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |