大數(shù)據(jù)時(shí)代來(lái)臨 如何挖掘數(shù)據(jù)中的寶藏 |
發(fā)布時(shí)間: 2012/9/5 18:06:55 |
大數(shù)據(jù)時(shí)代悄然來(lái)臨
不是我不明白,這世界變化快12000年還是一張軟盤打天下的時(shí)代,短短十多年光景,硬盤的存儲(chǔ)容量已從4GB、16GB、32GB迅速攀升到1TB。原來(lái)僅有1.44MB的軟盤在當(dāng)時(shí)感覺(jué)存儲(chǔ)容量還是蠻大的,到現(xiàn)在硬盤容量躥升至1TB了,反而感覺(jué)存儲(chǔ)空間捉襟見(jiàn)肘,到底是哪里出現(xiàn)了問(wèn)題? 大數(shù)據(jù)!一語(yǔ)驚醒夢(mèng)中人,大數(shù)據(jù)時(shí)代已經(jīng)悄然來(lái)臨。隨著社交網(wǎng)絡(luò)的逐漸成熟,移動(dòng)帶寬迅速提升,云計(jì)算、物聯(lián)網(wǎng)應(yīng)用更加豐富。更多的傳感設(shè)備、移動(dòng)終端接入到網(wǎng)絡(luò),由此產(chǎn)生的數(shù)據(jù)及增長(zhǎng)速度迅速攀升。 一項(xiàng)由UnisohereResearch對(duì)531名獨(dú)立Oracle用戶進(jìn)行的調(diào)查發(fā)現(xiàn),90%的企業(yè)的數(shù)據(jù)量在迅速上漲,其中16%的企業(yè)的數(shù)據(jù)量每年增長(zhǎng)率達(dá)到50%或更高。不少企業(yè)已經(jīng)感受到失控的數(shù)據(jù)增長(zhǎng)對(duì)績(jī)效造成的沖擊,其中87%的受訪者將企業(yè)的應(yīng)用程序性能下降歸咎于不斷增長(zhǎng)的數(shù)據(jù)量。調(diào)研機(jī)構(gòu)IDC在2011年6月的報(bào)告則顯示,全球數(shù)據(jù)量在2011年已達(dá)到1.8ZB,在過(guò)去5年里增加了5倍。 1.8ZB是什么樣的概念呢?首先從二進(jìn)制上解讀一下,從我們最熟悉的GB開(kāi)始,1TB(TrillionByte)=1024GB;1PB(PetaByte)=1024TB;1EB(ExaByte)=1024PB;1ZB(ZettaByte)=1024 EB;1YB(YottaByte)=1024 ZB;1BB(BrontoByte)=1024YB。 再來(lái)直接形象地形容一下1.8ZB的數(shù)據(jù)量,如果把所有這些數(shù)據(jù)都刻錄存入普通DVD光盤里,光盤的高度將等同于從地球到月球的一個(gè)半來(lái)回也就是大約720000英里。相當(dāng)于每位美國(guó)人每分鐘寫3條Twitter微博,而且還要不停地寫2.6976萬(wàn)年,是不是很恐怖?這還不是最恐怖的,IDC還預(yù)測(cè)全球數(shù)據(jù)量大約每?jī)赡攴环?015年全球數(shù)據(jù)量將達(dá)到近8ZB,到2020年,全球?qū)⑦_(dá)到35ZB。 所謂的大數(shù)據(jù)最直白的理解是海量數(shù)據(jù),通常用來(lái)形容一個(gè)公司創(chuàng)造的大量非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)在下載到關(guān)系型數(shù)據(jù)庫(kù)用于分析時(shí)會(huì)花費(fèi)很多時(shí)間和金錢。調(diào)研機(jī)構(gòu)IDC認(rèn)為,某項(xiàng)技術(shù)要想成為大數(shù)據(jù)技術(shù),必須滿足IBM所描述的三個(gè)“V”條件,即多樣性(Variety)、大容量(Volume)和時(shí)效性高(Velocity)。多樣性是指數(shù)據(jù)應(yīng)包含結(jié)構(gòu)化的和非結(jié)構(gòu)化的數(shù)據(jù);大容量是指聚合在一起供分析的數(shù)據(jù)量必須是非常龐大的;時(shí)效性高則是指數(shù)據(jù)處理的速度必須很快。 大數(shù)據(jù)中的大價(jià)值 現(xiàn)在有很多通過(guò)大數(shù)據(jù)分析受益的經(jīng)典案例。在科研民生領(lǐng)域,美國(guó)的海嘯預(yù)警系統(tǒng)一直為人們津津樂(lè)道,去年3月11日日本大地震發(fā)生后僅9分鐘,美國(guó)國(guó)家海洋和大氣管理局(NOAA)就發(fā)布了詳細(xì)的海嘯預(yù)警。隨即,NOAA通過(guò)對(duì)海洋傳感器獲得的實(shí)時(shí)數(shù)據(jù)進(jìn)行計(jì)算機(jī)模擬,制作的海嘯影響模型便出現(xiàn)在YouTube等網(wǎng)站。大數(shù)據(jù)分析在指導(dǎo)人們有效規(guī)避自然災(zāi)害面前發(fā)揮了很大的作用。 而在商業(yè)領(lǐng)域,eBay則很好地起到了示范作用。eBay定義了超過(guò)500種類型的數(shù)據(jù),對(duì)顧客的行為進(jìn)行跟蹤分析,每天處理的數(shù)據(jù)量高達(dá)100PB,通過(guò)準(zhǔn)確分析用戶的購(gòu)物行為,達(dá)到了減少?gòu)V告投入、穩(wěn)定高端賣家、實(shí)現(xiàn)持續(xù)增長(zhǎng)的目的。 通過(guò)上述兩個(gè)案例不難看到,大數(shù)據(jù)分析的價(jià)值是非常大的。伴隨著傳統(tǒng)的商業(yè)智能系統(tǒng)向縱深應(yīng)用的拓展,企業(yè)也逐漸步入到大數(shù)據(jù)時(shí)代。傳統(tǒng)的標(biāo)準(zhǔn)化、結(jié)構(gòu)化的數(shù)據(jù)只占到15%左右,85%的數(shù)據(jù)來(lái)源于廣泛存在于社交網(wǎng)絡(luò)、物聯(lián)網(wǎng)、電子商務(wù)等中的非結(jié)構(gòu)化數(shù)據(jù)。這些非結(jié)構(gòu)化數(shù)據(jù)的產(chǎn)生往往伴隨著社交網(wǎng)絡(luò)、移動(dòng)計(jì)算和傳感器等新的渠道和技術(shù)的不斷涌現(xiàn)和應(yīng)用。 企業(yè)用來(lái)分析的數(shù)據(jù)越全面,分析的結(jié)果就越接近于真實(shí),因此,大數(shù)據(jù)具有很大的商業(yè)價(jià)值。大數(shù)據(jù)分析是企業(yè)在未來(lái)發(fā)展過(guò)程中必須面對(duì)的,大數(shù)據(jù)分析意味著企業(yè)能夠從這些新的數(shù)據(jù)中獲取新的洞察力,并將它與已知業(yè)務(wù)的各個(gè)細(xì)節(jié)相融合。只有那些能夠運(yùn)用這些新數(shù)據(jù)形態(tài)的企業(yè),方能打造可持續(xù)發(fā)展的競(jìng)爭(zhēng)優(yōu)勢(shì)。 淘金大數(shù)據(jù)時(shí)代 云計(jì)算和大數(shù)據(jù)是2012年IT業(yè)界密切關(guān)注,且又最為火熱的兩大關(guān)鍵詞,對(duì)于嗅覺(jué)相當(dāng)靈敏的IT業(yè)界,很多企業(yè)早已嗅出了商機(jī)。以投資Facebook而聞名的風(fēng)投公司AccelPartners認(rèn)為:大數(shù)據(jù)是信息技術(shù)未來(lái)發(fā)展的戰(zhàn)略走向,將催生下一代價(jià)值數(shù)萬(wàn)億美元的軟件企業(yè)。 大數(shù)據(jù)跟普通數(shù)據(jù)一樣,從產(chǎn)生到處理,再到價(jià)值提取,再到最后被消費(fèi)掉,都有一個(gè)過(guò)程,每個(gè)步驟中都存在著不同的商業(yè)需求,目前已經(jīng)有企業(yè)開(kāi)始深耕細(xì)作或正在跑馬圈地。 本文出自:億恩科技【mszdt.com】 服務(wù)器租用/服務(wù)器托管中國(guó)五強(qiáng)!虛擬主機(jī)域名注冊(cè)頂級(jí)提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |