VMware范承工:數(shù)據(jù)庫向數(shù)據(jù)云的演變 |
發(fā)布時間: 2012/8/25 15:41:30 |
在2012年8月8日下午舉行的VMware & EMC大數(shù)據(jù)云高峰論壇上,VMware全球高級副總裁范承工分享數(shù)據(jù)管理技術(shù)的變遷時表示,數(shù)據(jù)、云及云的使用者的變化帶來的三大趨勢催生了將與傳統(tǒng)數(shù)據(jù)庫長期共存的數(shù)據(jù)云,而虛擬化技術(shù)和開源軟件則將架起兩方共同和諧生存的橋梁。
在當(dāng)前大數(shù)據(jù)如火如荼的背景下,VMware和EMC雙方聯(lián)手舉辦此次論壇,共同就把握云計算與大數(shù)據(jù)技術(shù)的發(fā)展趨勢,結(jié)合Hadoop等大數(shù)據(jù)技術(shù)與云計算所具有的諸多優(yōu)勢,介紹了其完整的大數(shù)據(jù)云解決方案,并分享了諸多客戶成功案例。 范承工從技術(shù)角度,分析了數(shù)據(jù)管理技術(shù)變遷的五大趨勢,數(shù)據(jù)獲取、分析方式的轉(zhuǎn)變,以及VMware在云計算與大數(shù)據(jù)方面的解決方案。本文將為您介紹這五大趨勢,以及五大趨勢可能帶來的市場格局變化。 三大趨勢催生數(shù)據(jù)云 數(shù)據(jù)庫是現(xiàn)在最領(lǐng)先的一個數(shù)據(jù)管理模式,它可以把數(shù)據(jù)進(jìn)行很好的歸類,關(guān)系型數(shù)據(jù)庫可以把數(shù)據(jù)組織起來,進(jìn)行很快的檢索,而且能夠進(jìn)行交易型的處理。正因為關(guān)系型數(shù)據(jù)庫的產(chǎn)生,使得現(xiàn)在很多的應(yīng)用都能夠非常順利的進(jìn)行開發(fā)。 而在過去10幾年里,數(shù)據(jù)倉庫有了非?斓陌l(fā)展,可以以比較大的數(shù)量進(jìn)行深層次的技術(shù)發(fā)掘,在數(shù)據(jù)庫技術(shù)底下,為客戶提供更高的價值。 這些意味著,用戶很難把數(shù)據(jù)庫換掉而不換掉上面的應(yīng)用,如果把數(shù)據(jù)從一種數(shù)據(jù)庫遷移到另外一種數(shù)據(jù)庫,不是很容易的事情。 不過,范承工認(rèn)為,在過去5年里面,這種情況有一些改變。他表示,有五個比較大的趨勢,使得一家獨(dú)大的數(shù)據(jù)庫統(tǒng)一數(shù)據(jù)管理的狀況會有一個比較根本的顛覆。 第一是數(shù)據(jù)本身的改變。 過去的數(shù)據(jù)大多是人為產(chǎn)生的,它的數(shù)據(jù)是一條條記錄式的,比較容易轉(zhuǎn)化成關(guān)系型數(shù)據(jù)庫形式。對它的處理往往不是實時的,可以等待數(shù)據(jù)產(chǎn)生,而要應(yīng)用它的時候,往往已經(jīng)過了一段時間。在這種情況下,關(guān)系型數(shù)據(jù)庫是一個很好的數(shù)字化。舉一個很簡單的例子,我在年初去滑雪,然后去租雪橇,去了一家夫妻店,是一個很小的雪橇店,他們還沒有電腦,沒有數(shù)據(jù)庫,完全是靠紙和筆記錄每一筆交易。我看到他們有一盒子的卡片,每一筆交易就是一張卡片。還有另外一個盒子是他所有客戶的信息,中間通過客戶的信息可以查每個交易的信息。我再一看,這是用紙做的關(guān)系型的數(shù)據(jù)庫,而這個夫妻店如果生意好,規(guī)模大了,就無法用紙和筆來完成,就必須要做成電腦上的數(shù)據(jù)庫。這樣的數(shù)據(jù)庫有幾個特點(diǎn),大家都知道CRUD,需要能夠保證有數(shù)據(jù)的產(chǎn)生,有數(shù)據(jù)的讀和寫以及更改,也要保證可以把數(shù)據(jù)刪除,這是過去所謂的記錄型的數(shù)據(jù)。而對這種數(shù)據(jù)的管理,數(shù)據(jù)庫是一個非常優(yōu)秀,非常完美的技術(shù)。而現(xiàn)在產(chǎn)生數(shù)據(jù)的源更多了,我們很多的數(shù)據(jù)不再是由人產(chǎn)生了,而是由機(jī)器產(chǎn)生的。隨著物聯(lián)網(wǎng)的發(fā)展,各種各樣的探測器,各種各樣的RFID,各種各樣移動的手機(jī),各種各樣的器件以及很多電腦、服務(wù)器會自動產(chǎn)生大量的數(shù)據(jù),而這些數(shù)據(jù)往往是以流的形式產(chǎn)生的。即使是人為的,包括我們剛才提到的社交網(wǎng)絡(luò)、微博,數(shù)據(jù)的形式和過去的形式也有些不一樣。 我們看到新型的數(shù)據(jù)往往很少改變過去已經(jīng)產(chǎn)生的東西,這些數(shù)據(jù)往往是產(chǎn)生一次,以后就再也不會更改。一個服務(wù)器的日志不會再改變昨天的日志,我昨天放上一個微博,也不會再進(jìn)行改變,往往數(shù)據(jù)產(chǎn)生一次就不會改變。而這些數(shù)據(jù)很多時候是不會被刪除,即使用戶把它刪除,在背后的基礎(chǔ)架構(gòu)里面往往也是不刪除的。新興的數(shù)據(jù)底下我們注意到是CRAP的數(shù)據(jù)模式,是產(chǎn)生、重復(fù)、復(fù)制,是可以添加的,還必須要進(jìn)行整合。是這樣一個有流模式大規(guī)模數(shù)據(jù)的產(chǎn)生,但是同時要對它進(jìn)行一個很好的歸納和整合。對于這樣的數(shù)據(jù)來說,我們大家熟悉的關(guān)系型數(shù)據(jù)庫已經(jīng)不再是最優(yōu)秀的技術(shù)能夠滿足他的需要了。在處理這樣大型的 CRAP的數(shù)據(jù),我們需要新型的數(shù)據(jù)管理技術(shù)和產(chǎn)品來幫助客戶解決這個問題。這也是現(xiàn)在為什么包括Hadoop這樣的技術(shù)這樣熱門的原因,是因為過去的數(shù)據(jù)已經(jīng)滿足不了新型大數(shù)據(jù)CRAP數(shù)據(jù)的需求。 第二是云所帶來的副作用。 云就在于你的應(yīng)用不止是在你的防火墻之后。隨著軟件即服務(wù)的產(chǎn)生,我們會生活在一個生活云的時代。對于很多的企業(yè)來說,我們很多的應(yīng)用會是在私有云里面,是在自己的數(shù)據(jù)中心當(dāng)中。但是同時我們有越來越多的應(yīng)用會由公有云進(jìn)行提供,包括客戶管理,包括人事管理,甚至以后包括財務(wù)管理,都會通過公有云來提供這樣的應(yīng)用。而這產(chǎn)生一個副作用,就在于數(shù)據(jù)往往是跟應(yīng)用在一起的。當(dāng)你的應(yīng)用在你的防火墻之外了,它的數(shù)據(jù)也在防火墻之外。我作為一個軟件即服務(wù)的提供商,提供給你應(yīng)用,而數(shù)據(jù)都會在我這里。我作為一個企業(yè)來說,第一次面對這種情況,企業(yè)的數(shù)據(jù)已經(jīng)不完全由我來掌控,我不可能把所有的數(shù)據(jù)都放在甲骨文的數(shù)據(jù)庫當(dāng)中。即使我作為CIO有這樣的愿望,也無法達(dá)成這個現(xiàn)實。因為到底這個應(yīng)用采用哪個數(shù)據(jù)庫,已經(jīng)不是由我這個IT部門說了算了。 在這么一個多地點(diǎn)、多來源的數(shù)據(jù)時代,怎么樣對這些不同的數(shù)據(jù)方式、不同的數(shù)據(jù)材料進(jìn)行統(tǒng)一的分析和處理,從它上面能夠得到智能是新一代的挑戰(zhàn)。在過去要做一個新的應(yīng)用,只要連接到已有的數(shù)據(jù)庫上就行了。而現(xiàn)在必須要有一個全球的云數(shù)據(jù)統(tǒng)一系統(tǒng),才能夠在上面開發(fā)出新的應(yīng)用程序,使它能夠提取到你私有云里面的數(shù)據(jù),也能夠提取到公有云的數(shù)據(jù)。所以這是另外一個云帶來的趨勢,使得數(shù)據(jù)管理模式會有一個比較根本的改變。 本文出自:億恩科技【mszdt.com】 服務(wù)器租用/服務(wù)器托管中國五強(qiáng)!虛擬主機(jī)域名注冊頂級提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |