定義大數(shù)據(jù):淺顯易懂的大數(shù)據(jù)入門 |
發(fā)布時間: 2012/9/7 18:46:47 |
定義大數(shù)據(jù):淺顯易懂的大數(shù)據(jù)入門當前,眾多企業(yè)都面對從四面八方涌來的數(shù)據(jù)流的沖擊。涓涓細流匯成大河,而科技企業(yè)、專家、分析師和技術顧問們紛紛將這條數(shù)據(jù)之河定義為大數(shù)據(jù)。但是,在這些眾說紛紜的大數(shù)據(jù)定義中,不乏大量的常見誤解。大量的企業(yè)都面臨著挑戰(zhàn),需要辨別具有價值的數(shù)據(jù)流,挖掘這些價值,協(xié)助企業(yè)做出最佳決策以形成強大的競爭優(yōu)勢。 "大數(shù)據(jù)"這一術語的內(nèi)涵遠遠超越了"大"或是"數(shù)據(jù)"的含義。大數(shù)據(jù)的確體現(xiàn)為數(shù)量龐大,但它仍有更多特性有待了解。在Forrester分析師布賴恩;羝战鹚梗˙rian Hopkins)和鮑里斯。埃韋爾松(Boris Evelson)撰寫的《首席信息官,請用大數(shù)據(jù)擴展數(shù)字視野》報告中,他們提出大數(shù)據(jù)的4項典型特征——海量(Volume)、多樣性(Variety)、高速(Velocity)和易變性(Variability)。下文將簡要介紹這些特性,并重點闡述大數(shù)據(jù)對前瞻性商界領袖的重大意義。 海量 企業(yè)面臨著數(shù)據(jù)量的大規(guī)模增長。例如,IDC最近的報告預測稱,到2020年,全球數(shù)據(jù)量將擴大50倍。目前,大數(shù)據(jù)的規(guī)模尚是一個不斷變化的指標,單一數(shù)據(jù)集的規(guī)模范圍從幾十TB到數(shù)PB不等。簡而言之,存儲1PB數(shù)據(jù)將需要兩萬臺配備50GB硬盤的個人電腦。 此外,各種意想不到的來源都能產(chǎn)生數(shù)據(jù)。例如,從巴塞羅那至沙特首府利雅得的單程航行中,一架商用噴氣飛機上收集的傳感器數(shù)據(jù)量將超過1PB.當用一次飛行的數(shù)據(jù)量乘以每天所有飛行的航班數(shù),數(shù)據(jù)總量將非常驚人。 多樣性 一個普遍觀點認為,人們使用互聯(lián)網(wǎng)搜索是形成數(shù)據(jù)多樣性的主要原因,這一看法部分正確。然而,數(shù)據(jù)多樣性的增加主要是由于新型多結構數(shù)據(jù),以及包括網(wǎng)絡日志、社交媒體、互聯(lián)網(wǎng)搜索、手機通話記錄及傳感器網(wǎng)絡等數(shù)據(jù)類型造成。其中,部分傳感器安裝在火車、汽車和飛機上,每個傳感器都增加了數(shù)據(jù)的多樣性。 高速 高速描述的是數(shù)據(jù)被創(chuàng)建和移動的速度。在高速網(wǎng)絡時代,通過基于實現(xiàn)軟件性能優(yōu)化的高速電腦處理器和服務器,創(chuàng)建實時數(shù)據(jù)流已成為流行趨勢。企業(yè)不僅需要了解如何快速創(chuàng)建數(shù)據(jù),還必須知道如何快速處理、分析并返回給用戶,以滿足他們的實時需求。 根據(jù)IMS Research研究機構關于數(shù)據(jù)創(chuàng)建速度的調(diào)查,通過跟蹤可聯(lián) 本文出自:億恩科技【mszdt.com】 |