跟蹤大數據趨勢、研究和統計數據為 IT 專(zhuān)業(yè)人員規劃大數據項目奠定了堅實(shí)的基礎。以下是每個(gè) IT 專(zhuān)業(yè)人員都應該知道的 15 個(gè)重要的大數據事實(shí)。每個(gè)人都在談?wù)摯髷祿?,從挑戰到年度支出、?chuàng )造就業(yè)機會(huì ),甚至是大數據項目所需的工具。許多人認為大數據將幫助企業(yè)做出更好的決策,事實(shí)上,近十分之八的高管同意或強烈同意“如果我們能夠利用所有數據,我們將成為一家更強大的企業(yè)”的說(shuō)法。
跟蹤大數據趨勢、研究和統計數據為 IT 專(zhuān)業(yè)人員規劃大數據項目奠定了堅實(shí)的基礎。Webopedia 編制了每個(gè) IT 專(zhuān)業(yè)人員都應該知道的重要大數據事實(shí)和統計數據列表。
大數據:我們是如何到達這里的?
1. 有多少數據?
每天,我們創(chuàng )建了 2.5 萬(wàn)億字節的數據,以至于當今世界上 90% 的數據都是在過(guò)去兩年中創(chuàng )建的。這些數據來(lái)自各處:用于收集氣候信息的傳感器、社交媒體網(wǎng)站的帖子、數字圖片和視頻、購買(mǎi)交易記錄以及手機 GPS 信號等等。
2. 結構化數據與非結構化數據
在對大數據進(jìn)行分類(lèi)時(shí),Tata Consultancy Services Limited (TCS) 研究了公司數據中有多少是結構化的與非結構化的,以及有多少是內部生成的與外部生成的。
– 51% 的數據是結構化的
– 27% 的數據是非結構化的
– 21% 的數據是半結構化的
遠高于預期的數據百分比不是非結構化或半結構化的,只有不到四分之一的數據是外部數據。
大數據工作
3. 大數據創(chuàng )造就業(yè)機會(huì )
到 2015 年,全球將創(chuàng )造 440 萬(wàn)個(gè) IT 工作崗位來(lái)支持大數據,在美國創(chuàng )造 190 萬(wàn)個(gè) IT 工作崗位。在美國,每一個(gè)大數據相關(guān)的職位都會(huì )為 IT 以外的三個(gè)人創(chuàng )造就業(yè)機會(huì ),因此未來(lái)四年,信息經(jīng)濟將在美國創(chuàng )造 600 萬(wàn)個(gè)就業(yè)崗位。挑戰?行業(yè)人才不足。
4. 大數據人才短缺
組織利用大數據所需的人才將會(huì )短缺。到 2018 年,僅美國就可能面臨 140,000 至 190,000 名具有深厚分析技能的人才以及 150 萬(wàn)名具備利用大數據分析做出有效決策的專(zhuān)業(yè)知識的管理人員和分析師的短缺。
5. 重新思考工作角色和頭銜
81% 的 IT 領(lǐng)導者和 77% 的 IT 專(zhuān)業(yè)人員認為,具有規劃、執行和利用組織數據資產(chǎn)潛力所需技能的員工嚴重短缺。大數據項目可能意味著(zhù)重新考慮工作角色和頭銜,以及充分利用數據所需的非技術(shù)技能。
大數據挑戰與困境
6. 不同的系統
66% 的 IT 領(lǐng)導者和 53% 的 IT 專(zhuān)業(yè)人員聲稱(chēng)他們的數據存儲在不同的系統中,這些組織必須構建新平臺來(lái)滿(mǎn)足這些增加的數據管理需求。
7. 從大數據中獲取商業(yè)價(jià)值
從大數據中獲取商業(yè)價(jià)值的最大挑戰是文化和技術(shù)。當被要求對 16 項挑戰進(jìn)行評分時(shí),公司將組織挑戰排在首位:讓業(yè)務(wù)部門(mén)跨組織孤島共享信息。緊隨其后的是技術(shù)問(wèn)題:處理眾所周知的大數據的三個(gè) V:數據量、速度和多樣性。第三個(gè)挑戰是確定將哪些數據用于不同的業(yè)務(wù)決策。
8. 數據質(zhì)量
超過(guò)一半的 IT 領(lǐng)導者 (57%) 和 IT 專(zhuān)業(yè)人員 (52%) 表示他們并不總是知道誰(shuí)擁有數據。如果不知道誰(shuí)擁有數據,就沒(méi)有人對其質(zhì)量負責。由于大數據項目將不同來(lái)源和種類(lèi)的數據融合在一起,確保數據的準確性和質(zhì)量將是成功的關(guān)鍵。
大數據投資的主要原因
9. 創(chuàng )建更強大的業(yè)務(wù)
CompTIA 發(fā)現,在其組織中負責涉及數據的技術(shù)或戰略決策的高管中有近十分之八的人同意,利用所有企業(yè)數據將帶來(lái)更強大的業(yè)務(wù)。調查還發(fā)現,93% 的調查參與者表示數據對他們的業(yè)務(wù)至關(guān)重要;同樣的百分比認為這在 2014 年也很重要。投資于數據計劃的最有力論據之一來(lái)自以下數據點(diǎn):近十分之八的高管同意或強烈同意“如果我們能夠利用所有數據,我們將成為一家更強大的企業(yè)”的說(shuō)法。
10. 更好地管理數據
不到五分之一的企業(yè)報告說(shuō)他們在管理和使用數據時(shí)正好處于他們想要的位置。誠然,這代表了一個(gè)很高的標準,但即使包括那些“非常接近”目標的企業(yè),它仍然讓大多數企業(yè)在數據方面有大量工作要做。
11. 三大大數據業(yè)務(wù)驅動(dòng)力
前三大大數據業(yè)務(wù)驅動(dòng)因素包括:
– 加快運營(yíng)或分析工作負載的時(shí)間 (39%)
– 通過(guò)業(yè)務(wù)解決方案中使用的數據靈活性提高競爭優(yōu)勢 (34%)
– 對更高級別高級分析的業(yè)務(wù)需求 (31%)。
大數據支出和實(shí)施
12. 大數據實(shí)施
生產(chǎn)中的大數據實(shí)施從 2012 年的 27% 上升到 2013 年的 34.3%。此外,作為大數據計劃的一部分,68% 的公司正在運行兩個(gè)或多個(gè)大數據項目。對于制定了分析戰略的公司來(lái)說(shuō),最重要的業(yè)務(wù)驅動(dòng)因素是需要將銷(xiāo)售信息與運營(yíng)分析相結合(57%)。
13. 大數據工具
80% 的響應者表示,他們已經(jīng)在或計劃在生產(chǎn)環(huán)境中使用專(zhuān)用的大數據工具或架構來(lái)應對海量數據的涌入。56% 的受訪(fǎng)者表示他們計劃將現有應用程序從 RDBMS 遷移到 NoSQL 數據存儲。
14. 大數據支出
在大數據上的支出存在兩極分化,少數公司花費大量資金,而大部分公司花費很少。2012 年,大約 15% 的被調查公司在大數據計劃上每家花費至少 1 億美元,7% 的公司投資至少 5 億美元。相比之下,近四分之一 (24%) 的人每人花費不到 250 萬(wàn)美元。
15. 在大數據上花費最多的行業(yè)
支出最多的行業(yè)是電信、旅游相關(guān)、高科技和銀行業(yè);生命科學(xué)、零售和能源/資源公司的支出最少。