來(lái)源: 中國(guó)科技網(wǎng)
科技專論
根據(jù)有關(guān)學(xué)者的研究,數(shù)據(jù)密集型科學(xué)將成為繼實(shí)驗(yàn)科學(xué)、理論科學(xué)、計(jì)算機(jī)科學(xué)之后,人類科學(xué)研究的第四個(gè)范式。以大數(shù)據(jù)為代表的數(shù)據(jù)密集型科學(xué)將成為新一次技術(shù)變革的基石。隨著數(shù)據(jù)的進(jìn)一步集中和數(shù)據(jù)量的增大,對(duì)海量數(shù)據(jù)進(jìn)行安全防護(hù)變得更加困難,數(shù)據(jù)的分布式處理也加大了數(shù)據(jù)泄露的風(fēng)險(xiǎn),信息安全正成為制約大數(shù)據(jù)技術(shù)發(fā)展的瓶頸。
大數(shù)據(jù)時(shí)代已經(jīng)到來(lái)
物聯(lián)網(wǎng)、云計(jì)算、移動(dòng)互聯(lián)網(wǎng)等新技術(shù)的發(fā)展,使得手機(jī)、平板電腦、PC及遍布地球各個(gè)角落的傳感器,成為數(shù)據(jù)來(lái)源和承載方式。據(jù)估計(jì),互聯(lián)網(wǎng)上的數(shù)據(jù)量每?jī)赡陼?huì)翻一番,到2013年,互聯(lián)網(wǎng)上的數(shù)據(jù)量將達(dá)到每年667EB(1EB=230GB)。這些數(shù)據(jù)絕大多數(shù)是“非結(jié)構(gòu)化數(shù)據(jù)”,通常不能為傳統(tǒng)的數(shù)據(jù)庫(kù)所用,但這些龐大的數(shù)據(jù)“寶藏”將成為“未來(lái)的新石油”。
1.大數(shù)據(jù)具有四個(gè)典型特征
大數(shù)據(jù)(Big Data)是指“無(wú)法用現(xiàn)有的軟件工具提取、存儲(chǔ)、搜索、共享、分析和處理的海量的、復(fù)雜的數(shù)據(jù)集合”。業(yè)界通常用四個(gè)V來(lái)概括大數(shù)據(jù)的特征。
——數(shù)據(jù)體量巨大(Volume)。到目前為止,人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量是200PB(1PB=210TB),而歷史上全人類說(shuō)過(guò)的所有的話的數(shù)據(jù)量大約5EB(1EB=210PB)。當(dāng)前,典型個(gè)人計(jì)算機(jī)硬盤(pán)的容量為T(mén)B量級(jí),而一些大企業(yè)的數(shù)據(jù)量已經(jīng)接近EB量級(jí)。
——數(shù)據(jù)類型繁多(Variety)。這種類型的多樣性也讓數(shù)據(jù)被分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。相對(duì)于以往便于存儲(chǔ)的以文本為主的結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)越來(lái)越多,包括網(wǎng)絡(luò)日志、音頻、視頻、圖片、地理位置信息等,這些多類型的數(shù)據(jù)對(duì)數(shù)據(jù)的處理能力提出了更高要求。
——價(jià)值密度低(Value)。價(jià)值密度的高低與數(shù)據(jù)總量的大小成反比。以視頻為例,一部1小時(shí)的視頻,在連續(xù)不間斷的監(jiān)控中,有用數(shù)據(jù)可能僅有一兩秒。如何通過(guò)強(qiáng)大的機(jī)器算法更迅速地完成數(shù)據(jù)的價(jià)值“提純”,成為目前大數(shù)據(jù)背景下亟待解決的難題。
——處理速度快(Velocity)。這是大數(shù)據(jù)區(qū)分于傳統(tǒng)數(shù)據(jù)挖掘的最顯著特征。根據(jù)IDC的“數(shù)字宇宙”報(bào)告,預(yù)計(jì)到2020年,全球數(shù)據(jù)使用量將達(dá)到35.2ZB(1ZB=210EB)。在如此海量的數(shù)據(jù)面前,處理數(shù)據(jù)的效率就是企業(yè)的生命。
2.大數(shù)據(jù)成為國(guó)家和企業(yè)的核心資產(chǎn)
2012年瑞士達(dá)沃斯論壇上發(fā)布的《大數(shù)據(jù)大影響》報(bào)告稱,數(shù)據(jù)已成為一種新的經(jīng)濟(jì)資產(chǎn)類別,就像貨幣或黃金一樣。奧巴馬政府已把“大數(shù)據(jù)”上升到國(guó)家戰(zhàn)略層面,2012年3月,美國(guó)宣布投資2億美元啟動(dòng)“大數(shù)據(jù)研究和發(fā)展計(jì)劃”,借以增強(qiáng)收集海量數(shù)據(jù)、分析萃取信息的能力。美國(guó)政府認(rèn)為,大數(shù)據(jù)是“未來(lái)的新石油”,一個(gè)國(guó)家擁有數(shù)據(jù)的規(guī)模、活性及解釋運(yùn)用的能力將成為綜合國(guó)力的重要組成部分,未來(lái)對(duì)數(shù)據(jù)的占有和控制甚至將成為繼陸權(quán)、海權(quán)、空權(quán)之外國(guó)家的另一個(gè)核心資產(chǎn)。
對(duì)企業(yè)來(lái)說(shuō),數(shù)據(jù)正在取代人才成為企業(yè)的核心競(jìng)爭(zhēng)力。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)資產(chǎn)取代人才成為企業(yè)智商最重要的載體。這些能夠被企業(yè)隨時(shí)獲取的數(shù)據(jù),可以幫助和指導(dǎo)企業(yè)對(duì)全業(yè)務(wù)流程進(jìn)行有效運(yùn)營(yíng)和優(yōu)化,幫助企業(yè)做出最明智的決策。此時(shí),企業(yè)智商的基礎(chǔ)就是形形色色的數(shù)據(jù)。
大數(shù)據(jù)在重新定義企業(yè)智商的同時(shí),對(duì)企業(yè)核心資產(chǎn)也進(jìn)行了重塑,數(shù)據(jù)資產(chǎn)當(dāng)仁不讓地成為現(xiàn)代商業(yè)社會(huì)的核心競(jìng)爭(zhēng)力。在大數(shù)據(jù)時(shí)代,企業(yè)必須熟悉和用好海量的數(shù)據(jù),而互聯(lián)網(wǎng)行業(yè)已提早感受到了大數(shù)據(jù)帶來(lái)的深切變化。一些互聯(lián)網(wǎng)企業(yè)已經(jīng)完成了核心競(jìng)爭(zhēng)力的重新定義。
3.大數(shù)據(jù)“藍(lán)海”成為競(jìng)爭(zhēng)的新焦點(diǎn)
大數(shù)據(jù)所能帶來(lái)的巨大商業(yè)價(jià)值,被認(rèn)為將引領(lǐng)一場(chǎng)足以與20世紀(jì)計(jì)算機(jī)革命匹敵的巨大變革。大數(shù)據(jù)正在對(duì)每個(gè)領(lǐng)域造成影響,在商業(yè)、經(jīng)濟(jì)和其他領(lǐng)域中,決策行為將日益基于數(shù)據(jù)分析,而不再是憑借經(jīng)驗(yàn)和直覺(jué)。大數(shù)據(jù)正在成為政府和企業(yè)競(jìng)爭(zhēng)的新焦點(diǎn)。各大企業(yè)正紛紛投向大數(shù)據(jù)促生的新藍(lán)海。甲骨文、IBM、微軟和SAP共投入超過(guò)15億美元成立各自的軟件智能數(shù)據(jù)管理和分析專業(yè)公司。在大數(shù)據(jù)時(shí)代,商業(yè)生態(tài)環(huán)境在不經(jīng)意間發(fā)生了巨大變化:無(wú)處不在的智能終端、隨時(shí)在線的網(wǎng)絡(luò)傳輸、互動(dòng)頻繁的社交網(wǎng)絡(luò),讓以往只是網(wǎng)頁(yè)瀏覽者的網(wǎng)民的面孔從模糊變得清晰,企業(yè)也有機(jī)會(huì)進(jìn)行大規(guī)模的精準(zhǔn)化的消費(fèi)者行為研究。大數(shù)據(jù)藍(lán)海將成為未來(lái)競(jìng)爭(zhēng)的制高點(diǎn)。
大數(shù)據(jù)給信息安全帶來(lái)了新的挑戰(zhàn)與機(jī)遇
大數(shù)據(jù)在成為競(jìng)爭(zhēng)新焦點(diǎn)的同時(shí),不僅帶來(lái)了更多安全風(fēng)險(xiǎn),同時(shí)也帶來(lái)了新機(jī)遇。
一是大數(shù)據(jù)成為網(wǎng)絡(luò)攻擊的顯著目標(biāo)。在網(wǎng)絡(luò)空間,大數(shù)據(jù)是更容易被“發(fā)現(xiàn)”的大目標(biāo)。一方面,大數(shù)據(jù)意味著海量的數(shù)據(jù),也意味著更復(fù)雜、更敏感的數(shù)據(jù),這些數(shù)據(jù)會(huì)吸引更多的潛在攻擊者。另一方面,數(shù)據(jù)的大量匯集,使得黑客成功攻擊一次就能獲得更多數(shù)據(jù),無(wú)形中降低了黑客的進(jìn)攻成本,增加了“收益率”。
二是大數(shù)據(jù)加大隱私泄露風(fēng)險(xiǎn)。大量數(shù)據(jù)的匯集不可避免地加大了用戶隱私泄露的風(fēng)險(xiǎn)。一方面,數(shù)據(jù)集中存儲(chǔ)增加了泄露風(fēng)險(xiǎn);而這些數(shù)據(jù)不被濫用,也成為人身安全的一部分;另一方面,一些敏感數(shù)據(jù)的所有權(quán)和使用權(quán)并沒(méi)有明確界定,很多基于大數(shù)據(jù)的分析都未考慮到其中涉及的個(gè)體隱私問(wèn)題。
三是大數(shù)據(jù)威脅現(xiàn)有的存儲(chǔ)和安防措施。大數(shù)據(jù)存儲(chǔ)帶來(lái)新的安全問(wèn)題。數(shù)據(jù)大集中的后果是復(fù)雜多樣的數(shù)據(jù)存儲(chǔ)在一起,很可能會(huì)出現(xiàn)將某些生產(chǎn)數(shù)據(jù)放在經(jīng)營(yíng)數(shù)據(jù)存儲(chǔ)位置的情況,致使企業(yè)安全管理不合規(guī)。大數(shù)據(jù)的大小也影響到安全控制措施能否正確運(yùn)行。安全防護(hù)手段的更新升級(jí)速度無(wú)法跟上數(shù)據(jù)量非線性增長(zhǎng)的步伐,就會(huì)暴露大數(shù)據(jù)安全防護(hù)的漏洞。
四是大數(shù)據(jù)技術(shù)成為黑客的攻擊手段。在企業(yè)用數(shù)據(jù)挖掘和數(shù)據(jù)分析等大數(shù)據(jù)技術(shù)獲取商業(yè)價(jià)值的同時(shí),黑客也在利用這些大數(shù)據(jù)技術(shù)向企業(yè)發(fā)起攻擊。黑客會(huì)最大限度地收集更多有用信息,比如社交網(wǎng)絡(luò)、郵件、微博、電子商務(wù)、電話和家庭住址等信息,大數(shù)據(jù)分析使黑客的攻擊更加精準(zhǔn)。此外,大數(shù)據(jù)也為黑客發(fā)起攻擊提供了更多機(jī)會(huì)。黑客利用大數(shù)據(jù)發(fā)起僵尸網(wǎng)絡(luò)攻擊,可能會(huì)同時(shí)控制上百萬(wàn)臺(tái)傀儡機(jī)并發(fā)起攻擊。
五是大數(shù)據(jù)成為高級(jí)可持續(xù)攻擊的載體。傳統(tǒng)的檢測(cè)是基于單個(gè)時(shí)間點(diǎn)進(jìn)行的基于威脅特征的實(shí)時(shí)匹配檢測(cè),而高級(jí)可持續(xù)攻擊(APT)是一個(gè)實(shí)施過(guò)程,無(wú)法被實(shí)時(shí)檢測(cè)。此外,大數(shù)據(jù)的價(jià)值低密度性,使得安全分析工具很難聚焦在價(jià)值點(diǎn)上,黑客可以將攻擊隱藏在大數(shù)據(jù)中,給安全服務(wù)提供商的分析制造很大困難。黑客設(shè)置的任何一個(gè)會(huì)誤導(dǎo)安全廠商目標(biāo)信息提取和檢索的攻擊,都會(huì)導(dǎo)致安全監(jiān)測(cè)偏離應(yīng)有方向。
六是大數(shù)據(jù)技術(shù)為信息安全提供新支撐。當(dāng)然,大數(shù)據(jù)也為信息安全的發(fā)展提供了新機(jī)遇。大數(shù)據(jù)正在為安全分析提供新的可能性,對(duì)于海量數(shù)據(jù)的分析有助于信息安全服務(wù)提供商更好地刻畫(huà)網(wǎng)絡(luò)異常行為,從而找出數(shù)據(jù)中的風(fēng)險(xiǎn)點(diǎn)。對(duì)實(shí)時(shí)安全和商務(wù)數(shù)據(jù)結(jié)合在一起的數(shù)據(jù)進(jìn)行預(yù)防性分析,可識(shí)別釣魚(yú)攻擊,防止詐騙和阻止黑客入侵。網(wǎng)絡(luò)攻擊行為總會(huì)留下蛛絲馬跡,這些痕跡都以數(shù)據(jù)的形式隱藏在大數(shù)據(jù)中,利用大數(shù)據(jù)技術(shù)整合計(jì)算和處理資源有助于更有針對(duì)性地應(yīng)對(duì)信息安全威脅,有助于找到攻擊的源頭。
保障我國(guó)大數(shù)據(jù)信息安全的建議
一是重視大數(shù)據(jù)及其信息安全體系建設(shè)。大數(shù)據(jù)作為一個(gè)較新的概念,目前尚未直接以專有名詞被我國(guó)政府提出來(lái)給予政策支持。在物聯(lián)網(wǎng)“十二五”規(guī)劃中,信息處理技術(shù)作為4項(xiàng)關(guān)鍵技術(shù)創(chuàng)新工程之一被提出來(lái),其中包括了海量數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)挖掘、圖像視頻智能分析,這都是大數(shù)據(jù)的重要組成部分。在對(duì)大數(shù)據(jù)發(fā)展進(jìn)行規(guī)劃時(shí),建議加大對(duì)大數(shù)據(jù)信息安全形勢(shì)的宣傳力度,明確大數(shù)據(jù)的重點(diǎn)保障對(duì)象,加強(qiáng)對(duì)敏感和要害數(shù)據(jù)的監(jiān)管,加快面向大數(shù)據(jù)的信息安全技術(shù)的研究,培養(yǎng)大數(shù)據(jù)安全的專業(yè)人才,建立并完善大數(shù)據(jù)信息安全體系。
二是加快大數(shù)據(jù)安全技術(shù)研發(fā)。云計(jì)算、物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)等新技術(shù)的快速發(fā)展,為大數(shù)據(jù)的收集、處理和應(yīng)用提出了新的安全挑戰(zhàn)。建議加大對(duì)大數(shù)據(jù)安全保障關(guān)鍵技術(shù)研發(fā)的資金投入,提高我國(guó)大數(shù)據(jù)安全技術(shù)產(chǎn)品水平。推動(dòng)基于大數(shù)據(jù)的安全技術(shù)研發(fā),研究基于大數(shù)據(jù)的網(wǎng)絡(luò)攻擊追蹤方法,搶占發(fā)展基于大數(shù)據(jù)的安全技術(shù)的先機(jī)。
三是加強(qiáng)對(duì)重點(diǎn)領(lǐng)域敏感數(shù)據(jù)的監(jiān)管。海量數(shù)據(jù)的匯集加大了敏感數(shù)據(jù)暴露的可能性,對(duì)大數(shù)據(jù)的無(wú)序使用也增加了要害信息泄露的危險(xiǎn)。在政府層面,建議明確重點(diǎn)領(lǐng)域數(shù)據(jù)庫(kù)范圍,制定完善的重點(diǎn)領(lǐng)域數(shù)據(jù)庫(kù)管理和安全操作制度,加強(qiáng)日常監(jiān)管。在企業(yè)層面,建議加強(qiáng)企業(yè)內(nèi)部管理,制定設(shè)備特別是移動(dòng)設(shè)備安全使用規(guī)程,規(guī)范大數(shù)據(jù)的使用方法和流程。
四是運(yùn)用大數(shù)據(jù)技術(shù)應(yīng)對(duì)高級(jí)可持續(xù)攻擊。傳統(tǒng)安全防御措施很難檢測(cè)出高級(jí)持續(xù)性攻擊。安全廠商要利用大數(shù)據(jù)技術(shù)對(duì)事件的模式、攻擊的模式、時(shí)間和空間上的特征進(jìn)行處理,總結(jié)抽象出一些模型,變成大數(shù)據(jù)安全工具。為了精準(zhǔn)地描述威脅特征,建模過(guò)程可能會(huì)耗費(fèi)幾個(gè)月甚至幾年,并耗費(fèi)大量人力、物力、財(cái)力。建議整合大數(shù)據(jù)處理資源,協(xié)調(diào)大數(shù)據(jù)處理和分析機(jī)制,推動(dòng)重點(diǎn)數(shù)據(jù)庫(kù)之間的數(shù)據(jù)共享,加快對(duì)高級(jí)可持續(xù)攻擊的建模進(jìn)程,消除和控制高級(jí)可持續(xù)攻擊的危害。