點(diǎn)擊產(chǎn)看中國大數(shù)據(jù)創(chuàng)新峰會

在下午的分論壇中,Websense網(wǎng)絡(luò)安全技術(shù)研發(fā)中國區(qū)技術(shù)總監(jiān)陳綱先生為大家坐了《大數(shù)據(jù)時代下的數(shù)據(jù)安全管理》的主題演講。在會中,他講道:

我們會覆蓋在大數(shù)據(jù)相關(guān)的價值體現(xiàn)以后的相關(guān)數(shù)據(jù)安全文化,這應(yīng)該說是我們前段時間在跟一些企業(yè)老總聊的時候非常重要的一個話題。后續(xù)的結(jié)果應(yīng)該如何保護(hù)?如何防止在各個行業(yè)之間、各個部門之間甚至相關(guān)的重要崗位之間的交互使用過程中防止泄露,這是很多老總們得到大數(shù)據(jù)價值后容易思考的問題。

在各式各樣的類型中我們會看到各式各樣的信息,包括他的交易習(xí)慣、關(guān)注點(diǎn)是什么,隨著這些結(jié)果出來以后,無疑可以幫助我們的企業(yè)經(jīng)營決策,在這個過程中,越來越的主管就會開始想象,我的分析結(jié)果如果給我相關(guān)的合作伙伴里又會帶來怎么樣的商業(yè)價值?或者說給我企業(yè)本身的競爭會帶來什么樣的影響?這真的是我們特別擔(dān)心的問題。

在大數(shù)據(jù)的高價值分析結(jié)果體現(xiàn)的時候,我們不得不關(guān)注數(shù)據(jù)安全的管理項目,當(dāng)我們呈現(xiàn)大量數(shù)據(jù)的時候,誠心出大量有價值的報表、成果、預(yù)測的模型的時候我們?nèi)绾巫龊帽Wo(hù)?當(dāng)看到大數(shù)據(jù)的時候很多人都覺得它非常龐大,我們很難在非常短的時間內(nèi)把所有的數(shù)據(jù)保護(hù)起來,然而大數(shù)據(jù)本身也會給大家?guī)硪粋€疑惑,就是大數(shù)據(jù)是不是都有價值值得讓我們?nèi)勘Wo(hù)。

更多的用戶會側(cè)重于把熱點(diǎn)營銷的分析數(shù)據(jù)進(jìn)行重點(diǎn)的保護(hù),簡單說就是化整為零,我們對原數(shù)據(jù)的看待和分析結(jié)果的看待是分開看的,圍繞重點(diǎn)分析、重點(diǎn)業(yè)務(wù)在一些特別重要的城市、特別重要的崗位得到的一些價值體現(xiàn),它的分析成果是真正值得我們有效監(jiān)管、有效保護(hù)和有效分析的,那么由此而來我們會發(fā)現(xiàn)我們保護(hù)的重點(diǎn)會從大的面上直接跳到企業(yè)現(xiàn)階段對他的商業(yè)價值最重要的核心數(shù)據(jù)上,這就真正幫我們體現(xiàn)出能夠在大數(shù)據(jù)中間抓住最核心的信息。

這里不能不談到一個概念就是數(shù)據(jù)泄露的防護(hù),這個概念在國內(nèi)外都已經(jīng)非常火了,在過去的2年內(nèi),Websense和中國,尤其是金融行業(yè)很多客戶都有大量的合作,現(xiàn)如今很多互聯(lián)網(wǎng)公司是大數(shù)據(jù)的代表,開始不斷涌現(xiàn)出新的與數(shù)據(jù)保護(hù)相關(guān)的想法。

我們一直講這些大數(shù)據(jù)體現(xiàn)價值的時候需要不斷的深入挖掘,不斷的分析從而得到我們想要的信息,然而在這里數(shù)據(jù)泄露防護(hù)上同樣有著相似的做法,就是如何在海量的數(shù)據(jù)中快速定位出那些高價值數(shù)據(jù),這里面離不開深層內(nèi)容分析的技術(shù),從而幫助我們對多種數(shù)據(jù)存在的形態(tài)進(jìn)行分析。對一個企業(yè)來講,你不得不看我如何對這些高價值數(shù)據(jù)進(jìn)行有效的識別和檢測,就像我們每天處理的數(shù)據(jù)、訪問的數(shù)據(jù)、編輯的數(shù)據(jù),或者是網(wǎng)絡(luò)中傳輸?shù)南嚓P(guān)信息,甚至包括我們從用戶端收集上來的信息,這些交互信息你如何快速定位出來?這里我們有三個簡單的方式讓大家快速理解。

第一,描述,描述通常會對大數(shù)據(jù)的很多源數(shù)據(jù)進(jìn)行有效判斷,利用運(yùn)營商特別關(guān)注通話的詳單,對于很多互聯(lián)網(wǎng)公司會在意用戶的交互數(shù)據(jù),這樣的信息量非常巨大,單條的記錄根本體現(xiàn)不出它的價值在這樣的情況下我們會通過描述的方式告訴系統(tǒng)什么是此類數(shù)據(jù),從而快速定位到它。

第二,登記,可以幫助我們把企業(yè)里最重要的信息錄入進(jìn)去,這里不得不談到,很多高價值的報表、財務(wù)分析的結(jié)果甚至大數(shù)據(jù)的輸出可以利用類似登記的方式讓系統(tǒng)了解它相應(yīng)的衍生產(chǎn)品是什么樣的。

第三,學(xué)習(xí),很多時候我們都說這個數(shù)據(jù)應(yīng)該怎么保護(hù)或者應(yīng)該如何識別,這是人用自己的經(jīng)驗(yàn)判斷的,那有沒有更好的方法呢?你不妨把這個信息交給數(shù)據(jù)保護(hù)系統(tǒng),讓它自己學(xué)習(xí)去判斷這些數(shù)據(jù)的共同性是什么,從而使它可以更簡單的對它進(jìn)行判斷。

數(shù)據(jù)描述,大量的交易數(shù)據(jù)、通話詳單甚至傳統(tǒng)行業(yè)會用到的地理坐標(biāo),這些信息大批量出現(xiàn)的時候我們可以利用數(shù)據(jù)描述的方式告訴它什么樣的情況下被稱 為是交易記錄,以這樣的描述方式讓我們以很自然的方式得到這個信息,從而讓系統(tǒng)知道當(dāng)這樣的信息大范圍傳輸?shù)臅r候值得我們關(guān)注。

同樣可以看 到數(shù)據(jù)登記的方法,我們叫它做指紋,你所留下來的不是指紋的圖,而是它們之間的不同特點(diǎn),在數(shù)據(jù)登記如果用指紋方式學(xué)習(xí)的時候,概念很類似,當(dāng)我們在大數(shù) 據(jù)整個群集中不斷提煉結(jié)果的時候,分析成果、樣式、報表甚至整個數(shù)據(jù)挖掘的設(shè)計是如何來完成整個過程的設(shè)計文檔,你都可以利用類似登記的方式讓它有效地了 解到這類數(shù)據(jù)的特點(diǎn)是什么,我的典型客戶行為是什么樣的,往往很多類似的結(jié)果最后的輸出會又回到這樣的數(shù)據(jù)系統(tǒng),或者回到某些特定的業(yè)務(wù)系統(tǒng),或者回到非 結(jié)構(gòu)化的文檔上,在這樣的情況下利用類似數(shù)據(jù)登記的方式讓我們對這些摘要信息進(jìn)行有效的學(xué)習(xí),他就會很清楚的知道有人拷貝了這段設(shè)計內(nèi)容,這些東西都是來 自于某一個分析成果的某個部分,幫助我們訓(xùn)練定位到這方面的某些問題。當(dāng)然,不僅如此,它同樣可以對企業(yè)自己認(rèn)為自己價值最大的信息進(jìn)行保護(hù)。

其 實(shí)剛才百度也談到,對于互聯(lián)網(wǎng)公司最大的價值是他的人,現(xiàn)在越來越多的公司跟Websense合作的人都說,我所保護(hù)的數(shù)據(jù)甚至包括人員信息、我員工的資 料都是重點(diǎn),我們曾經(jīng)在08年做過一個項目,當(dāng)時制造業(yè)的項目甚至說,我有一些重點(diǎn)的國家項目,他的整個項目組的人員資料都是非常、非常重要的,不能隨便 泄露出去。

機(jī)器學(xué)習(xí),我們不斷的希望機(jī)器能夠取代人在某方面做更多的事情,學(xué)習(xí)也是一種,你不妨交給機(jī)器讓它知道相關(guān)成果的特點(diǎn)是什么,在 這里我們經(jīng)常會講到很多企業(yè)都會有類似于生產(chǎn)的月報、周報、季報等,很多財務(wù)數(shù)據(jù)也會通過這樣的數(shù)據(jù)得到自己的分析,這張報表除了整個表格的形式以外,幾 乎沒有的數(shù)字之間是有關(guān)聯(lián)關(guān)系的,這就不得不使我們要看看有什么樣的方式對這類信息進(jìn)行有效的監(jiān)管,機(jī)器學(xué)習(xí)可以由它來進(jìn)行相似度的檢測,包括會議紀(jì)要, 在這樣一些相關(guān)的會議紀(jì)要的時候,我們給系統(tǒng),系統(tǒng)學(xué)習(xí)完之后就會知道這種格式呈現(xiàn)的時候就是會議紀(jì)要,甚至可以知道這是高層的會議紀(jì)要,從而幫助我們更 準(zhǔn)確地對這些類似的分析報告進(jìn)行有效的監(jiān)管。

OCR,語音識別現(xiàn)在已經(jīng)火熱到無法阻擋的地步,然而ORC技術(shù)開始讓人慢慢有點(diǎn)被人忘掉了,很多年以前大家都會看到說我們有很好的方式可以把印刷 的方式變成文字,很高興我們現(xiàn)在把它應(yīng)用到泄露信息防護(hù)到,因?yàn)楹芏鄡?nèi)部資料的外發(fā)往往是截圖、拍照,面對這樣的狀態(tài)的時候我們?nèi)绾芜M(jìn)行保護(hù)?之所以會發(fā) 生這樣的狀況很重要的因素是因?yàn)?,圖這個東西很少有技術(shù)會分析,Websense的數(shù)據(jù)安全當(dāng)進(jìn)行企業(yè)數(shù)據(jù)保護(hù)的時候,真的會看報表里的文字是什么,當(dāng)它 符合一定的價值的時候,會根據(jù)數(shù)據(jù)安全的要求進(jìn)行匹配,挑出某些圖片里的信息是否有問題,尤其在郵件的通道上的泄露,類似的ORC可以非常有效地幫助我們 發(fā)現(xiàn)這個問題。

點(diǎn)滴泄露,這個詞來源于什么?我們有一個客戶跟我們說,我們有的客服天天在處理一些信息,每時每刻都在把這些信息向外發(fā)送,我如何知道它的惡意是什 么?包括一些木馬,然而你無法發(fā)現(xiàn),因?yàn)樗看蔚牧刻伲谑怯腥苏f你能不能幫我檢測一段時間內(nèi)發(fā)生的少量但是多次的泄露場景,這樣就可以有效的發(fā)現(xiàn)一些 惡意的行為。

當(dāng)我們不斷關(guān)注數(shù)據(jù)中心、關(guān)注數(shù)據(jù)存儲的核心區(qū)域的時候,我們不得不看到數(shù)據(jù)最終的交互點(diǎn)在哪里。從數(shù)據(jù)泄露途徑每年的統(tǒng)計、分析來講,無論是四大 所做的分析還是其它行業(yè)分析機(jī)構(gòu)得到的統(tǒng)計,我們都會看到網(wǎng)絡(luò)、終端最終都是最容易導(dǎo)致數(shù)據(jù)泄露的邊緣區(qū)域,于是我們想到可不可以在企業(yè)的網(wǎng)絡(luò)通道上,尤 其是業(yè)務(wù)最需要用到的通訊渠道,利用Web、郵件,甚至我們的加密通道傳輸,看看這里面有沒有敏感信息的泄露,這都是我們講的從你的網(wǎng)絡(luò)覆蓋面應(yīng)該如何看 待的問題,當(dāng)然最重要的是我們?nèi)绾伟堰@些問題捕獲到、防止它離開你的企業(yè),這才能真正幫助我們解決相應(yīng)的問題。

很多人每天都在處理你的數(shù)據(jù),無論是客服人員還是數(shù)據(jù)分析人員,又或者很多企業(yè)的高管,他們都在接觸這些數(shù)據(jù),這樣一些數(shù)據(jù)出現(xiàn)和使用的過程中,如 何從終端層面防止它的泄露?防止它成為你泄露的渠道?這些問題都是很多企業(yè)在做出呈現(xiàn)以后不知道如何保護(hù)的,這恰恰是Websense不斷希望能夠給我們 客戶帶來新的思考點(diǎn),讓我們?nèi)ジ玫乜创@些問題,看如何進(jìn)行相關(guān)的保護(hù)。

在大數(shù)據(jù)數(shù)據(jù)中間我們不斷談數(shù)據(jù)挖掘,說從相應(yīng)的問題里如何發(fā)現(xiàn)最具價值的信息,從數(shù)據(jù)泄露防護(hù)的角度上講也是一樣,你的泄露事件的管理同樣無異于 一種深度的信息挖掘,那如何在這中間挑到你感興趣的?我們不妨給客戶呈現(xiàn)出更具價值的統(tǒng)計報表,例如基于地理位置,經(jīng)常聽到人談到說我們有很多用戶的信息 會通過采集地理位置、地理信息來得到信息,數(shù)據(jù)泄露也是一樣,如果我們能夠呈現(xiàn)出你的機(jī)密數(shù)據(jù)曾經(jīng)被送到互聯(lián)網(wǎng)上或者整個企業(yè)外部某個國家特定的服務(wù)器上 的時候,企業(yè)高管可以看看我們公司在這個地區(qū)有沒有相應(yīng)的業(yè)務(wù),沒有的話那數(shù)據(jù)怎么去那里了?這可以幫助他發(fā)現(xiàn)有些數(shù)據(jù)的泄露是不是我們企業(yè)所擔(dān)心的。通 過這樣的方式可以快速地讓我們定位出我們感興趣的泄露問題,從而幫助企業(yè)的經(jīng)營決策決定是否應(yīng)對此類行為進(jìn)行有效的阻擋和限制。

工作流,這是現(xiàn)在越來越多的企業(yè)關(guān)注的,很多企業(yè)都在談到這個狀況,一個企業(yè)在如何應(yīng)用這些技術(shù)的同時把流程做好,數(shù)據(jù)防護(hù)也是如此,要真正讓這樣 的技術(shù)跟你的企業(yè)日常運(yùn)維結(jié)合在一起,這才是最重要的。我們發(fā)現(xiàn)這樣的工作流可以使得我們所有的工作人員不需要每天面對我的計算機(jī),我甚至只需要通過郵件 的方式對相應(yīng)的泄露場景、泄露事件進(jìn)行有效的處理,無論是審批釋放、反饋領(lǐng)導(dǎo)或者別的,我都可以這樣做。

面對泄露的威脅,很多企業(yè)都想到,我們最需要擔(dān)心的往往是黑客的行為,或者是很多惡意的行為,然而在很多企業(yè)根據(jù)真正自己敏感數(shù)據(jù)外發(fā)進(jìn)行羅列的時候,你會發(fā)現(xiàn)很多偶發(fā)事件占了企業(yè)70%的比例,原因就是很多員工是無意識的把這些信息泄露出去了。

就 比如說云,很多人會把工作的內(nèi)容上傳到云里,但他并沒有意識說這些信息有沒有技術(shù)共享,包括我們?nèi)ヒ患一ヂ?lián)網(wǎng)公司,他們的CIO親自跟我說,他現(xiàn)在很擔(dān) 心,原因是微博竟然成為一個公司內(nèi)部運(yùn)用的平臺,機(jī)器出問題了他們會直接在微博上發(fā)出去,這是很不可思議的。我們這個系統(tǒng)就可以很好的監(jiān)管,當(dāng)你要往外發(fā) 的時候,你就可以警告他這樣的信息是不能往外發(fā)的,包括惡意的一些行為,無論是黑客進(jìn)來以后做一些竊取的動作還是企業(yè)內(nèi)部做的一些數(shù)字的便利,可能都會存 在這樣的問題。這里恰恰是類似通過數(shù)據(jù)泄露防護(hù)的方式幫助我們?yōu)槠髽I(yè)高管們提供敏感數(shù)據(jù)的可視性,讓你知道你的分析成果到底傳到了什么地方去,從而可以更 好地幫助我們在這方面進(jìn)行有效的控制。

Websense其實(shí)是一家上市公司,美國的一家上市公司,他做的很多方案越來越多的都是針對企業(yè)的敏感數(shù)據(jù)和企業(yè)的核心數(shù)據(jù)所展開 Websense專門設(shè)計了Trito的統(tǒng)一安全平臺,圍繞企業(yè)經(jīng)常發(fā)現(xiàn)的各種安全問題,在郵件、敏感數(shù)據(jù)等方面進(jìn)行有效的統(tǒng)一內(nèi)容分析,幫助我們發(fā)現(xiàn)他 相應(yīng)的問題。通過整合的一種分析技術(shù),幫助我們把它濃縮為ACE這樣的分析引擎,對一些客戶的數(shù)據(jù)使用行為進(jìn)行判斷,從而有效地進(jìn)行阻擋。

Websense在北京的安全實(shí)驗(yàn)室可以很好地為大家提供這方面的技術(shù)支撐,我們希望給客戶帶來的是希望在大數(shù)據(jù)的時代下,當(dāng)你們獲得他的高價值信息的同時,要注意如何在你的Web、郵件、敏感信息進(jìn)行有效的防范,甚至你應(yīng)該把安全方案逐步擴(kuò)展到云以及移動終端上。

?

分享到

zhangcun

相關(guān)推薦