1、大數據機遇和網絡安全挑戰
大數據是近年來非常熱的一個話題,目前IT科學問題基本三年為一個周期,但是大數據據預計會有6~9年的話題周期,因為
云計算話題從成熟到應用,已經走過約八九年的歷程。
大數據分析挖掘的價值
從大數據本身來看,存在有很多觀點。比如2010年Science上刊文指出,能夠根據個體之前的行為軌跡預測他/她未來行蹤的可能性,即93%的人類行為可預測。
大數定理告訴我們,在試驗不變的條件下,重復試驗多次,隨機事件的頻率近似于它的概率。“有規律的隨機事件”在大量重復出現的條件下,往往呈現幾乎必然的統計特性。從“數據”到“大數據”,不僅僅是數量上的差別,更是數據質量上的提升,即從量變到質變。
隨著計算機的處理能力的日益強大,人們能獲得的數據量越大,能挖掘到的價值就越多。實驗的不斷反復、大數據的日漸積累讓人類發現規律,預測未來不再是科幻電影里的讀心術,這也是大數據分析可見的價值之一。
從大數據分析挖掘的價值角度來看,大數據分析挖掘和數據融合的異同在于:大數據分析挖掘因為有極其豐富的數據作為基礎,可以讓“有規律的隨機事件”在大量重復出現的條件下,呈現幾乎必然的統計特性。
而數據融合其實是在一定的數據量條件下,通過多源傳感器的協同,改進測量和預測的結果,在發現規律、預測未來的準確性方面和大數據分析挖掘不在一個數量級上。我們認為,從數據融合到大數據分析挖掘,其實是從小智能到大智慧,這也是大數據分析挖掘的核心價值。
大數據國家發展戰略機遇
無論是從個人、行業、國家可能已都把數據看成一種有效的資源,大數據的開放和開發如今已經上升到一個國家的戰略。2015年是中國大數據發展高峰期,我國政府部門頒布了大數據開放行動的戰略。
2015年底,《中共中央關于制定國民經濟和社會發展第十三個五年規劃的建議》通過并提出了發展“互聯網+”、分享經濟和大數據等創新戰略,更是將大數據開放、開發提到了國家戰略高度。大數據作為社會的又一個基礎性資源,將給社會進步、經濟發展帶來強大的驅動力。大數據代表了先進生產力方向,已經成為不可阻擋的趨勢。
大數據安全現狀
從斯諾登事件曝光美國全球監控計劃來看,實際它曝光的不僅是一個所謂的監控,很大程度說明網絡安全中攻防的行為,包括個人上網的行為、習性、軌跡,很多數據都可以精確的定位并找到數據源。大數據的安全問題表現在:
一、是網絡攻擊成愈演愈烈之勢。如今的網絡攻擊,往往是通過各種手段獲得政府、企業或者個人的私密數據。因此在大數據時代,數據的收集與保護成為競爭的著力點。從隱私的角度來看,大數據時代把網絡大眾帶入到了一種開放透明的“裸奔”時代。
二、是DT(數據技術)時代是開放與安全的二元挑戰。在大數據獲得開放的同時,也帶來了對數據安全的隱憂。大數據安全是“互聯網+”時代的核心挑戰,安全問題具有線上和線下融合在一起的特征。
傳統解決網絡安全的基本思想是劃分邊界,在每個邊界設立網關設備和網絡流量設備,用守住邊界的辦法來解決安全問題。但隨著移動互聯網、云服務的出現,網絡邊界實際上已經消亡了。信息安全的危險正在進一步升級,在APT、DDos、異常風險、網絡漏洞等威脅下,傳統防御型、檢測型的安全防護措施已經力不從心,無法適應新形勢下的要求。
三、是難以用有效的方式向用戶申請權限,實現角色預設;難以檢測、控制開發者的訪問行為,防止過度的大數據分析、預測和連接。在大數據時代,很多數據在收集時并不知道其用途是什么,往往是二次開發創造了價值,公司無法事先告訴用戶尚未想到的用途,而個人也無法同意這種尚是未知的用途。所以這樣一種威脅狀態是值得我們去面對和需要思考的問題。
2、大數據帶來的網絡安全和用戶隱私問題
一、是大數據依托的NoSQL(非關系型數據庫)缺乏數據安全機制。從基礎技術角度來看,大數據依托的基礎技術是NoSQL。當前廣泛應用的SQL(關系型數據庫)技術,經過長期改進和完善,在維護數據安全方面已經設置嚴格的訪問控制和隱私管理工具。
而在NoSQL技術中,并沒有這樣的要求。大數據數據來源和承載方式多種多樣,如
物聯網、移動互聯網、PC以及遍布地球各個角落的傳感器,數據分散存在的狀態,使企業很難定位和保護所有這些機密數據。NoSQL允許不斷對數據記錄添加屬性,其前瞻安全性變得非常重要,對數據庫管理員提出了新的要求。
二、是社會工程學攻擊帶來的安全問題。社會工程學的特點是:無技術性、成本低、效率高。該攻擊與其他攻擊的最大不同是其攻擊手段不是利用高超的攻擊技術,而是利用受害者的心理弱點進行攻擊。因為不管大數據多么龐大總也少不了人的管理,如果人的信息安全意識淡薄,那么即使技術防護手段已做到無懈可擊,也無法有效保障數據安全。由于大數據的海量性、混雜性,攻擊目標不明確,因此攻擊者為了提高效率,經常采用社會工程學攻擊。
該類攻擊的案例很多,如黑客先攻擊某論壇的網站,使用戶無法正常登錄。然后再假冒管理員,以維護網站名義向用戶發送提醒信息,索要用戶的賬號和密碼,一般用戶此時會將密碼和賬號發送給黑客。此外,還有采用冒充中獎、假冒社交好友、信用卡掛失等欺詐手段獲得合法用戶信息。
三、是軟件后門,也會成為大數據安全的軟肋。在軟件定義世界的時代,云計算、大數據的基礎,軟件是IT系統的核心,也就是大數據的核心,所有的后門可能都是開放在軟件上面的。據了解,IBM、EMC等各大巨頭生產制造的存儲、服務器、運算設備等硬件產品,幾乎都是全球代工的,在信息安全的監聽方面是很難做手腳的。
換句話說,軟件才是信息安全的軟助所在。軟件供應方只要在主板上加入特殊的芯片,或是在軟件上設計了特殊的路徑處理,檢測人員只按照協議上的功能進行測試,根本就無法察覺軟件預留的監聽后門。
換言之,如果沒有自主可控的信息安全檢測方案,各種安全機制和加密措施,就都是形同虛設。所以近期代碼審計會是安全領域一個非常重要的領域。對于現代信息安全而言,最危險的行為是將自主控制的權力交給“他人”。這就好比將自家的鑰匙全部交到了外人手里,安全問題又從何談起呢?
四、是文件安全面臨極大挑戰。文件是整個數據和運行些核心。大多數的用戶文件都是在第三方的運行平臺中存儲的和處理的,這些文件往往包含了很多部門和個人的敏感信息,在安全性和隱私性自然成為一個重要的問題。
盡管文件的保護提供了對文件的訪問控制和授權,例如Linux自帶的文件訪問控制機制,通過文件訪問控制列表來限制程序對文件的操作。然而大部分文件保護機制都存在一定程度的安全問題,它們通常使用操作系統的功能來實現完整性驗證機制,因此只依賴于操作系統本身的安全性。但是作為網絡攻擊,操作系統才是最大的一個攻擊點。
五、是大數據存儲安全問題。大數據會使數據量呈非線性增長,而復雜多樣的數據集中存儲在一起,多種應用的并發運行以及頻繁無序的使用狀況,有可能會出現數據類別存放錯位的情況,造成數據存儲管理混亂或導致信息安全管理不合規范,F有的存儲和安全控制措施無法滿足大數據安全需求,安全防護手段如果不能與大數據存儲和應用安全需求同步升級更新,就會出現大數據存儲安全防護的漏洞。
六、是大數據安全搜索挑戰和問題。我們需要更高效更智慧的分割數據,搜索、過濾和整理信息的理論與技術,以應對大數據越來越龐大的處理量,特別是實時性數據變化加快,以及非結構化數據品種增多。大數據安全搜索服務將上述浩瀚數據整理分類,可以幫助人們更快更高效地從中找到所需要的內容和信息。
大數據安全搜索挑戰涉及通信網絡的安全、用戶興趣模型的使用安全和私有數據的訪問控制安全,包括傳統搜索過程中可能出現的網絡安全威脅,比如相關信息在網絡傳輸時被竊聽以及惡意木馬、釣魚網站等,也包括服務器端利用通信網絡獲取用戶隱私的危險。
七、是基于大數據的威脅發現技術挑戰。借用中共中央辦公廳機要局副局長馮登國的觀點,“棱鏡”計劃可被理解為應用大數據方法進行安全分析的成功故事。通過收集各個國家各種類型的數據,利用該技術發現潛在危險局勢,在攻擊發生之前識別威脅。
基于大數據的威脅發現技術雖然具有上述的優點,但它目前存在一些挑戰:一方面,大數據的收集很難做到全面,它的片面性會導致分析結果的偏差。為了分析企業信息資產面臨的威脅,不但要全面收集企業內部的數據,還要對一些企業外的數據進行收集;另一方面,大數據分析能力的不足,影響分析的準確性。
八、是大數據帶來的高級可持續攻擊挑戰。傳統的檢測是基于單個時間點進行的基于威脅特征的實時匹配檢測,而高級可持續攻擊(APT)是一個實施過程,無法被實時檢測。
此外,大數據的價值低密度性,使得安全分析工具很難聚焦在價值點上,黑客可以將攻擊隱藏在大數據中,給安全服務提供商的分析制造很大困難。黑客設置的任何一個會誤導安全廠商目標信息提取和檢索的攻擊,都會導致安全監測偏離應有方向。
前文中提到的APT,也就是基于大數據這樣一種高級可持續的威脅攻擊,比如量子網攻。美國《紐約時報》2014年1月15日曝光了美國網絡戰新技術量子項目,可入侵未聯網的電腦、iPhone和大型網絡服務器,從2008年開始,已操控全球10萬臺計算機,主要竊密中俄核心軍方網絡。
“量子”計劃的誕生,意味著個人隱私的終結,全球信息安全陷入危機。量子網攻可能是近幾年全球最完美的一個攻擊技術,它也是可以看得到的一系列經典攻擊的杰作?傮w來講量子網攻是近年來高級可持續威脅當中最具代表性的,也是世界各國的網軍包括黑客非常關注的一個主流攻擊。
九、是大數據支撐平臺--云計算安全。云計算的核心安全問題是用戶不再對數據和環境擁有完全控制權,云計算的出現徹底打破了地域的概念,數據不再存放于某個確定的物理節點,而是由服務商動態提供存儲空間,這些空間有可能是現實的,也可能是虛擬的,還可能分布在不同國家及區域。
用戶對存放在云中的數據不能像從前那樣具有完全的管理權,相比傳統的數據存儲和處理方式,云計算時代的數據存儲和處理,對于用戶而言,變得非常不可控。云環境中用戶數據安全與隱私保護難以實現。
十、是大數據用戶隱私保護考驗問題。大數據分析預測帶來的用戶隱私挑戰。從核心價值角度來看,大數據關鍵在于數據分析和利用,但數據分析技術的發展,對用戶隱私產生極大的威脅。在大數據時代,想屏蔽外部數據商挖掘個人信息是不可能的。
目前,各社交網站均不同程度地開放其用戶所產生的實時數據,被一些數據提供商收集,還出現了一些監測數據的市場分析機構。通過人們在社交網站中寫入的信息、智能手機顯示的位置信息等多種數據組合,已經可以以非常高的精度鎖定個人,挖掘出個人信息體系,用戶隱私安全問題堪憂。
十一、大數據共享安全性問題。我們不知道該如何分享私人數據,才能既保證數據隱私不被泄漏,又保證數據的正常使用。真實數據不是靜態的,而是越變越大,并且隨著時間的變化而變化。當前沒有一種技術能在這種情況下產生任何有用的結果。
許多在線服務要求人們共享私人信息,但是,在記錄級的訪問控制之外,人們根本不知道共享數據會意味著什么,不知道共享后的數據會怎樣被連接起來,更不知道如何讓用戶對共享后的數據仍能進行細粒度控制。
十二、大數據訪問控制難題。訪問控制是實現數據受控共享的有效手段,由于大數據可能被用于多種不同場景,其訪問控制需求十分突出。難以預設角色,實現角色劃分.由于大數據應用范圍廣泛,它通常要為來自不同組織或部門、不同身份與目的的用戶所訪問,實施訪問控制是基本需求。然而,在大數據的場景下,有大量的用戶需要實施權限管理,且用戶具體的權限要求未知。面對未知的大量數據和用戶,預先設置角色十分困難。
同時,難以預知每個角色的實際權限。面對大數據,安全管理員可能無法準確為用戶指定其可以訪問的數據范圍,而且這樣做效率不高。
不同類型的大數據存在多樣化的訪問控制需求。例如,在Web2.0個人用戶數據中,存在基于歷史記錄的訪問控制;在地理地圖數據中,存在基于尺度以及數據精度的訪問控制需求;在流數據處理中,存在數據時間區間的訪問控制需求等。如何統一地描述與表達訪問控制需求是一個挑戰。
十三、大數據的可信性難以保障。網絡的數據并非都可信,這主要反映在偽造的數據和失真的數據兩個方面。有人可能通過偽造數據來制造假象,進而對數據分析人員進行誘導;或者數據在傳播中逐步失真。這可讓大數據分析和預測得出無意義或錯誤的結果。馮登國認為,用信息安全技術手段鑒別所有數據來源的真實性是不可能的。過去往往認為“有圖有真相”,事實上圖片可以移花接木、時空錯亂,或者照片是對的,可是文字解釋是捏造的。
中國工程院院士鄔賀銓指出,傳感器收集的數據并非都是可信的,特別是歷史上該傳感器的數據與同類的其他傳感器報出的數據差異很大時,該數據就應棄用。密碼學中的數字簽名、消息鑒別碼等技術可用于驗證數據的完整性,但應用于大數據的真實性時面臨很大困難,主要根源在于數據粒度的差異。
大數據溯源技術的安全應用挑戰。數據溯源技術旨在幫助使用者確定數據的來源,進而檢驗分析結果是否正確,或對數據進行更新。2009年,數據溯源技術被相關報告列為三大確保國家安全的重要技術之一,其在未來數據信息安全領域中仍具有很大的發展空間。
數據溯源技術應用于大數據安全與隱私保護中還面臨如下挑戰:
1、大數據溯源與隱私保護之間的平衡。一方面,基于數據溯源對大數據進行安全保護首先要通過分析技術獲得大數據的來源,然后才能更好地支持安全策略和安全機制的工作;另一方面,數據來源往往本身就是隱私敏感數據。用戶不希望這方面的數據被分析者獲得。因此,如何平衡這兩者的關系是值得研究的問題之一。
2、大數據溯源技術自身的安全性保護。當前數據溯源技術并沒有充分考慮安全問題,例如標記自身是否正確、標記信息與數據內容之間是否安全綁定等等。而在大數據環境下,其大規模、高速性、多樣性等特點使該問題更加突出。
3、大數據帶來的網絡安全和用戶隱私問題對策
第一,是基于大數據的威脅發現技術。利用該技術,企業可以超越以往的“保護-檢測-響應-恢復”(PDRR)模式,更主動地發現潛在的安全威脅。相比于傳統技術,基于大數據的威脅發現技術有以下優點:分析內容的范圍更大。企業信息資產包括數據資產、軟件資產、實物資產、人員資產、服務資產和其他為業務提供支持的無形資產。
由于傳統威脅檢測技術并不能覆蓋這六類信息資產,因此所能發現的威脅有限。而通過在威脅檢測方面引入大數據分析技術,能全面發現針對這些信息資產的攻擊。分析內容的時間跨度更長。現有威脅分析技術具有內存關聯性,即實時收集數據,采用分析技術發現攻擊。分析窗口通常受限于內存大小,無法應對持續性和潛伏性攻擊。而引入大數據分析技術后,威脅分析窗口可以橫跨若干年的數據,因此威脅發現能力更強,可以有效應對APT類攻擊。
相比于傳統技術,基于大數據的威脅發現技術還有以下優點:攻擊威脅的預測性。傳統安全防護技術大多是在攻擊發生后對攻擊行為進行分析和歸類,并做出響應。而基于大數據的威脅分析,可進行超前的預判,對未發生的攻擊行為進行預防。對未知威脅的檢測。
傳統的威脅分析常由經驗豐富的專業人員根據企業需求和實際情況展開,威脅分析結果很大程度上依賴于個人經驗,分析所發現的威脅是已知的。而大數據分析的特點是側重于普通的關聯分析,而不側重因果分析,因此通過采用恰當的分析模型,可發現未知威脅。
第二,基于大數據的認證技術。基于大數據的認證技術指的是收集用戶行為和設備行為數據,并對這些數據進行分析,獲得用戶行為和設備行為的特征,進而通過鑒別操作者行為及其設備行為來確定其身份.這與傳統認證技術利用用戶所知秘密,所持有憑證,或具有的生物特征來確認其身份有很大不同。該技術具有如下優點:
攻擊者很難模擬用戶行為特征來通過認證,因此更加安全。利用大數據技術所能收集的用戶行為和設備行為數據是多樣的,可以包括用戶使用系統的時間、經常采用的設備、設備所處物理位置,甚至是用戶的操作習慣數據。通過這些數據的分析能夠為用戶勾畫一個行為特征的輪廓。而攻擊者很難在方方面面都模仿到用戶行為,因此其與真正用戶的行為特征輪廓必然存在一個較大偏差,無法通過認證。
該技術還具有如下優點:減小了用戶負擔。用戶行為和設備行為特征數據的采集、存儲和分析都由認證系統完成。相比于傳統認證技術,極大地減輕了用戶負擔。如,用戶無需記憶復雜的口令,或隨身攜帶硬件USBKey?梢愿玫刂С指飨到y認證機制的統一;诖髷祿恼J證技術可以讓用戶在整個網絡空間采用相同的行為特征進行身份認證,而避免傳統不同系統采用不同認證方式,且用戶所知秘密或所持憑證各不相同而帶來的種種不便。
第三,基于大數據的數據真實性分析。目前,基于大數據的數據真實性分析被廣泛認為是最為有效的方法。許多企業已經開始了這方面的研究工作,如Yahoo和Thinkmail等利用大數據分析技術來過濾垃圾郵件;Yelp等社交點評網絡用大數據分析來識別虛假評論;新浪微博等社交媒體利用大數據分析來鑒別各類垃圾信息等。
基于大數據的數據真實性分析技術能夠提高垃圾信息的鑒別能力:一方面,引入大數據分析可以獲得更高的識別準確率。例如,對于點評網站的虛假評論,可以通過收集評論者的大量位置信息、評論內容、評論時間等進行分析,鑒別其評論的可靠性。如果某評論者為某品牌多個同類產品都發表了惡意評論,則其評論的真實性就值得懷疑;另一方面,在進行大數據分析時,通過機器學習技術,可以發現更多具有新特征的垃圾信息。然而該技術仍然面臨一些困難,主要是虛假信息的定義、分析模型的構建等。
構建大數據安全策略
研究大數據基礎設施安全能力的評估以及加強大數據框架下的安全技術,如數據標簽法、Hadoop、NoSQL等,這些基礎設施、基本技術,都將直接影響大數據下的信息安全。推動信息安全的自主可控,提倡“可信計算”。所謂的“可信計算”就是,軟件不再做功能上的黑名單,而是換以白名單來進行控制。
圍繞大數據突出的安全和隱私問題,構建數據全生命周期的安全管理體系,結合大數據處理體系的特點,尤其關注分布式環境下的并行計算隔離;分布式集群的數據訪問控制;以及對敏感、重要數據的分級管控、加密處理和審計追蹤等安全保障措施。風險自適應的訪問控制。
在大數據場景中,安全管理員可能缺乏足夠的專業知識,無法準確地為用戶指定其可以訪問的數據。風險自適應的訪問控制是針對這種場景討論較多的一種訪問控制方法。在大數據環境下,發展基于密碼認證、攻防、風險控制、安全集成電路設計等信息安全技術。
立法保障大數據安全
為了防止數據泄露,鄔賀銓認為首先要從法律上約束制裁。“大數據時代,開放數據和保護數據安全都需要通過立法來保證,如果沒有相應的法律,我們很難判斷哪些數據應該共享,哪些數據不應泄露,誰可以用,誰不可以用,出了問題很難找出誰是幕后黑手,目前我們國家沒有信息安全法,未來需要從法律上約束。”
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:大數據安全與隱私保護的問題及對策
本文網址:http://www.guhuozai8.cn/html/consultation/10839519819.html