密碼學的研究進展是令人鼓舞的,但對云計算中的數據進行加密操作還沒有切實可行的解決方案。由羅納德L.李維斯特(Ronald L.Rivest)提供的“選種和篩選系統(Chaffing and Winnowing)”即技術保密而不加密算法將成為一種可行的解決方案,能從云計算中受益,該技術的提出是基于分組通信系統,其不適用所有云服務模式,如:SaaS,PaaS或IaaS。
1.簡介
1.1 可提供外包的計算密集型任務
計算密集型任務可以利用云服務的可擴展性,低成本等優勢,外包給遠程的云服務提供商(CSP)。在互聯網廣告業務中,無論是在線購物網站,社交網站或一個簡單的房地產搜索網站,都是通過事件日志來了解客戶的行為模式的,如他們的會話持續時間,頻率和數量,用戶在不同的關鍵點上花費的時間不同將產生不同的數據日志和搜索關鍵詞。
許多數字廣告和營銷公司會細分用戶和客戶的數據日志,并在此基礎上收集和分析這些日志,往往這些日志中會包含敏感的信息和客戶數據。因此云服務消費者(SCS)將這樣的任務外包到遠程的CSP是非常危險的,無論是黑客的外部入侵還是內部人員惡意盜用,一旦這些數據落入他人之手,將會給SCS帶來不小的損失。
1.2 MapReduce類似于IaaS
MapReduce是一種編程模型,用于大規模數據集的并行運算。概念“Map(映射)”和“Reduce(化簡)”以及它們的主要思想,都是從函數式編程語言里借來的,還有從矢量編程語言里借來的特性。它極大地方便了編程人員在不會分布式并行編程的情況下,將自己的程序運行在分布式系統上。當前的軟件實現是一個Map(映射)函數,用來把一組鍵值對映射成一組新的鍵值對,指定并發的Reduce(函數),用來保證所有映射的鍵值對中的每一個共享相同的鍵組。這樣一個典型的編程模型,尤其是對于網絡日志解析,將有幾個主要部分:
(1)數據收集。
如Apache Flume,Facebook's Scribe chukwa等一系列分布式,可靠性和可利用率高的服務,通常有三層:代理層,是負責收集各種來源的數據;采集層,是負責總匯這些數據;流層,是負責簡化數據并以流的形式發送至CSP。
(2)數據解析。
Hadoop和MapReduce服務一樣,兩者都采用WebLog數據解析模式概述了一種典型的CSC架構(如圖1)。Hadoop是一種能夠運行在廉價硬件之上的分布式文件系統,而且它提供高傳輸率來訪問應用程序的數據,適合那些有著超大數據集的應用程序。Hadoop放寬了POSIX接口的要求,這樣可以以流的形式訪問文件系統中的數據。
圖1 典型的CSC架構
(3)數據存儲。
以上數據解析服務的輸出可以導出成特定的存儲格式。
(4)數據分析。
最后的數據分析可以使用ApacheHive,Apache Pig或SQL查詢語言。
1.3 Chamng and Winnowing(選種和篩選系統)
該詞來自于農業,是用來表示小麥從谷殼分離的過程,這一技術的首次提出是實現保密而不加密的數據發送。
選種和篩選系統是自我強化系統的孿生組成部分。此系統不需要加密。該技術由發送錯誤包到數據庫(發送終端)和終端刪除錯誤包組成。錯誤包混淆假信息并且發送難解信息到認證收件人之外的任何人。每一個合法的信息包在源頭處都會被分派一個獨一無二的序列號和認證碼(MAC)。每個序列號和認證碼是管理者已知的。一旦一個虛假的數據包被加入發送源頭,就開始進行選種過程(谷物是植物最容易掉落的部分,就像小麥在磨面過程中分離一樣)。源數據包可能和正確信息有相同的格式,或者組成相同的序列號,但它的認證碼是無效的。除非在終端比較認證碼,否則無法識別合法數據包和源數據包。因此注冊碼也是比較真信息包和源信息包的唯一途經。
簡單地說,通信雙方都有一個共同的密鑰,發送方發送實際的數據包和一些任意值與其他一些數據包的簽名,接收方接收數據然后通過共同密鑰計算每一個數據包的簽名,然后分離出無用的數據包。因此通信雙方是采用明確的文字和其他一些假包來迷亂第三者,而技術上的分組是不經過加密的。
這種技術可以適用于實現云計算的隱私,特別是在IaaS中,因為在遠程CSP服務上操作加密解密數據還尚未可行。
2.框架結構的實現
下面是實現無加密模式下CSC數據機密性的幾個重要環節:
(1)數據收集。
CSC有多個數據代理收集數據,所有的這些代理可以共享一個公共解密,并且使用該密鑰可以簽署產生日志文件。CSC也可以有一些假的代理,假數據和假密鑰簽名產生的日志文件。所有這些日志文件由收集節點匯集和簡化并發送到MapReduce集群。
(2)數據解析。
MapReduce集群從混淆的數據中解析出真實的數據,并將結果返回到CSC的數據存儲器中。這里最值得注意的是如何編寫高效并且松耦合的程序來識別真簽名數據和假簽名數據。
(3)數據存儲。
MapReduce將真實的數據解析后保存到CSC指定的數據存儲空間中以便以后分析使用。
(4)數據分析。
CSC的數據分析器與數據代理共享著相同的密鑰,CSC數據分析器通過密鑰與數字簽名仔細從結果中過濾掉假數據。
圖2為具有虛假數據的CSC架構。
圖2 具有虛假數據的CSC架構
任何CSP的外部攻擊者,或者不受信任的CSP本身由于缺乏密鑰還不能將密集型任務解析成真實的數據。
3.結束語
值得注意的是,可以通過CSC所需的保密程度來逐步添加虛假數據的信息量,因此日志分析是一個密集型任務而不是分析假日志。
可以通過進一步分析這一技術來適用于其他云服務模型,如SaaS和PaaS。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:無加密模式下對云數據的隱私保密
本文網址:http://www.guhuozai8.cn/html/consultation/10839511160.html