2019年后,隱私計算進入應用期,走出學院派與實驗室,廣泛與行業(yè)應用場景相結合。各類隱私計算廠商也如雨后春筍一般涌現出來,激發(fā)了隱私計算技術可用性的快速提升。
當前,隱私計算在應用中快速發(fā)展,領域內仍在持續(xù)涌現出更多新的技術特點和解決方案。
從技術層面來說,隱私計算主要有三類主流技術路線:一類是采用密碼學和分布式系統,以多方安全計算(Secure Multiparty Compute,MPC)為代表;另一類是采用基于硬件的可信執(zhí)行環(huán)境(Trusted Execution Environment,TEE);最后一類是近年來發(fā)展相當火熱的聯邦學習(Federated Learning,FL)。此外,還有零知識證明、同態(tài)加密、差分隱私等技術。各類技術路線融合應用趨勢凸顯。
多方安全計算
多方安全計算(Secure Multiparty Compute,MPC)是一種將計算分布在多個參與方之間的密碼學分支,參與者在不泄露各自隱私數據情況下,利用隱私數據參與保密計算,共同完成某項計算任務。
這項技術最早可追溯至1981年,Rabin首次提出通過Oblivious Transfer(OT) 協議實現機密信息交互。1982年,姚期智教授在論文《Protocols for Secure Computations》中提出“百萬富翁問題“,即兩個百萬富翁在沒有可信第三方、不透露自己財產狀況的情況下,如何比較誰更富有,這標志著多方安全計算技術的產生。1986年,姚期智教授提出混淆電路技術,實現了第一個多方(兩方)安全計算方案。1987年,Goldreich等人提出了基于電路的秘密共享方案GMW,并將其應用于多方安全計算。
同態(tài)加密
同態(tài)加密(Homomorphic Encryption,HE)是一種通過對相關密文進行有效操作(不需獲知解密秘鑰),從而允許在加密內容上進行特定代數運算的加密方法。其特點是允許在加密之后的密文上直接進行計算,且計算結果解密后和明文的計算結果一致。
1978年,Ron Rivest、Leonard Adleman和Michael L. Dertouzos提出同態(tài)加密問題,并在同年提出滿足乘法同態(tài)的RSA算法。同態(tài)加密問題的提出將加密技術的研究從靜態(tài)引向動態(tài),是理論上的巨大革新,也開創(chuàng)了隱私計算的先河。2009年,Gentry提出了首個實用的全同態(tài)加密算法,標志著全同態(tài)計算時代的開始。2017年,國際同態(tài)加密標準委員會成立,標志著同態(tài)加密在全球進入高速發(fā)展階段。
聯邦學習
聯邦學習(Federated Learning,FL)是一種具有隱私保護屬性的分布式機器學習技術。在機器學習中,通常會從多個數據源聚合訓練數據,并將其傳送到中央服務器進行訓練。然而這一過程容易產生數據泄露風險。在聯邦學習模型中,運算在本地進行,只在各個參與方之間交換不包含隱私信息的中間運算結果,用于優(yōu)化各個參與方相關的模型參數,最終產生聯邦模型,并將應用于推理,從而實現了“原始數據不出本地”、“數據可用不可見”的數據應用模式。按照數據集合維度相似性構成的特點,業(yè)界普遍將聯邦學習分為橫向聯邦學習、縱向聯邦學習與聯邦遷移學習。
2012年,王爽等在期刊Journal of Biomedical Informatics發(fā)表論文,首次解決醫(yī)療在線安全聯邦學習問題,該框架服務于多個國家級醫(yī)療健康網絡,也是聯邦學習系統構架層面的突破。
零知識證明
零知識證明(Zero-Knowledge Proof,ZKP),是指證明者能夠在不向監(jiān)控者提供任何有用信息的情況下,使驗證者相信某個論斷是正確的。零知識證明實際上是一種涉及雙方或更多方的協議,即雙方或更多方完成一項任務需要采取的一系列步驟,證明者需要向驗證者證明并使其相信自己知道或擁有某一消息,但證明過程不向驗證者泄露任何關于被證明消息的信息。
1985年,S. Goldwasser、S. Micali和C. Rackoff首次提出零知識證明(Zero-Knowledge Proof, ZKP)概念。目前在實際應用中,某些加密貨幣就采用了這一技術路線。
可信執(zhí)行環(huán)境
可信執(zhí)行環(huán)境(TEE)是一種基于硬件的隱私保護方法,是指計算平臺上由軟硬件方法構建的一個安全區(qū)域,可保證在安全區(qū)域內部加載的代碼和數據在機密性和完整性方面得到保護。2009年,OMTP工作組率先提出一種雙系統解決方案:在同一個智能終端下,除多媒體操作系統外再提供一個隔離的安全操作系統,這一運行在隔離硬件之上的隔離安全操作系統用來專門處理敏感信息以保證信息安全,該方案是可信執(zhí)行環(huán)境的前身。
在實踐層面,目前以Intel SGX和ARM TrustZone為基礎的TEE技術起步較早,社區(qū)和生態(tài)已比較成熟。同時,國產化的芯片廠商在TEE方向上已經開始發(fā)力,國內芯片廠商如海光、鯤鵬、飛騰、兆芯等都推出了支持可信執(zhí)行環(huán)境的技術,信創(chuàng)國產化趨勢明顯,相關生態(tài)也正在加速建立、完善。
差分隱私
2006年,C. Dwork提出差分隱私(Differential Privacy, DP),這一技術路線的主要原理是通過引入噪聲對數據進行擾動,并要求輸出結果對數據集中的任意一條記錄的修改不敏感,使攻擊者難以從建模過程中交換的統計信息或者建模的結果反推出敏感的樣本信息。
隱私計算的未來:融合應用
除上述技術之外,還有圖聯邦、混淆電路、不經意傳輸等多種技術路線被先后提出,并不斷在科研和產業(yè)的推動下得到發(fā)展和應用。
縱觀隱私計算不同技術路線,可以發(fā)現各有其優(yōu)勢與不足,在可支持計算、隱私保護維度、隱私保護強度、安全性、性能等方面有較大差異,分別適合不同的應用和場景;同時,不同的技術路線目前正在持續(xù)融合、取長補短,實現1+1>2的應用效果。例如通過硬件加速的全同態(tài)加密算法構建強隱私、高性能的縱向聯邦學習系統,就是一個不同技術路線深度融合的典型案例。
相信在未來,不同技術路線的融合以及與人工智能、區(qū)塊鏈等新興技術的結合,能夠推動隱私計算大規(guī)模落地,實現海量數據要素的價值釋放。