在WWDC2016中公布的即將升級的操作系統中,iOS是更新最多的一個平台。其中包括Quick Type預測能力的加強與Spotlight全局搜索的升級。
Quick Type(輸入預測)是一款前年推出的鍵盤應用,主要為用戶在輸入時提供預測性建議,即聯想輸入。更新後,鍵盤可以基於Siri,更加智能的為用戶提供詞語聯想,也可以利用鍵盤做更多的事情,比如發動定位、使用不同國家的語言等。
Spotlight是一個基於系統內所包含信息的快速搜索功能,可以根據搜索關鍵詞搜索到系統內所有的相關信息,包括聯系人、信息、郵件、歌曲等。現在的spotlight只能在主屏幕向左滑動時出現,更新後,在鎖屏界面與通知欄中也將出現搜索框。
二者都需要在了解用戶習慣的基礎上來提供更好的操作體驗,且使用的時間越長,顯示的結果會更優。加強這些應用,也就意味著需要獲取更多的用戶數據。蘋果一直主張,真正貼近你的技術,也應真正保護你的隱私。在這次WWDC的主旨演講中可以了解到,iOS10將內置一種創新安全保護功能,差別隱私保護(Differential Privacy)。
在蘋果發給媒體的郵件中,關於ios10的更新前瞻裡這樣介紹道,
“從iOS10開始,蘋果將使用差分隱私技術,使系統在不影響個人隱私的前提下,幫助發現大批量用戶的使用模式。為了掩蓋個人身份,差別隱私會像個人使用模式的小樣本中加入數學噪音。隨著更多的用戶呈現出相同的模式,總體模式就會開始顯現,這可以用來增強用戶體驗。”
WWDC現場,負責蘋果軟件工程的高級副總裁Craig Federighi說,
蘋果從不收集用戶的個人隱私,並且會盡可能的在用戶所使用的手機上而不是在服務器上,保護好其個人信息。我們深信,用戶在擁有優秀功能的同時,也應該擁有更好的隱私保護。差別隱私保護是統計和數據分析領域中的研究主題,利用哈希、分段抽樣和噪聲注入等方法,在實現眾包學習時也完全保護了用戶的個人隱私。蘋果在這個技術方面做了很多非常重要的努力,來確保其可以進行大規模的應用。
照蘋果的說法,差別隱私是一個統計學的概念,在試圖更多分析了解一個群組信息整體趨勢的同時,可以盡可能少的了解這個群組中的個體詳情。利用差別隱私,蘋果可以收集和存儲其用戶數據,並從中總結出用戶們在做什麼、喜歡什麼、想要什麼等,但同時又不會提取到有關該群體中任何可能會侵犯隱私的個人信息。並且在理論上,黑客或者情報機構也不可能提取到這些個體信息。
Federighi在演講中還提到過一本已經出版的,關於差別隱私的書。這本書的聯合作者是賓夕法尼亞大學計算機教授Aaron Roth。蘋果在研發出差別隱私技術後就給他進行了展示。Roth說,
一個大數據集裡包含有個人信息,你可能會需要一種機器學習算法來從數據庫中獲取數據化的“總結”,但又想要保護這些數據不被一些外界的攻擊者或窺探者所收集。這種保護並不是一種簡單的模糊化或者匿名化保護。
2007年,美國一家在線視頻網站Netflix,為了優化網站的推薦功能,發布了大量用戶的電影點評,其中隱去了用戶的名字及與其相關的個人信息。但是黑客很快通過對Netflix數據與IMDB上公眾點評數據進行相互對照,找出了兩個網站之間相似的點評推薦,從而獲得了這個匿名數據庫中的用戶姓名。
Roth認為,模糊化或匿名畫的處理只是可能采取了一些比前人略為聰明的辦法來保護你的數據,但隨時有可能出現比你更聰明的人,對數據集進行反匿名化。差分隱私保護能夠徹底封堵這種回路,因此是不會過時的。
但有一點值得注意,Fedrighi在演講中把差別隱私稱作是一個“研究主題”。約翰霍普金斯大學密碼學教授Matthew Green認為,未經嚴格檢驗的差別隱私技術,很有可能存在危險。Green還在Twitter上發布了一系列針對蘋果差分隱私的質疑。
這的確是個很棒的想法,但我從未真正見過它被應用。它最終會成為數據准確性和隱私之間的折衷。而隱私性的提高必然會伴隨著准確性的降低。
大多數人(在面對新技術時)都會從理論走到實踐,然後再大范圍應用。而在面對差分隱私時,蘋果似乎省略了中間步驟。
(差別隱私技術是否真的安全),問題在於(蘋果所使用的)數據類型、測量方式和具體用途。
在大數據時代,隨著交互式應用的不斷發展,如何保護隱私數據和防止敏感信息洩露已漸漸成為科技企業中面臨的重大挑戰。大數據隱私以及數據挖掘中的隱私問題也成為了信息安全領域目前的一個研究熱點,差別隱私保護較傳統的隱私保護模型有著許多的優勢。但都還處於研究展望中,沒有具體的應用實例。
目前也還沒有關於蘋果差別隱私保護技術更詳細的資料,還無法驗證這一技術在實際操作中是否像Fedrighi所說的那樣神奇。但正如Green教授所說,蘋果的差別隱私到底安不安全最終取決於他們打算如何利用這一功能,以及他們對數據處理的技術是否可靠。一旦成功,蘋果又將會創造出另一個技術傳奇,並在此基礎上對所有交互式應用進行一次深度升級。