5月6日,同盾科技人工智能研究院團(tuán)隊(duì)在院長(zhǎng)、佛羅里達(dá)大學(xué)終身教授李曉林帶領(lǐng)下,經(jīng)過長(zhǎng)期打磨,重磅推出《知識(shí)聯(lián)邦白皮書》。白皮書中對(duì)知識(shí)聯(lián)邦的背景、定義、平臺(tái)、挑戰(zhàn)、場(chǎng)景應(yīng)用以及未來發(fā)展前景進(jìn)行了全方位、全景式剖析,并對(duì)人工智能3.0時(shí)代進(jìn)行展望。與此同時(shí),同盾科技人工智能研究院自主研發(fā)的基于知識(shí)聯(lián)邦體系的智邦平臺(tái)V2.1正式發(fā)布。
在原有平臺(tái)基礎(chǔ)上,智邦平臺(tái)V2.1版升級(jí)了安全功能、安全交換的算法和策略。同時(shí)增加了面向數(shù)據(jù)安全交換的標(biāo)準(zhǔn)產(chǎn)品,極大地簡(jiǎn)化數(shù)據(jù)對(duì)接和融合的成本。此外,結(jié)合公司自身豐富的風(fēng)控/營(yíng)銷模型分析優(yōu)勢(shì),提供了基于樹模型/邏輯回歸/深度神經(jīng)網(wǎng)絡(luò)等快速部署的聯(lián)邦算法,本文重點(diǎn)闡述智邦平臺(tái)安全的數(shù)據(jù)和知識(shí)交換體系。
數(shù)據(jù)安全和隱私保護(hù)是聯(lián)邦的核心。知識(shí)聯(lián)邦首先將數(shù)據(jù)轉(zhuǎn)化成信息、模型、認(rèn)知或知識(shí),滿足數(shù)據(jù)不可見,再通過聯(lián)邦的方式實(shí)現(xiàn)數(shù)據(jù)可用,打造安全的人工智能。同時(shí),也面臨一個(gè)安全合規(guī)問題,如何從技術(shù)端保障企業(yè)之間的數(shù)據(jù)安全,并讓大多數(shù)公司愿意加入聯(lián)邦?
智邦平臺(tái)V2.1就安全的數(shù)據(jù)和知識(shí)交換體系構(gòu)建做了下列工作:
數(shù)據(jù)分級(jí)與脫敏
通常情況下,安全級(jí)別越高則意味著整體效率的降低,對(duì)此智邦平臺(tái)根據(jù)個(gè)人信息的類型、敏感程度、處理方式等對(duì)個(gè)人信息進(jìn)行分類,對(duì)不同敏感等級(jí)的隱私數(shù)據(jù)進(jìn)行不同層級(jí)的隱私保護(hù),從而來平衡安全和效率的問題。比如對(duì)不同敏感等級(jí)的數(shù)據(jù)采用不同的脫敏方法,脫敏方法有部分屏蔽、泛化、哈希加密等。同時(shí)要保證去標(biāo)識(shí)化和脫敏后的各方數(shù)據(jù)具有一致性。
全程過程域的數(shù)據(jù)安全和隱私保護(hù)
智邦平臺(tái)的數(shù)據(jù)安全性可以從數(shù)據(jù)完整的過程域進(jìn)行評(píng)估,包括數(shù)據(jù)導(dǎo)入、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)處理、數(shù)據(jù)傳輸、數(shù)據(jù)共享、數(shù)據(jù)溯源、數(shù)據(jù)銷毀。比如在銀行的風(fēng)控場(chǎng)景,用戶數(shù)據(jù)的敏感等級(jí)較高,但又希望能結(jié)合其他銀行或其他機(jī)構(gòu)的數(shù)據(jù)特征進(jìn)行特征維度的補(bǔ)充從而優(yōu)化建模效果。在各機(jī)構(gòu)進(jìn)行聯(lián)邦學(xué)習(xí)時(shí),樣本對(duì)齊、特征選擇、模型訓(xùn)練、預(yù)測(cè)等均保證數(shù)據(jù)“可用不可見”。在樣本對(duì)齊環(huán)節(jié),使用Hash函數(shù)、對(duì)稱加密算法安全快速計(jì)算參與方交集,保護(hù)交集外數(shù)據(jù)不泄漏。智邦平臺(tái)設(shè)計(jì)的業(yè)務(wù)場(chǎng)景是至少一方數(shù)據(jù)量級(jí)為億級(jí)別,常規(guī)的樣本對(duì)齊方式傳輸量和消耗時(shí)長(zhǎng)非常巨大,目前智邦平臺(tái)在相同資源下,運(yùn)行效率可以提升近百倍;在模型訓(xùn)練和預(yù)測(cè)環(huán)節(jié),根據(jù)模型的特點(diǎn)采用一次一密、同態(tài)加密的方式來對(duì)梯度或模型參數(shù)進(jìn)行加密,一次一密的密鑰使用Diffile-Hellman密鑰交換協(xié)議、安全偽隨機(jī)數(shù)發(fā)生器生成。
三級(jí)網(wǎng)絡(luò)安全域的劃分
智邦平臺(tái)將數(shù)據(jù)聯(lián)邦劃分為三個(gè)的安全域:數(shù)據(jù)提供方私有域、數(shù)據(jù)交換域、聯(lián)邦聚合域。私有域和交換域都在參與方本地,私有域持有所有原始數(shù)據(jù);數(shù)據(jù)交換域持有脫敏后用戶身份信息(用戶姓名、身份證號(hào)或手機(jī)號(hào)等)及原始特征和標(biāo)簽;聯(lián)邦聚合域不持有參與方數(shù)據(jù),僅接收加密后的模型參數(shù)或梯度信息等,并進(jìn)行聚合計(jì)算。域邊界處部署防火墻,通過防火墻策略控制白名單 IP 網(wǎng)段接入訪問。在不同域之間設(shè)置策略進(jìn)行控制,比如在私有域中的數(shù)據(jù)放入交換域前需要按聯(lián)邦約定的方式進(jìn)行脫敏、匿名化處理,同時(shí),交換域和聯(lián)邦域通過 CA 證書雙向認(rèn)證,且采用加密信道對(duì)數(shù)據(jù)發(fā)送和接收進(jìn)行加密保護(hù)。智邦平臺(tái)提供交換域和聯(lián)邦聚合域的實(shí)現(xiàn);私有域由參與方提供,一般為參與方數(shù)據(jù)生產(chǎn)環(huán)境。交換域和私有域部署在參與方本地,聯(lián)邦聚合域部署在第三方機(jī)構(gòu)。
安全的第三方
智邦平臺(tái)采用的是弱中心化的分布式方法,相對(duì)強(qiáng)中心化的方式,弱中心化更能保證數(shù)據(jù)的安全和合規(guī)。強(qiáng)中心化方式第三方通常會(huì)聚集保存所有參與方的數(shù)據(jù),且計(jì)算和學(xué)習(xí)都在中心節(jié)點(diǎn)完成,這種方式有數(shù)據(jù)安全隱患。另外,市場(chǎng)上還有采用一些完全去中心化的方法來保證數(shù)據(jù)安全,但去中心化模式?jīng)]有中心節(jié)點(diǎn),需要所有參與方互聯(lián)互通。當(dāng)節(jié)點(diǎn)規(guī)模較大時(shí),通信成本很高,達(dá)成共識(shí)效率低下。
相較而言,智邦平臺(tái)的弱中心化模式中原始數(shù)據(jù)是保留在本地的,且不會(huì)離開本地,計(jì)算和學(xué)習(xí)仍然發(fā)生在本地,第三方的存在只是一個(gè)協(xié)調(diào)和仲裁作用,它不會(huì)觸碰和保存所有的原始數(shù)據(jù),更多地是對(duì)參與方進(jìn)行知識(shí)信息聚合,并對(duì)參與方的數(shù)據(jù)質(zhì)量和貢獻(xiàn)進(jìn)行仲裁。事實(shí)上,第三方可以是虛擬的,只是一個(gè)可審計(jì)和可追溯的機(jī)器。在數(shù)據(jù)參與方都達(dá)成共識(shí)的情況下,虛擬第三方可以部署在更擔(dān)心數(shù)據(jù)安全的一方的私有云上,也可以部署在多方都認(rèn)可的公有云或?qū)S性粕?。第三方也可以是?shí)體機(jī)構(gòu),一般是一個(gè)中立的、可信的機(jī)構(gòu)??尚诺谌揭WC在任何情況下都不會(huì)撒謊,也不會(huì)泄露任何不該泄露的信息。
針對(duì)實(shí)際的業(yè)務(wù)場(chǎng)景,例如股份制商業(yè)銀行需要面向政府機(jī)關(guān)調(diào)用相關(guān)數(shù)據(jù)接口,并需按要求留下調(diào)用用戶的部分信息。在這種場(chǎng)景下,政府機(jī)關(guān)的數(shù)據(jù)接口和調(diào)用的用戶信息,都應(yīng)該是可用不可見且不適合對(duì)外保存的。智邦平臺(tái)V2.1提供數(shù)據(jù)安全交換功能,在單次查詢和批量調(diào)用情況下,都可以做到“數(shù)據(jù)可用不可見”。
《商業(yè)銀行法》明確規(guī)定,商業(yè)銀行不得非法查詢個(gè)人儲(chǔ)蓄存款,如有違反,對(duì)直接負(fù)責(zé)的董事、高級(jí)管理人員和其他直接責(zé)任人員,應(yīng)當(dāng)給予紀(jì)律處分。近日某行未經(jīng)本人同意泄露個(gè)人銀行消費(fèi)信息事件,不僅是對(duì)銀行系統(tǒng)合規(guī)性的檢視,也是公民個(gè)人隱私信息保護(hù)缺失的現(xiàn)狀,假如銀行內(nèi)部對(duì)明文數(shù)據(jù)查詢有安全的處理機(jī)制,就可從源頭就會(huì)斷絕這類事件的發(fā)生。
由此案例可見,當(dāng)下社會(huì)對(duì)知識(shí)安全交換的需求仍是普遍存在的。而業(yè)界在知識(shí)聯(lián)邦、聯(lián)邦學(xué)習(xí)的應(yīng)用落地上還存在以下問題:比如如何應(yīng)對(duì)各方數(shù)據(jù)數(shù)據(jù)的多樣性和訓(xùn)練環(huán)境的不同,如何提升聯(lián)邦學(xué)習(xí)效率等。后續(xù)同盾也會(huì)針對(duì)智邦平臺(tái)V2.1的易用性、智能性方面展開詳細(xì)解讀。
免責(zé)聲明:以上內(nèi)容為本網(wǎng)站轉(zhuǎn)自其它媒體,相關(guān)信息僅為傳遞更多信息之目的,不代表本網(wǎng)觀點(diǎn),亦不代表本網(wǎng)站贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性。如稿件版權(quán)單位或個(gè)人不想在本網(wǎng)發(fā)布,可與本網(wǎng)聯(lián)系,本網(wǎng)視情況可立即將其撤除。