【金猿案例展】浙江省統(tǒng)計局大數(shù)據(jù)應(yīng)用中心——隱私計算賦能政務(wù)數(shù)據(jù)跨域安全共享與融合計算
原創(chuàng) 金智塔科技 | 2022-12-22 14:22
【數(shù)據(jù)猿導(dǎo)讀】 本項目案例由金智塔科技投遞并參與“數(shù)據(jù)猿年度金猿策劃活動——《2022大數(shù)據(jù)產(chǎn)業(yè)年度創(chuàng)新服務(wù)企業(yè)》榜單/獎項”評選。

近幾年,國家先后發(fā)布多個政策文件,要求建設(shè)協(xié)同高效的數(shù)字政府;并開放政務(wù)數(shù)據(jù),賦能數(shù)字經(jīng)濟發(fā)展。但另一方面,為保護個人隱私、保障國家信息安全,政府也出臺了一系列法律法規(guī),旨在規(guī)范和整治數(shù)據(jù)信息非法泄露、濫用等亂象,數(shù)據(jù)流通合規(guī)要求不斷提高。因此,各級政府面臨著數(shù)據(jù)開放和隱私保護之間難以兩全的局面。
隨著數(shù)據(jù)合規(guī)監(jiān)管趨嚴(yán),以及數(shù)字政府建設(shè)不斷深入。隱私計算技術(shù)安全合規(guī)打破了政府各部門間數(shù)據(jù)孤島,實現(xiàn)了數(shù)據(jù)可用不可見,正成為政務(wù)數(shù)據(jù)安全共享和融合計算的關(guān)鍵核心技術(shù)。
實施時間:
項目開始時間:2021年11月
中間重要時間節(jié)點:2022年05月
項目完結(jié)時間:2022年08月
應(yīng)用場景
項目實現(xiàn)了浙江省統(tǒng)計局、浙江省經(jīng)信廳、嘉興市發(fā)改委等多個政府部門內(nèi)外部千萬級數(shù)據(jù)安全共享和融合計算,相繼成功應(yīng)用到省市多個政府部門的具體業(yè)務(wù)場景,如:畝均論英雄聯(lián)合隱私統(tǒng)計、企業(yè)經(jīng)營狀態(tài)智能查詢、新業(yè)態(tài)從業(yè)人員群體識別和預(yù)測、雙碳數(shù)據(jù)隱私計算、共富指數(shù)聯(lián)合預(yù)警等。
場景1:畝均論英雄聯(lián)合隱私統(tǒng)計
在省統(tǒng)計局側(cè)部署數(shù)據(jù)融合計算平臺的調(diào)度節(jié)點和子節(jié)點,并在省經(jīng)信廳部署數(shù)據(jù)融合計算平臺的子節(jié)點。通過數(shù)據(jù)融合計算平臺中聯(lián)合統(tǒng)計模塊中的自助查詢功能,創(chuàng)建省統(tǒng)計局與省經(jīng)信廳的聯(lián)合任務(wù)。運行該聯(lián)合計算任務(wù),可得到企業(yè)畝均論英雄各指標(biāo)與年度基準(zhǔn)值的比值。將平臺所得結(jié)果下載,進行匯總計算,即可得到各企業(yè)的畝均論英雄的評分結(jié)果。
場景2:企業(yè)經(jīng)營狀態(tài)智能查詢
在省統(tǒng)計局側(cè)部署數(shù)據(jù)融合計算平臺的調(diào)度節(jié)點和子節(jié)點;在杭州征信部署據(jù)融合計算平臺的子節(jié)點。通過數(shù)據(jù)融合計算平臺中聯(lián)合查詢模塊中的聯(lián)邦求交功能,創(chuàng)建省統(tǒng)計局與杭州征信的聯(lián)合任務(wù)。運行求交任務(wù)可得到在營企業(yè)名單和非營企業(yè)名單。將平臺所得結(jié)果下載,按行業(yè)進行分組,可得到在營和非營企業(yè)在各行業(yè)的分布,用以核查分析。
場景3:新業(yè)態(tài)從業(yè)人員群體識別和預(yù)測
在省統(tǒng)計局側(cè)部署數(shù)據(jù)融合計算平臺的調(diào)度節(jié)點和子節(jié)點;在浙江移動部署據(jù)融合計算平臺的子節(jié)點。通過數(shù)據(jù)融合計算平臺中建模功能,創(chuàng)建省統(tǒng)計局與浙江移動的聯(lián)合建模任務(wù)。以浙江移動信令、通話行為等數(shù)據(jù)為依托,結(jié)合統(tǒng)計數(shù)據(jù),通過對外賣員行為特征的分析,提出一種基于XGBOOST決策樹算法對外賣員行為進行預(yù)測的方法,根據(jù)外賣員判定條件,達到對外賣員群體的精準(zhǔn)識別。
面臨挑戰(zhàn)
該項目主要實施難點體現(xiàn)在部署和性能兩個方面。
在部署方面,本項目涉及的節(jié)點眾多,且各自的基礎(chǔ)設(shè)施和網(wǎng)絡(luò)差異較大,部署實施面臨較大困難。本項目節(jié)點分為橫向和縱向兩個維度,橫向維度包括:統(tǒng)計局、經(jīng)信廳、稅務(wù)以及外部的征信公司等,縱向維度涉及省、市、縣三級的打通。橫向和縱向兩個維度的基礎(chǔ)設(shè)施、網(wǎng)絡(luò)情況各不相同。在基礎(chǔ)設(shè)施方面,有的機構(gòu)是提供虛擬機,有的機構(gòu)是基于容器化底座,有的需要適配機構(gòu)的已有數(shù)據(jù)庫。在網(wǎng)絡(luò)方面,不同機構(gòu)具有不同的網(wǎng)絡(luò)策略、四層和七層代理方案。這些復(fù)雜性給項目部署實施帶來很大的困難。我們采取service mesh技術(shù),將跨機構(gòu)網(wǎng)絡(luò)打平,對上層應(yīng)用屏蔽網(wǎng)絡(luò)復(fù)雜性,使得上層應(yīng)用的部署運維更加簡單、可擴展,將節(jié)點部署的耗時由原來的兩周縮短至1.5天。
在性能方面,本項目面臨的問題是節(jié)點之間專線帶寬有限,且各節(jié)點的計算能力差異較大,這給算法設(shè)計帶來不小的挑戰(zhàn)。針對帶寬受限的問題,我們利用機器學(xué)習(xí)容錯性的特點,在保證算法安全的前提下,通過模型壓縮、量化、近似擬合等手段,平衡模型精度和性能。針對各節(jié)點計算能力差異較大的問題,我們調(diào)整算法設(shè)計,利用同態(tài)加密技術(shù),將計算平衡至算力較強的一方進行計算。
數(shù)據(jù)支持
在統(tǒng)計基層數(shù)據(jù)共享場景,突破性的實現(xiàn)基層數(shù)據(jù)安全共享,累計共享5600萬。
應(yīng)用技術(shù)與實施過程
技術(shù)解決方案
數(shù)據(jù)融合計算平臺基于“金智塔隱私計算平臺”的成熟框架開發(fā),采用多方安全計算、聯(lián)邦學(xué)習(xí)和區(qū)塊鏈等技術(shù),打破政府部門間的“數(shù)據(jù)孤島”并安全接入社會商業(yè)數(shù)據(jù),構(gòu)建省市縣三級一體化橫向、縱向的數(shù)據(jù)要素流通體系,在保護數(shù)據(jù)隱私安全的前提下,激發(fā)政務(wù)數(shù)據(jù)的應(yīng)用價值,最大限度造福社會。
政務(wù)數(shù)據(jù)多方安全聯(lián)合計算業(yè)務(wù)圖
數(shù)據(jù)融合計算平臺提供基層數(shù)據(jù)共享、聯(lián)合查詢、聯(lián)合建模、聯(lián)合統(tǒng)計等服務(wù),安全合規(guī)融合統(tǒng)計局、征信公司、電力公司、發(fā)改委、經(jīng)信廳和中國移動數(shù)據(jù),實現(xiàn)數(shù)據(jù)可用不可見、用途用量安全可控;提供存證審計功能,數(shù)據(jù)使用可查可溯源;保護數(shù)據(jù)的隱私、保障數(shù)據(jù)的安全,實現(xiàn)數(shù)據(jù)的多跨安全共享和融合計算,助力提升政府的治理和服務(wù)水平,促進社會經(jīng)濟的發(fā)展。
關(guān)鍵技術(shù)路線
多方安全計算:需要使用兩個或兩個以上部門的數(shù)據(jù),開展多方數(shù)據(jù)安全計算,如聯(lián)合查詢、聯(lián)合統(tǒng)計和聯(lián)合建模等工作。適用于多個部門的原始數(shù)據(jù)均不允許出域的應(yīng)用場景,需要在多方部署子節(jié)點。
聯(lián)邦學(xué)習(xí):一種分布式機器學(xué)習(xí)技術(shù),可以在多個分散的節(jié)點上訓(xùn)練算法,而不需要交換本地數(shù)據(jù)。聯(lián)邦學(xué)習(xí)由一個中心服務(wù)器聚合本地訓(xùn)練得到權(quán)重或梯度,更新全局模型。聯(lián)邦學(xué)習(xí)性能較好,適合大數(shù)據(jù)量下不要求算法可證安全的場景。
區(qū)塊鏈:區(qū)塊鏈?zhǔn)且环N分布式賬本技術(shù),由不斷增長的記錄列表組成,這些記錄使用加密技術(shù)安全地鏈接在一起。區(qū)塊鏈?zhǔn)遣豢赡娴?,一旦記錄下來,任何給定塊中的數(shù)據(jù)都不能在不更改所有后續(xù)塊的情況下更改。因此,區(qū)塊鏈技術(shù)在隱私計算場景非常適合對操作進行存證、審計。
在畝均論英雄聯(lián)合隱私統(tǒng)計場景,運用數(shù)據(jù)融合計算平臺中聯(lián)合統(tǒng)計的自助查詢功能,創(chuàng)建并運行省統(tǒng)計局與省經(jīng)信廳的聯(lián)合任務(wù),可得到企業(yè)畝均論英雄各指標(biāo)與年度基準(zhǔn)值的比值。
在企業(yè)經(jīng)營狀態(tài)智能查詢場景,使用數(shù)據(jù)融合計算平臺中聯(lián)合查詢模塊中的聯(lián)邦求交功能,建立并運行省統(tǒng)計局與杭州征信的聯(lián)合任務(wù),可得到在營企業(yè)名單和非營企業(yè)名單。
在新業(yè)態(tài)從業(yè)人員群體識別和預(yù)測場景,運用數(shù)據(jù)融合計算平臺中建模功能,創(chuàng)建省統(tǒng)計局與浙江移動的聯(lián)合建模任務(wù),采用基于XGBOOST決策樹算法進行預(yù)測,實現(xiàn)對外賣員群體的精準(zhǔn)識別。
商業(yè)變化
在統(tǒng)計基層數(shù)據(jù)共享場景,突破性的實現(xiàn)基層數(shù)據(jù)安全共享,累計共享5600萬次;在企業(yè)在經(jīng)營狀態(tài)查詢場景,核查效率提高10倍以上,準(zhǔn)確率從85%提高到96%,并極大節(jié)省了人力;在畝均論英雄場景,應(yīng)用隱私計算技術(shù),較大的提高政務(wù)工作效率:由原來耗時2天,到現(xiàn)在只需130秒,節(jié)省了大量人力,并減少企業(yè)報送50712次,環(huán)比減少50%以上;在新業(yè)態(tài)從業(yè)人員群體識別和預(yù)測場景中,利用隱私計算技術(shù),創(chuàng)新性的完成了高實時、高精準(zhǔn)識別從業(yè)人員。
融合計算平臺響應(yīng)了國務(wù)院《關(guān)于加強數(shù)字政府建設(shè)的指導(dǎo)意見》、浙江省人民政府《關(guān)于深化數(shù)字政府建設(shè)的實施意見》等政策文件,構(gòu)建數(shù)字化、智能化的政府運行新形態(tài),推進公共數(shù)據(jù)、社會數(shù)據(jù)融合應(yīng)用,促進數(shù)據(jù)合法有序流通利用,避免了公共數(shù)據(jù)泄漏的風(fēng)險,并落實了浙江省“最多報一次”的政策要求。
作為浙江省首個省級政務(wù)數(shù)據(jù)隱私計算平臺,為政務(wù)數(shù)據(jù)的安全共享、融合創(chuàng)新應(yīng)用積累了豐富經(jīng)驗,具有強烈示范效應(yīng),已獲得中國信通院2022大數(shù)據(jù)「星河(Galaxy)」隱私計算標(biāo)桿案例。近期,浙江省人社廳、國家電網(wǎng)等部門已提出新的業(yè)務(wù)應(yīng)用需求,其中包括“困難補助人群智能監(jiān)測”、“電力能耗數(shù)據(jù)質(zhì)量校驗”等,將進一步加快政府?dāng)?shù)字化數(shù)據(jù)要素流通與應(yīng)用,助力浙江省建設(shè)數(shù)字政府。
相關(guān)企業(yè)介紹
·金智塔科技
金智塔科技是由浙江大學(xué)人工智能研究所和浙江大學(xué)金融科技研究院聯(lián)合孵化的隱私計算服務(wù)商,為政府、金融機構(gòu)、大型企業(yè)等提供安全高效的隱私計算產(chǎn)品和數(shù)智化解決方案。
作為國家高新技術(shù)企業(yè),金智塔科技擁有40余項發(fā)明專利和軟著,通過CMMI3、ISO9001、ISO27001認證,參編數(shù)據(jù)要素流通與隱私計算相關(guān)標(biāo)準(zhǔn)40余項,承擔(dān)多項國家和省部級重點研發(fā)項目,并入選杭州市海外高層次人才創(chuàng)業(yè)計劃。金智塔科技由斯坦福大學(xué)訪問學(xué)者、浙江大學(xué)人工智能研究所博導(dǎo)創(chuàng)立,核心團隊來自浙大、阿里,具有突出的技術(shù)創(chuàng)新能力和豐富的運營經(jīng)驗。
在國家重點研發(fā)項目(NO.2018YFB1403001)支持下,金智塔科技自主研發(fā)的工業(yè)級隱私計算平臺融合了多方安全計算、聯(lián)邦學(xué)習(xí)等技術(shù),對接了大量的征信、房產(chǎn)、發(fā)票、運營商、物流、知識產(chǎn)權(quán)等權(quán)威數(shù)據(jù),可基于不同業(yè)務(wù)場景提供多層次產(chǎn)品和服務(wù)。平臺通過了央行國家金融科技中心、工信部中國信通院等權(quán)威機構(gòu)的評測認證,并成功應(yīng)用在數(shù)字政府、智慧金融、智慧企業(yè)等領(lǐng)域。
·浙江省統(tǒng)計局大數(shù)據(jù)應(yīng)用中心
浙江省統(tǒng)計局大數(shù)據(jù)應(yīng)用中心是浙江省統(tǒng)計局下屬機構(gòu)。主要職責(zé)包括:開展統(tǒng)計大數(shù)據(jù)研究、開發(fā)與應(yīng)用,推進大數(shù)據(jù)與統(tǒng)計工作深度融合,承擔(dān)《國家統(tǒng)計局浙江省人民政府共建統(tǒng)計大數(shù)據(jù)應(yīng)用中心合作協(xié)議》確定的統(tǒng)計大數(shù)據(jù)應(yīng)用與開發(fā)平臺的共同建設(shè)任務(wù),承擔(dān)省政府統(tǒng)計大數(shù)據(jù)和國家統(tǒng)計大數(shù)據(jù)的共享與利用,承擔(dān)全球平臺亞太區(qū)域中心大數(shù)據(jù)和全國統(tǒng)計大數(shù)據(jù)的挖掘與分析,承擔(dān)統(tǒng)計大數(shù)據(jù)能力建設(shè)相關(guān)工作等。
來源:數(shù)據(jù)猿