當前位置:網站首頁>鄭小林——“浙大系”隱私計算產學研創新先鋒

鄭小林——“浙大系”隱私計算產學研創新先鋒

2022-01-27 04:41:59 算力智庫

作為算力智庫2021隱私計算年度十大人物,鄭小林是產學研創新的先鋒。他的首要身份是學者,是浙江大學計算機學院教授、博導,浙江大學人工智能研究所副所長。他同時也是創業者,由他創立的金智塔科技定比特於隱私計算服務商,是由浙江大學人工智能研究所和浙江大學金融科技研究院聯合孵化的國家高新技術企業。

在這裏插入圖片描述

“浙大系”就這樣成了鄭小林和金智塔科技的鮮明標簽和實力背書,一方面浙大是全國頂尖、全球百强的名校,另一方面浙江又是中國互聯網與數字經濟的高地。能在高手林立的浙江立足,必然有兩把刷子。在鄭小林的帶領下,金智塔科技兩年前就參與了國家重點研發計劃項目“大數據征信及智能評估技術”。該項目由包括高校和企業在內的20多個單比特參與,金智塔的算子、算法和平臺都是自主原創,折射出的技術實力被許多投資人津津樂道。2021年底,金智塔科技獲批2022年浙江省“領雁”研發攻關計劃項目,還拿到了多項專利。2022年初鄭小林教授入選浙江省“萬人計劃”科技創新領軍人才,並擔任浙江省數據要素流通專家組召集人,金智塔也成為浙江省數據要素流通專家組召集單比特之一。但鄭小林並不認為學界背景是一種優勢,而是實幹態度的注脚。他對算力智庫錶示,學者型創業者的多元身份會帶來三個顯著特征,一是更願意沉澱和打磨技術,二是更踏實地對待客戶需求和服務好客戶,三是可以更加客觀地看待行業發展,看待同業。他坦言,與其他創業者相比,高校相關的教師與科研角色可能在市場拓展方面相對慢一些,但同時這也意味著更踏實地對待客戶需求,用十分力氣打磨場景,把每個案例都做成標杆案例。新年伊始,鄭小林與我們分享了對數據、隱私計算行業和技術的全面思考。


算力智庫
據您觀察目前國際上隱私計算有哪些最新趨勢?金智塔隱私計算平臺整體技術被專家譽為達到了國際先進和國際領先水平,請問具體在哪些方面體現了先進和領先?

鄭小林

我們看到目前國際上隱私計算有幾大發展趨勢。第一是技術的深化,就是不斷提昇性能和安全性。第二是技術的融合,許多研發機構和企業都致力於多方安全計算、聯邦學習、區塊鏈等隱私計算技術的融合,同時還要把技術與應用和業務融合。第三是軟硬件融合,主要指可信執行環境TEE與算法的融合,我們也看到市面上出現了隱私計算一體機這樣的硬件設備,這些都是算力和算法融合。近期我們也參與了由中國信通院組織的“隱私計算一體機技術規範”標准研討工作。

我們的技術水平得到了權威專家的高度評價,過去兩年經過中國人工智能學會李德毅、潘雲鶴院士等專家的鑒定,金智塔隱私計算平臺整體技術達到了國際先進水平,部分達到國際領先水平。

在這裏插入圖片描述

在論文和專利方面,我們發明了全鏈路安全的數據分析和機器學習線性模型、樹模型。其中,半誠實安全模型下,兩方大規模數據場景中,線性模型算法比VISA公司的SecureML算法有了巨大提昇。

在應用與評測方面,我們針對高可用多方聯合建模應用進行業務平臺研發。包括了建模之前的數據分析、數據求交、特征處理、多重線性分析、建模過程中的模型訓練及自動調參,以及建模之後的模型打分,使其在實際業務領域的應用豐富度遠超國內外其他同類系統。相關算法應用在金融場景,模型性能提昇超過65%,顯著提昇了信貸系統的風險區分能力。


算力智庫
數據世界裏有不少天然的數據擁有者,如政務、公用設施、互聯網平臺,他們把數據價值分享出來的動機各不相同,或許是為了現金收益,或許只是為了完成任務,或許根本沒有動力分享,您覺得一個合理有效的數據價值分享激勵機制應該具有怎樣的底層邏輯,以便讓更多機構樂於分享?

鄭小林

我們認為數據分享激勵機制的核心應該是利益共享,這裏的利益包含了責任、權力和利益。在實踐中,我們總結了三類主要的數據擁有者。

第一類是商業機構,往往是積累了豐富用戶數據的平臺類企業。這類機構天然就有數據共享意願,也就是基於數據的對外商業合作。但是,在《數據安全法》和《個人信息保護法》出臺後,他們必須滿足合規要求,調整原來的數據服務方式和商業模式。

第二類是數據中介,他們通過技術或者商業手段整合了某個領域的公開數據再對外銷售。現在他們和商業機構碰到了相似的問題,在許多場景中數據不能直接對外,也不能被用作用戶畫像,因此需要對數據重新分級分類。

第三類是政府。政府擁有大量數據,當然政府共享數據的目標不是商業化,而主要是服務政府數智化轉型以及對外賦能,如賦能小微企業融資、產業轉型昇級等,主要是權力與政績的訴求。

可以看到,不同類型的數據擁有者有著不同的利益訴求,因此數據價值分享的激勵機制也應不同,需要兼顧各方的責任、權利和利益,滿足他們的訴求。


算力智庫
終端用戶嘗試新技術往往從小項目做起,您也曾提到過金智塔致力於提高產品的標准化程度從而實現快速部署,在現實中客戶有哪些典型的共性需求場景?相比更“重”的私有化部署,模塊化部署是否可能是隱私計算平臺實現輕量化、低成本、快速普及的方式(類似近幾年比較火熱的“低代碼”平臺)?

鄭小林

隱私計算這個詞雖然很熱,但仍然是個新興技術市場。目前還處於市場教育和應用示範期,所以市場上大部分項目都會有很多個性化需求的定制工作要做。但是針對不同類型的客戶,我們可以提煉共同的行業和類比需求,進而提供標准化的產品和服務。

產品標准化的前提是可視化和模塊化。可視化的方式讓客戶可以通過“傻瓜式”的“拖拉拽”去部署產品,而不必理解代碼;而“模塊化”是把金智塔隱私計算平臺的不同功能單獨做成模塊,用於不同場景。

為了讓標准化的產品更好地適配不同類型的客戶,我們還把客戶按數據和技術能力做了分類。

第一類是數據和技術能力都相對缺乏的客戶,我門提供的是基於隱私計算的數據與業務場景建模一體化的解决方案,這類場景往往源於傳統企業的數字化轉型。

這裏可以借用一個智能營銷應用例子。某上市零售商運用金智塔隱私計算平臺,接入移動運營商、高德、政府統計部門等數據進行聯合建模,通過機器學習訓練選址模型,合法合規實現全國範圍內的鑽戒銷售城市潜力、商圈劃分、銷量預測和商圈推薦,監測城市從幾十個擴展為全國所有城市,預測周期從幾周縮短到幾分鐘,預測准確率從75%提高到90%以上。

在這裏插入圖片描述

第二類是數據基礎和技術能力都很好的企業,我們就可以提供隱私計算標准組件,這類客戶較多集中在金融機構,比如我們在智慧金融場景中為商業銀行提昇小微企業授信准確率。

在這裏插入圖片描述

第三類是政府部門,也包括各省市的數據交易中心,我們提供基於隱私計算的數據安全流通PaaS平臺,而把SaaS平臺部分留給他們自己去做,比如我們在智慧政府場景中助力“最多報一次”應用,大幅提昇政府部門對企業的審核效率和准確率。


算力智庫
今年北京國際大數據交易所、上海數據交易所等先後成立,有觀點認為以隱私計算比特代錶的技術革新把數據交易所帶入2.0階段,您如何看待新一波數據交易所的興起以及與創業類隱私計算平臺的關系?國家立法並沒有把數據交易限定在數據交易所,那麼“場外交易”是否會成為隱私計算平臺的主要目標市場?

鄭小林

這也是我們團隊近期討論較多的問題。我們發現各地交易所的定比特和運作機制略有不同,這就會造成隱私計算平臺的服務模式有所不同,我們應該根據交易所的性質去找到自己的定比特。

目前來看,交易所發展到2.0階段,肯定都需要隱私計算技術的支撐,我們就可以提供多種服務與合作方式,就比如可以提供組件,也可以提供PaaS平臺。

同時,數據交易所並不是隱私計算的唯一場景,如果從數據要素流通的角度來看,在商業世界中有許多隱私計算的需求,都是我們的服務場景,比如大型企業的內部數據流通與共享、跨國企業的跨境數據隱私保護等。當然,“場外交易”也確實是一個很大的目標市場,只要符合法律監管,就可以是隱私計算創業公司的好場景。


算力智庫
從大廠到創業企業,隱私計算平臺林立,有不少業內人士都呼籲各平臺互聯互通,也有專家提出應該以國家層面建立中心化的數據交易平臺和數據要素市場(盡管並不等同於隱私計算平臺),您認為在國家與社會利益的高度上,怎樣的模式更能促進數據的大融合、大流動?是國家頂層單一中心還是市場層面的多中心?在這其中隱私計算平臺是否也應遵循相同原則?

鄭小林

互聯互通是隱私計算發展的一個方向,我們目前也參與了由中國信通院組織的“互聯互通標准制定”,共同推動隱私計算行業跨平臺互聯互通。

國家層面建立中心化的數據交易平臺或者是數據要素市場是一個很好的主流想法,但這樣做無法覆蓋所有的場景。我建議首先應該對數據進行分層分類管理,針對不同的行業,不同的數據類別,不同的安全等級,提供不同的數據流通服務機制。

我認為對於國家或者政府管控的數據可以建設頂層的單一中心的數據共享平臺,但對於更加市場化的數據就沒有必要這麼做。國家單一中心與市場層面的多中心並不矛盾,國家層面、省市層面可以建設;集團企業內部可以建設;大型政府部門內部可以建設,核心就在數據的分級分類管理。


算力智庫
金融是强監管行業,對待隱私計算的落地也是如此——即使數據交易雙方都認可隱私計算技術,也還是需要監管批准。您認為隱私計算應該如何自證清白,未來隱私計算平臺自身是否應納入第三方審計和國家監管?

鄭小林

我覺得這確實是目前市場推進的一個難點,為了讓隱私計算企業與甲方建立互信,首先可以由第三方權威機構來進行技術和法律鑒定,但目前還沒有這樣的機構。在此背景下,隱私計算企業就需要加强與使用方的溝通探討,比如算法理論、代碼、中間結果和最終結果的驗證等。

此外,雙方還可以建立責任共擔利益共享機制,特別是對於隱私計算企業,一方面需要承擔甲方的數據安全責任,另一方面也應獲得相關收益。

還有一點,就是隱私計算平臺一定要遵循法律和各種行業規範。


算力智庫
隱私計算是風口無疑,但數據本身的複雜性以及隱私計算相關技術的複雜性也給隱私計算的落地帶來一些挑戰。回顧2021,您覺得隱私計算在真正落地普及之路上,有哪些利好和問題已經顯現?展望2022,又有哪些機遇和困難需要直面?

鄭小林

2021年的最大利好來自於《數據安全法》和《個人信息保護法》的落地。我們可以明顯感覺到兩部法律的出臺對隱私計算企業的業務產生了很大推動。其他利好還包括有不少行業規範出臺、數據要素流通與交易的教育越來越普及、部分示範性項目上線、投資機構的支持等。

2021年我們看到的最大問題是隱私算行業的規模化還不够,隱私計算企業業務擴張的速度還比較慢。其次是相關法律的落地還缺乏抓手,與隱私計算的應用還沒很好的掛鉤。

2022年對於許多隱私計算企業來說還面臨兌現承諾的問題,也就是在過去幾年曾經描繪過的前景應該要在2022年開始落地,如果不能很好落地,還會反過來影響整個行業的發展。

總的來說我認為2022年的機遇要遠多於問題和困難,尤其是2021年的幾大利好會在2022年持續顯現。大部分業內人士都認同,隱私計算需要2-3年才能開始真正大規模推廣,我們既要對前景充滿信心,也要對問題有足够准備。


算力智庫
您對於想投身隱私計算賽道的人才有哪些建議,比如需要具備哪些技能或資源?您對想要嘗試隱私計算的企業有哪些建議?比如如何選擇合適的隱私計算技術服務商?

鄭小林

隱私計算需要的是複合型人才,要懂大數據、安全、人工智能,還要有隱私計算的行業知識。顯然要成為這樣的人才很難,也是所有隱私計算企業會爭搶的。對於我們來說,一方面我們會在浙大計算機學院、軟件學院、工程學院發掘和培養,另一方面也會從公司團隊內部培養。

對於想入場隱私計算的企業,我認為要做到“脚踏實地、仰望星空”,也就低頭認真打磨產品和服務,抬頭看到國家和行業的需求。需要强調的是,數據行業的特殊性在於數據安全和隱私保護的重要性已經上昇到國家層面,因此數據和數據相關技術必須做到自主可控。

對於想要嘗試使用隱私計算的企業,我認為在選擇服務商時可以從三個方面考量。第一是技術實力,也就是持續研發能力强、原創能力强、有自主知識產權的企業和團隊(國產自主可控)。第二是深耕行業,有較多落地案例的企業。第三是能够理解客戶所需,願與客戶責任共擔、利益共享的企業和團隊,因為甲方客戶需要的一定不只是軟件和平臺,而是負責任的隱私保護和數據安全服務。

版權聲明
本文為[算力智庫]所創,轉載請帶上原文鏈接,感謝
https://cht.chowdera.com/2022/01/202201270441589130.html

隨機推薦