比特幣交易所 比特幣交易所
Ctrl+D 比特幣交易所
ads

數據將取代石油 隱私計算如何保障數據主權?_ETH

Author:

Time:1900/1/1 0:00:00

數據的重要性,在近二十年飛速發展的互聯網的推動下,已逐漸深入人心。但是,用戶數據泄露、被濫用的新聞還是屢見不鮮。用戶如何使用數據,如何確保數據主權,成為一個重要和迫切的問題。

除此之外,隨著國家網絡安全審查辦公室發布消息,將依據《中華人民共和國國家安全法》和《中華人民共和國網絡安全法》對多款互聯網應用進行網絡安全審查之時,「防范國家數據安全風險」也成為一個值得關注的話題。

此時此刻,數據的價值和安全性愈發值得重新思考。

本文最早發布于 2019 年,介紹了理解隱私計算商業模式的最基本入門知識。

《經紀學人》早在 2017 年就發表封面文章,稱「數據將取代石油」成為當今時代最有價值的資源。但直到今天,擁有「數據石油」主權的普通人依然無法從這寶貴的資源中獲得收益。

相反,這些數據還給它們的擁有者帶來了嚴重的隱私泄露的問題。

為何美好愿景與現實情況間有著巨大差距?怎樣才能實現數據所有權和數據價值?本文試著從已有的實踐去探討,希望能理清一些線索,對建立起關于該問題的思考框架貢獻一點力量。

相信我們每個人都有過接到推銷電話的經歷。絕大多數人的個人數據都被買賣過,最簡單的比如電話號碼和一些消費信息,這些數據此刻也許正在某個地方等著被再次出售。

數據確實能賣出錢來,錢落入了那些獲取了我們數據的機構的口袋。

這個現象容易帶來一個認識的誤區,即認為我們可以通過出售數據來實現數據的價值,也就是說,在我們借助法律條文和技術手段擁有數據主權后,可以通過把這些數據賣給需要的人來獲得數據價值,把「石油」賣成錢。

數據:以太坊網絡當前已銷毀194.90萬枚ETH:金色財經報道,據Ultrasound數據顯示,截止目前,以太坊網絡總共銷毀1,949,045.94枚ETH。其中,OpenSea銷毀230041.92枚ETH,ETHtransfers銷毀185311.66枚ETH,UniswapV2銷毀125763.61枚。注:自以太坊倫敦升級引入EIP-1559后,以太坊網絡會根據交易需求和區塊大小動態調整每筆交易的BaseFee,而這部分的費用將直接燃燒銷毀。[2022/3/6 13:39:55]

但這是錯誤的,我們不能買賣數據。在闡述這個問題之前,我們有必要區分數據的所有權和數據的使用權。

對于這個世界上絕大多數的資產,買賣行為意味著資產所有權的轉讓:一方得到所有權,另一方失去所有權。但買賣數據不會轉讓數據的所有權,你賣出了數據,但這些數據的所有權依然屬于你。

因此圍繞數據的交易實際上是圍繞數據使用權,而不是數據所有權的交易。但因為數據可以被無限復制,如果我們賣出了數據,就無法保證買方會如何使用以及是否會再次出售這些數據,更準確的說,在某種程度上我們已經「失去」了這些數據,哪怕我們擁有數據所有權。

非法的數據交易會直接買賣數據,是因為他們不在乎數據所有人的權益,但當我們真實擁有了數據所有權后,為了實現數據價值,我們是不能買賣數據的。

那么該如何交易數據的使用權但不失去數據?答案是不交易數據本身,只交易數據的計算結果。也就是說,買方可以利用這些數據進行計算,得到其需要的結果,但買方不能獲取到原始數據本身。

這是當我們討論數據所有權和數據價值時,第一件、或許也是最重要需要理解的事情:我們不能通過出售數據實現數據價值,只能通過出售數據結果實現數據價值。

數據:最近一周,以太坊網絡新增85萬枚NFT資產:金色財經報道,NFTScan數據顯示,最近一周,以太坊網絡新增85萬枚NFT資產,平均每天新增鑄造12.1萬枚NFT資產。[2022/1/11 8:40:06]

也就是說,我們要把數據的所有權和使用權分離,只交易數據使用權。

如何實現只出售數據結果?答案是:通過隱私計算。

隱私計算是在不暴露原始數據的情況下計算數據,且計算結果可被驗證。它包括全同態加密、安全多方計算等多個研究方向,有許多專業的技術文章介紹它們的工作原理,若你希望更進一步了解,可以去查看。

在這里我們有第二個模糊地帶需要澄清,即:隱私計算不只是為保護用戶隱私服務,它更是實現數據使用權交易的基礎,也就是實現數據價值的基礎。

之所以需要做這個澄清,是因為「隱私計算」容易被理解成又一種保護隱私的技術,重點被落在「隱私」上,但實際上「隱私計算」的重點是在「計算」上。

在區塊鏈行業中,由于隱私計算常常被作為一種增強用戶隱私的方法用于密碼貨幣交易中和區塊鏈上,所以人們更容易把隱私計算理解為它是為實現用戶隱私服務的,這一理解并沒有錯,但它把隱私計算局限到了一個小的領域。

也許從另一個角度看待這個問題會更清晰。我們把數據問題拆分成用戶隱私問題和數據價值問題。用戶隱私問題解決的是與用戶相關的原始數據不被泄露、用戶的隱私不被暴露,我們可以把該問題看作一種特定范圍內的數據隱私保護。

在這個階段中,隱私計算的角色是一種可供選擇的保護隱私的方法。

在用戶得到了數據隱私后,如果他 / 企業選擇把數據放在那兒什么都不做,故事就結束了;但如果用戶 / 企業想更進一步,得到數據的價值,就要把數據拿出來使用,事情就進入到下一個階段,此時需要通過各種方法來保證數據在被使用的整個生命周期內都不被泄露,我們可以把這看作一種全范圍的數據隱私保護。

數據:Solana上DeFi協議總鎖倉量為97.5億美元:金色財經報道,DeFiLlama數據顯示,Solana上DeFi協議總鎖倉量為97.5億美元。其中,鎖倉量排名前三的協議分別是Raydium(12.4億美元)、Marinade Finance(11億美元)、Sunny(29.3億美元)、Serum(9.07億美元)。[2022/1/9 8:35:40]

在這個階段中,隱私計算的角色不再是一種可供選擇的方法,而是一條必經之路,因為實現數據價值的方法是在不暴露原始數據的情況下出售數據結果,進行數據使用權的交易,只有隱私計算能夠達成這一目標。

如果把數據比作石油,那么隱私計算就是煉油的第一道工序,它是我們在保證用戶隱私前提下把「原油」轉換成各種產品的基礎。

并非所有數據都具有相似的價值,也并非所有數據都能實現數據價值,這可能是我們在討論數據價值時又一個需要明確的地方。

只有當我們理解數據的復雜性和多樣性后,才有可能針對不同的情況,在法律上和技術上使用不同的條款和方法來真正解決問題。

本文將試著從應用角度出發對數據的類別進行一個簡單的劃分,再介紹該類數據的數據價值問題。此處提出的數據分類方法不一定全面和準確,它只是為建立起一個基本的可供討論的框架服務。

我們可以把數據分為三大類:

第一類是身份數據;

第二類是行為數據;

第三類是生產力價值數據。

第一類身份數據在網絡和現實世界中被用于注冊和身份確定,比如身份證號碼、電話號碼、賬戶信息等等,這類信息對于非法產業有著最大的價值,一旦泄露也會給用戶帶來大的安全隱患。但對于正規數據產業,這類信息反而沒有計算價值,它們計算不出有意義的結果。

火幣大學校長于佳寧:區塊鏈讓“數據價值最大化”:10月26日,火幣大學校長于佳寧為全球區塊鏈領導者課程(GBLP)第七期學員帶來主題為《區塊鏈究竟改變了什么》的現場授課。

提及“區塊鏈之于確權的價值和意義”,于佳寧在課堂上指出:資產=確權+定價+流通,確權是一切資產形成和流通交易的基礎,沒有產權就沒有市場。但是以往的確權方式成本不菲,且權屬不清是常態。因此,區塊鏈理解為一種“確權的機器”,作為基礎設施為市場提供一種極低成本的確權服務,讓資產活過來!總而言之,只有確權才有資產,有了資產才能交易,有了交易才有經濟。區塊鏈讓數據資源實現確權,形成數字資產,是數字經濟的重要基石。區塊鏈讓“數據價值最大化”。

火幣大學是致力于推動區塊鏈賦能實體經濟的教育培訓機構,火幣大學GBLP課程以帶領學員“探索商業變革前沿新知,跨入區塊鏈界核心圈層”為宗旨,幫助各位火幣大學學員洞悉全球區塊鏈產業趨勢,探尋區塊鏈未來價值。[2020/10/26]

因此,這一類數據本身是不需要考慮如何通過隱私計算實現數據價值的。

第二類是行為數據,它包括用戶在網絡上的瀏覽痕跡、消費數據,也包括用戶的產品使用習慣數據等。可以通過計算這些數據對用戶進行個人畫像,再基于畫像向用戶推送廣告、推送內容、提供服務,甚至推銷觀點。

行為數據有兩大類價值,一是廣告價值,我們都知道幾乎是廣告養活著整個互聯網產業;二是能夠幫助產品了解用戶,從而為用戶提供更好的個性化服務。

目前在世界范圍內被廣泛關注和討論的數據所有權問題主要集中在這一類型的數據身上。很長時間以來該類數據的各種權限并不明確,人們也并未在意,直到這些數據的計算結果被越來越多的用于影響或者控制我們時,我們才認識到該問題的嚴峻性。

動態 | 百度鏈上存證量破億 包含版權、溯源等多場景數據:近期,百度超級鏈推出區塊鏈存證SaaS服務,利用SaaS規模化、標準化、低成本等特點,把成熟且權威的存證能力賦能給更多企業。目前百度鏈上存證量已經破億,包含版權、溯源、廣告、醫療、金融等多場景、多種類數據。

其中,區塊鏈存證在版權場景的應用已經獲得北京互聯網法院認可,在一審宣判中,法院支持了原告采用區塊鏈作為存證方式,認可百度版權鏈與北京互聯網法院天平鏈的跨鏈對接,確定數據未經篡改,判定對應的侵權事實,從存證、固證、出證到驗證完成司法閉環。[2019/9/23]

這其中標志性的事件是 2018 年 Facebook 的數據門事件。在該事件中,一家名為劍橋分析的數據運營公司獲取了超過 5000 萬名 Facebook 用戶的數據,通過數據計算,他們篩選出其中立場搖擺的對象并向其投放精準匹配的宣傳廣告,從而影響了美國的大選和英國的脫歐公投。

好消息是,我們似乎正在拿回這一類數據的所有權。歐盟出臺的《通用數據保護條例》(GDPR)規定,產生數據的個人是數據主體,他有權要求清除其個人數據,也有權反對并要求停止對其個人數據的處理。

壞消息是,我們沒有拿回數據的使用權,如前文所說,數據價值是建立在數據使用權交易的基礎之上的,所以我們離用這類數據實現歸屬于用戶的數據價值還很遙遠。它的困難在于:

一方面,即使被稱為史上最嚴苛的數據保護條例,GDPR 也只是要求企業在使用數據前告知用戶哪些數據被使用了,以及用這些數據做什么,也就是說,它只約束企業不濫用數據,但并不限制企業使用數據。

另一方面,因為這類數據可被用于幫助產品了解用戶,如果企業以提高用戶體驗為理由使用數據——它們現在就是這么做的——我們似乎難以拒絕。讓用戶犧牲用戶體驗去要求企業無權使用任何行為數據似乎很難,而希望企業主動把這類數據的兩種用途區分開、讓渡部分廣告價值似乎更難。

這是否意味著企業依然可以按照以前的數據處理方式行事?并不是。我們會發現上述數據所有權和使用權的分離僅僅是字面意義上的,企業雖說只擁有數據的使用權,但它們是「拿到」并使用原始數據本身的,這讓數據依然存在被濫用以及安全方面的問題。

而因為大眾隱私意識的覺醒以及各國數據保護法(將安全職責放在使用數據的公司上)的出臺,一旦出現問題,企業將可能面臨用戶的抵制以及巨額的罰款,因此我們可以看到 Google、蘋果等公司如今都在隱私計算領域進行著大量的研究。

以 Google 為例,它的「聯邦學習 Federated Learning」是將機器學習模型集成到每一臺設備上,在匯總用戶參數發送給云端時,通過隱私保護地聚合算法和系統工程實現隱私計算。

但需要再次指出的是,企業通過隱私計算實現數據所有權和使用權的分離,不是為了用戶能夠進行數據使用權的交易,它們更多的是希望降低數據使用風險、免受隱私泄漏指責,能夠滿足合規要求的繼續免費使用用戶的數據。

因此,用戶得到這類數據的數據價值是一件道路漫長的事情,其中最大的難點在于意識,只有當我們有強烈的數據所有權和使用權意識時,才可能推動政府出臺更嚴格的數據保護條例,或者推動新的互聯網架構顛覆如今中心化服務器的模式。

了解了「身份數據」和「行為數據」之后,接下來介紹第三類數據,在本文中我們稱其為「生產力價值數據」。

該類數據的一大用途是做機器學習,訓練 AI;另一大用途是做數據分析,幫助進行科學研究、產品設計、決策制定等。這一類數據如果被恰當使用,能夠驅動社會往更有效率、更為友好的方向發展,它們是一種生產力。

第三類數據的采集范圍最廣,數據量最大。它可以來自于人類,比如個人的醫療數據和財務數據、個人的產品使用習慣數據等等;也可以來自于物聯網設備,比如傳感器收集到的大氣情況數據、自動駕駛數據等等。

它的一部分數據來源與第二類數據相同,都是使用互聯網產品的用戶,只不過采集到的數據的處理方式和用途不同:第二類數據是取之于用戶、用之于用戶,而第三類數據是被集合后跨數據主體使用。從數據本身的角度出發,我們可以認為某個數據既是第二類數據,也是第三類數據。

第三類數據具有最大的數據價值,同時它們也有可能最先進入到數據使用權的交易市場,實現數據價值。

不同于第二類數據是互聯網企業自己擁有數據使用權同時自己使用數據,不需要進行數據交易,在生產力價值數據的應用場景中,出現了不擁有數據使用權但希望使用數據的角色。從這個角度,我們可以認為第三類數據是指所有可資產化的數據的集合。

我們可以拿醫療數據為例來更好的理解如何使用第三類數據。科研機構或制藥廠如果能有大量的醫療數據的支持,就能更好、更快的研究疾病和開發新藥,但擁有數據資源的醫療機構因為用戶隱私問題和自身利益,并不會把這些數據提供給其他機構使用。

如果我們通過隱私計算分離數據的所有權和使用權,就能建立起一個數據使用權的交易市場,不同醫療機構、科研機構和制藥廠的數據就可以在這個平臺上實現連通——流行的說法是打破數據孤島——這些機構間可以進行數據的買賣,也可以數據共享進行聯合的疾病研究。

如果我們要訓練能夠診斷疾病的 AI,也需要通過上述方式打破數據孤島,這樣才能提供給 AI 更多、更全面的數據。

需要贅述的是,在現階段,即使實現了數據的交易和價值,但因為數據使用權在法律上和使用上的邊界都不明確,我們作為個體依然很難拿回全部的數據的價值。

數據所有權和使用權是這個時代最重要的議題之一,《人類簡史》的作者、歷史學家尤瓦爾·赫拉利(Yuval Noah Harari)的觀點是:「如果我們希望避免財富和權力都集中到一小群精英手中,關鍵在于規范數據的權限」。

因為數據自身的復雜性和多樣化,從邊界清晰、可以被準確描述的細小處出發定義問題、解決問題,而不是寄希望于輿論、立法和技術能夠整體解決問題,也許才是快速與有效的方法。我們可以對不同的數據類別進行更具體的分類和分析,或者用不同的分類標準探討數據的分類,再基于此討論數據的隱私、數據的所有權和數據的價值實現問題。

數據常被比作石油。

雖然楔形文字中便有人類在死海沿岸采集天然石油的記錄,但直到 1846 年亞布拉罕·季斯納發明從煤中提取煤油的方法,1853 年伊格納齊·武卡謝維奇和揚·策從原油中分餾出精煉的煤油,現代石油工業的歷史才算真正開始。

不過這僅僅是開始,作為煤油燈燃料的石油并不特別,只有在后來當它被用于內燃機后,才爆發出巨大的潛力,并成為世界上最重要的一種資源。

數據與石油的相似之處在于,僅僅有數據還不夠,只有實現了數據的「煉油術」,才有可能開啟數據的產業時代。

而數據與石油的不同之處在于,石油是先有煉油廠,然后才有內燃機的需求,而數據是已有巨大的使用需求,卻沒有成熟的技術和基礎設施支持這種需求。

這或許是一件好事。道路漫長,但我們知道方向。

Tags:區塊鏈以太坊ETHNBS以下哪個不是區塊鏈區塊的結構以太坊最新價格行情昭BABYETHV2nbs幣未來價格

萊特幣最新價格
在清算的邊緣瘋狂摩擦 這次還會遭遇“黑天鵝”嗎?_DAI

很多時候崩潰往往是不經意間發生,而大家都認為會發生的事件,往往又不那么容易出現。大家好,我是佩佩,感覺現在哪哪都是壞消息,除了下周一不確定的消息面,海外最近又開始流傳關于U的FUD。

1900/1/1 0:00:00
Polygon和BSC的出現 V神欽點的Rollup還能得到青睞嗎?_GON

注,原文來自Dragonfly Research,以下為全文編譯。在過去6個月中,以太坊上最大的事便是交易需求的爆炸。交易費用已經超過了歷史最高水平,導致許多日常用戶現在已經不愿意使用以太坊了.

1900/1/1 0:00:00
金色DeFi日報 | Visa加密貨幣部門聘請多位NFT和DeFi等領域專家_SWAP

DeFi數據 1.DeFi總市值:670.93億美元 市值前十幣種排名數據來源DeFiboxDeFi總市值數據來源:Coingecko2.過去24小時去中心化交易所的交易量:30.

1900/1/1 0:00:00
倫敦升級前夕以太坊準備的怎么樣了_DEFI

7月14日,以太坊將迎來倫敦硬分叉網絡升級,屆時包括5個(EIP-1559、EIP-3198、EIP-3529、EIP-3541和EIP-3554)EIP將納入升級規范中被正式執行.

1900/1/1 0:00:00
金色觀察丨挖來五個關鍵人物 解讀Visa數字貨幣“新野心”_數字貨幣

金色財經 區塊鏈6月30日訊? 據Visa加密貨幣業務負責人 Cuy Sheffield在推特上透露,這家支付巨頭正在擴充內部加密貨幣團隊規模.

1900/1/1 0:00:00
平行鏈上線到底意味著什么?之后我們還能期待些什么?_KUSA

上周,Karura 成功競拍到 Kusama 的第一個平行鏈插槽,并順利上線了,這也是全球第二條 “平行鏈”(第一條是 Kusama 上的資產鏈 Statemine).

1900/1/1 0:00:00
ads