當多方安全計算技術遇到量化投研,投研機構將怎樣借力充分挖掘數據價值?算力隱私數據安全專欄特邀郭嘉,初探大數據量化建模,及多方安全計算技術與量化投研工作的結合方式。傳統的投研數據同質化程度極高,模型效果不具有獨特性,美國市場有一群人在挖掘和研究更加互聯網化的數據指標,稱另類因子。由于第三方數據的開放流通限制,必須遵守數據安全的游戲規則。本文借由投研對數據的安全建模方案,實現了多方數據的投研建模,并實現了投資模型的加密部署。大數據的量化邏輯
我們可以按數據開放程度,簡單地把投研信息分為三類:公開數據、半公開數據、以及非公開數據。公開數據,很好理解,就是股價,K線圖等隨時可以查看的數據;半公開數據,指我們可以獲取到,但不能全面地獲取的數據,如實時的資金流向我們隨時可以獲取,但是網站并不會公開以往的數據;非公開數據,即市場上與股票相關的其他公司、證券交易所內部數據,無法對外提供。引入一個概念——量化投資,量化投資簡而言之就是在數據中找規律。大數據為量化投資打開了全新的大門,在量化交易中引入大數據技術,可以充分挖掘海量數據所隱藏的一切信息,來預測金融經濟活動,并結合歷史預測,及時將預測效果加以反饋,以動態更新交易策略,獲得最理想的預測效果。傳統的各類量化指標,無論是基于價格還是基于財務數據都會存在一定的滯后性,無法用更具領先性的手段來了解行業和市場。而采用了大數據技術的行業及個股判斷,則可以在一定程度上改善這一情形。利用搜索因子可掌握投資者情緒,利用電商數據可實時得知各行業的基本面動向,利用大V數據集合了集體的智慧,這幾種大數據理論上都可以用來預測未來市場情況,將互聯網金融的大數據作為選股因子引入模型,代表著資產管理機構在指數投資上重構選股邏輯。股票市場的信息不對稱性是一直存在的問題,量化交易者無法獲知市場上非公開數據和互聯網數據,且基于大數據與模型的量化交易,往往對操作中的數量與時間節點要求分外嚴格,丟失或篡改數據均會致使預測與正確結果相偏離,又或致使交易在不對的時刻,以錯誤的數量來達成。若因信息不安全而外泄數據,長時間便可能會致使業內彼此利用這些數據來惡化競爭。2多方安全計算的量化優勢
MakerDAO擬將金庫上限設為5000萬枚DAI,超出部分買入MKR并添加流動性:7月3日消息,MakerDAO風險核心單元團隊在社區發布“智能銷毀引擎與初始參數介紹”提案,目前該提案尚未投票。該提案稱,智能銷毀引擎(Smart Burn Engine)是一種新型智能合約系統,旨在從Maker未將其用作應急儲備的Surplusbuffer中分配多余的Dai。智能銷毀引擎與此前的銷毀設計不同之處在于,MKR代幣將以Uniswap V2LP代幣形式累積,而非被獲取并銷毀。此外,Surplus Auctions(Flaps)將被DssFlapper合約取代。[2023/7/3 22:14:51]
事實上,有價值的數據往往躺在別人的懷里,如何只進行“精神共享”,不進行“肉體接觸”,這是當下對數據應用安全的合規要求。隱私計算技術很好地解決了這個用數難題。多個持有各自私有數據的參與方,共同執行一個計算邏輯并獲得計算結果,各方發送的消息中不能推斷出各方持有的私有數據信息,在此技術下,各參與者的身份和地位相同,可建立共享數據策略。由于數據不發生轉移,因此不會泄露用戶隱私或影響數據規范,為了保護數據隱私、滿足合法合規的要求。專業術語稱之為多方安全計算。
數據:19,998枚ETH從Liquity轉移到未知錢包:金色財經報道,據Whale Alert數據顯示,19,998 枚ETH (31,093,017 美元) 從Liquity轉移到未知錢包。[2023/1/17 11:15:28]
此技術能夠在保證信息安全前提下,讓投研機構利用非公開數據資訊和信息,更好的發掘和預測股票的波動。本文即嘗試通過安全多方計算技術和聯邦學習技術,將公開數據和非公開數據進行結合,并進行量化交易分析,希望該案例能夠給從事量化交易的專業人士拓展分析思路。Avatar的開幕式
“這個case不是為了證明第三方數據有多牛,是表演一下投研對數據的安全建模方案”。研究標的:2019年8月5日-2020年8月4日創業板中所有股票研究目標:該策略目標為利用歷史數據,預測每只股票當天是否漲幅超8%,即樣本集中日股票漲幅超8%,y值為1,否則y值為0。研究變量聯邦學習中節點A數據:通過股票歷史數據,構建了當日星期、近三天平均收益率、近七天平均收益率、近三天絕對收益率、近七天絕對收益率、近三天標準差、近七天標準差、近三天平均換手率、近七天平均換手率、近三天平均成交量、近七天平均成交量、近三天上漲天數、近七天上漲天數、近三天漲幅大于5%次數、近七天漲幅大于5%次數、近三天跌幅大于5%次數、近七天跌幅大于5%次數,共17個指標。聯邦學習中節點B數據:通過百度搜索中關鍵詞為“創業板”的搜索次數,構建了當日創業板搜索指數、近一天創業板搜索指數、近三天創業板搜索指數、近七天創業板搜索指數、近三天創業板指數上升天數、近七天創業板指數上升天數、創業板搜素指數漲幅,共7個指標,模擬外部非公開的數據源。綜上,該策略通過上述24個指標的構建,結合動量策略和反轉策略原理,并通過百度搜索次數作為外部數據,作為反應市場情緒的變量,之后根據IV等指標篩選入參變量,構建邏輯回歸模型,預測當日股票是否上漲超過8%。為驗證百度指數作用,策略制定了四個模型作為對照,具體如下:樣本集為全部股票,未用到百度指數構建模型樣本集為全部股票,用到了百度指數構建模型樣本集為華興源創,未用到百度指數構建模型樣本集為華興源創,用到百度指數構建模型模型結論1)通過IV值可推斷百度指數數據對于預測y值有較為重要的作用,其中創業板搜索漲跌幅和近三天創業板搜索平均值效果較為顯著,通過模型系數可知創業板搜索漲跌幅和近三天創業板搜索平均值和y值具有正相關關系,即數值越高,越容易漲幅超過8%。
上周數字資產投資產品凈流出970萬美元:1月9日消息,據CoinShares報告顯示,上周數字資產投資產品凈流出970萬美元,其中比特幣投資產品凈流出650萬美元,以太坊投資產品凈流出310萬美元,做空比特幣的投資產品凈流入120萬美元,XRP投資產品流入300萬美元。[2023/1/9 11:02:42]
2)樣本集為全部股票,用到百度指數構建模型,AUC為0.76,未用到百度指數構建模型,AUC為0.72,說明百度指數對應預測有明顯提升效果。
韓國金融機構正考慮直接參與加密貨幣在交易所上線的資格評定:12月12日消息,韓國金融服務委員會和金融情報機構(FIU)等金融監管部門正在審查一項提議,將“由監管機構直接批準代幣在國內加密交易所上線”的內容納入虛擬資產基本法。最近,因Wemade旗下鏈游平臺Wemix的WEMIX代幣遭各加密交易所下架,該國投資者陸續蒙受損失。
在這種情況下,有人提出意見稱,金融當局應該同時參與該國交易所對加密貨幣上線和下架資格的評定。但金融當局內部也出現了贊成和反對的意見分歧,因此,能否實現還有待觀察。(Herald)[2022/12/12 21:38:38]
3)樣本集為華興源創,用到百度指數構建模型,AUC為0.74,未用到百度指數構建模型,AUC為0.73,說明百度指數對應預測有提升效果。
Edge & Node聯合創始人:熊市正是建設的好時機:7月22日消息,The Graph背后團隊Edge & Node的聯合創始人Tegan Kline表示,“在區塊鏈領域里還可以創造更多的東西,好消息是社區成員知道它們是什么。”Kline提到Layer 2、多鏈聚合、橋接技術、托管和DAO等一些開發中的東西。他還表示區塊鏈可以影響社交媒體的發展。
Kline談到了加密冬天,并就市場下跌時社區成員應該關注的問題提出建議,社區應該堅持其核心價值觀,并保持提供真正解決方案的決心。“我們一起經歷了市場低迷,我們都會變得更加強大。我們都支持彼此的項目,并且存在持續培育生態系統的良性循環。”
Kline還強調,加密冬天為建設者提供機會。這是因為熊市期間噪音較小,因此Kline稱之為“建設者的天堂”。“社區將埋頭苦干,專注于建設。只有堅定的創始人和社區成員會留下來,這最終會成為一個很好的過濾器。出于這個原因,有些人甚至歡迎熊市。”
他指出,“不要坐等復蘇發生:繼續建設,專注于核心任務,記住我們現在正在為下一次復蘇奠定基礎。”(Cointelegraph)[2022/7/22 2:31:27]
根據上述案例,我們發現添加外部的非公開信息,確實能夠提升股票預測能力。對量化投資來講,傳統量化投資大部分的時間都浪費在了數據清洗和數據整理上,且對外獲取的數據,由于不清楚數據來源,數據質量和數據安全存在重大隱患,量化策略可能因為數據質量而帶來反向影響。利用安全多方計算的方式,量化公司就可以使用外部數據源直接進行聯邦學習,數據方會根據量化投資者需求,前期進行數據的加工和處理,對于量化公司來說,一是可以有效減少數據清洗和整理時間,二是直接對接數據源,確保了數據安全和數據質量,三是可以確保業務合規,保證量化模型效果穩定,四是可以通過外部數據,構建非公開數據相關的量化策略和指標,獲取更多的超額收益。展望
本文只是大數據量化建模的初探,隱私計算技術能夠提供給量化交易更為廣泛、有效的基礎資源、技術支持,有機會促進大數據技術基礎下量化交易策略的快速發展。本篇文章僅僅是通過非公開信息,利用安全多方計算技術對量化研究工作進行的初步探究,探究方法還比較粗糙,后期作者將基于安全多方計算對量化交易進行更加深入的探究和分析,希望感興趣的朋友們持續關注后續相關系列文章。作者黃奉孝自詡從技術走向業務的小學生。近十年互聯網大數據行業經驗,先后就職于上海大智慧、平安、挖財,任職大數據架構師、資深分析師等職位,對金融科技有深入研究。目前任職富數科技高級總監,負責隱私計算的解決方案與業務落地。
三個月前,比特幣剛剛從“312”的極端暴跌行情中緩過勁來,在9000美元震蕩,市場對下半年的行情走勢一度很迷茫.
1900/1/1 0:00:00吳說區塊鏈獲悉,8月21日央行主管的《中國金融雜志》刊登了中國人民銀行貨幣政策司司長孫國峰等的文章,透露出非常重要的內部信息.
1900/1/1 0:00:00編者按:本文來自Cointelegraph中文,作者:SAMUELHAIG,Odaily星球日報經授權轉載.
1900/1/1 0:00:002020年第32周區塊鏈二級市場報告2020年8月3日-2020年8月10日本期報告重點內容:本周大盤走勢:突破前高承壓回調.
1900/1/1 0:00:00在發布JustSwap的前27天,波場對它的宣傳就從未停止。然而,上線第一天的JustSwap略顯匆促:上線時間推遲、初期假幣泛濫、連「土狗」都出現了對應的「假土狗」.
1900/1/1 0:00:00編者按:本文來自MulticoinCapital官方,Odaily星球日報經授權轉載。近期,去中心化金融的活動和公眾興趣呈爆炸式增長.
1900/1/1 0:00:00