比特幣交易所 比特幣交易所
Ctrl+D 比特幣交易所
ads
首頁 > 酷幣 > Info

深度:如何用機器學習來預測主流幣的幣價?_人工智能

Author:

Time:1900/1/1 0:00:00

機器學習技術在幣種分析中的應用

談到機器學習,大家可能會對這個AI方面的概念比較陌生,但如果提到谷歌AlphaGo,大家肯定就很熟悉了。當年谷歌人工智能程序通過機器學習的方式掌握圍棋比賽技巧后,輕松擊敗了多個國家的圍棋冠軍,時隔3年世界冠軍韓國李世石宣布退役時,還高呼AI不可戰勝......通過機器學習訓練后的計算機程序,在某些類似比賽和交易這樣的博弈場景中,是比人類具有更高勝率的。

非小號研究本次就做了一個硬核的試驗:將機器學習技術應用在幣種分析中,看看會有什么好玩的結論,以及是否真的能夠幫助我們判斷、交易。

我們的具體課題是,通過現有的市場公開數據預測明日收益率為正還是為負。

這是一個二分類問題,我們可以使用的模型有很多,這里我們選用了以下模型用于實驗:邏輯回歸LR、線性判別分析LDA、二次判別分析QDA、支持向量機SVC、決策樹DT、隨機森林RF、漸變提升樹GBC等。

本次用來試驗的數據主要有三個方面:

于佳寧:元宇宙的普及將推動實體經濟與數字經濟加速深度融合:火大教育校長于佳寧指出,元宇宙成為新一輪全球數字創新競爭高地。2021年是元宇宙元年,互聯網迭代升級的大幕就此拉開。于佳寧認為,未來,元宇宙的普及將推動實體經濟與數字經濟加速深度融合,區塊鏈等各類技術價值也將在賦能實體產業中逐步顯現,實現新商業模式,重構分配模式,再造組織形態,重塑產業關系。(上海證券報)[2021/12/4 12:50:23]

1、資產的歷史數據;

2、相關品種,如黃金原油美國三大股指等;

3、幣圈相關幣種數據,主要是主流幣。

完整的機器學習建立流程

1.首先,特征工程

特征工程是機器學習中最關鍵的步驟,沒有之一。

這有別于大眾認知的AI能解決一切問題,人工智能是萬能的認知。真實的情況是數據科學家們常掛在嘴邊的一句話是“輸入的是垃圾,輸出的也一定是垃圾”,這意味著特征工程做得好不好會直接影響AI的“智商”。

陳曉豐:區塊鏈技術在金融領域的應用廣度和應用深度都得到提升:金色財經現場報道,2020年9月22日下午,區塊鏈行業應用反洗錢標準討論會在北京召開。杭州趣鏈科技有限公司質量標準部總監陳曉豐表示,區塊鏈技術作為“新基建”的重要支撐技術,在金融領域的應用廣度和應用深度都得到了很大的提升。趣鏈科技參與研制區塊鏈行業應用反洗錢的標準工作,將使金融領域的研究和探索進入了更深的層次,增強服務金融、賦能金融的能力和實力。[2020/9/22]

特征工程不止是數據需要清洗重新組合,還需要將數據進行標準化處理。

2.其次,建模

建模是一個簡單的過程,模型在那里,無非是灌入數據后不斷地調參優化。國內很多大互聯網公司的AI團隊也都是在常用模型中選擇靴子不斷優化,大家的過程都是一樣的,沒有什么捷徑。

3.評價模型效果

模型的效果評估有很多,常見的有MSE,MAE,取代矩陣,ROC等。

4.最終,應用

動態 | 安徽省政府常務會議強調推動區塊鏈等與開發區基礎設施等深度融合:金色財經報道,1月8日下午,安徽省長李國英主持召開省政府第83次常務會議。會議強調,推動大數據、云計算、區塊鏈、人工智能、物聯網等新一代信息技術與開發區基礎設施、產業發展、管理服務等深度融合,實現開發區基礎設施現代化、政務服務高效化、社會服務精細化,全面提升開發區競爭優勢。[2020/1/9]

當模型對數據的可解釋度良好時,模型可用。一般這個可解釋度要達到80%以上,90%以上更好,但如果100%可解釋就需要注意是否出錯了。

對BTC的解釋性

數據一

僅有高開低收量,及高開低收量計算的技術指標作為訓練數據。得到各個模型解釋度如下表所示:

由上表可以得到,單純的用高開低收量和技術指標作為特征,在以上機器學習模型中訓練,無法很好地解釋價格。其實僅從這里就能看出幣圈屬于弱勢有效市場。技術分析得到的尺度是判斷二分類正確概率是50%,即模型無效,也與弱勢有效市場中技術分析無效,基本面分析和內幕信息有效相吻合。

動態 | 甘肅省將推動互聯網、區塊鏈等與實體經濟深度融合:12月5日消息,甘肅省政府辦公廳近日印發《新時代甘肅融入“一帶一路”建設打造信息制高點實施方案》。《方案》提出,我省將全面推動互聯網、大數據、人工智能、物聯網、區塊鏈和實體經濟深度融合,促進新舊動能轉換,打造服務西北、聯接全國,面向中西亞、南亞、中東歐等“一帶一路”沿線國家和地區的通信樞紐、區域信息匯集中心和大數據服務輸出地,努力建設數字經濟強省。[2019/12/5]

市場包含三種信息:歷史信息,公開信息和內幕信息。

各種信息分別對應不同分析交易策略:歷史信息對應技術分析;公開信息對應的基本分析;內幕信息對應的內幕交易。

當市場有效時,市場已反映三種信息,故對三種信息的分析均值不能在市場獲得優勢,某種分析和交易策略均值無效;當市場為半強勢有效時,市場已反映公開信息和歷史信息,故技術分析和基本分析無效,內幕交易有效;當市場為弱有效市場時,市場只反映歷史信息,故技術分析無效,基本分析和內幕交易有效。

聲音 | 諾基亞李琨:5G必須要與區塊鏈深度融合才能滿足智慧城市需求:據賽迪網報道,在2018中國通信產業大會暨第十三屆中國通信技術年會(CCIC2018)上,諾基亞大中華區行業解決方案事業部負責人李琨表示,5G必須要與人工智能、機器學習、區塊鏈、視覺計算以及感應技術的深度融合,才能滿足智慧城市、自動駕駛、超高清視頻、工業控制等行業應用的需求。第四次工業革命即將到來,數萬億美元的產值等著我們解鎖,我們應該利用5G、區塊鏈、人工智能等等這些ICT信息技術產生的經濟紅利,惠及更多行業市場,包括汽車、能源、交通、醫療、工業制造等密集型行業。[2018/12/19]

數據二

不但有高開低收量數據,我們還增加了相關品種的數據,如美國三大股指,黃金,原油,幣圈主流幣種等作為訓練數據。

為什么認為美國三大股指,黃金,原油,幣圈其他主流幣種等數據可以插入基本面數據?

雖然這些因素不是直接影響BTC的基本面因素,但是它們和BTC由相同的基本面因素影響,所以這些數據中包含很少的一部分基本面信息。

由上表可以得知:在增加基本面替代特征后,解釋度提升了10%以上。

那么提高多少可解釋度是模型極限?

經過1000次的實驗得到,當隨機因子為1730時,隨機森林RF模型的可解釋度67%,這是所有實驗中所有模型中可解釋度最高的一組。

模型效果的衡量:

混淆矩陣

混淆矩陣就是分別統計分類模型歸錯類,歸對類的觀測值個數,然后把結果放在一個表里展示出來。這個表就是混淆矩陣,把預測情況與實際情況的所有結果兩兩混合,結果就會出現以下幾種情況,就組成了混淆矩陣。如下:

ROC曲線

ROC曲線,又稱接受者操作特征曲線。該曲線最早應用于雷達信號檢測領域,用于區分信號與噪聲。后來用于評價模型的預測能力,ROC曲線是基于混淆矩陣得出的。

ROC曲線中的主要兩個指標就是真正率和假正率,其中橫坐標為假正率,縱坐標為真正率,下面就是一個標準的ROC曲線圖。

橫軸FPR:1-TNR,1-Specificity,FPR越大,預測正類中實際負類越多。

縱軸TPR:Sensitivity(正類覆蓋率),TPR越大,預測正類中實際正類越多。

為什么解釋性不強?

1.交易量數據造假

2.未有數據披露制度約束,未形成一體的基本面數據

3.市場有可能存在內幕信息

目前我們模型中的數據還不夠全面,仍然需要更多的努力揭示更多的基本面信息,才能更好地解釋BTC價格。

在披露更多信息時,才能促進市場效率的提高,促進幣圈的發展,這也是“非小號”作為機構應該做且做好的事情。

是否有使用價值?

雖然機器學習在解決傳統問題時都要求正確率達到80%甚至90%以上才可以使用,但是我們能否使用一個解釋度在60%-70%之間的模型?

-1.模型是有解釋度的,60%也遠高于50%,長期預測勝率顯著高于50%的多空各一半的平均水平,這有點類似賭場莊家在輪盤賭中有概率優勢一樣,時間越久贏面越大;

-2.加入限制條件時可以提高概率,單次若想取得概率優勢只能限制使用條件

如下所示為決策樹輸出的樹形圖,用紅色框起來的枝杈正確率很高,但是只有滿足層層條件后才會有交易機會。為了達到盈利目的,交易者要在交易機會與單次交易盈利水平中找到平衡點。

單個樹杈局部圖如下所示,當滿足紅框圈住的條件時,正確率提高到93%,這完全達到了使用要求:

對ETH和TRX的解釋性

從模型訓練結果看,已知特征使用以上模型訓練時,可解釋度也在60%-70%之間。下面我們列舉一些有價值的樹杈,樹杈概率的提高是基于條件概率提升的。

ETH

由以下ETH樹形圖可以看出,當同時滿足條件

美元比eth收盤價<0.01,eth昨日成交量<3956783616,原油成交量>117392.5,漲跌幅>0,黃金開盤價<1489.25時,時,有93%的正確率,這時交易機會是總交易機會的19.05%(28/147)。

TRX

由以下TRX樹形圖可以看出,當同時滿足條件bch<289.51,bsv>63.5,美元比eth調整后收盤價>0.01,納指收盤價<8371.12,道指最低價>24290.5,美元比eth收盤價>0.01,瑞波幣收盤價<0.32時,有82%的正確率,這時交易機會是總交易機會的23.68(36/152)。

如果以上使用機器學習來分析不同幣種交易機會的流程沒看懂,也沒有關系,涉及到的知識比較復雜。所以,非小號后期將應用很多大數據或AI等技術幫助大家建立分析模型,直接在APP中為大家提供易懂和好用的幣價預測工具或投資策略參考,一鍵體驗。

Tags:區塊鏈ETHROC人工智能區塊鏈工程專業學什么課程的togetherbnb幾個女主Rocket Global Coin人工智能專業

酷幣
Vid基金會公布Staking計劃,并計劃在未來三個月內發布白皮書_VID

社交媒體應用程序Vid背后的公司Vid基金會近日公布Staking計劃,允許更多人可以質押其VI代幣.

1900/1/1 0:00:00
阿帆談幣:9.5繼續高空 不要做抓反彈的傻事_FTX

各位朋友們,你們好,我是阿帆談幣(aftb88888)。阿帆本著負責、誠懇、認真的態度用心寫好每一篇分析文章,特點鮮明,不夸張,不含糊,力求能讓大家看懂大的趨勢分析以及小范圍的多空搏殺力度! 技.

1900/1/1 0:00:00
Gate.io將上線SAL(Salmon),TAI,CRT(Carret),CORN交易公告_GATE

Gate.io將于2020年9月4日上線SAL(Salmon),TAI,CRT(Carret),CORN交易.

1900/1/1 0:00:00
User Data Stream Websocket Payloads更新公告_USE

親愛的用戶: 幣安將于2020年09月09日上午8:00對API的UserDataStreamWebsocketPayloads做以下更新:Base第二輪Prop House資助啟動.

1900/1/1 0:00:00
TAI (TAI)_TAI

基本信息: 英文全稱:tBridge 英文簡稱:TAI 項目簡介: tBridge.io是TronFi生態系統中最重要的部分之一,它是一個跨鏈資產交換解決方案.

1900/1/1 0:00:00
維基百科資深編輯刪除澳大利亞公司Power Ledger區塊鏈相關條目_GER

據Cointelegraph報道,維基百科資深編輯DavidGerard刪除關于澳大利亞公司PowerLedger的區塊鏈相關條目.

1900/1/1 0:00:00
ads