比特幣交易所 比特幣交易所
Ctrl+D 比特幣交易所
ads

AI Arena:掌握游戲機制 訓練你的下一個拳王_ARE

Author:

Time:1900/1/1 0:00:00

人工神經網絡

一個最重要的創新:人工神經網絡

簡單來講,神經網絡意味著理論上它可以學習任何用戶動作的映射!

為了介紹一會兒將使用的一些術語,從狀態到行動的映射將被稱為“策略”。

為了讓拳手的神經網絡學習策略,AI Arena將采取模擬學習和強化學習。其中神經網絡架構存儲在IPFS上。

在上圖中,神經元之間的連接稱為“權值”。當你的神經網絡正在“學習”時,所發生的是它正在改變權值的值。

拜登政府發起AI Cyber Challenge,獎金近2000萬美元:金色財經報道,拜登政府8月9日透露,黑客可以通過應用人工智能(AI)來保護美國重要基礎設施免受網絡安全漏洞的影響,從而獲得巨額金錢獎勵。初賽階段將選出最多20支表現優異的隊伍參加DEF CON 2024的半決賽。其中,最多5支隊伍每支將獲得200萬美元的獎金,并晉級DEF CON 2025的決賽。

AI Cyber Challenge獎金近2000萬美元,匯聚了Anthropic、Google、Microsoft、OpenAI等知名AI企業。AI Cyber Challenge將要求參與者公開分享其系統的內部工作原理,以便更廣泛地利用其解決方案。此外,該挑戰賽的指導由Linux基金會的一個部門開源安全基金會提供。競賽的組織機構美國國防高級研究計劃局(DARPA)承諾為七家有意參加競賽的小企業提供高達100萬美元的資金支持,從而確保參與者的多元化。[2023/8/10 16:17:30]

權值最終將決定狀態如何映射到動作,這意味著我們可以將權值解釋為“智能”。

報告:三分之二的AI Chrome擴展程序可能危及用戶安全:金色財經報道,Incogni最新報告的數據顯示,超過三分之二的Google Chrome瀏覽器人工智能擴展具有高風險影響,如果遭到破壞,可能會對用戶網絡安全造成“嚴重損害”。

8月份的報告分析了7個不同類別的70個AI Chrome擴展程序,其中10個寫作擴展程序均屬于高風險類別。70個擴展中的48個如果擱淺,就會屬于高風險影響類別,但60%的擴展首先面臨安全漏洞的風險較低。

Incogni負責人Darius Belejevas表示,雖然這些擴展提供了“不可否認的便利”,但用戶應該將隱私和安全保護作為首要任務。[2023/8/8 21:32:08]

神經網絡權值對于每個NFT都是唯一的,并存儲在以太坊上。

AI設計機制全攻略

狀態

火幣全球站現已恢復RAI(RAI Finance)充幣和提幣業務:官方消息,RAI錢包升級已完成,火幣全球站現已恢復RAI(RAI Finance)的充幣和提幣業務。[2021/7/7 0:32:51]

(1)什么是狀態?

狀態是環境在某個時間點的表示。它并沒有包含所有信息——只包含了其中必要的信息。

例如:研究人員使用屏幕上的所有像素作為狀態,讓AI計算出像素代表什么。然后根據他們認為對決策過程重要的因素進行人工調試。

AI Arena一再強調其關心的是為所有人提供平等的機會——團隊希望獎勵能夠更多地給予堅持訓練AI的用戶,而不是獎勵擁有更多資源的用戶。

(2)游戲將使用哪些變量?

下面是狀態中包含的變量列表。需要注意的是,AI Arena將使用下標1表示用戶自己的AI,下標2表示對手。

MXC抹茶6月23日20:00上線DAI & MKR:官方公告,6月23日20:00,MXC抹茶將上線MakerDAO項目的DAI及MKR通證,并開放DAI/USDT、MKR /USDT交易,6月22日18:00開放充值,6月25日20:00開放提現。

據MakerDAO官方資料顯示,MakerDAO是以太坊最大的去中心化DeFi應用,提供第一個去中心化穩定幣Dai和衍生品。詳情請閱讀相關公告。[2020/6/22]

此外,競技場的左邊界的X位置為0,右邊界的X位置為1。

訓練

(1)訓練概述

這是改變神經網絡中權值的過程,以使AI能夠起作用。

動態 | PAI 24h成交量已達火幣Pro全站的20%:據火幣Pro行情顯示,PAI/BTC的24h成交量占火幣Pro全站成交量的13.24%,PAI/ETH占6.86%,兩者合計已達全站成交量的20%。自7月2日PAI上線以來,其累計成交額高達20億元。[2018/7/5]

例如:如果我們在對手面前,我們可能希望我們的戰士出擊。

有一系列的權值可以實現這一點,訓練的重點是讓AI學會在特定場景中采取特定的行動。

AI Arena在應用程序中嵌入了以下培訓計劃:

模仿學習

為了學習如何戰斗,你的AI將觀察你并學習模仿你的動作。

自我學習

為了學習你無法教給它的技能,你的AI將與自己的副本對抗,以不斷提高。

(2)為什么需要訓練?

1·隨機初始化

首次創建NFT拳手時,神經網絡權值也隨之生成。一開始它會隨機采取行動,因為它不知道在什么情況下應該采取什么行動。

因此為了準備戰斗,我們必須訓練它,使它學會一個好的作戰策略。

2·隨機策略

正如上文“神經網絡”部分中提到的,從狀態到動作的映射稱為策略。

換句話說,策略定義了代理在某些情況下的行為方式。在訓練之前,NFT拳手還沒有學會一個好的戰斗策略,所以只是隨機行動。

(1)通過觀察學習

理解模仿學習的最好方法是想象你是一個師父,你的AI是一個你正在準備戰斗的戰士。

你用你的人工智能進行搏擊,它學習模仿你在特定場景中的動作。

我們正在寫一篇關于模仿學習的綜合博文,到時候會將其鏈接到這里。

(2)演示

實際情況:你實際操控的是左邊的灰色拳手,而你的AI在右邊。你可以測試一些動作,觀察AI如何模仿你。

請注意:它不會立即復刻你的動作,因為神經網絡需要一點時間來學習,所以在AI學會之前,你可能需要多重復幾次你的動作。

為簡單演示,目前AI Arena只允許用戶使用這些操作:向左跑、向右跑、單拳、雙拳和防守。

(1)完美匹配

最完美的拳擊搭檔就是用戶自己。通過自我學習,你的AI總是在不斷地挑戰自己,不斷地改進。

(2)不同的學習范式

通過模仿學習,AI通過觀看演示進行學習。在自我學習中,AI像對手一樣學習和戰斗沒有多大意義,因為對手是人工智能本身的克隆。

但是如果沒有專家向人AI展示如何戰斗,那么它如何學習該做什么呢?——通過獎勵。

AI將學會采取給予它更多正向獎勵的行動,而減少采取給予它負面獎勵的行動。

定制訓練

Python環境[正在準備中]

AI Arena計劃為玩家引入一個python環境來訓練他們自己的模型。

目前,用戶僅限于使用團隊在應用程序中提供的兩種培訓方法;但不久的將來,應用程序將可以允許玩家導入其自定義培訓模型并上鏈。

游戲模式探索

戰斗

AI Arena目前有兩種可用的作戰模式:模擬賽和排位賽。除此之外,團隊計劃在不久后整合另外兩種作戰模式。

1)模擬賽

玩家可以在對抗競技場測試他們的拳手來預先訓練的AI。在這種模式下將沒有任何獎勵。

2)排位賽

玩家將讓他們的拳手去對抗來自世界各地的拳手。玩家的唯一目標就是努力攀登排行榜,成為競技場的冠軍!

玩家在排行榜上的排名越高,贏得一場戰斗的回報獎勵就越高。

3)目標

雖然每種戰斗模式都有其獨特之處,但它們都有一個共同的勝利目標:在指定的時間內消耗對手所有生命值。

鏈金交易員總結

目前AI Arena尚處在早期,很適合提前埋伏觀察。據官方透露,游戲正式版本大概率于明年推出,而今年年末推出的測試版本將只有白名單用戶可以參與體驗。

白名單用戶名額的獲取方式是參與團隊即將推出的解密游戲,通過游戲后的用戶將會被隨機選擇是否進入白名單。

有興趣的玩家可以加入他們的Discord嘗試體驗,大概率后期會有早鳥空投獎勵。

Tags:ARERENARENRAIQuiz ArenaGamer ArenaKAREN幣SAITAMURAI

POL幣最新價格
詳解BitDAO:擁有數十億資產的投資型DAO_BitDAO

去中心化的自治組織(DAO)最近名聲大噪。像FlamingoDAO這樣的收藏家的DAO正在購買Bored Ape Yacht Club和Crypto Punks等藍籌項目的NFT.

1900/1/1 0:00:00
即將開啟創世居民鑄造 一文了解Chibi Clash如何構建P2E游戲世界_CHI

Chibi Clash將于1月31日開啟鑄造創世壁居民們(Gen Zero Chibi Citizens).

1900/1/1 0:00:00
25 個值得持續關注的潛在空投項目 0基礎指南_比特幣

Bankless 近期整理出了 25 個未來值得關注的,可能會發放空投的項目,一共 25 個,第一篇文章中介紹了其中5個,本文將繼續介紹其中10個項目.

1900/1/1 0:00:00
Cronos中文世界第一人的VVS的自閉之旅_CROS

在GameFi、memecoin熱度持續霸屏的當下,DeFi熱度遲遲不見起色,前段時間熱議的DeFi2.0也并沒有持續多久。圈內盼“神礦”久矣.

1900/1/1 0:00:00
Zebec Protocol:Solana上的流支付_LANA

在我們的認知里,買賣行為通常為「一手交錢,一手交貨」,事件發生在某個具體的時間點。但是我們所有的交易行為,并不僅僅是錢貨兩訖這樣簡單.

1900/1/1 0:00:00
全面解讀隱私公鏈 Aleph Zero 的技術架構、代幣模型與路線圖_ZER

介紹 公共區塊鏈提出了許多源自其協議架構設計的挑戰。這類限制最常見的例子包括速度、驗證時間、可擴展性和安全性。另一方面,其他方面在實施方面不太重要,例如隱私、互操作性、可組合性和商業吸引力.

1900/1/1 0:00:00
ads