比特幣交易所 比特幣交易所
Ctrl+D 比特幣交易所
ads
首頁 > 火幣APP > Info

看不下去AI胡說八道,英偉達出手給大模型安了個“護欄”_SOL

Author:

Time:1900/1/1 0:00:00

來源:量子位

作者:蕭簫

大模型們胡說八道太嚴重,英偉達看不下去了。

他們正式推出了一個新工具,幫助大模型說該說的話,并回避不應該觸碰的話題。

這個新工具名叫“護欄技術”,相當于給大模型加上一堵安全圍墻,既能控制它的輸出、又能過濾輸入它的內容。

一方面,用戶誘導大模型生成攻擊性代碼、輸出不道德內容的時候,它就會被護欄技術“束縛”,不再輸出不安全的內容。

另一方面,護欄技術還能保護大模型不受用戶的攻擊,幫它擋住來自外界的“惡意輸入”。

美國太空軍官員:美國應存儲比特幣作為自衛武器:3月31日消息,美國太空軍Jason Lowery少校提出了一種非常規的網絡安全和國防方法。他建議美國應該囤積比特幣作為自衛武器。Lowery指出,比特幣的工作量證明系統可以作為網絡領域的權力競爭渠道,且這一競爭破壞力小。這一競爭扮演了類似于冷戰時期的國際象棋比賽和奧運會的角色。

Lowery呼吁美國囤積比特幣,并培育國內的比特幣采礦業。它還呼吁將第二修正案的保護范圍擴大到該技術,將其視為自衛武器。2019年2月,美國總統特朗普要求國防部起草法案組建太空軍。 同年8月,特朗普宣布正式成立美國太空軍司令部。(beincrypto)[2023/3/31 13:37:59]

現在,這個大模型護欄工具已經開源,一起來看看它的效果和生成方法。

Solana生態錢包Solflare帶來高Gas Fees\"優先\"服務:金色財經報道,Solana生態錢包Solflare周一宣布其用戶現在可以支付更高的Gas Fees來克服網絡擁堵。Solrise Finance聯合創始人Vidor Gencel在推特上表示,錢包內的交易將自動以當前市場價格的費用為優先,確保你的交易比其他錢包內的交易更快列入。[2023/1/18 11:17:33]

防止大模型胡言亂語的三類“護欄”

根據英偉達介紹,目前NeMoGuardrails一共提供三種形式的護欄技術:

話題限定護欄、對話安全護欄和攻擊防御護欄。

推特:馬斯克所謂的終止收購是無效和錯誤的:7月22日消息,推特稱:認為特斯拉CEO埃隆·馬斯克所謂的終止收購是無效和錯誤的,合并協議仍然有效。此外,對賬戶樣本進行了內部審查,估計第二季度的虛假或垃圾郵件賬戶平均占平均可貨幣化的日活躍數的5%以下。(金十)[2022/7/22 2:31:39]

話題限定護欄,簡單來說就是“防止大模型跑題”。

大模型具備更豐富的想象力,相比其他AI更容易完成創造性的代碼和文字編寫工作。

但對于特定場景應用如寫代碼、當客服而言,至少用戶不希望它在解決問題時“脫離目標范圍”,生成一些與需求無關的內容。

這種情況下就需要用到話題限定護欄,當大模型生成超出話題范圍的文字或代碼時,護欄就會將它引導回限定的功能和話題上。

以太坊市值跌破1200億美元關口:金色財經報道,據CMC最新數據顯示,以太坊市值已跌破1200億美元關口,本文撰寫時為115,745,175,389美元。當前ETH價格已跌至963.33美元,流通供應量為121,223,422 ETH。[2022/6/19 4:38:08]

對話安全護欄,指避免大模型輸出時“胡言亂語”。

胡言亂語包括兩方面的情況。

一方面是大模型生成的答案中包括事實性錯誤,即“聽起來很有道理,但其實完全不對”的東西;

另一方面是大模型生成帶偏見、惡意的輸出,如在用戶引導下說臟話、或是生成不道德的內容。

攻擊防御護欄,即防止AI平臺受到來自外界的惡意攻擊。

這里不僅包括誘導大模型調用外部病APP從而攻擊它,也包括黑客主動通過網絡、惡意程序等方式攻擊大模型。護欄會通過各種方式防止這些攻擊,避免大模型癱瘓。

所以,這樣的護欄要如何打造?

如何打造一個大模型“護欄”?

這里我們先看看一個標準的“護欄”包含哪些要素。

具體來說,一個護欄應當包括三方面的內容,即格式規范、消息和交互流。

首先是格式規范,即面對不同問題的問法時,規定大模型要輸出的內容。

例如被問到“XX文章是什么”,大模型必須給出特定類型的“文章”,而非別的東西;被問到“誰發表了什么”,大模型必須給出“人名”,而非別的回答。

然后是消息定義,這里以“用戶問候”話題為例,大模型可以輸出這些內容:

最后是交互流的定義,例如告訴大模型,怎么才是問候用戶的最好方式:

一旦問候用戶的機制被觸發,大模型就會進入這個護欄,規規矩矩地問候用戶。

具體工作流程如下:首先,將用戶輸入轉換成某種格式規范,據此生成對應的護欄;隨后,生成行動步驟,以交互流指示大模型一步步完成對應的操作;最后,根據格式規范生成輸出。

類似的,我們就能給大模型定義各種各樣的護欄,例如“應對用戶辱罵”的護欄。

這樣即使用戶說出“你是個傻瓜”,大模型也能學會冷靜應對:

目前,英偉達正在將護欄技術整合進他們的AI框架NeMo中,這是個方便用戶創建各種AI模型、并在英偉達GPU上加速的框架。

對“護欄”技術感興趣的小伙伴們,可以試一試了~

Tags:比特幣SOLERYEMO特比特幣是什么Frz Solar SystembakeryswapTHEMOON

火幣APP
IDO&IEO:盤點即將上線的7個熱門項目(5月第一彈)_TAL

昨晚SUI上線各大交易平臺,其中Binance最高價格2USDT,較公募價最高上漲1900%?.

1900/1/1 0:00:00
坎昆升級將成為以太坊L2的轉折點_BLO

在即將到來的坎昆升級中,以太坊將迎來重大改變,將使得以太坊Layer?2的速度提高?10?x,甚至有機會提高?100?倍且成本更低。本文將探討坎昆升級的影響以及可能受益的L2項目.

1900/1/1 0:00:00
2ETH入手Azuki?從Blend協議看NFT借貸市場_END

最近,NFT交易市場Blur宣布了一項針對NFT的新借貸協議BlurLending,又名Blend,讓NFTfi市場又攪起了波瀾.

1900/1/1 0:00:00
AIGC產業研究報告 2023——圖像生成篇_AIG

來源:易觀 圖片來源:由無界AI工具生成今年以來,隨著人工智能技術不斷實現突破迭代,生成式AI的話題多次成為熱門,而人工智能內容生成的產業發展、市場反應與相應監管要求也受到了廣泛關注.

1900/1/1 0:00:00
當年馬斯克離開 OpenAI 的真相_PEN

在ChatGPT?的影響下,目前?OpenAI?成為了全球最火爆的AI公司。然而回顧過去,它與馬斯克之間的恩怨從創立之初就埋下了.

1900/1/1 0:00:00
五折買ETH機會還是陷阱?深入解析 Grayscale 信托_THE

摘要 2023年加密市場從去年的深熊里大幅反彈,很多人可能還未來的及‘上車’,此時對比資產凈值仍有5折左右折價的Grayscale信托份額顯得格外有吸引力;基于以太坊Web3核心基礎設施的地位.

1900/1/1 0:00:00
ads