比特幣交易所 比特幣交易所
Ctrl+D 比特幣交易所
ads
首頁 > MEXC > Info

AIGC的里程碑 Chat GPT憑什么引爆科技圈?_GPT

Author:

Time:1900/1/1 0:00:00

摘要

事件:11月30日,OpenAI上線了新模型ChatGPT,其網頁應用允許用戶免費使用,ChatGPT能夠理解人類語言并且回答問題,不限于普通聊天、協助寫代碼、解決具體難題等等應用場景。因為其高質量的回答、高效獲取信息的方式、以及上癮式的交互體驗,ChatGPT引起了社交媒體的廣泛傳播與關注。

ChatGPT效果出人意料,“全能AI”火遍社交媒體。ChatGPT的交互界面簡潔,只有一個輸入框,AI將根據輸入內容進行回復,并允許在一個語境下持續聊天。ChatGPT的聊天范圍廣泛,涵蓋大部分領域,根據親身體驗以及社交媒體分享的內容來看,ChatGPT能在絕大部分知識領域給出專業回答,同時對輸入的理解能力和包容度高。無論是讓ChatGPT寫首押韻的詩、檢查代碼的bug、回答科學問題、對推特未來的發展提出建議都不在話下,其回復內容每次都是隨機的,但總體保持著一定的專業性和信息量,具備很強的參考意義。與ChatGPT持續對話是一種令人上癮的體驗,因此在該應用發布的短短幾天內,就能看到國內外的社交媒體上就有大量關于ChatGPT對話的分享。

ChatGPT的背后離不開大模型、大數據、大算力。ChatGPT成為AIGC里程碑的背后,是算力發展和數字時代形成的大數據所共同支持的大模型訓練,才能實現目前的效果。由OpenAI研發的ChatGPT是微調后的GPT-3.5系列模型,有著多達1750億個模型參數,并在今年年初訓練完成。模型訓練的背后離不開大數據的支持,OpenAI主要使用的公共爬蟲數據集有著超過萬億單詞的人類語言數據集。在算力方面,GPT-3.5在AzureAI超算基礎設施上進行訓練,總算力消耗約3640PF-days。

證監會科技監管局局長姚前:重點發展基于AIGC技術的合成數據產業:3月7日消息,證監會科技監管局局長姚前在《中國金融》撰文稱,建議重點發展基于AIGC技術的合成數據產業。以更高效率、更低成本、更高質量為數據要素市場“增量擴容”,助力打造面向人工智能未來發展的數據優勢。在強化數據要素優質供給方面,應統籌兼顧自立自強和對外開放。可考慮對Wikipedia、Reddit等特定數據源建立過濾后的境內鏡像站點,供國內數據處理者使用。

國家相關部門應對大模型訓練數據的處理和使用標準進行統一規范;建立數據托管機制,對數據托管方進行約束,要求數據托管方按照監管機構的規定對數據來源、處理結果以及使用去向等進行監測,從而使得模型的輸入、輸出結果符合監管要求。[2023/3/7 12:46:29]

AIGC不僅改變創作,還將改變獲取信息的主要方式。在之前的報告中,我們討論過AIGC對于創作的替代,降低了創作門檻,為元宇宙數字內容的豐富打下基礎。而在此之上,ChatGPT所展示了作為生產力的存在,ChatGPT在尋找答案、解決問題的效率上已經部分的超越了如今的搜索引擎,ChatGPT或許在未來會改變我們獲取信息、輸出內容的方式,AIGC有望成為數字經濟時代驅動需求爆發的殺手級應用。

模型缺點瑕不掩瑜,未來迭代值得期待。據官網顯示,ChatGPT目前存在著一些局限性,包括:有時會給出看上去正確但荒謬的答案、微調提問的方式會得到完全不同的答案、有時會反復使用某些句子等等。在我們實際體驗中也能感受到,這些問題來自訓練過程和數據集的局限性。ChatGPT本次面向用戶免費開放能夠進一步強化訓練,從而完善模型質量。

DigiDaigaku創始人:將在超級碗期間投放廣告,同時開啟新NFT的免費鑄造:1月31日消息,DigiDaigaku母公司Limit Break的創始人Gabriel Leydon發推稱,Limit Break將在2月12日舉行的超級碗現場投放廣告。

在廣告出現之時,Limit Break也將開放全新NFT系列DigiDaigaku Dragons的免費鑄造,該系列NFT總供應量為10000只,白名單申請現已開放。[2023/2/1 11:39:36]

投資建議:軟硬件與數據集。生成算法、NLP與算力決定AIGC能否運行,而高質量的數據集決定了AIGC質量與商業模式。軟件層面主要包括自然語言處理技術:谷歌、微軟、科大訊飛、拓爾思;AIGC生成算法模型及數據集:視覺中國、萬興科技、藍色光標、昆侖萬維;算力層包括:三大運營商、英偉達、瀾起科技、中興通訊、新易盛、天孚通信、中際旭創等。

風險提示:技術創新不及預期;政策監管風險。

11月30日,OpenAI上線了新模型ChatGPT,該模型允許用戶以對話的方式與其交互。ChatGPT是之前發布的InstructGPT的兄弟模型,后者被訓練用于根據輸入給出詳細的一段輸出。同時,ChatGPT模型為了獲得更多用戶反饋,在目前階段對用戶開放免費使用,用戶可通過chat.openai.com進行應用交互體驗。

PeckShield:DigiDaigaku CEO 推特賬戶攻擊者盜取的 MAYC#5738 已售出:金色財經報道,PeckShield 發推表示,DigiDaigaku CEO 推特賬戶攻擊者盜取了 MAYC #5738 NFT,并在 OpenSea 上以 11.45 WETH 的價格出售,獲利近 1.8 萬美元。[2022/11/3 12:13:10]

ChatGPT的交互界面簡潔,只有一個輸入框,用戶可以任意開啟話題或者給出指令,模型將根據輸入內容給出輸出。ChatGPT的一大特點就是允許在同一個語境下持續交流,能夠根據上下文進行回復。

ChatGPT的聊天范圍廣泛,涵蓋大部分領域,具備參考意義。根據親身體驗以及社交媒體分享的內容來看,ChatGPT能在絕大部分知識領域給出專業回答,同時對輸入的理解能力和包容度高。無論是讓ChatGPT寫首押韻的詩、檢查代碼的bug、回答科學問題、對推特未來的發展提出建議都不在話下,其回復內容每次都是隨機的,但總體保持著一定的專業性和信息量,具備很強的參考意義。

ChatGPT的對話內容開始在社交媒體引起關注。因為ChatGPT對話的隨機性以及較為豐富的信息量,與ChatGPT持續對話令人上癮,在該應用發布的短短幾天內,國內外的社交媒體上就有大量關于ChatGPT對話的分享。這其中包括馬斯克向ChatGPT請教如何改變推特,也有各類有趣的問答合輯。

區塊鏈之父Scott Stornetta:我不是中本聰,Craig Wright也不是:關于中本聰(Satoshi Nakamoto)這個名字,區塊鏈之父Scott Stornetta稱,你可以買一本關于日本名字的字典,Satoshi可以有20種日本漢字。但我傾向于認為‘satoru’是‘to know’、‘to be wise’。”“中本”在日本非常常見,如果把它分解成漢字,那么可能的解釋是:‘Naka’顯然是中心,‘moto’是起源。雖然其工作以及能流利使用日語使他成為完美的中本聰候選人,他一直明確否認。因此,我們很大一部分注意力都放在隨著時間推移不斷更新記錄完整性的能力上,這樣記錄就能持續幾十年甚至幾個世紀,我們就能在抗量子計算和所有這些東西中生存下來。這是中本聰沒有注意到的。雖然他不知道中本聰的身份,但排除了Craig Wright的可能性。他認為,我們應該努力理解中本聰對比特幣的愿景,以便理解如何向前發展。他認為比特幣與其說是科學,不如說是藝術。我是這個陣營的一員,我相信用比特幣做的事情肯定是天才的杰作。但這更像是一件藝術品,一件為許多可能性打開大門的工程藝術品,但絕不是最終或最佳的解決方案。(Cointelegraph)[2020/4/28]

AIGC里程碑的背后離不開大模型、大數據、大算力。ChatGPT成為AIGC里程碑的背后,是算力發展和數字時代形成的大數據所共同支持的大模型訓練,才能實現目前的效果。由OpenAI研發的ChatGPT是微調后的GPT-3.5系列模型,有著多達1750億個模型參數,并在今年年初訓練完成。

聲音 | Craig wright:將建立可供數十億用戶使用的平臺:據bitcoinexchangeguide消息,Craig wright最近表示,預計到明年年底,比特幣的容量將達到2GB,這將使更多的用戶能夠使用BSV,但不會給網絡帶來任何壓力。他說,“我們的目標是讓50億人每天使用BSV,對比特幣SV來說,當前競爭仍是該網絡的主要障礙。”[2018/12/4]

模型訓練的背后離不開大數據的支持,公共爬蟲數據集有著超過萬億單詞的人類語言數據集,OpenAI團隊在此基礎上進行整理加工形成用于訓練模型的數據集。在算力方面,GPT-3.5在AzureAI超算基礎設施上進行訓練,總算力消耗約3640PF-days。

AIGC不僅改變創作,還將改變獲取信息的主要方式。在之前的報告中,我們討論過AIGC對于創作的替代,降低了創作門檻,為元宇宙數字內容的豐富打下基礎。而在此之上,ChatGPT所展示了作為生產力的存在,ChatGPT在尋找答案、解決問題的效率上已經部分的超越了如今谷歌等搜索引擎,ChatGPT或許在未來會改變我們獲取信息的方式,AIGC成為新時代的用戶入口。

模型缺點瑕不掩瑜,未來迭代值得期待。官網注明了ChatGPT目前存在著一些局限性及原因,在我們的實際體驗中,也確實遇到這些問題:

1)有時ChatGPT會寫一些看上去合理但錯誤且荒謬的答案,這個在體驗中較少但會出現。據官網描述,這個問題是難以解決的,因為:第一,在訓練期間,并沒有提問者目前所有的事實;第二,如果讓模型過于謹慎,那么他能回答的問題也會拒絕回答;第三,有觀察的訓練誤導了模型,因為正確的答案來源于模型的數據庫而非人類知道什么。

2)ChatGPT對輸入的改變比較敏感。例如,給出一句問題,模型聲稱無法得知答案,但輕微地改變問題,就能正確地回答。這種特性在體驗中表現的比較明顯。

3)ChatGPT有時會非常重復表達,反復使用某些句子,例如:重申自己是OpenAI訓練的語言模型。這個問題在我們的體驗中也經常出現,根據官網,該問題來自于訓練數據的偏差,以及過度擬合問題。

4)在理想情況下,當用戶問題模糊時,模型應該會提問將問題清晰化。但目前的模型經常不去追問問題,直接猜想用戶可能問的方向。

除了官網提到的局限性外,根據實際體驗,ChatGPT即使在輸入的明確要求下,也難以在表達中使用數據支持,這可能是因為ChatGPT所使用的語言數據集并不包含太多關于數據的內容。

投資建議

相比于此前的AI繪畫,ChatGPT更具有將AI能力與工作流程相結合的潛力,例如我們試著讓其解釋“光學模塊中的光芯片和電芯片是什么?當前的全球主流供應商是誰?中國企業的競爭地位如何?未來是否有什么技術可以替代InP材料?”這類問題時,ChatGPT能夠給出頗為專業的答復,且語言表達流暢。如果將ChatGPT與Midjourney等創作工具融合,有可能直接輸出設計圖稿等內容,畢竟文字生成是基礎,而用戶要做的盡量調整自己的輸入,以促使AI輸出更質量的內容,這本身也是一種訓練和反饋過程。目前部分用戶已在社交媒體上表達了對ChatGPT的付費意愿,可見C端用戶為了提高效率有意愿訂閱此類服務。

目前OpenAI等巨頭已著手自建計算集群來滿足AIGC的要求,這種集中式的訓練對GPU、存儲、機房、供電等基礎設施均有巨大需求。國內部分創業團隊目前基于公有云訓練,隨著需求的增加,也有望轉向自建集群。

今年以來,我國“東數西算”戰略自上而下快速推進,作為數字經濟的基礎,“算力即權力”,其重要性不言而喻,此前我們更多的互聯網應用聚焦于“存”而非“算”,隨著AIGC技術在全球的興起,“東數西算”的算力需求將越來越顯著。

關于AIGC的投資策略,能夠從軟硬件與數據集的三個角度梳理,生成算法、NLP與算力決定AIGC能否運行,而高質量的數據集決定了AIGC質量與商業模式。

軟件層面主要包括自然語言處理技術:谷歌、微軟、科大訊飛、拓爾思。

AIGC生成算法模型及數據集:藍色光標、視覺中國、昆侖萬維、萬興科技。

算力層包括:三大運營商、英偉達、瀾起科技、中興通訊、新易盛、天孚通信、中際旭創等。

風險提示

技術創新不及預期:AIGC的技術發展不及預期,以及底層硬件技術,如:超級計算機,算力的發展不及預期。

政策監管風險:目前AIGC還處于相對早期,后續是否會出臺AIGC作品相關的知識版權或其他法律監管條款尚不明確。

本文節選自國盛證券研究所已于2022年12月5日發布的報告《AIGC的里程碑——ChatGPT憑什么引爆科技圈?》,具體內容請詳見相關報告。

宋嘉吉?S0680519010002??songjiaji@gszq.com

特別聲明:《證券期貨投資者適當性管理辦法》于2017年7月1日起正式實施。通過微信形式制作的本資料僅面向國盛證券客戶中的專業投資者。請勿對本資料進行任何形式的轉發。若您非國盛證券客戶中的專業投資者,為保證服務質量、控制投資風險,請取消關注,請勿訂閱、接受或使用本資料中的任何信息。因本訂閱號難以設置訪問權限,若給您造成不便,煩請諒解!感謝您給予的理解和配合。

重要聲明:本訂閱號是國盛證券通信團隊設立的。本訂閱號不是國盛通信團隊研究報告的發布平臺。本訂閱號所載的信息僅面向專業投資機構,僅供在新媒體背景下研究觀點的及時交流。本訂閱號所載的信息均摘編自國盛證券研究所已經發布的研究報告或者系對已發布報告的后續解讀,若因對報告的摘編而產生歧義,應以報告發布當日的完整內容為準。本資料僅代表報告發布當日的判斷,相關的分析意見及推測可在不發出通知的情形下做出更改,讀者參考時還須及時跟蹤后續最新的研究進展。

本資料不構成對具體證券在具體價位、具體時點、具體市場表現的判斷或投資建議,不能夠等同于指導具體投資的操作性意見,普通的個人投資者若使用本資料,有可能會因缺乏解讀服務而對報告中的關鍵假設、評級、目標價等內容產生理解上的歧義,進而造成投資損失。因此個人投資者還須尋求專業投資顧問的指導。本資料僅供參考之用,接收人不應單純依靠本資料的信息而取代自身的獨立判斷,應自主作出投資決策并自行承擔投資風險。

Tags:GPTCHAHATCHATArbGPTquickpaymentchainHATOK幣Stripchat10元等于多少代幣

MEXC
Alameda 混亂資產負債表引發對 FTX 的擔憂 會否帶來系統性風險?_AME

前言:CoinDesk對Alameda的報道,發現其最大的單一資產、大量的抵押品均為FTX的平臺幣FTT,Alameda與FTX的大量不透明的關聯交易,此前利率超乎常規的理財產品.

1900/1/1 0:00:00
守護創作者經濟 NFT 版稅的未來應該是怎么樣的?_SEA

原文:Bankless 編譯:DeFi之道 圖片來源:由無界版圖AI工具生成在過去幾年里,大量藝術家進入了加密經濟。這些創作者的動力是什么?能夠從他們作品的二次銷售中賺取版稅.

1900/1/1 0:00:00
金色觀察 | 10張圖了解FTX流動性現狀_OIN

文/DefiIgnas 1、Cryptoquant數據顯示,自10月20日以來,已有7.08億美元的穩定幣被提取。根據數據,仍有1.7億美元留在FTX儲備中.

1900/1/1 0:00:00
Layer2代幣經濟學:除了治理 還應該具備什么價值?_以太坊

作者:MichaelNadeau來源:TheDeFiReport 為什么我們需要L2? 任何在2021年期間使用以太坊的人都知道,該區塊鏈可能會變得非常擁堵.

1900/1/1 0:00:00
你需要知道的 DeFi 原語和技術棧_EFI

原文標題:《DeFiEcosystem:PrimitivesandTechnologyStack》撰文:AwKaiShin編譯:ChinaDeFi隨著社區繼續構建新的原語、資產和軌道.

1900/1/1 0:00:00
金色觀察丨2022年各大機構加密布局盤點_NFT

按:2022年雖然是加密市場進入熊市,而且LUNA、三箭、FTX、BlockFi等中心化機構陸續發生暴雷。但其實,各領域的頭部機構和公司在急劇進入加密貨幣領域.

1900/1/1 0:00:00
ads