大型語言模型(LLMs)已經成為科技行業的熱點,為我們提供了一些令人稱奇的體驗——從幾秒鐘內編寫一周的代碼,到生成比與人類進行的對話更富有共情的對話。通過使用成千上萬個GPU進行數萬億令牌的數據訓練,LLMs展示了出色的自然語言理解能力,并改變了文案和代碼等領域,將我們推進了全新、令人興奮的生成式AI時代。與任何新興技術一樣,生成式AI也受到了一些批評。盡管這些批評在一定程度上反映了LLMs當前能力的局限性,但我們將這些阻礙視為進一步創新的機會,而不是技術本質性的缺陷。
為了更好地了解LLMs的近期技術突破,并為創始人和運營者做好未來準備,我們與一些領先的生成式AI研究人員進行了交談,他們正在積極構建和訓練一些最大最前沿的模型,包括Anthropic公司的首席執行官Dario Amodei、Cohere公司的首席執行官Aidan Gomez、Character.AI公司的首席執行官Noam Shazeer以及AI21 Labs的Yoav Shoham。這些交談確定了未來即將到來的4個關鍵創新方向:導向、記憶、"手和腳"以及多模態。在本文中,我們將討論這些關鍵創新如何在未來6到12個月內發展,以及對于對將AI整合到自己的業務中感興趣的創始人來說,如何利用這些新進展。
導向
許多創始人對在其產品和工作流程中使用LLMs表示擔憂,因為這些模型有可能產生幻覺和重現偏見。為了解決這些問題,一些領先的模型公司正在致力于改進導向技術——一種在LLMs輸出中更好地控制模型結果、讓模型更好地理解和執行復雜用戶需求的方法。Noam Shazeer在這方面提到了LLMs和孩子之間的相似之處:“這是如何更好地引導[模型]的問題...我們在LLMs上面臨的問題就是我們需要正確的方式告訴它們如何按照我們的要求行事。小孩子也是如此——他們有時會編造事情,對幻想和現實沒有一個明確的理解。”盡管在模型提供商和類似Guardrails和LMQL的工具出現之后,在導向能力方面已經取得了顯著的進展,研究人員仍在不斷取得進步,我們認為這對于更好地將LLMs產品化對于最終用戶至關重要。
A16z支持的Bitski推出加密貨幣錢包:金色財經報道,Bitski宣布推出了一款新錢包,面向加密貨幣本地人和新來者。?在A16z、Galaxy Digital 和 Kindred Ventures等主要投資者的支持下,Bitski 為以太坊用戶提供了通過電子郵件和密碼設置登錄的選項,類似于 Wax 區塊鏈上的 Wax Cloud 錢包和 Flow 區塊鏈上的 Dapper 錢包等服務。[2023/2/22 12:23:08]
在企業公司中,改進的導向尤其重要,因為不可預測行為的后果可能是昂貴的。Amodei指出,LLMs的不可預測性會讓人們感到不安,作為一個API提供者,他希望能夠“對著客戶說‘不,模型不會做這個’,或者至少很少會這樣做。”通過改進LLMs的輸出,創始人們可以更有信心地確保模型的性能與客戶需求相符。改進的導向還將為其他行業的廣泛采用鋪平道路,這些行業對精確性和可靠性的要求更高,例如廣告行業,其中廣告投放的風險很高。Amodei還認為改進的導向可以應用于“法律用例、醫療用例、存儲金融信息和管理金融賭注,以及需要保護公司品牌的場景。您不希望您所整合的技術是不可預測或難以預測或刻畫的。”通過更好的導向,LLMs還能夠在少量提示工程的情況下完成更復雜的任務,因為它們將能夠更好地理解整體意圖。
LLMs導向方面的進展還有可能在用戶期望定制和準確回應的敏感消費者應用中開啟新的可能性。雖然當用戶與LLMs進行對話或創造性交互時,他們可能會容忍較低準確性的輸出,但是當用戶使用LLMs來協助日常任務、指導重要決策或增強生活教練、治療師和醫生等專業人士時,他們希望得到更準確的輸出。有人指出,LLMs有望取代搜索等已深入人心的消費者應用,但在這成為真正可能之前,我們可能需要更好的導向來改善模型輸出并建立用戶信任。
Fortune:a16z對加密貨幣和區塊鏈投資明顯放緩:10月21日消息,據《財富》(Fortune)雜志披露,a16z參與的全球加密貨幣和區塊鏈風險投資交易出現明顯放緩的跡象。數據顯示,管理著76億美元資金的a16z Crypto在三季度僅有7筆加密和區塊鏈風險投資交易,創下自2021年一季度以來的最低記錄。另據據PitchBook的數據顯示,a16z Crypto的投資規模也出現驟降從2022年一季度的24億美元跌至三季度的約6億美元,但仍高于2021年三季度。
對于《財富》披露的數據,a16z一位發言人表示,鑒于尚有投資交易尚未公開披露,因此該公司對相關數據無法給予確認。[2022/10/21 16:34:34]
關鍵突破點:用戶可以更好地定制LLMS的輸出。
記憶
由LLMs驅動的文案撰寫和廣告生成應用程序已經取得了巨大的成功,從而在營銷人員、廣告商和創業者中迅速流行起來。然而,目前大多數LLMs的輸出相對泛化,這使得難以將它們用于需要個性化和情境理解的用例。雖然提示工程和微調可以提供一定程度的個性化,但是提示工程的可擴展性較差,而微調往往代價高昂,因為它需要一定程度的重新訓練,并且通常需要與大多數閉源LLMs緊密合作。為每個個體用戶進行微調模型通常是不可行或不可取的。
上下文學習是實現這一目標的圣杯,其中LLMs從您的公司生成的內容、您公司的特定行話和特定上下文中獲取信息,以創建更精細、針對特定用例的輸出。為了實現這一目標,LLMs需要增強的記憶能力。LLM記憶有兩個主要組成部分:上下文窗口和檢索。上下文窗口是模型可以處理和用于指導其輸出的文本,除了它被訓練的數據語料庫之外。檢索是指從模型的訓練數據語料庫之外的數據體中檢索和引用相關信息和文檔(“上下文數據”)。目前,大多數LLMs的上下文窗口有限,無法原生地檢索附加信息,因此生成的輸出缺乏個性化。然而,通過更大的上下文窗口和改進的檢索,LLMs可以直接提供更加精細的、針對個別用例的輸出。
a16z推出規模達45億美元的第四支加密基金:5月25日消息,a16z推出規模達45億美元的第四支加密基金Crypto Fund 4,其中約15億美元將用于種子投資,30億美元將用于風險投資,這使得其籌集的加密資金總額超過76億美元。
a16z將用這些資金在每個融資階段投資于有前途的Web3初創公司,目前對Web3游戲、DeFi、去中心化社交媒體、自我主權身份、Layer1和Layer2基礎設施、橋、DAO和治理、NFT社區、隱私、創造者經濟、可再生金融、ZK證明的新應用、去中心化內容和故事創作以及許多其他領域的發展感到興奮。
a16z還將繼續發展運營團隊,以便繼續為創始人提供最好的服務,其中運營職能包括研究和工程、安全性、人才管理、法律和監管、市場拓展。[2022/5/25 3:41:19]
特別是通過擴展上下文窗口,模型將能夠處理更大量的文本并更好地保持上下文,包括在對話中保持連貫性。這將進一步顯著提高模型在需要更深入理解較長輸入的任務中的能力,例如總結長篇文章或在長時間對話中生成連貫且上下文準確的回應。在上下文窗口方面,我們已經看到了顯著的改進——GPT-4具有8k和32k標記的上下文窗口,相比之下,GPT-3.5和ChatGPT的上下文窗口分別為4k和16k標記,而Claude最近將其上下文窗口擴展到驚人的100k標記。
僅擴展上下文窗口并不能充分改善內存,因為推理的成本和時間與提示的長度呈準線性甚至二次方關系。檢索機制通過與提示相關的上下文數據增強和完善LLM的原始訓練語料庫。由于LLMs是在一個信息體上進行訓練的,并且通常難以更新,檢索的兩個主要好處是根據Shoham的說法:“首先,它允許您訪問在訓練時沒有的信息源。其次,它使您可以將語言模型聚焦在您認為與任務相關的信息上。”矢量數據庫(例如Pinecone)已成為高效檢索相關信息的事實標準,并且作為LLMs的內存層,使模型更容易快速準確地搜索和引用海量信息中的正確數據。
Solana Labs獲3.14億美元融資,由A16z及Polychain Capital領投:6月9日消息,Solana開發者生態Solana Lab完成由A16z及Polychain Capital領投的314億美元融資,參與本輪融資的機構還包括AlamedaResearch、CMSHoldings、CoinShares、JumpTrading、MulticoinCapital、SinoGlobalCapital等。本輪融資將用于啟動孵化器,以幫助Solana生態內項目技術開發。(The Block)[2021/6/9 23:25:11]
增加的上下文窗口和檢索將在企業用例中尤為重要,例如導航大型知識庫或復雜數據庫。公司將能夠更好地利用其專有數據,如內部知識、歷史客戶支持票據或財務結果,作為LLMs的輸入,而無需進行微調。改進LLMs的記憶將在培訓、報告、內部搜索、數據分析和業務智能以及客戶支持等領域帶來改進和深度定制的能力。
在消費者領域,改進的上下文窗口和檢索將實現強大的個性化功能,從而革新用戶體驗。Noam Shazeer認為:“其中一個重大突破將是開發出一種具有非常高的內存容量,可以針對每個用戶進行定制,同時在規模上仍然具有成本效益的模型。您希望您的治療師了解您的生活方方面面;您希望您的老師了解您已經掌握的知識;您希望生活教練能夠就正在發生的事情向您提供建議。他們都需要上下文。” Aidan Gomez對此發展也表示興奮。“通過讓模型訪問與您獨特相關的數據,如您的電子郵件、日歷或直接消息,”他說,“模型將了解您與不同人的關系以及您如何與朋友或同事交談,并在這種情況下幫助您最大程度地提供幫助。”
關鍵突破點:LLMs將能夠考慮大量相關信息,并提供更個性化、定制和有用的輸出。
a16z完成兩支新基金的募資,管理資產規模達165億美元:a16z宣布完成兩支新基金的募資,分別是13億美元的FundVII基金和32億美元的GrowthII基金,至此a16z管理的總資產規模達近165億美元。其中,FundVII」基金是一支投資于消費者、企業和金融服務技術的早期基金,而GrowthII基金則是一支后期階段的基金,投資于a16z的所有核心垂直領域:消費者、企業、金融技術、生物和加密。[2020/11/21 21:35:14]
“手臂和腿部”:賦予模型使用工具的能力
LLMs的真正威力在于使自然語言成為行動的媒介。LLMs對常見且有詳細文檔的系統具有復雜的理解能力,但它們無法執行從這些系統中提取的任何信息。例如,OpenAI的ChatGPT、Anthropic的Claude和Character AI的Lily可以詳細描述如何預訂航班,但它們本身無法原生地預訂航班(盡管像ChatGPT的插件等技術進展正在推動這一邊界)。Amodei表示:“這個大腦在理論上擁有所有這些知識,只是缺少從名稱到按鈕的映射。”他說:“連接這些電纜并不需要太多的訓練。你有一個沒有實體的大腦,它知道如何移動,但它還沒有連接上手臂和腿部。”
隨著時間的推移,我們已經看到公司不斷改善LLMs使用工具的能力。像必應和谷歌這樣的老牌公司和Perplexity和You.com這樣的初創公司推出了搜索API。AI21 Labs推出了Jurassic-X,它通過將模型與一組預定工具(包括計算器、天氣API、維基百科API和數據庫)結合起來,解決了獨立LLMs的許多缺陷。OpenAI推出了ChatGPT的插件測試版,允許ChatGPT與Expedia、OpenTable、Wolfram、Instacart、Speak、網絡瀏覽器和代碼解釋器等工具進行交互,這一突破被認為類似于蘋果的“應用商店”時刻。最近,OpenAI在GPT-3.5和GPT-4中引入了函數調用 ,允許開發者將GPT的能力與任何外部工具進行鏈接。
通過從知識挖掘轉向行動導向,增加手臂和腿部的能力有望在各種公司和用戶類型之間實現一系列用例。對于消費者而言,LLMs可能很快就能給出菜譜建議,然后為您訂購所需的食材,或者建議一個早午餐地點并為您預訂餐桌。在企業領域,創始人可以通過接入LLMs使他們的應用程序更易于使用。正如Amodei所指出的:“對于從用戶界面角度來說非常難以使用的功能,我們可能只需用自然語言描述即可實現復雜的操作。”例如,對于Salesforce等應用程序,LLM集成應允許用戶用自然語言進行更新,并使模型自動進行這些更改,從而大大減少了維護CRM所需的時間。像Cohere和Adept這樣的初創公司正在致力于將LLMs集成到這類復雜工具中。
Gomez認為,雖然LLMs能夠在2年內使用Excel等應用程序的可能性越來越大,但“仍然需要進行許多細化工作。我們將擁有第一代能夠使用工具的模型,這將是引人注目但易碎的。最終,我們將獲得夢寐以求的系統,我們可以將任何軟件交給模型,并附上一些描述,例如‘這是工具的功能,這是如何使用它的’,它將能夠使用它。一旦我們可以為LLMs提供特定和通用的工具,它所帶來的自動化將成為我們領域的巔峰之作。”
關鍵突破點:LLMs將能夠與我們今天使用的工具進行更加有效的交互。
多模態
盡管聊天界面對許多用戶來說令人興奮和直觀,但人類聽和說語言的頻率可能與寫或讀語言的頻率相當或更高。正如Amodei所指出的:“AI系統能做的事情是有限的,因為并不是所有的事情都是文本。”具備多模態功能的模型能夠無縫地處理和生成多種音頻或視覺格式的內容,將這種交互擴展到超越語言的領域。像GPT-4、Character.AI和Meta的ImageBind這樣的模型已經能夠處理和生成圖像、音頻和其他模態,但它們在這方面的能力還比較基礎,盡管進展迅速。用Gomez的話說,我們的模型在字面上今天是盲的,這一點需要改變。我們構建了很多假設用戶能夠看到的圖形用戶界面(GUI)。
隨著LLMs不斷進化,更好地理解和與多種模態交互,它們將能夠使用依賴GUI的現有應用程序,比如瀏覽器。它們還可以為消費者提供更加引人入勝、連貫和全面的體驗,使用戶能夠超越聊天界面進行互動。Shazeer指出:“多模態模型的許多出色整合可以使事物更具吸引力和與用戶更緊密相連。”他還說:“我認為,目前大部分核心智能來自文本,但音頻和視頻可以使這些事物更有趣。”從與AI導師進行視頻聊天到與AI合作迭代和編寫電視劇劇本,多模態有潛力改變娛樂、學習與發展以及跨各種消費者和企業用例的內容生成。
多模態與工具使用密切相關。盡管LLMs最初可能通過API與外部軟件進行連接,但多模態將使LLMs能夠使用設計給人類使用但沒有自定義集成的工具,例如傳統的企業資源計劃(ERP)系統、桌面應用程序、醫療設備或制造機械。在這方面,我們已經看到了令人興奮的進展:例如,谷歌的Med-PaLM-2模型可以合成乳腺攝影和X射線圖像。而且從長遠來看,多模態(特別是與計算機視覺的集成)可以通過機器人、自動駕駛車輛和其他需要與物理世界實時交互的應用程序,將LLMs擴展到我們自己的物理現實中。
關鍵突破點:多模態模型能夠在沒有重大定制的情況下推理圖像、視頻,甚至物理環境。
盡管LLMs存在一些實際限制,但研究人員在短時間內對這些模型進行了驚人的改進。事實上,我們在撰寫本文時已經多次更新過它,這證明了該領域技術的快速發展。Gomez也表示同意:“LLM在20次中有1次編造事實顯然還是太高了。但我真的非常有信心,這是我們第一次構建這樣的系統。人們的期望相當高,所以目標已經從‘計算機很笨,只會做數學’變成了‘一個人可能做得更好’。我們已經足夠彌合差距,以至于批評集中在人類能做到什么程度上。”
我們特別對以下4項創新感到興奮,它們正處于改變創業者構建產品和經營公司方式的臨界點。從長遠來看,潛力更大。Amodei預測:“在某個時刻,我們可能會擁有一個模型,它能夠閱讀所有生物數據,并找出治愈癌癥的方法。”現實情況是,最好的新應用可能仍然是未知的。在Character.AI,Shazeer讓用戶開發這些用例:“我們將看到許多新的應用程序解鎖。對我來說很難說出這些應用程序是什么。將會有數百萬個應用程序,用戶比少數工程師更善于發現如何使用技術。”我們迫不及待地期待這些進步將如何影響我們作為創業者和公司在生活和工作中的方式,因為這些新工具和能力賦予了我們新的力量。
感謝Matt Bornstein、Guido Appenzeller和Rajko Radovanovi?在撰寫過程中提供的意見和反饋。
DoraFactory
個人專欄
閱讀更多
金色早8點
Odaily星球日報
金色財經
Block unicorn
DAOrayaki
曼昆區塊鏈法律
作者:Beehive Validator;編譯:深潮 TechFlow目前,質押(Staking)是 DeFi 市場中最大的領域之一.
1900/1/1 0:00:00作者:金色財經,36度區塊鏈 摘要 6月14日,全國政協委員、香港特區立法會議員吳杰莊在推特宣布與加密貨幣交易所Coinbase取得聯系,探討Coinbase在香港發展的機會.
1900/1/1 0:00:00【06.18 - 06.24】周報概要:1、上周NFT總交易額:184,283,496(美元)2、上周NFT總交易筆數:364.
1900/1/1 0:00:00作者:比推BitpushNews Mary Liu在美國證券交易委員會(SEC)針對幣安和 Coinbase 等頭部加密交易所采取監管行動,加密市場盤整萎靡之際.
1900/1/1 0:00:00作者:Conor 編譯:白話區塊鏈自從以太坊過渡到 PoS 以來,任何愿意質押 ETH 的人都可以獲得大約 4% 的收益率.
1900/1/1 0:00:00作者:cr1st0f;編譯:深潮 TechFlow從 CryptoPunks、Rare Pepes 到 Fidenzas,最著名且成功的 NFT 都屬于藝術和收藏品類別.
1900/1/1 0:00:00