比「GPT偵探」更重要的是,AI生成內容在不同行業的「容忍度」。
圖片來源:由無界版圖AI工具生成
作者|美漪編輯?|靖宇
最近兩個月,科技圈最熱的話題,無疑是OpenAI推出的對話式AI應用ChatGPT,不僅可以讓它給你寫一首詩、回答你的任何問題,甚至可以讓它幫忙寫沒那么復雜的代碼。業內甚至認為,ChatGPT甚至有取代谷歌的潛力。
為ChatGPT歡呼的還有另一群人,就是「社畜」和學生——他們發現月度總結、學校論文和作業這樣的任務,也可以讓ChatGPT代勞了,后者甚至寫得有模有樣,不比真人寫得差多少。
ChatGPT似乎讓學生們的日子更輕松了,但卻讓教師更「頭疼」了,因為后者很難確認,眼前這些文字,到底是學生寫的,還是出自OpenAI的產品之手。為此,紐約教育部甚至禁止公立學校使用ChatGPT。
在這樣的混亂中,一位普林斯頓大學的學生,EdwardTian推出了一個專殺ChatGPT的應用——「GPTZero」,有了這面「照妖鏡」,內容是人寫的,還是機器寫的,真相馬上就揭曉。
「GPTZero」在網絡迅速爆紅,吸引了a16z在內的硅谷創投的目光。但是應用創造者本人Tian卻認為,最重要的事,是「讓AI更加透明」。
加密上市公司Tokens.com開發移動Web3游戲:金色財經報道,Web3加密資產上市公司Tokens.comCorp.宣布其子公司Hulk Labs(“Hulk”)正處于創建一款名為Astraeus Defense的基于手機的專有web3視頻游戲的高級開發階段。
Astraeus Defense將是一款移動優先游戲,采用由Hulk Labs開發的創新web3經濟機制。Astraeus Defense將于2023年進行初步Beta測試,并計劃于2024年第一季度全面發布。[2023/7/17 10:59:12]
01
「ChatGPT殺手」
在ChatGPT成為學生們「偷懶」的神器后,教育和科研機構不得不開始抵制這個新的噩夢。
紐約教育部宣布禁止學生在公立學校使用ChatGPT;全球知名機器學習會議之一的ICML也宣布禁止發表包含由ChatGPT和其他類似系統生成內容的論文,以免出現「意外后果」。
出于對學術界,使用ChatGPT相關道德問題的擔憂,華人小哥EdwardTian在一家當地的咖啡店里,花了一個寒假的時間,研發了GPTZero,希望能讓學術界恢復嚴謹性。
Tian年僅22歲,目前仍是美國普林斯頓大學的大四學生,主修計算機科學專業,專門研究自然語言處理,同時輔修認知科學和新聞學。
數據:某聰明錢拋售約54萬美元的SHIB,目前仍持有價值約228萬美元的SHIB:6月18日消息,據Spot On Chain監測,此前從SHIB中賺取960萬美元以上的某聰明錢地址,在過去16天中以0.00000712美元的均價拋售了754億枚SHI(總價值約53.7萬美元),并兌換成ETH和USDT。值得注意的是,SHIB價格在幾乎每次在該地址拋售后出現明顯下降。該地址當前仍持有3290億枚SHIB(價值約228萬美元)。[2023/6/18 21:45:20]
GPTZero的開發者EdwardTian|網絡
他還曾是英國廣播公司和開源情報網站Bellingcat的研究員,也曾是被微軟收購的反恐初創公司MiburoSolutions的分析師。在那里,他監測虛假信息和機器人檢測。Tian說,「所有的這些經歷,都是他研發GPTZero的動力」。
2023年1月2日,Tian將GPTZero發布到網絡,預計只會有幾十個人嘗試它,完全沒有想過,這會掀起一場世界級別的軒然大波。
在他把這款軟件上傳到互聯網上的幾個小時內,竟有超過?2000人在Steamlit上測試了GPTZero的公開版本。
1月5日,也就是發布的第三天,Tian對GPTZero做出了更新和改善,還顯著降低了誤報率;此時,新程序已有超過?1萬的用戶量了!Tian也不禁對它的「爆炸性增長」和「病式傳播」感到震驚。
QuickNode宣布正式推出QuickNode Marketplace:金色財經報道,區塊鏈基礎設施QuickNode今天在Messari Mainnet會議上宣布,正式推出QuickNode Marketplace。開發者現在可以為QuickNode Marketplace創建和銷售定制插件,使QuickNode的95,000多名注冊開發者能夠以各種方式為其支持區塊鏈的應用程序訪問新的API。(prnewswire)[2022/9/23 7:15:13]
據NPR報道,一周內有?3萬多人試用了GPTZero,甚至「導致該應用由于出乎意料的高網絡流量」而崩潰,托管GPTZero的免費平臺Streamlit此后介入,以更多的內存和資源支持Tian,以處理網絡流量。
EdwardTian通過在視頻中展示其對一篇《紐約客》文章和LinkedIn上的ChatGPT生成器的帖子的分析,展示了該應用如何區分人類和人工智能撰寫的文本。
GPTZero的工作原理就是檢測文本的「困惑性」和「突發性」這兩項指標,并分別對其打分,根據統計學特征來確定,文本是由人工智能寫的還是人類寫的。總體來說,如果這兩項參數得分都很低,那么該文本很有可能出自AI之手。
這里所說的「困惑性」,是指來自人類所寫作品的語言的復雜性和隨機性。
中非共和國:投資“Sango幣”6萬美元可成為公民:金色財經報道,中非共和國Sango創新公司發表的一份聲明內容中稱,“Sango幣將于7月21日開始發售。購買Sango幣的最低金額為500美元,將以加密貨幣的形式收到,包括比特幣和以太坊。”不僅如此,還能通過Sango幣獲得中非共和國公民身份——根據中非共和國的倡議,外國投資者只需要以6萬美元的價格購買Sango幣,并在五年內持有質押可獲得公民身份,或者以6,000美元的價格獲得共和國三年的“電子居留權”。那些購買了Sango幣但沒有使用它們的人將能夠以其他加密貨幣取回錢。[2022/7/19 2:22:07]
這個指標主要是衡量文本在一個句子中的隨機程度,以及一個句子的構造方式是否會讓GPTZero感到困惑。
每當用戶在GPTZero輸入一段測試內容,它就會分別計算出:「文字總困惑度」、「所有句子的平均困惑度」、「每個句子的困惑度」。
這些數值越低,越能說明這個文本對GPTZero來說是非常「熟悉」的,那么它很可能是AI生成的;相反,如果這些數值越高,就越能說明文本中句子的構造或用詞方式讓GPTZero感到「驚訝」,那么它就更可能是出自人類之手。
這是因為,人工智能接受過數據庫的訓練,生成的文本在一段時間內,表現出的困惑度會更均勻和恒定,選詞的可預測性也更高;而人類書寫的文本則不會這樣,真人的遣詞造句一般會比較隨機,比機器更容易寫比較出乎意料的詞句。
bitbank計劃與三井住友信托控股合作成立數字資產信托公司:5月24日消息,日本加密資產交易所運營商bitbank正式宣布與三井住友信托控股簽署合作意向,計劃成立專門從事數字資產業務的信托公司JADAT。[2022/5/24 3:38:55]
使用GPTZero檢測文字是否由ChatGPT生成|Twitter
而「突發性」,則是指來自人類使用的句子結構的變化。
這個參數主要是比較句子復雜性的變化程度,衡量它們的一致性。
這是因為,人類傾向于寫高度復雜的文本;而人工智能產出的文本則是低復雜度的;此外,由于人類的思維結構不是線性的,他們的句子結構也遵循類似的模式。
這意味著,人類使用句子結構,會在長而復雜的句子,和短而簡單的句子之間搖擺不定,有著更多的句式變化,比如復雜和簡單交替并存,一個長難句之后接著出現更簡短的句子;而機器生成的句子則傾向于更加統一,很少會有一系列長度相差很大的句子。
簡而言之,在選詞上「簡單」而「熟悉」,并使用「統一整齊」的句子,是人工智能生成作品的標志特征,而更復雜和多樣的東西,則表明是人類寫的。這也是「困惑性」和「突發性」這兩項指標可以作為衡量標準的原因。
除了EdwardTian本人對GPTZero進行測試之外,也有不少網友用它對ChatGPT、一些GPT-3衍生工具生成的內容進行了多次測試。最終結果顯示,GPTZero每次都能抓住AI生成的文本,并在十多個案例中正確識別了人類寫的文本。
GPTZero的一炮而紅,讓Tian獲得了來自a16z、MenloVentures和RedSwan等知名風投的青睞。不過,面對推特私信和電話轟炸,Tian卻顯得異常冷靜,他謙遜地表示自己不會拒接投資者打來的電話,但他不會忘記自己仍然是一位即將畢業的大四學生。
同時,他還表示自己的GPTZero尚未完成,仍需改進和進一步地開發,甚至計劃讓大家繼續免費使用他的程序,用來支持各地新晉英文老師的工作。
02
急需的「AI透明」
對于GPTZero這一甄別文字是否是AI寫作的新程序,推特上的輿論褒貶不一,以教師為代表的成年人大多喜聞樂見,而學生卻諷刺GPTZero的創造者Tian是「學術緝警察」。
的確,當GPTZero推出時,Tian收到了眾多教師對該應用程序在檢測AI寫的文章方面的積極反饋,來自世界各地的無數教師也都對Tian表達了他們的感激之情——這讓他們的教學難度大大減輕了。
當然,也不難理解,不少學生并不看好Tian這款打擊學術偷工減料、不勞而獲的軟件。
事實上,不只是Tian,就連ChatGPT的開發商OpenAI自己,也已經表明了對防止人工智能剽竊的承諾。
2022年12月,OpenAI專注于人工智能安全的研究員ScottAaronson透露,該公司正在努力開發「緩解措施」,用一種「不易察覺的秘密信號」對GPT生成的文本打上「水印」,以識別其來源,從而打擊作弊的系統。
這項技術將通過微妙地調整ChatGPT選擇的特定單詞選擇來發揮作用,讀者不會注意到這種方式,但對于任何尋找機器生成文本跡象的人來說,這在統計上都是可預測的。
公司發言人表示,「我們將ChatGPT作為新研究的預覽技術,希望能從現實世界的應用中進行學習。我們認為這是開發和部署功能強大、安全的AI系統的關鍵部分。我們會不斷吸取反饋和經驗教訓,」。
GPTZero首頁|GPTZero
此外,OpenAI還聯合哈佛等高校機構聯合打造了一款檢測器:GPT-2OutputDetector。
作者們先是發布了一個「GPT-2生成內容」和WebText數據集,幫助AI理解機器語言和人類語言之間的差異。
隨后,用這個數據集對RoBERTa模型進行微調,就得到了這個AI檢測器。其中人類語言一律被識別為True,AI生成的內容則一律被識別為Fake。
值得一提的是,RoBERTa是BERT的改進版。原始的BERT使用了13GB大小的數據集,但RoBERTa使用了包含6300萬條英文新聞的160GB數據集。
盡管如此,還是有不少人認為,「AI文本檢測器」注定是一場失敗的「軍備競賽」,其實際效果并不理想,更無法阻擋ChatGPT等AI語言模型的發展。
然而,盡管Tian建立了GPTZero,他并不反對使用ChatGPT等人工智能工具,他認為GPTZero應用程序的目的不是阻止這些新技術的使用,而是提供一種負責任地使用這些技術的方法,并提供必要的保護。
同時,相對于對抗或者禁止一項技術,也許更重要的是如何為其使用定下規范和標準。例如,在廣告、影視及娛樂等行業,對于AI生成類內容的容忍度可能適當提高一些;而在學術、教育和科研領域,非常強調準確性和原創性,毫無疑問,對于AI生成內容的容忍度就要低一些。
而如何確定AI工具使用的「透明度」,可能要比研究如何「反AI」,要更有效,也更有意義一些。
本文為極客公園原創文章,轉載請聯系極客君微信geekparkGO
中文推特:https://twitter.com/8BTC_OFFICIAL英文推特:https://twitter.com/btcinchinaDiscord社區:https://discord.gg/defidao電報頻道:https://t.me/Mute_8btc電報社區:https://t.me/news_8btc
尊敬的投資者, 假設現在是2022年1月1日。想象一下,到2023年1月17日,特斯拉將下跌63%,Meta下跌60%,亞馬遜-42%,PayPal-57%,Square-54%.
1900/1/1 0:00:00據MarsBit統計,1月28日至2月3日期間,加密市場共發生17筆投融資事件,其中基礎設施領域3筆、DeFi領域2筆、鏈游和NFT領域5筆、Web3領域5筆.
1900/1/1 0:00:00如果詢問近期有哪些最受加密社區關注的?NFT?項目,保時捷“PORSCHΞ911?”絕對是其中之一.
1900/1/1 0:00:00據MarsBit統計,1月7日至2023年1月13日期間,加密市場共發生16筆投融資事件,其中基礎設施領域1筆、DeFi領域2筆、鏈游和NFT領域3筆、Web3領域5筆.
1900/1/1 0:00:00首先不管我們要做任何一件事兒,都需要有一個北極星指標,這不僅是企業管理和運營推廣中重要的指標,運營出身的狗哥,一直堅守無論做什么事情,是我每次都要放在優先級最高的去思考清楚的東西.
1900/1/1 0:00:00這是白話區塊鏈的第1848期原創?作者|CyberPunkMetalHead編譯|火火出品|白話區塊鏈區塊鏈的可擴展性是指隨著越來越多的用戶采用該服務,它能夠自如應對不斷增長的用戶數據計算需求.
1900/1/1 0:00:00