來源:量子位
隨便一張照片,就可生成3D頭像。而且光線真實,任意角度可調。
這是蘋果的最新黑科技生成框架FaceLit。
正如其名,FaceLit的特色就是可以將人臉“點亮”。
“自帶光環”的FaceLit在易用性上也不輸同類,甚至更勝一籌——
進行3D建模時,需要的照片素材無需專門選擇角度,數量上也只需一張。
甚至對表情、發型、眼鏡等元素進行調節時,也不需要額外素材。
而傳統的頭像合成工具或者需要多張圖片才能工作,或者對照片角度有刁鉆的要求。
正是憑借這一創新,FaceLit獲得了3.5的FID評分,較同類產品直接高出了25%。
深圳開出第一張區塊鏈代理出口貨物證明:7月26日消息,24日深圳地區開出了全國第一張基于區塊鏈技術的“代理出口貨物證明”,這是區塊鏈技術在出口退稅領域的首次應用,標志著深圳市稅務局圓滿完成了稅務總局證明類業務區塊鏈上鏈的試點任務。(鳳凰網)[2021/7/26 1:16:00]
改進式EG3D合成人像,光線信息單獨處理
下面就來看一下FaceLit具體是如何實現頭像合成的。
總的來說,蘋果采用了將人物本體與光線分別處理再進行疊加的策略。
早期的三維人像合成工具在轉換過程中可能產生形變。
而爆火的NeRF通過將場景拆分成具體因素,提高了3D圖像合成效果,改善了這一問題。
但蘋果團隊認為,在可控性方面,NeRF仍存有不足之處。
于是,在EG3D框架的基礎上,蘋果創造了FaceLit的合成模型。
EG3D通過三平面解碼器,賦予了二維卷積神經網絡生成渲染3D模型所需深度參數的能力。
Visa批準第一張用于消費比特幣的實體借記卡:7月14日消息,悉尼科技大學的兩位伙伴創建的一家初創公司已說服全球信用卡巨頭Visa批準發行實體借記卡,該借記卡將允許CryptoSpend應用程序的用戶通過在商店和酒吧中花費他們的比特幣交易利潤在現有的支付終端上。這是第一次可以使用在澳大利亞發行的借記卡支付加密貨幣,該借記卡運行在其中一個國際卡計劃的網絡上,并突出了Visa和萬事達卡的全球舉措,使比特幣及其他數字貨幣更容易用來支付日常用品。(Financial Review)[2021/7/14 0:50:19]
蘋果團隊對標準的EG3D訓練方式進行了擴展,并將之轉化成了FaceLit框架。
△FaceLit與傳統EG3D渲染流程對比圖
標準的ED3G使用相機位置p參數作為基本輸入參數。
法官阻止銷售Jay-Z的第一張專輯及其作為NFT的版權:一名紐約法官發布了一項臨時限制令,以阻止 Roc-A-Fella Records Inc (RAF) 聯合創始人 Damon Dash 涉嫌出售 Ja??y-Z 首張專輯“合理懷疑”的代幣化版本及其版權。(cointelegraph)[2021/6/23 23:59:56]
在建立GAN2操作時,蘋果在EG3D的基礎上加入了光照參數l。
不同p(左→右)與l(上→下)值下的初始圖像
蘋果選擇了經過球形諧波方式簡化后的Phong反射模型作為處理光源的物理基礎。
光照參數l就是在這一基礎之上獨立處理得到的。
在自然界中,反射包括鏡面反射和漫反射兩種形式。
動態 | 第一張基于區塊鏈的數字營業執照、第一張醫保電子憑證在濟南誕生:當前,濟南不斷推進“一次辦成”改革提質增效,打造“在泉城 全辦成”品牌,為人民群眾帶來更好的政務服務體驗。濟南高新區把區塊鏈作為核心技術自主創新重要突破口,構建整體性數字政府,持續推進流程再造,在全國首創“政務服務智能自動化流水線”模式,創新打造“區塊鏈+政務”服務系統,創造了“企業開辦”僅需47分鐘的全國最快速度,比承諾時限壓縮75%,中國第一張基于區塊鏈的數字營業執照、第一張醫保電子憑證在濟南誕生。高新區管委會辦公室陳波介紹,“區塊鏈用共識機制,密鑰算法等,保證上鏈數據傳輸、傳遞、使用的安全和可信,上鏈數據使用,必須由數據所有者授權,真正實現了“我的資產我做主”。高新區“區塊鏈+”智能政務服務模式,開啟了全省乃至全國在政務服務領域應用區塊鏈技術的先河,達到了國內領先水平。(舜網)[2019/12/24]
動態 | 全國港口第一張區塊鏈電子發票在招商港口蛇口集裝箱碼頭(SCT)上線:據航運交易公布微博, 4月26日上午,招商港口在蛇口集裝箱碼頭(SCT)舉行全國港口第一張區塊鏈電子發票上線儀式。10點50分,SCT副總經理姚勝蘭宣布儀式啟動。10點58分,貨主代表劦福公司總經理曾杰辦理提貨辦單手續并完成微信支付后,全國港口第一張區塊鏈電子發票順利生成。[2019/4/28]
△不同鏡面反射率條件下的效果對比
因此,蘋果在ED3G模型中加入了鏡面反射解碼器和漫反射解碼器。
它們替代了可以直接得到顏色c、密度σ數據的三平面解碼器。
△反射解碼器流程示意圖
通過對GAN2產生的數據進行再次解碼,可以得到鏡面反射率ks和漫反射率kd。
然后再通過兩種反射著色器得到顏色c,密度σ則由漫反射解碼器計算得出。
最終,FaceLit以與三平面解碼器相同的參數渲染圖像,并進行分辨率優化。
有的放矢設計訓練策略,數據無需人工標注
生成框架已有,那就來到訓練階段,其特點在于訓練過程中無需人工標注。
方法論層面,在訓練時,團隊使用了FFHQ、MetFaces和CelebA-HQ數據集。
對于不同的數據集,蘋果使用了不同的訓練方式。
FFHQ包含了7萬余條人臉數據,其訓練分為兩個階段:先在較低的分辨率下訓練,再提高分辨率再次進行。
對于包含2萬數據量的CelebA-HQ,訓練不需要分階段進行。
而對于更小的MetFAces,則只需要通過ADA擴容的方式,使用預訓練的FFHQ進行優化調整即可。
定性地看,訓練結果在機位、光源和反射高光等方面都有出色的表現,圖中的細節也有所增強。
△FaceLit生成的頭像唇齒部位的細節進行了明顯重構
定量結果同樣表明,FaceLit在FID、KID等指標上均優于包括標準EG3D在內的傳統生成方式。
在使用FFHQ作為訓練集的條件下,各生成方式的表現如下表,不難看出FaceLit擁有最低的FID和KID值。
而相比于英偉達的StyleGAN2,FaceLit的表現依舊出色:
光線準確度方面,FaceLit在使用三種不同訓練數據集的情況下,與人工設定的標準值平均均方誤差均低于0.01。
網友:人們低估了蘋果AI
消息發出后,便有網友認為“這是對更重磅產品的預熱”。
更有網友直接推測,FaceLit的出現標示著人工智能將進軍AR和VR領域,蘋果的混合現實將最終實現商用……
也有網友認為,FaceLit不會商用,否則蘋果才不會以論文的形式發表。
針對FaceLit本身,也有網友表示,除了LLM,其他都是浮云,他們如果不開發LLM,就沒有未來。
但這位網友同時也說,蘋果可能已經在做了。
相應的,也有網友稱人們“低估了蘋果在AI領域的深度”。
所以各位網友對蘋果在AI領域還有什么樣的期待呢?
論文地址:https://arxiv.org/abs/2303.15437
GitHub地址:https://github.com/apple/ml-facelit
參考鏈接:https://twitter.com/AlphaSignalAI/status/1648361623004774400
明牌與暗牌 今天任何能輕易想到的idea,都是明牌,上來就攤牌比經驗值,武力值,和血條了,比如大家討論最多的AI助手,虛擬老師,AI客服,文案生成等等.
1900/1/1 0:00:00來源:深響,作者:祖楊 圖片來源:由無界AI工具生成你能想象嗎?上百平米的直播基地里,工位上空無一人,桌面上數十臺電腦屏幕里的AI主播正不知疲倦、神采奕奕地直播著,他們的神態與真人無異.
1900/1/1 0:00:00原文作者:MUSTAFA、CARL原文編譯:深潮TechFlow與其他任何投資一樣,加密貨幣也有其獨特的風險和挑戰,其中之一是了解代幣的解鎖計劃如何影響價格波動和整體表現.
1900/1/1 0:00:00原文作者:JamesPrestwich原文編譯:0x11?,ForesightNews共享排序器正在飛速發展,是時候對它是什么及其存在的原因進行深入分析了.
1900/1/1 0:00:00原文作者:Kylo,ForesightVentures Tips: AMM與RFQ實際代表著DeFi和TradFi思維模式的差別AMM提高資金利用效率的方式是通過LP杠桿化實現的RFQ模式對于跨.
1900/1/1 0:00:00作者:Will阿望 來源:Web3小律 花旗的這份162頁研報全面闡述了區塊鏈及Web3行業實現十億用戶和數十萬億美元市場規模的具體路徑.
1900/1/1 0:00:00