字節(jié)跳動AI系統(tǒng)“X-Portrait 2”能讓照片演繹出電影場景

?? 由 文心大模型 生成的文章摘要

字節(jié)跳動推出了一款人工智能系統(tǒng)“X-Portrait 2”,可以將任何照片轉換成令人信服的視頻表演,其微妙的表情和情感深度堪比真實鏡頭。這使得靜態(tài)圖像成為著名電影場景的鏡像——其效果非常逼真,模糊了真實內容和人造內容之間的界限。

該系統(tǒng)的演示展示了《閃靈》、《變臉》和《藩籬》等電影中經典場景的靜態(tài)照片,捕捉了原版表演中每一個細微的表情?,F在,一張照片就可以像訓練有素的演員一樣,以同樣令人信服的細節(jié)展示恐懼、憤怒或喜悅,同時保留原人物的身份和特征。

X-Portrait 2能夠根據任何照片制作出與現實難以區(qū)分的視頻,而以往的AI動畫工具通過機械動作產生了明顯的人工效果。但X-Portrait 2可以捕捉面部肌肉的自然流動、細微的眼部運動和復雜的表情,這些都使人類的面部具有獨特的表現力。

X-Portrait 2通過創(chuàng)新方法實現了這種逼真度,系統(tǒng)不是追蹤面部上的特定點(這是大多數動畫軟件使用的標準方法),而是觀察和學習完整的面部動作。舊系統(tǒng)通過連接點來創(chuàng)建表情,而X-Portrait 2可以捕獲整個面部的流暢動作,即使在快速講話或從不同角度觀看時也是如此。

字節(jié)跳動的優(yōu)勢源于其作為TikTok所有者的獨特地位,TikTok每天處理超過10億個用戶生成的視頻。這一龐大的面部表情、動作和情緒集合提供了大多數AI公司無法獲得的大規(guī)模訓練數據。雖然競爭對手依賴有限的數據集或合成數據,但字節(jié)跳動可以使用從不同面部、光照條件和攝像機角度捕捉到的真實表情來微調其AI模型。

「93913原創(chuàng)內容,轉載請注明出處」