午夜性色福利在线视频福利|欧美v日韩v亚洲v最新在线|日韩女同在线二区三区|在线免费看片a欧美

      <td id="ivdo3"><tr id="ivdo3"></tr></td>
      <track id="ivdo3"><tbody id="ivdo3"><noframes id="ivdo3"></noframes></tbody></track>

    • 
      
      <center id="ivdo3"></center>

      當(dāng)前位置:區(qū)塊鏈 >區(qū)塊鏈 > 效果超越Gen-2!字節(jié)最新視頻生成模型,一句話讓綠巨人戴上VR眼鏡

      效果超越Gen-2!字節(jié)最新視頻生成模型,一句話讓綠巨人戴上VR眼鏡

      更新時(shí)間:2024-01-11 13:27:11 | 作者:佚名
      原文來源:量子位 圖片來源:由無界AI生成 一句話,就讓綠巨人戴上VR眼鏡。 4K畫質(zhì)那種。 熊貓的奇幻漂流~ 這是字節(jié)最新的AI視頻生成模型MagicVideo-V2,各種奇思妙想的想法都能實(shí)現(xiàn)。它不僅支持4K、8K超高分辨率,輕松hold各種繪圖風(fēng)格。 △從左往右:油畫風(fēng)、賽博風(fēng)、設(shè)計(jì)風(fēng) 測(cè)評(píng)效果超過Gen-2、Pika以及現(xiàn)有AI視頻生成工...

      原文來源:量子位

      圖片來源:由無界 AI生成

      一句話,就讓綠巨人戴上VR眼鏡。

      4K畫質(zhì)那種。

      熊貓的奇幻漂流~

      這是字節(jié)最新的AI視頻生成模型MagicVideo-V2,各種奇思妙想的想法都能實(shí)現(xiàn)。它不僅支持4K、8K超高分辨率,輕松hold各種繪圖風(fēng)格。

      從左往右:油畫風(fēng)、賽博風(fēng)、設(shè)計(jì)風(fēng)

      測(cè)評(píng)效果超過Gen-2、Pika以及現(xiàn)有AI視頻生成工具。

      結(jié)果上線不到24小時(shí)就引發(fā)眾人圍觀,比如一條推文就有近20萬瀏覽量。

      不少網(wǎng)友驚訝其效果,甚至直言:比runway和pika還要好。


      “比runway和pika還要好”


      研究人員也的確進(jìn)行了實(shí)際的效果比較。選手分別為:MagicVideo-V2、StabilityAI的SVD-XT,新潛力玩家Pika1.0,以及Runway的Gen-2

      第一輪:光影效果。

      夕陽西下,旅行者獨(dú)自行走在迷霧森林中。

      (從左到右依次是:MagicVideo-V2、SVD-XT,右上Pika,右下Gen-2,下同)

      可以看到,MagicVideo-V2、Gen-2和Pika都有明顯的光影。不過Pika看不出是為旅行者,MagicVideo-V2的色調(diào)更為豐富。

      第二輪:情境劇情的表達(dá)。

      1910 年代的情景喜劇,講述社會(huì)中的日常生活和瑣事

      這一輪明顯也是MagicVideo-V2、Gen-2更勝一籌。SVD-XT呈現(xiàn)的中景構(gòu)圖,雖然年代體現(xiàn)出來了,但表達(dá)不夠。

      第三輪:寫實(shí)。

      小男孩在公園的小路上騎著自行車,車輪踩在碎石上發(fā)出嘎吱嘎吱的聲音.

      這次對(duì)比就更為明顯了。MagicVideo-V2和SVD-XT是完整體現(xiàn)出句子意思的,不過MagicVideo-V2可以看到小孩明顯腳在動(dòng)的細(xì)節(jié)。

      除此之外,研究人員還將MagicVideo-V2與當(dāng)下最先方法進(jìn)行一對(duì)一的人類評(píng)估。

      結(jié)果顯示,相較于其他方法,人們認(rèn)為MagicVideo-V2的效果更好。


      (綠色、灰色和粉色條分別代表 MagicVideo-V2 被評(píng)價(jià)為更好、相當(dāng)或較差的試驗(yàn)效果。)


      如何實(shí)現(xiàn)?


      簡(jiǎn)單來說,MagicVideo-V2是一條視頻生成流水線,集成了文本到圖像模型、視頻運(yùn)動(dòng)生成器、參考圖像嵌入模塊、插值模塊。

      首先是有T2I模塊首先根據(jù)文字生成1024×1024圖像,隨后I2V模塊對(duì)該靜態(tài)圖像進(jìn)行動(dòng)畫處理,生成600×600×32的幀序列,然后再用V2V模塊增強(qiáng),并完善視頻內(nèi)容,最后再用插值模塊將序列擴(kuò)展到94個(gè)幀。

      這樣一來,既保證了高保真,時(shí)間上也有連續(xù)性。

      不過早在2022年11月字節(jié)曾推出了MagicVideo V1版。

      不過,當(dāng)時(shí)更強(qiáng)調(diào)的是高效性,它能在單個(gè)GPU卡上生成256x256分辨率的視頻。

      參考鏈接:
      https://twitter.com/arankomatsuzaki/status/1744918551415443768?s=20
      項(xiàng)目鏈接:
      https://magicvideov2.github.io/
      論文鏈接:
      https://arxiv.org/abs/2401.04468
      https://arxiv.org/abs/2211.11018

      本站提醒:投資有風(fēng)險(xiǎn),入市須謹(jǐn)慎,本內(nèi)容不作為投資理財(cái)建議。