flag-dit
-
DiT架构大一统:一个框架集成图像、视频、音频和3D生成,可编辑、能试玩
基于 diffusion transformer(dit)又迎来一大力作「flag-dit」,这次要将图像、视频、音频和 3d「一网打尽」。
今年 2 月初,Sora 的发布让 AI 社区更加看到了基础扩散模型的潜力。连同以往出现的 Sta
基于 diffusion transformer(dit)又迎来一大力作「flag-dit」,这次要将图像、视频、音频和 3d「一网打尽」。
今年 2 月初,Sora 的发布让 AI 社区更加看到了基础扩散模型的潜力。连同以往出现的 Sta