国际顶尖水平！首个Sora级国产自研视频大模型Vidu发布

叮当号4月28日消息，在2024中关村论坛年会未来人工智能先锋论坛上，生数科技联合清华大学发布中国首个长时长、高一致性、高动态性视频大模型Vidu。

这也是自Sora发布之后全球率先取得重大突破的视频大模型，性能全面对标国际顶尖水平，还在加速迭代提升中。

据了解，该模型采用团队原创的Diffusion与Transformer融合的架构U-ViT，支持一键生成长达16秒、分辨率高达1080P的高清视频内容。

除了在时长方面突破，Vidu在视频效果方面也实现了显著提升，主要包括：

能够生成细节复杂的场景，且符合真实的物理规律；

能够生成真实世界不存在的虚构画面，创造出具有深度和复杂性的超现实主义内容；

能够生成复杂的动态镜头，不再局限于简单的推、拉、移等固定镜头，而是能够围绕统一主体在一段画面里就实现远景、近景、中景、特写等不同镜头的切换；

在16秒的时长上保持连贯流畅，随着镜头的移动，人物和场景在时间、空间中能够保持一致；

能够生成特有的中国元素，例如熊猫、龙等。

文章来自互联网，只做分享使用。发布者：叮当号，转转请注明出处：https://www.dingdanghao.com/article/416319.html