训练
-
开源!超越ZoeDepth! DepthFM:快速且精确的单目深度估计!
0. 这篇文章干了啥?
提出了DepthFM:一个多功能且快速的最先进的生成式单目深度估计模型。除了传统的深度估计任务外,DepthFM还展示了在深度修复等下游任务中的最先进能力。DepthFM效率高,可以在少数推理步骤内合成深度图。
下面 -
0门槛免费商用!孟子3
澜舟科技官宣:孟子3-13b大模型正式开源!
这一主打高性价比的轻量化大模型,面向学术研究完全开放,并支持免费商用。
在MMLU、GSM8K、HUMAN-EVAL等各项基准测评估中,孟子3-13B都表现出了不错的性能。
尤其在参量20B以内 -
开源11天,马斯克再发Grok
Grok-1官宣开源不过半月,新升级的Grok-1.5出炉了。
刚刚,马斯克xAI官宣,128K上下文Grok-1.5,推理能力大幅提升。
并且,很快就会上线。11天前,Grok-1模型的权重和架构开源,展示了Xai在去年11月之前取得的进 -
马斯克大模型Grok1.5来了:推理能力大升级,支持128k上下文
以上就是马斯克大模型Grok1.5来了:推理能力大升级,支持128k上下文的详细内容,更多请关注叮当号网其它相关文章!
-
Mamba超强进化体一举颠覆Transformer!单张A100跑140K上下文
之前引爆了AI圈的Mamba架构,今天又推出了一版超强变体!
人工智能独角兽AI21 Labs刚刚开源了Jamba,世界上第一个生产级的Mamba大模型!Jamba在多项基准测试中表现亮眼,与目前最强的几个开源Transformer平起平坐 -
一张图即出AI视频!谷歌全新扩散模型,让人物动起来
只需一张照片,和一段音频,就能直接生成人物说话的视频!
近日,来自谷歌的研究人员发布了多模态扩散模型VLOGGER,让我们朝着虚拟数字人又迈进了一步。论文地址:https://enriccorona.github.io/vlogger/pa -
微软“去OpenAI化”引发高层洗牌:必应CEO被DeepMind联创挤跑!纳德拉会见Stable Diffusion老板
微软高层大变动。
一切都由纳德拉任命新AI主管引发。
这不,上周DeepMind联创苏莱曼刚成为微软全新AI部门CEO——
这周,必应负责人就突然被宣布:卸任了。这位高管在微软累积工作11年有余。
如今去向不明,是完全离开老东家还是内部转岗 -
LLM性能最高60%提升!谷歌ICLR 2024力作:让大语言模型学会「图的语言」
在计算机科学领域,图形结构由节点(代表实体)和边(表示实体之间的关系)构成。
图无处不在。
互联网可以被视为一个庞大的网络,搜索引擎利用图形化的方式来组织和展示信息。
LLMs主要在常规文本上训练,因此将图转化为LLMs可理解的文本是一项具 -
两分钟1200帧的长视频生成器StreamingT2V来了,代码将开源
广阔的战场,风暴兵在奔跑……prompt:Wide shot of battlefield, stormtroopers running…
这段时长达1200帧的2分钟视频是由文本生成视频(text-to-video)模型生成的。尽管A -
详解Latte:去年底上线的全球首个开源文生视频DiT
随着 Sora 发布成功,视频 DiT 模型引起了广泛关注和讨论。设计稳定的超大规模神经网络一直是视觉生成领域研究的重点。DiT 模型的成功为图像生成的规模化带来了新的可能性。
然而,由于视频数据的高度结构化和复杂性,将 DiT 扩展到视频