训练相关文章列表 - 叮当号

开源！超越ZoeDepth！ DepthFM：快速且精确的单目深度估计！

0. 这篇文章干了啥？
提出了DepthFM：一个多功能且快速的最先进的生成式单目深度估计模型。除了传统的深度估计任务外，DepthFM还展示了在深度修复等下游任务中的最先进能力。DepthFM效率高，可以在少数推理步骤内合成深度图。
下面

pansz

2024-04-03

119000

科技

0门槛免费商用！孟子3

澜舟科技官宣：孟子3-13b大模型正式开源！
这一主打高性价比的轻量化大模型，面向学术研究完全开放，并支持免费商用。
在MMLU、GSM8K、HUMAN-EVAL等各项基准测评估中，孟子3-13B都表现出了不错的性能。
尤其在参量20B以内

老板不要肥肉

2024-04-01

90000

科技

开源11天，马斯克再发Grok

Grok-1官宣开源不过半月，新升级的Grok-1.5出炉了。
刚刚，马斯克xAI官宣，128K上下文Grok-1.5，推理能力大幅提升。
并且，很快就会上线。11天前，Grok-1模型的权重和架构开源，展示了Xai在去年11月之前取得的进

城南北边

2024-03-30

99000

科技

马斯克大模型Grok1.5来了：推理能力大升级，支持128k上下文

以上就是马斯克大模型Grok1.5来了：推理能力大升级，支持128k上下文的详细内容，更多请关注叮当号网其它相关文章！

叮当号

2024-03-29

122000

科技

Mamba超强进化体一举颠覆Transformer！单张A100跑140K上下文

之前引爆了AI圈的Mamba架构，今天又推出了一版超强变体！
人工智能独角兽AI21 Labs刚刚开源了Jamba，世界上第一个生产级的Mamba大模型！Jamba在多项基准测试中表现亮眼，与目前最强的几个开源Transformer平起平坐

走不完的路

2024-03-29

66000

科技

一张图即出AI视频！谷歌全新扩散模型，让人物动起来

只需一张照片，和一段音频，就能直接生成人物说话的视频！
近日，来自谷歌的研究人员发布了多模态扩散模型VLOGGER，让我们朝着虚拟数字人又迈进了一步。论文地址：https://enriccorona.github.io/vlogger/pa

走不完的路

2024-03-28

121000

科技

微软“去OpenAI化”引发高层洗牌：必应CEO被DeepMind联创挤跑！纳德拉会见Stable Diffusion老板

微软高层大变动。
一切都由纳德拉任命新AI主管引发。
这不，上周DeepMind联创苏莱曼刚成为微软全新AI部门CEO——
这周，必应负责人就突然被宣布：卸任了。这位高管在微软累积工作11年有余。
如今去向不明，是完全离开老东家还是内部转岗

代号邱小姐

2024-03-28

96000

科技

LLM性能最高60%提升！谷歌ICLR 2024力作：让大语言模型学会「图的语言」

在计算机科学领域，图形结构由节点（代表实体）和边（表示实体之间的关系）构成。
图无处不在。
互联网可以被视为一个庞大的网络，搜索引擎利用图形化的方式来组织和展示信息。
LLMs主要在常规文本上训练，因此将图转化为LLMs可理解的文本是一项具

张大嘴

2024-03-27

66000

科技

两分钟1200帧的长视频生成器StreamingT2V来了，代码将开源

广阔的战场，风暴兵在奔跑……prompt：Wide shot of battlefield, stormtroopers running…
这段时长达1200帧的2分钟视频是由文本生成视频（text-to-video）模型生成的。尽管A

叮当

2024-03-27

79000

科技

详解Latte：去年底上线的全球首个开源文生视频DiT

随着 Sora 发布成功，视频 DiT 模型引起了广泛关注和讨论。设计稳定的超大规模神经网络一直是视觉生成领域研究的重点。DiT 模型的成功为图像生成的规模化带来了新的可能性。
然而，由于视频数据的高度结构化和复杂性，将 DiT 扩展到视频

张大嘴

2024-03-27

92000

训练

联系我们