模型
-
爆火后反转?「一夜干掉MLP」的KAN:其实我也是MLP
多层感知器(MLP),也被称为全连接前馈神经网络,是如今深度学习模型的基础构建块。MLP 的重要性无论如何强调都不为过,因为它们是机器学习中用于逼近非线性函数的默认方法。
但是最近,来自 MIT 等机构的研究者提出了一种非常有潜力的替代方法 -
看透物体的3D表示和生成模型:NUS团队提出X
项目主页:https://tau-yihouxiang.github.io/projects/X-Ray/X-Ray.html
论文地址:https://arxiv.org/abs/2404.14329
代码地址:https://githu -
58行代码把Llama 3扩展到100万上下文,任何微调版都适用
堂堂开源之王llama 3,原版上下文窗口居然只有……8k,让到嘴边的一句“真香”又咽回去了。
在32k起步,100k寻常的今天,这是故意要给开源社区留做贡献的空间吗?
开源社区当然不会放过这个机会:
现在只需58行代码,任何Llama 3 -
LeCun上月球?南开、字节开源StoryDiffusion让多图漫画和长视频更连贯
两天前,图灵奖得主 Yann LeCun 转载了「自己登上月球去探索」的长篇漫画,引起了网友的热议。在《Story Diffusion:Consistent Self-Attention for long-range image and v
-
特斯拉机器人进厂打工,马斯克:手的自由度今年将达到22个!
特斯拉机器人Optimus最新视频出炉,已经可以在厂子里打工了。
正常速度下,它分拣电池(特斯拉的4680电池)是这样的:官方还放出了20倍速下的样子——在小小的“工位”上,拣啊拣啊拣:这次放出的视频亮点之一在于Optimus在厂子里完成这 -
AI学会隐藏思维暗中推理!不依赖人类经验解决复杂任务,更黑箱了
ai做数学题,真正的思考居然是暗中“心算”的?
纽约大学团队新研究发现,即使不让AI写步骤,全用无意义的“……”代替,在一些复杂任务上的表现也能大幅提升!
一作Jacab Pfau表示:只要花费算力生成额外token就能带来优势,具体选择了 -
小红书让智能体们吵起来了!联合复旦推出大模型专属群聊工具
语言,不仅仅是文字的堆砌,更是表情包的狂欢,是梗的海洋,是键盘侠的战场(嗯?哪里不对)。语言如何塑造我们的社会行为?
我们的社会结构又是如何在不断的言语交流中演变的?
近期,来自复旦大学和小红书的研究者们通过引入一种名为AgentGroup -
史上最大重建25km²!NeRF
原标题:nerf-xl: scaling nerfs with multiple gpus
论文链接:https://research.nvidia.com/labs/toronto-ai/nerfxl/assets/nerfxl.pdf -
GitHub版Devin上线,会打字就能开发应用,微软CEO:重新定义IDE
微软的“github版devin”——copilot workspace,终于上线了!
WorkSpace是一种“Copilot原生”的全新开发环境,目的是让所有开发者都可以用自然语言,把脑海里的创意转化成应用。
也就是说,只要有想法,而且 -
Python团队还没解散完,谷歌又对Flutter、Dart动手了
上周,「谷歌解雇 Python 基础团队」的消息引发热议。
“谷歌 Python 指导委员会成员 Thomas Wouters 的一条动态让所有人感到惊讶:「当与你直接共事的每个人,包括你的主管,都被裁员——哦,是职位被削减,而你被要求安排