模型
-
CVPR 2024 | 面向真实感场景生成的激光雷达扩散模型
原标题:towards realistic scene generation with lidar diffusion models
论文链接:https://hancyran.github.io/assets/paper/lidar_di -
牛津大学最新!Mickey:3D中的2D图像匹配SOTA!(CVPR\’24)
写在前面
项目链接:https://nianticlabs.github.io/mickey/
给定两张图片,可以通过建立图片之间的对应关系来估计它们之间的相机姿态。通常,这些对应关系是二维到二维的,而我们估计的姿态在尺度上是不确定的。一些 -
综述!深度模型融合(LLM/基础模型/联邦学习/微调等)
23年9月国防科大、京东和北理工的论文“deep model fusion: a survey”。
深度模型融合/合并是一种新兴技术,它将多个深度学习模型的参数或预测合并为一个模型。它结合了不同模型的能力来弥补单个模型的偏差和错误,以获得更 -
你好,电动Atlas!波士顿动力机器人复活,180度诡异动作吓坏马斯克
波士顿动力Atlas,正式进入电动机器人时代!
昨天,液压Atlas刚刚「含泪」退出历史舞台,今天波士顿动力就宣布:电动Atlas上岗。看来,在商用人形机器人领域,波士顿动力是下定决心要和特斯拉硬刚一把了。
新视频放出后,短短十几小时内,就 -
大模型下B端前端代码辅助生成的思考与实践
一、背景
重构工作中,代码规范:b端前端开发过程中开发者总会面临重复开发的痛点,很多crud页面的元素模块基本相似,但仍需手动开发,将时间花在简单的元素搭建上,降低了业务需求的开发效率,同时因为不同开发者的代码风格不一致,使得迭代时其他人上 -
用MoE横扫99个子任务!浙大等提出全新通用机器人策略GeRM
多任务机器人学习在应对多样化和复杂情景方面具有重要意义。然而,当前的方法受到性能问题和收集训练数据集的困难的限制。
这篇论文提出了GeRM(通用机器人模型),研究人员利用离线强化学习来优化数据利用策略,从演示和次优数据中学习,从而超越了人类 -
清华团队推出新平台:用去中心化AI打破算力荒
最近,一则数据点出了AI领域算力需求的惊人增长——
根据业内专家的预估,OpenAI推出的Sora在训练环节大约需要约4200-10500张NVIDIA H100上训练1个月,并且当模型生成到推理环节以后,计算成本还将迅速超过训练环节。
照 -
谷歌出手整顿大模型“健忘症”!反馈注意力机制帮你“更新”上下文,大模型无限记忆力时代将至
编辑|伊风
出品 | 51CTO技术栈(微信号:blog51cto)
谷歌终于出手了!我们将不再忍受大模型的“健忘症”。
TransformerFAM横空出世,放话要让大模型拥有无限记忆力!
话不多说, -
清华最新!RoadBEV:BEV下的道路表面重建如何实现?
原标题:roadbev: road surface reconstruction in bird’s eye view
论文链接:https://arxiv.org/pdf/2404.06605.pdf
代码链接:https://githu -
一阶优化算法启发,北大林宙辰团队提出具有万有逼近性质的神经网络架构的设计方法
神经网络作为深度学习技术的基础已经在诸多应用领域取得了有效成果。在实践中,网络架构可以显著影响学习效率,一个好的神经网络架构能够融入问题的先验知识,确立网络训练,提高计算效率。目前,经典的网络架构设计方法包括人工设计、神经网络架构搜索(NA