理论
-
ICLR 2024 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务
在机器学习模型日益应用于开放世界场景中,如何有效识别和处理分布外(out-of-distribution,ood)数据成为一个重要研究领域。分布外数据的存在可能导致模型过度自信和错误预测,这在安全关键应用(如自动驾驶和医疗诊断)中尤为危险。
-
ICLR 2024 Spotlight | NoiseDiffusion: 矫正扩散模型噪声,提高插值图片质量
作者 | pengfei zheng
单位 | USTC, HKBU TMLR Group
近年来,生成AI的迅猛发展为文本到图像生成、视频生成等令人瞩目的领域注入了强大的动力。这些技术的核心在于扩散模型的应用。扩散模型首先通过定义一个不断 -
参数量不到10亿的OctopusV3,如何媲美GPT
多模态 AI 系统的特点在于能够处理和学习包括自然语言、视觉、音频等各种类型的数据,从而指导其行为决策。近期,将视觉数据纳入大型语言模型(如 GPT-4V)的研究取得了重要进展,但如何有效地将图像信息转化为 AI 系统的可执行操作仍面临挑战
-
科学探索的本质是什么 科学探索的最终目的是什么
导语:科学探索的本质是什么?这个问题一直困扰着人类,激发着我们对世界的好奇心,那么科学,作为人类认识世界、探索未知的重要工具,承载着人类对真理的追求和对未知的探索,下面就一起去了解了解科学探索的最终目的是什么吧! 科学探索的本质是什么 自然 作为现代社会的成员,我们常常会被告知从科学获得某些好处。但是,什么是科学探索的本质?本书一个重要的主题就是了解科学和科…
-
让大模型不再「巨无霸」,这是一份最新的大模型参数高效微调综述
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazho
-
基于Transformer的高效单阶段短时RGB
引言
如图1所示,现有的三阶段RGB-T单目标跟踪网络通常采用两个独立的特征提取分支,分别负责提取两个模态的特征。然而,相互独立的特征提取分支会导致两个模态在特征提取阶段存在缺乏有效的信息交互。因此,一旦网络完成离线训练,其只能从每个模态图 -
Transformer本可以深谋远虑,但就是不做
语言模型是否会规划未来 token?这篇论文给你答案。
「别让 Yann LeCun 看见了。」Yann LeCun 表示太迟了,他已经看到了。今天要介绍的这篇 「LeCun 非要看」的论文探讨的问题是:Transformer 是深谋远虑的 -
AI助力脑机接口研究,纽约大学突破性神经语音解码技术,登Nature子刊
作者 | 陈旭鹏
编辑 | ScienceAI由于神经系统的缺陷导致的失语会导致严重的生活障碍,它可能会限制人们的职业和社交生活。
近年来,深度学习和脑机接口(BCI)技术的飞速发展为开发能够帮助失语者沟通的神经语音假肢提供了可行性。然 -
比手动快13倍多,「机器人+AI」发现电池最佳电解质,加速材料研究
编辑 | 紫罗
传统的材料研发模式主要依赖「试错」的实验方法或偶然性的发现,其研发过程一般长达 10-20 年。
基于机器学习(ML)的数据驱动方法可以加速清洁能源技术新材料的设计。然而,由于缺乏大型高保真实验数据库,其在材料研究中的实际应 -
OPPO 即将行业首发 5.5G 技术 理论可实现 10 倍连接速率提升
3 月 28 日,oppo find 系列产品负责人周意保在微博发文,表示 oppo 已经进入了 5.5g 时代。OPPO Find X7 系列
周意保在微博上传了一张截图,图中的手机锁屏界面右上方状态栏信号一栏显示为 5GA,也就是人们更