工程
-
Nature子刊 | 基于内生复杂性,自动化所新类脑网络构筑人工智能与神经科科学的桥梁
aixiv专栏是本站发布学术、技术内容的栏目。过去数年,本站aixiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou
-
给RAG系统做一次全面「体检」,亚马逊开源RAGChecker诊断工具
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou
-
给视频模型安上快慢两只眼睛,苹果免训练新方法秒了一切SOTA
自从 Sora 发布以来,AI 视频生成领域变得更加「热闹」了起来。过去几个月,我们见证了即梦、Runway Gen-3、Luma AI、快手可灵轮番炸场。和以往一眼就能识破是 AI 生成的模型不太一样,这批视频大模型可能是我们所见过的「最
-
混合专家更有主见了,能感知多模态分情况行事,Meta提出模态感知型专家混合
混合专家,也得术业有专攻。
对于目前的混合模态基础模型,常用的架构设计是融合特定模态的编码器或解码器,但这种方法存在局限:无法整合不同模态的信息,也难以输出包含多种模态的内容。为了克服这一局限,Meta FAIR 的 Chameleon 团 -
入选国际数据库顶级会议ICDE,腾讯云数据库技术创新获权威认可
今日获悉,腾讯云数据库2篇论文入选国际数据库顶级会议icde。其分布式事务协议——lion和内存-磁盘跨越索引设计框架,解决了数据库领域的普遍难题,技术创新获得国际权威认可。腾讯云数据库团队在ICDE会场进行技术分享三大数据库顶级会议
IC -
首届大模型顶会COLM 高分论文:偏好搜索算法PairS,让大模型进行文本评估更高效
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou
-
投机采样会损失大语言模型的推理精度吗?
mitchell stern 等人于 2018 年提出了投机采样的原型概念。这种方法后来被各种工作进一步发展和完善,包括 lookahead decoding、rest、medusa 和 eagle,投机采样显著加快了大型语言模型 (llm
-
Llama3训练每3小时崩一次?豆包大模型、港大团队为脆皮万卡训练提效
伴随大模型迭代速度越来越快,训练集群规模越来越大,高频率的软硬件故障已经成为阻碍训练效率进一步提高的痛点,检查点(checkpoint)系统在训练过程中负责状态的存储和恢复,已经成为克服训练故障、保障训练进度和提高训练效率的关键。
近日,字 -
错误率从10%降至0.01%,领英全面分享LLM应用落地经验
随着大型语言模型(llm)技术日渐成熟,各行各业加快了 llm 应用落地的步伐。为了改进 llm 的实际应用效果,业界做出了诸多努力。近期,领英(linkedin)团队分享了他们在构建生成式 ai 产品的过程中总结的宝贵经验。领英表示基于生
-
70倍极致压缩!大模型的检查点再多也不怕
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou