工程
-
极长序列、极快速度:面向新一代高效大语言模型的LASP序列并行
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazho
-
谁说大象不能起舞! 重编程大语言模型实现跨模态交互的时序预测 | ICLR 2024
近期,来自澳大利亚蒙纳士大学、蚂蚁集团、ibm研究院等机构的研究人员探索了模型重编程(model reprogramming)在大语言模型(llms)上应用,并提出了一个全新的视角:高效重编程大语言模型进行通用时间序列预测系统,即time-
-
曾爆火的 InstantID又有了新玩法:风格化图像生成,已开源
InstantID 原班团队推出了风格迁移的新方法 InstantStyle。
风格化图像生成通常被称为风格迁移,其目标是生成与参考图像风格一致且与原始图像内容一致的图像。这种技术基于diffusion的方法(比如lora)进行批量的同风格 -
CVPR 2024 | 仅需文本或图像提示,新框架CustomNeRF精准编辑3D场景
美图影像研究院(mt lab)与中国科学院信息工程研究所、北京航空航天大学、中山大学共同提出了3d场景编辑方法——customnerf。该研究成果已被cvpr 2024接收。customnerf不仅支持文本描述和参考图片作为3d场景的编辑提
-
改变LoRA的初始化方式,北大新方法PiSSA显著提升微调效果
随着大模型的参数量日益增长,微调整个模型的开销逐渐变得难以接受。
因此,北京大学的研究团队提出了一种名为 PiSSA 的参數高效微调方法,在主流数据集上都超过了目前广泛使用的 LoRA 的微调效果。论文: PiSSA: Principal -
蚂蚁集团CodeFuse 发布“图生代码”功能,超五成程序员用AI写代码
4月11日,蚂蚁集团自研的智能研发平台codefuse推出了”图生代码”新功能,支持开发人员用产品设计图一键生成代码,大幅提升前端页面的开发效率。目前相关功能正处于内测中。
与许多互联网公司一样,蚂蚁集团正全面推行AI编程,使用CodeFu -
CVPR 2024 | 分割一切模型SAM泛化能力差?域适应策略给解决了
第一个针对「Segment Anything」大模型的域适应策略来了!相关论文已被CVPR 2024 接收。
引言大语言模型(LLMs)的成功激发了计算机视觉领域探索分割基础模型的兴趣。这些基础分割模型通常通过 Prompt Enginee -
N
这是数学中最著名的未解问题之一。新的工作已通过同行评审,全文可看。
起猛了,流体力学迎来自己的超导时刻了?最近几天,数学圈内人们正在热烈讨论纳维 – 斯托克斯问题的正则哈密顿公式终于出现了 —— 这个数学史上悬而未决的问题可能有了解答。而在 -
二次元专用超分AI模型APISR:在线可用,入选CVPR
动漫作品如《龙珠》、《神奇宝贝》、《新世纪福音战士》等上个世纪开播的动漫是许多人童年回忆的一部分,它们曾给我们带来了充满了热血、友情与梦想的视觉之旅。某些时候,我们会突然有重温这些童年回忆的冲动,但我们却可能会遗憾地发现这些童年回忆的辨识率
-
ICLR 2024 | 联邦学习后门攻击的模型关键层
联邦学习使用多个参与方可以在数据隐私得到保护的情况下训练模型。但是由于服务器无法监控参与者在本地进行的训练过程,参与者可以篡改本地训练模型,从而对联邦学习的整体模型构成安全隐患,如后门攻击。
本文重点关注如何在有防御保护的训练框架下,对联邦