文本大模型卷出新高度,claude 3 在数学、编程、多语言理解、视觉等多个维度超越 gpt-4 和上线不足一个月的 gemini 1.0 ultra。「日新月异」已经不足以形容当下大模型技术发展之势。为了更好地分享大模型技术最新进展,2024 年,本站、张江科投、张江孵化器、waic circle 联合发起举办「大模型技术 workshop」系列活动,邀请产学研一线大咖带来前沿观察与洞见。3 月 22 日下午,上海张江纳贤路 800 号科海大楼 a 座 3 层 ,以「claude 3 热浪来袭,一起聊聊文本大模型的重点技术路径」为主题,来自复旦大学、波形智能、亚马逊云科技的学者和技术专家们将进行深入分享与交流。欢迎关注大模型进展的专业观众加入活动,一起交流探讨。
嘉宾介绍
演讲题目:大模型能力对齐
演讲嘉宾:
- 桂韬
复旦大学自然语言处理实验室副研究员
研究领域:
- 预训练模型
- 类人对齐
- 智能体交互
学术成就:
- 发表 50 余篇论文于高水平国际学术期刊和会议
- 主持多个人才项目(国家自然科学基金、计算机学会、人工智能学会)
-
获得奖项:
- 钱伟长中文信息处理科学技术奖一等奖
- NeurIPS2023 大模型对齐 Track 最佳论文奖
- COLING2018 最佳论文提名奖
- NLPCC2019 杰出论文奖
- CIPS 优博奖
- ACM 优博奖
-
入选:
- 中国科协青年人才托举工程
- 上海市启明星计划
- 世界人工智能大会云帆奖“璀璨明星”
演讲题目: 超长文本创意写作大模型的训练和推理方案
演讲嘉宾:
周王春澍,波形智能 CTO。
- 本科和硕士毕业于北航中法工程师学院
- 博士曾就读于 ETH Zurich,师从 Ryan Cotterell & Mrinmaya Sachan
- 2023 年 4 月辍学并创立了波形智能(AIWaves),担任公司的 Cofounder & CTO
-
研究方向主要包括:
- LLM training & prompting
- language agents
- long/creative text generation
- efficient methods for NLP
- multi-modal LLMs
- commonsense reasoning 等
- 曾于 2022 获得百度奖学金
- 曾于 MSRA/字节AI Lab/AI2 等机构实习,并在字节跳动 AI Lab 担任 research scientist
- 周王春澍在 NeurIPS/ICML/ICLR/ACL/EMNLP/NAACL 等机器学习和自然语言处理会议中发表文章 30 余篇,同时担任这些会议的审稿人,以及 ARR/*ACL 的领域主席(Action Editor / Area Chair)。
演讲题目:Claude 3 技术解析与场景演示
演讲嘉宾:
林业,亚马逊云科技资深解决方案架构师。擅长 C++/C#/Java/PHP/Python/JS 等多种开发语言,持续开发过一个 Github repo 从个位数?增加到 3000?。曾构建过支持 1000 万用户的共享单车 APP,参与开发多款知名车企 APP,并获得 2005 年浙江省 ACM 奖项,现专注于企业云原生架构与 GenAI 发展,并致力于将其能力应用于企业业务场景。
活动报名
此次「大模型技术 Workshop 第一期」报名已开启,扫描下图二维码或点击底部「阅读原文」可直达活动报名页。
关于本次活动的相关问题,欢迎添加本站小助手(ID:13661489516)或通过邮件(chenyinyi@jiqizhixin.com)进行咨询。
以上就是能力对齐、长文本、Claude 3,这次聊聊大模型重点技术路径的详细内容,更多请关注叮当号网其它相关文章!
文章来自互联网,只做分享使用。发布者:weapp,转转请注明出处:https://www.dingdanghao.com/article/685122.html