通义千问开源320亿参数模型，已实现7款大语言模型全开源

pansz • 2024-04-08 16:30 • 科技 • 阅读 82

4月7日消息，阿里云通知千问开源320亿参数模型qwen1.5-32b，可最大限度兼顾性能、效率和内存占用的平衡，为企业和开发者提供更高性价比的模型选择。目前，通知千问共开源6款大语言模型，在海内外开源社区累计下载量突破300万。

通用问题千问此前已开发了5亿、18亿、40亿、70亿、140亿和720亿参数模型，并均已升级至1.5版本。其中，几款小尺寸模型可便捷地部署在端侧，720亿参数模型则拥有业界领先的性能，多次登上HuggingFace等模型榜单。此次开源的320亿参数模型，将在性能、效率和内存占用之间实现更理想的平衡。例如，相比于相14B模型，32B在智能体场景下能力更强；相比于72B，32B的推理成本更低。通用问题团队希望32B开源模型能为下游应用提供更优的解决方案。

基础能力方面，通过千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测试中表现优异，性能接近千问720亿参数模型，远超其300亿级参数模型。

Chat模型方面，Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分，与Qwen1.5-72B-Chat之间的差距相对较小。

有着丰富语言能力的人，在选择了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言后，可以在考试、理解、数学及翻译等多个领域做了评估。Qwen1.5-32B的多语言能力仅仅限于通用千问720亿参数模型。

以上就是通义千问开源320亿参数模型，已实现7款大语言模型全开源的详细内容，更多请关注叮当号网其它相关文章！

文章来自互联网，只做分享使用。发布者：pansz，转转请注明出处：https://www.dingdanghao.com/article/319075.html

通义千问开源320亿参数模型，已实现7款大语言模型全开源

关于作者

pansz

联系我们

通义千问开源320亿参数模型，已实现7款大语言模型全开源

关于作者

pansz

相关推荐

联系我们