通义千问开源320亿参数模型，已实现7款大语言模型全开源

访客2年前 (2024-04-18)AI生活146

4月7日消息，阿里云通义千问开源320亿参数模型Qwen1.5-32B，可最大限度兼顾性能、效率和内存占用的平衡，为企业和开发者提供更高性价比的模型选择。目前，通义千问共开源了7款大语言模型，在海内外开源社区累计下载量突破300万。

通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本，其中，几款小尺寸模型可便捷地在端侧部署，720亿参数模型则拥有业界领先的性能，多次登上HuggingFace等模型榜单。此次开源的320亿参数模型，将在性能、效率和内存占用之间实现更理想的平衡，例如，相比14B模型，32B在智能体场景下能力更强；相比72B，32B的推理成本更低。通义千问团队希望32B开源模型能为下游应用提供更好的解决方案。

通义千问开源320亿参数模型，已实现7款大语言模型全开源

基础能力方面，通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异，性能接近通义千问720亿参数模型，远超其他300亿级参数模型。

通义千问开源320亿参数模型，已实现7款大语言模型全开源

Chat模型方面，Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分，与Qwen1.5-72B-Chat之间的差距相对较小。

通义千问开源320亿参数模型，已实现7款大语言模型全开源

多语言能力方面，通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言，在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。

通义千问开源320亿参数模型，已实现7款大语言模型全开源

本站部分文章来自互联网，文章版权归原作者所有。如有疑问请联系QQ：362580117！

返回列表

上一篇：波士顿动力公司开发的 Spot 机器人成功“入职”石油公司 AkerBP！

下一篇：疫情当前，设立临床诊断意见是非常必要的！

相关文章

今天才知道，铅酸、石墨烯、钠电池、锂电池区别多大，价格是多少

今天才知道，铅酸、石墨烯、钠电池、锂电池区别多大，价格是多少

我们常说电动车有三大件，分别是电机、控制器、电池，其中电机负责动力，控制器负责各种指令发出，而电池是储存电能的装置，也只有电动车具备电池，电...

“CTO”李斌的一次奇袭

“CTO”李斌的一次奇袭

“蔚来没有CTO，蔚来CTO就是我。” 9月21日，蔚来终于迎来了成立以后的第一个科技日，蔚来CEO李斌也官宣了自己的“新身份”——蔚来CT...

AI可以修复声画，也能修复回忆吗？

AI可以修复声画，也能修复回忆吗？

有一种情怀叫Beyond，黄家驹一开口，谁的DNA动了？ 7月3日19点，“Beyond Live 1991生命接触演唱会精选及纪念音乐会精...

大热的「数字疗法」，该泼一泼凉水了

大热的「数字疗法」，该泼一泼凉水了

数字疗法，被提上讨论的议程，是在2017年。这一年7月，美国食品药品监督管理局（FDA）发布数字健康创新行动计划，正式公布“移动医疗应用指导...

微信：上半年处理2.6万违规个人账号；米家App崩溃小米致歉

微信：上半年处理2.6万违规个人账号；米家App崩溃小米致歉

微信：上半年处理2.6万违规个人账号 6 月 16 日消息，今日晚间，微信发布公告称，为规范微信个人账号的信息发布行为，微信团队近期加强了对...

2023杭州云栖大会定档10月31日，即日起免费申领门票

2023杭州云栖大会定档10月31日，即日起免费申领门票

10月16日消息，记者从云栖大会组委会获悉，2023杭州·云栖大会将于10月31日至11月2日在杭州云栖小镇举办。今年云栖大会以“计算，为了无...

发表评论