通义千问开源320亿参数模型,已实现7款大语言模型全开源

访客1年前AI生活102

4月7日消息,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。

通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本,其中,几款小尺寸模型可便捷地在端侧部署,720亿参数模型则拥有业界领先的性能,多次登上HuggingFace等模型榜单。此次开源的320亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡,例如,相比14B模型,32B在智能体场景下能力更强;相比72B,32B的推理成本更低。通义千问团队希望32B开源模型能为下游应用提供更好的解决方案。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

基础能力方面,通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异,性能接近通义千问720亿参数模型,远超其他300亿级参数模型。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

多语言能力方面,通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言,在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

创新引擎,值得信赖的生产力工具PowerEdge T550塔式服务器

创新引擎,值得信赖的生产力工具PowerEdge T550塔式服务器

随着数字经济时代的到来,各行各业的信息化发展已经成为大势所趋,企业的信息化发展亦成为未来发展的重要变革之路。所谓工欲善其事必先利其器,设备...

鹏华基金核心系统完成国产化升级,腾讯云大数据TBDS再拓应用新场景

5月8日,腾讯云联合鹏华基金共同对外宣布,通过双方技术团队以及战略合作伙伴华云中盛共同努力,腾讯云大数据套件TBDS日前已经正式在鹏华基金大数...

CirroData数据库通过国标检测,助力国网数科“业务协同运营数据服务平台”高质量上线

CirroData数据库通过国标检测,助力国网数科“业务协同运营数据服务平台”高质量上线

近日,东方国信CirroData多款数据库产品通过了信息产业数据通信产品质量监督检验中心审批的CMA-CNAS检测认证,达到了国家和国际质量...

为什么用中台理念做AI芯片和GPU?

为什么用中台理念做AI芯片和GPU?

对于互联网公司来说,中台是一个非常熟悉的概念。 但在芯片领域,提中台概念的人并不多。 2022世界人工智能大会上,瀚博半导体创始人兼CEO钱军...

腾讯、恒大联合推出“微物云”

腾讯、恒大联合推出“微物云”

5月31日,腾讯与恒大集团举行战略合作签约仪式,联合推出物业科技平台“微物云”。 官方资料显示,”微物云“将集成智慧物业SaaS系统、空间物...

腾讯联合牵头!联合信通院全面推进金融行业大模型标准建设

腾讯联合牵头!联合信通院全面推进金融行业大模型标准建设

7月28日,中国信通院“行业大模型高质量发展论坛暨可信AI大模型标准宣贯会”(以下简称“宣贯会”)在南京举办。会上,腾讯作为推动行业大模型的核...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。