工联院大模型测评:360智脑位列国产第一梯队表现超ChatGPT

访客1年前AI生活98

近日,中国工业互联网研究院(以下简称“工联院”)针对人工智能大模型在中文工业领域的知识问答能力进行系统性评测。结果显示,360集团(601360.SH,下称“360”)自研大模型“360智脑”在多项指标超过GPT3.5,综合表现位于国产大模型前列。

工联院此次评测选取了工业领域典型的八大行业,集合五大院士,八大IEEE Fellow共13位顶级专家构成了专家委员会。每个行业抽取客观题和主观题,主观题主要考察基础能力、语句能力、概括能力和逻辑能力四大维度,最终八大行业共计超过1100道题,对大模型就行全方位评测。评测对象涵盖GPT4、GPT3.5、360智脑、文心一言等国内外具有代表性的头部大模型。

工联院大模型测评:360智脑位列国产第一梯队表现超ChatGPT

从评测结果可以看出,GPT4表现最佳,国内大模型表现亮眼,360智脑在多个行业均处于前列,其中装备制造业和纺织行业更是超过GPT-3.5,表现优异。

虽然国内大模型在本次评测表现较好,以360智脑为代表的国产大模型甚至在部分行业赶超GPT3.5,但工联院评测报告也指出,国内外通用大模型在工业知识问答领域探索仍处于初级阶段,也缺乏行业针对性训练。

其实,360近期已经推出一个企业级的AI大模型解决方案,基于360智脑的能力,综合行业和企业的专业知识库,打造“行业化、企业化、垂直化、小型化、专有化”企业级大模型,目前已在智慧城市、智慧企服场景下落地应用实践,且双双入选“北京市通用人工智能大模型行业应用十大典型场景案例”。

这不是360智脑第一次在第三方评测中表现出优异成绩,早在不久前中文通用大模型基准(SuperCLUE)评测中,360智脑数次上榜,且多项能力蝉联国产大模型第一。

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

知乎起诉苏宁拖欠百万广告费;顺丰官宣服务升级:派件不上门必赔付

华为“截胡”苹果发布卫星通信功能,Mate50手机首发采用卫星技术“没网也能发信息” 9月6日消息,在苹果发布会前夕,华为在线上发布了其首款支...

首届“兴智杯”全国人工智能创新应用大赛行业赋能专题赛举办决赛

首届“兴智杯”全国人工智能创新应用大赛行业赋能专题赛举办决赛

日前,首届“兴智杯”全国人工智能创新应用大赛行业赋能专题赛决赛暨人工智能行业赋能高峰论坛在线上成功举办。 本次论坛由广州市人民政府主办,广州...

苹果公司发布研究论文, Siri 大揭秘!

苹果公司发布研究论文, Siri 大揭秘!

苹果公司的跨渠道 Siri 虚拟帮手在全球有着超越 5 亿用户,明显,语音辨认是苹果感兴趣的重要范畴之一。 上星期,苹果公司宣布了一系...

软银愿景基金大幅裁员,预计超过百人;字节跳动宣布新增家庭关爱假

软银愿景基金大幅裁员,预计超过百人;字节跳动宣布新增家庭关爱假

今日头条 软银被曝大幅裁减愿景基金员工!预计至少100名员工受影响 9月29日,据国外知情人士爆料,软银集团已经开始在其亏损的愿景基金裁员,预...

连接“法国未来工业”与“中国制造2025” 法孚:用更多示范项目助力高质量发展

连接“法国未来工业”与“中国制造2025” 法孚:用更多示范项目助力高质量发展

法孚集团拥有210年历史,是一家专为行业客户设计和制造机械、工艺设备和生产线的工业工程公司。1999年在浦东注册的法孚斯坦因冶金技术(上海)...

RISC-V冲击高性能的“拦路虎”

RISC-V冲击高性能的“拦路虎”

在2022 RISC-V中国峰会上,RISC-V中国峰会主席、平头哥半导体副总裁孟建熠对RISC-V回顾了过去一年里RISC-V在生态建设上取...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。