工联院大模型测评:360智脑位列国产第一梯队表现超ChatGPT

访客1年前AI生活167

近日,中国工业互联网研究院(以下简称“工联院”)针对人工智能大模型在中文工业领域的知识问答能力进行系统性评测。结果显示,360集团(601360.SH,下称“360”)自研大模型“360智脑”在多项指标超过GPT3.5,综合表现位于国产大模型前列。

工联院此次评测选取了工业领域典型的八大行业,集合五大院士,八大IEEE Fellow共13位顶级专家构成了专家委员会。每个行业抽取客观题和主观题,主观题主要考察基础能力、语句能力、概括能力和逻辑能力四大维度,最终八大行业共计超过1100道题,对大模型就行全方位评测。评测对象涵盖GPT4、GPT3.5、360智脑、文心一言等国内外具有代表性的头部大模型。

工联院大模型测评:360智脑位列国产第一梯队表现超ChatGPT

从评测结果可以看出,GPT4表现最佳,国内大模型表现亮眼,360智脑在多个行业均处于前列,其中装备制造业和纺织行业更是超过GPT-3.5,表现优异。

虽然国内大模型在本次评测表现较好,以360智脑为代表的国产大模型甚至在部分行业赶超GPT3.5,但工联院评测报告也指出,国内外通用大模型在工业知识问答领域探索仍处于初级阶段,也缺乏行业针对性训练。

其实,360近期已经推出一个企业级的AI大模型解决方案,基于360智脑的能力,综合行业和企业的专业知识库,打造“行业化、企业化、垂直化、小型化、专有化”企业级大模型,目前已在智慧城市、智慧企服场景下落地应用实践,且双双入选“北京市通用人工智能大模型行业应用十大典型场景案例”。

这不是360智脑第一次在第三方评测中表现出优异成绩,早在不久前中文通用大模型基准(SuperCLUE)评测中,360智脑数次上榜,且多项能力蝉联国产大模型第一。

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

最佳云转码,腾讯云MPS夺得MSU编码器大赛21项第 一

最佳云转码,腾讯云MPS夺得MSU编码器大赛21项第 一

4月15日,莫斯科国立大学举办的MSU云端视频转码比赛成绩揭晓,腾讯云媒体处理产品MPS(Media Processing Service)在...

弄潮儿向涛头立—— 海宁:工业往高攀升 向新进军

弄潮儿向涛头立—— 海宁:工业往高攀升 向新进军

初夏,草木勃发,钱江潮奔腾不息。 嘉兴海宁,钱塘江畔的工业之星,光芒愈加璀璨。 2022年,海宁实现规上产值2500亿元、规上增加值472....

提前解锁8月第四届深圳国际人工智能展,感受前沿科技魅力

提前解锁8月第四届深圳国际人工智能展,感受前沿科技魅力

为积极响应国家高质量发展号召,全面迎接2023年人工智能行业发展新机遇、新挑战,由深圳市科技创新委员会、深圳市福田区人民政府指导,深圳市人工...

滴滴获国内最大金额自动驾驶融资!

滴滴获国内最大金额自动驾驶融资!

5月29日,滴滴出行宣布旗下自动驾驶公司完成首轮超过5亿美元融资,由软银愿景基金2期领投。这是滴滴自动驾驶公司成立后首次对外融资,也是目前国...

李一男重续造车梦:命运坎坷的牛创自游家,已获工信部生产资质

李一男重续造车梦:命运坎坷的牛创自游家,已获工信部生产资质

小编7月17日获悉,造车新势力的生产资质问题近日终于有了新进展。牛创自游家,在本轮资质审批中通过了工信部的审批,出现在工信部发布的最新一期产...

外卖平台开启多元化业务模式,饿了么推出“预售留货”服务!

外卖平台开启多元化业务模式,饿了么推出“预售留货”服务!

随着iPhone 12的发布,可以预测新一轮的购机潮又要出现了。虽然苹果已经不再处于最辉煌的时代,但每次手机一出来还是非常容易被一抢而空。为...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。