工联院大模型测评:360智脑位列国产第一梯队表现超ChatGPT

访客2年前AI生活229

近日,中国工业互联网研究院(以下简称“工联院”)针对人工智能大模型在中文工业领域的知识问答能力进行系统性评测。结果显示,360集团(601360.SH,下称“360”)自研大模型“360智脑”在多项指标超过GPT3.5,综合表现位于国产大模型前列。

工联院此次评测选取了工业领域典型的八大行业,集合五大院士,八大IEEE Fellow共13位顶级专家构成了专家委员会。每个行业抽取客观题和主观题,主观题主要考察基础能力、语句能力、概括能力和逻辑能力四大维度,最终八大行业共计超过1100道题,对大模型就行全方位评测。评测对象涵盖GPT4、GPT3.5、360智脑、文心一言等国内外具有代表性的头部大模型。

工联院大模型测评:360智脑位列国产第一梯队表现超ChatGPT

从评测结果可以看出,GPT4表现最佳,国内大模型表现亮眼,360智脑在多个行业均处于前列,其中装备制造业和纺织行业更是超过GPT-3.5,表现优异。

虽然国内大模型在本次评测表现较好,以360智脑为代表的国产大模型甚至在部分行业赶超GPT3.5,但工联院评测报告也指出,国内外通用大模型在工业知识问答领域探索仍处于初级阶段,也缺乏行业针对性训练。

其实,360近期已经推出一个企业级的AI大模型解决方案,基于360智脑的能力,综合行业和企业的专业知识库,打造“行业化、企业化、垂直化、小型化、专有化”企业级大模型,目前已在智慧城市、智慧企服场景下落地应用实践,且双双入选“北京市通用人工智能大模型行业应用十大典型场景案例”。

这不是360智脑第一次在第三方评测中表现出优异成绩,早在不久前中文通用大模型基准(SuperCLUE)评测中,360智脑数次上榜,且多项能力蝉联国产大模型第一。

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

嬴彻科技、阿里巴巴获自动驾驶卡车公开道路测试牌照,可「主驾无人」在德清行驶

嬴彻科技、阿里巴巴获自动驾驶卡车公开道路测试牌照,可「主驾无人」在德清行驶

近日,阿里巴巴获得德清县颁发的“主驾无人”L4级自动驾驶卡车公开道路测试牌照的消息传出,将德清县、阿里巴巴与L4级自动驾驶卡车的结合推入更多...

腾讯钟翔平:数字底座催生云上生态,助力汽车、交通、城市协同发展

腾讯钟翔平:数字底座催生云上生态,助力汽车、交通、城市协同发展

交通是国民经济的基础性、先导性、战略性产业,也是重要的服务性行业,被誉为国民经济大动脉。同时,交通出行也是腾讯扎根产业互联网的重要领域,以数实...

英国新冠病毒确诊病例达逾358万例,NHS在疫情防控上投入了更多科技的力量!

英国新冠病毒确诊病例达逾358万例,NHS在疫情防控上投入了更多科技的力量!

尽管国内的疫情防控早已经进入“常态化”防控的阶段,但是放眼世界,其他国家仍然在应对着最严峻的疫情考验,其中就不乏英国。 据Wo...

GPT诸神之战,小巨头如何做大模型?

GPT诸神之战,小巨头如何做大模型?

据不完全统计,ChatGPT 发布不过半年,中国已经发布接近 40 个类 ChatGPT 的大模型产品。 这一数字表明,AI 大模型进入了「诸...

京东物流与Darwynn Ltd签署战略合作

京东物流与Darwynn Ltd签署战略合作

2023年7月10日,为全球卖家在北美提供端到端供应链服务及电商服务的Darwynn公司,与为全球客户提供优质、高效全面的一体化供应链解决...

一加 11 哈苏影像系统全面升级 多项领先技术还原真实色彩

一加 11 哈苏影像系统全面升级 多项领先技术还原真实色彩

1月3日,一加宣布旗舰新品一加11 哈苏手机影像系统全面升级,以更丰富真实的色彩用户获得故事感更佳的影像体验:配备全新的13通道多光谱传感器...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。