阿里云 EasyNLP 跨模态学习能力再升级,电商文图检索效果刷新SOTA

访客1年前AI生活202
阿里云 EasyNLP 跨模态学习能力再升级,电商文图检索效果刷新SOTA

近日,阿里云机器学习 PAI 开源框架 EasyNLP进行升级发布,推出了融合了丰富电商场景知识的CLIP模型,在电商文图检索效果上刷新了SOTA结果,并且将上述模型免费开源,贡献给开源社区。

CLIP(Contrastive Language-Image Pre-training)是一种经典的文图跨模态检索模型,它在大规模图文数据集上进行了对比学习预训练,具有很强的文图跨模态表征学习能力。EasyNLP借鉴CLIP的轻量化、易迁移的预训练架构,构建基于CLIP包含图像和文本Encoder两部分的双流模型,同时基于商品数据,以优化电商场景的文图检索优化。

Fashion-Gen数据集是一个大规模的时尚场景的图文数据集,以Fashion-Gen数据集为例,EasyNLP基于pai-clip-commercial-base-en和pai-clip-commercial-large-en这两个模型在Fashion-Gen数据集上进行了20个epoch的微调。实验结果表明,相比于现公布的SOTA模型(CommerceMM),电商CLIP-large模型在文到图和图到文的检索结果上均有显著提升,评测指标最高提升了8.7~15个百分点。

除此之外,电商base模型在文到图与CommerceMM相当检索结果下,使用了更少的参数量。由此可见,电商CLIP无论在large还是base图像Encoder的设置下,都取得了有竞争力的电商场景跨模态检索能力。

文到图检索评测结果

999.jpg 

图到文检索评测结果

888(1)_看图王.jpg 

目前,电商CLIP可在EasyNLP中直接安装使用,在未来,EasyNLP框架会集成更多NLP的多模态的知识模型,覆盖各个常见领域和任务,同时也将集成更多SOTA模型(特别是中⽂模型),来⽀持各种NLP和多模态任务,共建NLP和多模态算法库。

Github地址:https://github.com/alibaba/EasyNLP

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

AI可以修复声画,也能修复回忆吗?

AI可以修复声画,也能修复回忆吗?

有一种情怀叫Beyond,黄家驹一开口,谁的DNA动了? 7月3日19点,“Beyond Live 1991生命接触演唱会精选及纪念音乐会精...

外卖平台开启多元化业务模式,饿了么推出“预售留货”服务!

外卖平台开启多元化业务模式,饿了么推出“预售留货”服务!

随着iPhone 12的发布,可以预测新一轮的购机潮又要出现了。虽然苹果已经不再处于最辉煌的时代,但每次手机一出来还是非常容易被一抢而空。为...

对话云舶科技CEO梅嵩:AIGC加速虚拟直播3.0时代到来,未来人人皆可虚拟

“前几年是虚拟人的技术的研发和储备期,AIGC技术会加速产品的落地。”云舶科技CEO梅嵩说,未来,人人皆可虚拟。 云舶科技成立了2017年,从...

理想成立无人卡车项目组,向感知负责人常黎汇报

理想成立无人卡车项目组,向感知负责人常黎汇报

小编消息,9月8日,据界面新闻报道,理想汽车内部正在调研卡车项目,欲开拓新业务。 随后,理想汽车官方回复称,“暂时无进军自动驾驶卡车领域的计...

浪潮云怎么样?国内云计算市场研究报告!

浪潮云怎么样?国内云计算市场研究报告!

日前,赛迪顾问发布的《2020-2021年中国云计算市场研究年度报告》(以下简称《报告》)显示,2020年中国云计算市场依然保持快速增长,市...

从智能云首次盈利,看百度如何在大模型时代奔流

文心一言大模型发布整两个月后,百度披露了其第一份“大模型时代”的财报。 5月16日,百度发布2023年Q1财报。财报显示:一季度,百度实现营收...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。