阿里云 EasyNLP 跨模态学习能力再升级,电商文图检索效果刷新SOTA

访客1年前AI生活290
阿里云 EasyNLP 跨模态学习能力再升级,电商文图检索效果刷新SOTA

近日,阿里云机器学习 PAI 开源框架 EasyNLP进行升级发布,推出了融合了丰富电商场景知识的CLIP模型,在电商文图检索效果上刷新了SOTA结果,并且将上述模型免费开源,贡献给开源社区。

CLIP(Contrastive Language-Image Pre-training)是一种经典的文图跨模态检索模型,它在大规模图文数据集上进行了对比学习预训练,具有很强的文图跨模态表征学习能力。EasyNLP借鉴CLIP的轻量化、易迁移的预训练架构,构建基于CLIP包含图像和文本Encoder两部分的双流模型,同时基于商品数据,以优化电商场景的文图检索优化。

Fashion-Gen数据集是一个大规模的时尚场景的图文数据集,以Fashion-Gen数据集为例,EasyNLP基于pai-clip-commercial-base-en和pai-clip-commercial-large-en这两个模型在Fashion-Gen数据集上进行了20个epoch的微调。实验结果表明,相比于现公布的SOTA模型(CommerceMM),电商CLIP-large模型在文到图和图到文的检索结果上均有显著提升,评测指标最高提升了8.7~15个百分点。

除此之外,电商base模型在文到图与CommerceMM相当检索结果下,使用了更少的参数量。由此可见,电商CLIP无论在large还是base图像Encoder的设置下,都取得了有竞争力的电商场景跨模态检索能力。

文到图检索评测结果

999.jpg 

图到文检索评测结果

888(1)_看图王.jpg 

目前,电商CLIP可在EasyNLP中直接安装使用,在未来,EasyNLP框架会集成更多NLP的多模态的知识模型,覆盖各个常见领域和任务,同时也将集成更多SOTA模型(特别是中⽂模型),来⽀持各种NLP和多模态任务,共建NLP和多模态算法库。

Github地址:https://github.com/alibaba/EasyNLP

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

“东数西算”内蒙古枢纽节点建成中国最大自动驾驶智算中心,小鹏汽车与阿里云合建

“东数西算”内蒙古枢纽节点建成中国最大自动驾驶智算中心,小鹏汽车与阿里云合建

8月2日,记者获悉,“东数西算”内蒙古枢纽节点建成中国最大的自动驾驶智算中心。该智算中心由小鹏汽车与阿里云在乌兰察布合建,算力可达600PFL...

腾讯汤道生:超千亿参数  超2万亿tokens  腾讯混元大模型向行业全面开放

腾讯汤道生:超千亿参数 超2万亿tokens 腾讯混元大模型向行业全面开放

9月7日,2023腾讯全球数字生态大会在深圳宝安举行。腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示,腾讯将迈入“全面拥抱大模型”...

蔚来座舱负责人张磊离职,接任者为原系统软件部负责人吴杰

小编获悉,蔚来汽车数字座舱与软件开发副总裁张磊(职级L1)因为个人原因离职,会在月底交接完离职手续。座舱负责人一职将由原软件系统负责人吴杰(职...

HUD狂飙上车,本土企业上演防守反击战

HUD狂飙上车,本土企业上演防守反击战

2020年,HUD在奔驰S Class上“惊艳全场”已是快三年前的故事,HUD也从当初让人眼前一亮的新鲜物件变得越发触手可及。在众多HUD厂...

到2040年,自动驾驶飞机市场价值将达到1.5万亿美元!

到2040年,自动驾驶飞机市场价值将达到1.5万亿美元!

飞行汽车,又被称为空中出租车,在很早之前就成为了人们的梦想。 如果你看过《杰森一家》(The Jetsons)或《回到未来》(...

搜狗投资春雨:这不是搜狗第一次涉足互联网医疗领域!

最近,北京春雨天下软件有限公司经历了一场工商变更。公司新增股东为搜狗运营主体“北京搜狗信息服务有限公司”,春雨现有22名股东,搜狗为第七大股...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。