阿里云 EasyNLP 跨模态学习能力再升级,电商文图检索效果刷新SOTA

访客2年前AI生活334
阿里云 EasyNLP 跨模态学习能力再升级,电商文图检索效果刷新SOTA

近日,阿里云机器学习 PAI 开源框架 EasyNLP进行升级发布,推出了融合了丰富电商场景知识的CLIP模型,在电商文图检索效果上刷新了SOTA结果,并且将上述模型免费开源,贡献给开源社区。

CLIP(Contrastive Language-Image Pre-training)是一种经典的文图跨模态检索模型,它在大规模图文数据集上进行了对比学习预训练,具有很强的文图跨模态表征学习能力。EasyNLP借鉴CLIP的轻量化、易迁移的预训练架构,构建基于CLIP包含图像和文本Encoder两部分的双流模型,同时基于商品数据,以优化电商场景的文图检索优化。

Fashion-Gen数据集是一个大规模的时尚场景的图文数据集,以Fashion-Gen数据集为例,EasyNLP基于pai-clip-commercial-base-en和pai-clip-commercial-large-en这两个模型在Fashion-Gen数据集上进行了20个epoch的微调。实验结果表明,相比于现公布的SOTA模型(CommerceMM),电商CLIP-large模型在文到图和图到文的检索结果上均有显著提升,评测指标最高提升了8.7~15个百分点。

除此之外,电商base模型在文到图与CommerceMM相当检索结果下,使用了更少的参数量。由此可见,电商CLIP无论在large还是base图像Encoder的设置下,都取得了有竞争力的电商场景跨模态检索能力。

文到图检索评测结果

999.jpg 

图到文检索评测结果

888(1)_看图王.jpg 

目前,电商CLIP可在EasyNLP中直接安装使用,在未来,EasyNLP框架会集成更多NLP的多模态的知识模型,覆盖各个常见领域和任务,同时也将集成更多SOTA模型(特别是中⽂模型),来⽀持各种NLP和多模态任务,共建NLP和多模态算法库。

Github地址:https://github.com/alibaba/EasyNLP

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

直连直采,小象超市助力乡村振兴

2023年底,美团买菜更名为小象超市,这一事件曾引发热议。 在部分业内人士看来,看似只是简单改了个名字,实则小象超市是在表达不一样的品牌声音。...

美菱跑出合肥发展“加速度” 0.26秒下线一台冰箱

美菱跑出合肥发展“加速度” 0.26秒下线一台冰箱

国家强盛离不开工业发展,城市发展,亦是如此。从解放初期“合肥仅有的机械设备——一台四尺车床”,到今天拥有37个工业行业、200多个工业门类...

红外夜视「加速上车」,高手云集 |  盘点车载红外夜视厂家

红外夜视「加速上车」,高手云集 | 盘点车载红外夜视厂家

即使目前车辆配备摄像头、激光雷达、毫米波雷达等多种类型的传感器,仍不能避免交通事故的发生,尤其是在夜间。 面对这一问题,比亚迪、广汽埃安、长城...

哪吒推出首款中大型SUV哪吒L,售价12.99万起

哪吒推出首款中大型SUV哪吒L,售价12.99万起

小编消息,4月22日,哪吒汽车举办2024年春季发布会,哪吒L正式上市。新车此次上市四款增程版本,包括220闪充版、310闪充版、310闪充...

首发|融合视觉传感芯片公司锐思智芯完成近2亿元A轮融资

小编消息,本周一,融合视觉传感器芯片公司锐思智芯宣布,公司已于今年初完成近2亿元人民币A轮融资,锐思智芯创始人邓坚表示,本轮融资将用于IoT领...

自动驾驶L4前装量产进入“万元时代”?

自动驾驶L4前装量产进入“万元时代”?

自动驾驶正快速步入“前装量产”时代,如何以更合理的成本满足海量的车型适配和场景应用需求,成为各自动驾驶公司的极力破局之点。 5月18日,L4级...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。