微软发布新的语言生成模型Turing NLG:如今英伟达现在只能屈居第二了!

访客2年前AI生活334
微软分享史上最大基于Transformer架构的语言生成模型

微软AI&Research今天分享了有史以来最大的基于Transformer架构的语言生成模型Turing NLG(下文简称为T-NLG),并开源了一个名为DeepSpeed的深度学习库,以简化对大型模型的分布式培训。

基于Transformer的架构,意味着该模型可以生成单词来完成开放式文本任务。除了完成未完成的句子外,它还可以生成对输入文档的问题和摘要的直接答案。

去年8月,英伟达曾宣布已训练世界上最大的基于Transformer的语言模型,当时该模型使用了83亿个参数,比BERT大24倍,比OpenAI的GPT-2大5倍。

而此次微软所分享的模型,T-NLG的参数为170亿个,是英伟达的Megatron(现在是第二大Transformer模型)的两倍,其参数是OpenAI的GPT-2的十倍。微软表示,T-NLG在各种语言建模基准上均优于最新技术,并在应用于许多实际任务(包括总结和问题解答)时表现出色。

微软分享史上最大基于Transformer架构的语言生成模型

不过,像Google的Meena一样,最初使用GPT-2,T-NLG最初只能在私人演示中共享。

微软AI研究应用科学家Corby Rosset在博客文章中写道:“除了通过汇总文档和电子邮件来节省用户时间之外,T-NLG还可以通过为作者提供写作帮助,并回答读者可能对文档提出的问题,由此来增强Microsoft Office套件的使用体验。” 

具有Transformer架构的语言生成模型可以预测下一个单词。它们可用于编写故事,以完整的句子生成答案以及总结文本。

微软表示,他们的目标是在任何情况下都能够像人类一样直接,准确,流畅地做出响应:以前,问题解答和摘要系统依赖于从文档中提取现有内容,这些内容可以作为备用答案或摘要,但它们通常看起来不自然或不连贯。使用T-NLG这样的自然语言生成模型,可以自然地总结或回答有关个人文档或电子邮件主题的问题。

来自AI领域的专家告诉VentureBeat,2019年是NLP模型开创性的一年——使用Transformer架构无疑是2019年最大的机器学习趋势之一,这导致了语言生成领域和GLUE基准测试领导者的进步,Facebook的RoBERTa、谷歌的XLNet和微软的MT-DNN都纷纷加入到各类基准测试榜首的争夺当中。

同样是在今天,微软还开源了一个名为DeepSpeed的深度学习库。该学习库已针对开发人员进行了优化,以提供低延迟、高吞吐量的推理。

DeepSpeed包含零冗余优化器(ZeRO),用于大规模训练具有1亿个或更多参数的模型,微软过去曾用它训练T-NLG。

微软表示,DeepSpeed和ZeRO使得他们能够降低模型并行度(从16降低到4),将每个节点的批处理大小增加四倍,并将训练时间减少了三分之二;DeepSpeed使用更少的GPU可以使大型模型的训练效率更高。

开发人员和机器学习从业人员都可以使用DeepSpeed和ZeRO,因为培训大型网络(例如利用Transformer架构的网络)可能会很昂贵,并且可能会遇到大规模问题。

另外,Google的DeepMind今天也发布了一种新的远程内存模型Compressive Transformer,以及一种针对书本级语言建模的新基准PG19。

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

权威期刊《自然》援引百度搜索指数,称中国疫情已过高峰

权威期刊《自然》援引百度搜索指数,称中国疫情已过高峰

近日,国际顶级权威期刊《自然》在首页发布文章,称中国的新冠疫情或许已过峰值。 该文报道英国南安普敦大学学者通过模型推演了中国各地区的感染人数...

元器件代理商打造开放实验室,「噱头」还是「止痛」?

元器件代理商打造开放实验室,「噱头」还是「止痛」?

提起艾睿电子,绝大多数人对其的印象还停留在 “全球性的代理商”,帮助英飞凌、意法半导体、美信等国际半导体大厂做芯片代理并销往全球各地。 事实上...

腾讯财付通:智能风控体系打击非法交易 挽回用户资金超千万

腾讯财付通:智能风控体系打击非法交易 挽回用户资金超千万

消费者权益保护无小事。今年以来,在中国人民银行指导下,腾讯旗下第三方支付平台“财付通”以科技牵引金融消保,通过“毫秒级识别“的智能风控体系有效...

容联云发布大语言模型“赤兔”,赋能沟通智能2.0

容联云发布大语言模型“赤兔”,赋能沟通智能2.0

7月8日,上海,容联云在2023世界人工智能大会上举办以“数智进化、越级向上”为主题的“生成式营销服务与大模型”论坛。 论坛现场,容联云正式发...

把实验室建在车间里 临港高校研发团队成为企业创“新”力量

把实验室建在车间里 临港高校研发团队成为企业创“新”力量

走进上海顺超五金机械制造有限公司生产车间,实训基地操作台前火花四溅,来自上海电机学院的学生正在调试自主研发的激光焊接机器人完成十字焊接,突破原来仅能实现直线焊接的技术局限。 自动...

2020年智能安防市场规模将达千亿!智能安防将如何可持续发展?

2020年智能安防市场规模将达千亿!智能安防将如何可持续发展?

一、 安防产业概况 (一)安防产业总览 安防统属于电子行业的范畴,是对现代计算机技术、集成电路应用技术、 网络控制与传输...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。