微软发布最新论文:在非结构化 2D 图像基础上生成 3D 形状图像!

访客1年前AI生活79
微软发布最新论文:在非结构化 2D 图像基础上生成 3D 形状图像!
上图为微软模型生成的 3D 沙发,椅子和浴缸图像

已经有不少机构在将 2D 图像转换为 3D 形式的方面进行了尝试,包括 Facebook、Nvidia 等公司的 AI 研究实验室,或是类似 Threedy.AI 这样的初创公司。近日,来自微软的研究团队也发表了一篇预印论文,展示了其在非结构化 2D 图像的基础上生成 3D 形状图像的能力。

通常来说,训练这样的框架需要通过栅格化处理来进行微分步骤渲染,因此,过去研究人员在该领域的努力都专注于开发定制渲染模型。然而,通过此类模型处理的图像会显得不够真实自然,也不适合用于生成游戏以及图形产业的工业效果图。 

微软的研究人员这一次做了新的突破——他们在论文中详细介绍了一个框架,该框架采用的“可缩放”训练技术是第一次被用于这一领域。研究人员提到,在使用 2D 图像进行训练时,该框架始终可以比现有的模型生成效果更好的 3D 形状,这对于视频游戏开发人员、电子商务公司,以及缺乏创建 3D 模型经验的动画公司来说,称得上是“福音”。       

具体来说,研究人员试图利用功能齐全的工业渲染器,该渲染器可以根据显示数据来生成图像。为此,研究人员训练了 3D 形状的生成模型,以便渲染形状并生成与 2D 数据集分布相匹配的图像。生成器模型采用随机输入向量(代表数据集特征的值)并生成 3D 对象的连续体素表示(3D 空间中网格上的值),然后将体素输入到不可微分的渲染过程中,并在使用现有渲染器进行渲染之前将其阈值降低为离散值。

也就是说,这是一种新颖的代理神经渲染器直接渲染由 3D 形状生成模型生成的连续体素网格的方式。正如研究人员所解释的那样,在给定 3D 网格输入的情况下,需要对其进行训练以匹配现成渲染器的渲染输出。         

生成式对抗网络(GANS)在产生 2D 图像数据方面的成果令人印象深刻,许多视觉应用,比如游戏,都需要 3D 模型作为输入,而不仅仅是图像。但是,直接将现有的 GAN 模型扩展到 3D,需要获取 3D 训练数据。         

微软发布最新论文:在非结构化 2D 图像基础上生成 3D 形状图像!
上图为微软模型生成的 3D 蘑菇图像

在实验过程中,研究团队为上述生成器采用了 3D 卷积 GAN 架构(GAN 是一个由两部分组成的 AI 模型,其中包括生成器,这些生成器使用分布式采样从随机噪声中生成合成示例,并将这些示例与训练数据集中的真实示例一起馈入鉴别器中,以尝试区分两者)。基于 3D 模型生成的数据集和真实的数据集可以合成来自不同对象类别的图像,并在整个训练过程中从不同角度进行渲染。

研究人员还表示,他们的框架还会从图像中提取照明和阴影信息,使其能够从每个训练样本中提取更多有意义的数据,并在此基础上产生更好的结果。在对自然图像的数据集进行训练之后,该框架可以生成逼真的样本。此外,该框架还可以利用表面之间的曝光差异来成功检测出凹形物体的内部结构,从而使准确地捕获凹形程度和中空空间。        

将颜色,材料和照明等信息合并到系统中,未来,这些信息就可以与更多“常规”实际数据集一起使用。

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

科技赋能垃圾处理,行深智能首推无人喷雾除臭车

科技赋能垃圾处理,行深智能首推无人喷雾除臭车

随着城市的不断发展,生活垃圾量不断增加,居民的环保意识逐渐提高,生活垃圾处置终端的运营能力与周边居民持续增高的环境要求之间的矛盾日益突出,...

飞利浦COO人事变动,将临危受命解决「供应链和产品召回」双重危机

飞利浦COO人事变动,将临危受命解决「供应链和产品召回」双重危机

近日,飞利浦宣布,已任命Willem Appelo为首席运营官,自 10 月 1 日起正式接替Sophie Bechu。 在完成接棒前,他将于...

人大毕业生大肆黑进内网,窃取全校学生信息进行颜值打分;雪铁龙C6补贴9万被指涉嫌诈骗

人大毕业生盗取全校学生信息建颜值打分网站,校方:已报警 7月2日消息,近日网传中国人民大学一名硕士毕业生涉嫌在校期间非法获取全校学生的个人信息...

增速第一!腾讯云引领中国AI工业质检市场,助力制造业数字化转型

增速第一!腾讯云引领中国AI工业质检市场,助力制造业数字化转型

近日,国际知名咨询机构IDC发布的《中国AI赋能的工业质检解决方案市场份额,2022:差异化竞争日益凸显》报告中,腾讯云凭借领先的技术创新能力...

国内首款大算力存算一体AI芯片,上车了!

国内首款大算力存算一体AI芯片,上车了!

美国硅谷的车库,是一个神奇的地方,惠普、苹果、亚马逊、谷歌等影响世界的科技公司都诞生于车库。 中国的沙县小吃也是一个神奇的地方,国内首款大算力...

十五天内,阿里云用三颗子弹击穿To B围城

十五天内,阿里云用三颗子弹击穿To B围城

十五天内,阿里云迅速拉开战线。其动作之敏捷,规划之全面,在近年来的中国云计算市场上实属罕见。 4月11日,大模型“通义千问”作为重型武器首度...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。