Select Language

AI社区

数据要素产业

NVIDIA希望用AI化身填充虚拟和物理世界之间的距离

NVIDIA宣布了一个用于创建虚拟代理的新平台,名为Omniverse Avatar。该平台结合了一些离散技术--包括语音识别、合成语音、面部跟踪和3D头像动画--NVIDIA称这些技术可用于支持一系列的虚拟化身。在该公司年度GTC会议的一次演讲中,NVIDIA首席执行官黄仁勋展示了几个使用Omniverse Avatar技术的演示。

在其中一个演示中,数字收银台中的一个可爱的动画人物向一对夫妇介绍了一家快餐店的菜单,回答了诸如哪些项目是素食的问题。这个角色使用面部追踪技术,与顾客保持目光接触,并对他们的面部表情做出反应。"黄说:"这对智能零售、自动取款机和客户服务都很有用。"

在一个演示中,NVIDIA的化身技术被用来创造一个可爱的角色,让一对夫妇通过菜单进行交谈。

在另一个演示中,一个动画形象的黄仁勋回答了包括气候变化和食物生产在内的问题,在第三个演示中,有人在电话会议中使用了自己的逼真动画化身作为替身。打电话的人在一个繁忙的咖啡馆里穿着休闲服,但他们的虚拟化身却穿着得体,说话时没有任何背景噪音的干扰。最后这个例子建立在NVIDIA的Project Maxine工作之上,其目的是在机器学习修复的帮助下改善视频会议的常见问题(如低质量流和保持眼神接触)。

Omniverse Avatar的发布是NVIDIA"Omniverse"愿景的一部分,为一个模糊的技术集合提供了一个明确的品牌。与"元宇宙"一样,"全宇宙"基本上是关于共享的虚拟世界,允许远程协作。但与Facebook所有者meta提出的愿景相比,NVIDIA不太关注将你的办公室会议转移到虚拟现实中,而是更关注用虚拟对应物复制工业环境,以及在其化身工作中,特别是创造与物理世界中的人互动的化身。

与以往的演讲一样,NVIDIA的演示看起来相当流畅,但目前还不清楚这项技术在现实世界中的用途。例如,对于AI收银员的角色,目前还不清楚顾客是否真的喜欢这种互动体验,而不是简单地从菜单中选择他们想要的物品。黄晓明在演讲中指出,这个化身有两秒钟的反应时间,这肯定比人还慢,如果顾客在赶时间,肯定会非常沮丧。同样,尽管该公司的Project Maxine技术看起来很炫,但我们还没有看到它在现实世界中产生重大影响。