[乐游网导读]Roblox Cube:用AI重新定义3D创作的游戏开发者新“魔方”3月18日,全球最大的UGC游戏平台Roblox扔出一颗“技术炸弹”——正式推出首个基于生成式AI的3D建模工具Cube,并宣布将开源其核心模型。这不仅让数百万创作者能用一句话生成3D物体,更向整个行业开放了“造物主”级能力。
Roblox Cube:用AI重新定义3D创作的游戏开发者新“魔方”3月18日,全球最大的UGC游戏平台Roblox扔出一颗“技术炸弹”——正式推出首个基于生成式AI的3D建模工具Cube,并宣布将开源其核心模型。这不仅让数百万创作者能用一句话生成3D物体,更向整个行业开放了“造物主”级能力。
Roblox Cube下载:点击下载
Roblox官宣Cube开源AI模型!一键生成3D物体,3.8 亿月活用户或将迎来全新游戏体验。
Roblox官宣Cube开源AI模型!一键生成3D物体,引爆AI+3D UGC生态
Roblox周一宣布推出其首个AI生3D的基础模型:名为"Cube",允许创作者使用生成式AI创建3D对象。该公司还发布了开源版本,使平台外的任何人都可以基于它进行构建。
目前处于测试阶段的Cube 3D Mesh生成功能,使创作者能够通过单个提示生成"网格"(即物体的3D表示)。例如,"生成一辆带黑色条纹的橙色赛车"。创作者可以在Roblox Studio中进一步调整游戏内物品。
Cube 3D的开源版本允许任何人定制、创建插件或使用自己的数据集训练模型以满足其需求。
Roblox还宣布了三个额外的AI工具——文本生成、文本转语音和语音转文本。这些功能将在未来几个月内推出。
文本生成工具让开发者能够在游戏中添加基于文本的AI功能。这包括给玩家提供与交互式非玩家角色(NPCs)进行对话的选项。
与此同时,文本转语音功能让开发者可以添加旁白、让NPC说话或在游戏中包含语音字幕。语音转文本则允许玩家使用语音命令,比如指挥角色向前移动。
该公司未来的其他计划包括为更"复杂"的对象推出网格生成和场景生成功能。例如,场景生成工具将允许创作者提示AI制作完整的森林场景,并将树上的绿叶变成秋季颜色以展示季节变化。
正如Roblox去年所述,长期目标是使3D对象和场景完全功能化,称之为"4D创作"。"第四维是指物体、环境和人之间的互动,"Roblox工程副总裁Nick Tornow表示。
与任何探索生成式AI工具的公司一样,Roblox相信Cube将帮助创作者更快地工作,使独立开发者能够承担更大的项目。该公司已经发布了多种AI工具,包括用于纹理生成和头像创建的工具。
https://corp.roblox.com/newsroom/2025/03/introducing-roblox-cube
元宇宙巨头Roblox发布AI生3D大模型!还开源,建模的时代来了!
去年秋天,我们宣布了一个雄心勃勃的项目,旨在构建一个开源的3D基础模型,用于在Roblox上创建3D对象和场景。本周,我们开源了该模型的首个版本,使其可供Roblox平台内外的任何人使用。我们将这个模型命名为Cube 3D。我们还推出了它的首个功能,即网格生成API的测试版。Cube将成为我们未来几年开发的许多AI工具的基础,包括高度复杂的场景生成工具。它最终将成为一个多模态模型,接受文本、图像、视频和其他类型的输入进行训练,并将与我们现有的AI创作工具集成。
Cube 3D直接通过文本(未来还将包括图像输入)生成3D模型和环境。目前,最先进的3D生成技术使用图像和重建方法来构建3D对象。当没有足够的3D训练数据时,这是一个很好的选择。然而,得益于我们平台的特性,我们可以直接使用原生3D数据进行训练。生成的对象完全兼容当今的游戏引擎,并且可以扩展使对象具有功能性。
这种差异类似于赛道电影布景。在电视上,你可能会看到一个看似功能齐全的赛道,有看台、车库和冠军通道。但如果你在那个布景上走动,你会很快意识到这些结构实际上是平面的。构建一个真正身临其境的3D世界需要完整、功能性的结构,有可以开车进入的车库,可以坐的看台,以及有功能性领奖台的冠军通道。
为了实现这一目标,我们从最先进的模型中汲取灵感,这些模型通过文本标记(或字符集)进行训练,以便它们能够预测下一个标记来形成句子。我们的创新基于同样的核心理念。我们构建了对3D对象进行标记化和理解形状为标记的能力,并训练Cube 3D预测下一个形状标记,以构建完整的3D对象。当我们将此扩展到完整场景生成时,Cube 3D会预测布局,并递归地预测形状以完成该布局。
任何人都可以对Cube 3D进行微调、开发插件或使用自己的数据进行训练,以满足其需求。我们相信AI工具应建立在开放性和透明度之上,这就是为什么我们成为开源AI社区的忠实合作伙伴。我们发布了我们的一个AI安全模型,因为我们强烈认为分享AI安全领域的进步有助于整个行业加速创新和技术进步。出于这个原因,我们还帮助创立了ROOST,这是一个致力于通过开源安全工具解决数字安全重要领域的新非营利组织。通过开源Cube 3D,我们的目标是使研究人员、开发者和更广泛的AI社区能够学习、增强和推进整个行业的3D生成技术。
我们之前曾谈到AI如何加速3D资产、配件和体验的创作。最终,AI将实现更具沉浸感和个性化的游戏和连接。我们在创作周期的每个阶段投资基础设施以支持AI——既为这些体验的开发者,也为在其中花时间的用户。我们设想未来开发者将通过在他们的体验中启用AI,为用户提供新的创作方式。这将AI的力量交到超过8500万日活跃用户手中,作为他们游戏体验的一部分。
在过去一年中,我们通过Roblox Studio内的AI驱动助手引入了几项新功能,为开发者提供所需的工具和能力,以创作和消除数小时的手动工作。通过Cube,我们打算使3D创作更加高效。通过3D网格生成,开发者可以快速探索新的创意方向,并通过快速决定推进哪些方向来提高生产力。
想象一下构建一个赛道游戏。今天,你可以在助手中使用网格生成API,输入一个简短的提示,如"/生成一辆摩托车"或"/生成橙色安全锥"。几秒钟内,API就会生成这些对象的网格版本。然后可以为它们添加纹理、颜色等。使用此API,你可以更快地建模道具或设计空间——无需花费数小时建模简单对象。它让你专注于有趣的事情,比如设计赛道布局和调整汽车操控性。这个API为每个创建的对象节省数小时,并让你有时间尝试新想法,而不必担心花费太多时间或精力。长期来看,我们计划支持更复杂和功能性的对象,甚至是场景。
这项技术延伸到每天在Roblox上玩耍和连接的数千万创意人士。我们看到一个未来,开发者使他们的用户能够使用AI成为创作者。启用网格生成API后,玩家可以将他们能想象的任何东西变为现实。如果玩家想要一辆未来感十足的汽车,他们只需输入"带侧翼的红色未来汽车"或"黑色皮革摩托车夹克",就能看到它被生成。这种游戏内AI生成将解锁全新的创造力水平。玩家可以以开发者从未想象过的方式个性化他们的体验,这将使游戏更具吸引力。
技术细节:3D与文本/图像标记之间的交叉注意力
关键技术挑战是将文本和图像与3D形状连接起来。我们的核心技术突破是3D标记化,它允许我们将3D对象表示为标记,就像文本可以表示为标记一样。这使我们能够预测下一个形状,就像语言模型预测句子中的下一个词一样。
为了实现3D生成,我们设计了一个统一的架构,用于单个对象的自回归生成、形状补全和多对象/场景布局生成。自回归变换器是使用先前输入来预测下一个组件的神经网络。这种架构提供了可扩展性和多模态兼容性,因此随着模型的扩展,它将适用于多种不同类型的输入(文本、视觉、音频和3D)。我们正在开源这个模型。在初始阶段,创作者将能够基于文本提示生成3D对象。未来,我们希望创作者能够基于多模态输入生成整个场景。
为了训练用于形状生成的生成式预训练变换器(GPT),我们使用离散的3D形状标记并将它们与文本提示对齐。这种新颖的方法为我们开创了可玩的3D场景生成世界。
Cube的未来发展方向
今天,世界上大多数人使用AI进行文本处理,预测句子中的词语。许多人也将其用于图像,预测像素。当创建场景时,所有这些元素汇集在一起并需要在相互关联的环境中工作,这变得更加复杂。例如,想象一个可以描述为"在赛道前有树木的摩托车上的avatar"的简单场景体验。
构建这一体验需要许多元素。树木是两个3D网格的组合,摩托车是一个带有细节和三角形的密集网格,建筑物由Roblox部件组成。摩托车上的avatar在身体、肢体和头部有更复杂的几何特征。最后,我们需要一种方法将所有这些联系在一起形成布局。为此,我们需要边界框,它概述了一个对象以定义其大小和位置,以知道如何安排这种几何结构。这是一个艰巨的过程,但AI能够帮助完成每一步。通过AI,创作者可以更快地完成第一个版本,有更多时间测试新想法或完善他们的场景。
当我们实现这一目标时,我们希望我们创建的3D对象和场景能够完全发挥功能。我们称之为4D创作,其中第四维是对象、环境和人之间的互动。实现这一点不仅需要构建沉浸式3D对象和场景的能力,还需要理解这些对象之间的上下文和关系。这就是我们通过Cube所要达到的目标。
除了网格生成的首个用例外,我们计划扩展到场景生成和理解。我们将能够为用户提供他们最感兴趣的体验,并通过在上下文中添加对象来增强场景。例如,在一个森林场景的体验中,开发者可以要求助手将树上所有茂盛的绿叶替换为秋季落叶,以表示季节的变化。我们的AI助手工具响应开发者的请求,帮助他们快速创建、调整和扩展他们的体验。
热门评论
最新评论