当前位置：首页 > 文章列表 > 科技周边 > 人工智能 > 一块GPU，每秒20个模型！英伟达新玩具用GET3D造元宇宙

一块GPU，每秒20个模型！英伟达新玩具用GET3D造元宇宙

来源：51CTO.COM 2023-04-29 11:39:50 0浏览收藏

偷偷努力，悄无声息地变强，然后惊艳所有人！哈哈，小伙伴们又来学习啦~今天我将给大家介绍《一块GPU，每秒20个模型！英伟达新玩具用GET3D造元宇宙》，这篇文章主要会讲到等等知识点，不知道大家对其都有多少了解，下面我们就一起来看一吧！当然，非常希望大家能多多评论，给出合理的建议，我们一起学习，一起进步！

Abracadabra！

在2D生成3D模型上，英伟达亮出了自称「世界级」研究：GET3D。

通过2D图像训练后，该模型可生成具有高保真纹理和复杂几何细节的3D形状。

究竟有多厉害？

形状、纹理、材质自定义

GET3D之所以得名，是因为它能够生成显式纹理3D网格（Generate Explicit Textured 3D meshes ）。

论文地址：https://arxiv.org/pdf/2209.11163.pdf

也就是说，它创建的形状是三角形网格的形式，就像纸模型一样，上面覆盖着纹理材质。

关键是，这个模型可以生成多种多样，且高质量的模型。

比如，椅子腿上的各种轮子；汽车的车轮，灯和车窗；动物的耳朵、角；摩托车的后视镜，车轮胎上的纹理；高跟鞋，人类衣服...

街道两旁的独特建筑，不同的车辆呼啸而过，还有不同的人群穿梭而过...

若想通过手动建模做出同样的3D虚拟世界非常耗时。

尽管先前的3D生成AI模型虽然比手动建模更快，但它们在生成更多丰富细节模型的能力还是欠缺。

即便是，最新的逆向渲染方法也只能基于从各个角度拍摄的2D图像生成3D对象，开发人员一次只能构建一个3D物体。

GET3D可就不一样了。

开发者可以轻松地将生成模型导入到游戏引擎、3D建模器和电影渲染器中，对它们进行编辑。

当创建者将GET3D生成的模型导出到图形应用程序，他们就可以在模型所在的场景中移动或旋转时应用逼真的照明效果。

如图所示：

另外，GET3D还可以做到文本引导形状生成。

通过使用英伟达的另一个AI工具StyleGAN-NADA，开发人员可以使用文本提示为图像添加特定的风格。

比如，可以将渲染后的汽车变成一辆烧毁的汽车或出租车

将一个普通的房子改造成砖房、着火的房子，甚至是鬼屋。

或者将老虎纹、熊猫纹的特色应用在任何动物身上...

简直就是辛普森一家的「动物森友会」...

英伟达介绍，在单个英伟达GPU上训练，GET3D每秒可以生成大约20个对象。

在此，它所学习的训练数据集越大、越多样化，输出的多样性和详细程度就越高。

英伟达称，研究团队仅用2天时间，就使用A100 GPU在大约100万张图像上训练了模型。

研究方法与过程

GET3D框架，主要作用是合成有纹理的三维形状。

生成过程分为两个部分：第一部分是几何分支，可以输出任意拓扑结构的表面网格。另一部分则是纹理分支，它会产生一个纹理场，由此可以在表面点上进行查询。

在训练过程中，一个可微分光栅化器被用来高效渲染所产生的纹理网格，并渲染成二维的高分辨率图像。整个过程是可分的，允许通过传播二维判别器的梯度，从图像中进行对抗性训练。

之后，梯度从二维判别器传播到两个发生器分支。

研究人员又进行了广泛的实验来评估该模型。他们首先将GET3D生成的三维纹理网格的质量与现有的使用ShapeNet和Turbosquid数据集生成的做比较。

接下来，研究人员根据对比结果在之后的研究中对模型进行了优化，并做了更多实验。

GET3D模型在几何形状和纹理能够实现相分离。

如图，在每一行中展示了由相同的几何隐藏代码生成的形状，同时更改了纹理代码。

在每一列中展示了由相同的纹理隐藏代码生成的形状，同时更改了几何代码。

另外，研究人员在每一行中相同的纹理隐藏代码生成的形状，从左到右插入几何隐藏代码。

并由相同的几何隐藏代码生成的形状，同时从上到下插入纹理代码。结果显示，每个插值对生成模型都是有意义的。

在每个模型的子图中，GET3D能够在所有类别的不同形状之间的生成实现平滑过渡。

在每一行中，通过添加一个小噪声来局部扰乱隐藏代码。通过这种方式，GET3D能够在局部生成外观相似但略有差异的形状。

研究人员指出，未来版本的GET3D可以使用摄像机姿态估计技术，让开发人员训练模型的现实世界的数据，而不是合成数据集。

未来，通过改进，开发人员可以在各种3D形状上一次性训练GET3D，而不需要一次在一个对象类别上训练它。

英伟达人工智能研究副总裁Sanja Fidler表示，

GET3D让我们离人工智能驱动的3D内容创作大众化又近了一步。它即时生成带纹理3D形状的能力可能会改变开发人员的游戏规则，帮助他们用各种有趣的对象快速填充虚拟世界。

作者介绍

论文一作Jun Gao是多伦多大学机器学习小组的博士生，导师是Sanja Fidler。

除了学历优异以外，他还是英伟达多伦多人工智能实验室的研究科学家。

他的研究主要集中在深度学习（DL），目标直指结构化几何表示学习。同时，他的研究还从人类对2D和3D图像、视频的感知中获得见解。

这么一位优秀的高材生，来自北京大学。他于2018年本科毕业，获得学士学位。在北大期间，他和王立威教授一同工作。

毕业后他还在斯坦福大学、MSRA和英伟达进行过实习。

Jun Gao的导师同样是业内翘楚。

Fidler是多伦多大学的副教授，Vector研究所的一名教师，同时，她还是该研究所的联合创始成员之一。

教学之外，她还是英伟达公司的人工智能研究副总裁，领导着多伦多的一个研究实验室。

在来到多伦多之前，她是芝加哥丰田技术研究所的研究助理教授。该研究所位于芝加哥大学校园内，算是个学术机构。

Fidler的研究领域集中在计算机视觉（CV）和机器学习（ML），聚焦于CV和图形学的交叉领域、三维视觉，以及三维重建与合成，还有图像注释的互动方法等等。

好了，本文到此结束，带大家了解了《一块GPU，每秒20个模型！英伟达新玩具用GET3D造元宇宙》，希望本文对你有所帮助！关注golang学习网公众号，给大家分享更多科技周边知识！

模型英伟达

版本声明

本文转载于：51CTO.COM 如有侵犯，请联系study_golang@163.com删除

华为云与多家企业发布行动倡议：共建自动驾驶开放产业生态

华为云与多家企业发布行动倡议：共建自动驾驶开放产业生态

上一篇: 华为云与多家企业发布行动倡议：共建自动驾驶开放产业生态

无需下游训练，Tip-Adapter大幅提升CLIP图像分类准确率

下一篇: 无需下游训练，Tip-Adapter大幅提升CLIP图像分类准确率

评论列表

美好的发夹

很棒，一直没懂这个问题，但其实工作中常常有遇到...不过今天到这，帮助很大，总算是懂了，感谢大佬分享技术贴！

2023-05-08 01:47:25
专注的菠萝

这篇文章内容太及时了，太全面了，很好，已收藏，关注大佬了！希望大佬能多写科技周边相关的文章。

2023-05-05 22:18:24
甜蜜的大米

这篇文章出现的刚刚好，up主加油！

2023-05-04 12:52:16
清秀的信封

很详细，收藏了，感谢up主的这篇技术贴，我会继续支持！

2023-05-03 20:37:23

查看更多

最新文章

科技周边 · 人工智能 | 14小时前 | 人工智能 · 前端流式输出 · AI聊天 · Fetch Stream · 前端 AI聊天流式输出 ReadableStream TextDecoder Fetch Stream

AI 聊天流式输出前端配方：用 Fetch Stream 实现逐字渲染和中断控制

448浏览收藏
科技周边 · 人工智能 | 1天前 | 人工智能 · rag · 向量数据库 · 检索增强生成 · 人工智能 AI应用 RAG embedding 向量检索

RAG 答非所问怎么排查：从切块、向量到召回上下文

427浏览收藏
科技周边 · 人工智能 | 1星期前 | 人工智能 · rag · 向量检索 · 知识库问答 · AI工程化 · 人工智能知识库 RAG 重排向量检索文档切分证据引用

AI 知识库检索召回工作流：从文档切分到重排和证据引用

191浏览收藏
科技周边 · 人工智能 | 1星期前 | JSON · 人工智能 · 结构化输出 · 大模型接口 · 后端接入 · 人工智能 JSON AI接口 Schema 结构化输出

AI 接口 JSON 返回不稳定排查：从提示词到结构化输出

299浏览收藏
科技周边 · 人工智能 | 1星期前 | 人工智能 · mcp · ai agent · 工具接入 · 安全审计 · AI Agent MCP Model Context Protocol 工具清单资源上下文权限审计

MCP 服务接入工作流：从工具清单到权限审计的 AI Agent 落地路线

378浏览收藏
科技周边 · 人工智能 | 1星期前 | 人工智能 · ai agent · 工具调用 · 结构化输出 · 工程排查 · AI Agent Schema 结构化输出超时重试工具调用兜底回答

AI Agent 工具调用失败排查：从 Schema 到超时兜底的完整工作流

195浏览收藏
科技周边 · 人工智能 | 1星期前 | 人工智能 · rag · 知识库检索 · RAG 向量检索 AI知识库混合召回结果重排

AI 知识库检索不到答案排查：从分块到重排的 RAG 修复流程

453浏览收藏
科技周边 · 人工智能 | 1星期前 | 人工智能 · AI工程 · 成本控制 · 人工智能成本控制 AI接口 token预算 Batch API

AI 批量调用成本控制：从请求日志到预算阈值的完整工作流

202浏览收藏
科技周边 · 人工智能 | 1星期前 | 人工智能 · rag · 知识库 · AI工程实践 · 人工智能 RAG 知识库问答向量检索引用检查

AI 知识库回答跑偏怎么办：RAG 检索、重排和引用检查完整流程

419浏览收藏
科技周边 · 人工智能 | 1星期前 | 人工智能 · ai agent · 工程实践 · AI Agent 上下文管理人工确认多智能体交接摘要

AI Agent 交接跑偏怎么办：从意图检查到交接摘要一步步排查

170浏览收藏
科技周边 · 人工智能 | 1星期前 | 人工智能 · 质量检查 · AI应用 · 提示词工程 · 回归测试 · 大模型应用回归测试人工复核 AI提示词评分规则上线检查

AI 提示词回归测试实战：小样本集、评分规则和上线前对比

475浏览收藏
科技周边 · 人工智能 | 2星期前 | 人工智能 · tracing · ai agent · 可观测性 · 工具调用 · 可观测性 AI Agent Tracing 工具调用 OpenAI Agents SDK

AI Agent Tracing 实战：工具调用、护栏和人工确认怎么追踪

292浏览收藏

查看更多

课程推荐

前端进阶之JavaScript设计模式

设计模式是开发人员在软件开发过程中面临一般问题时的解决方案，代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景，打造一站式知识长龙服务，适合有JS基础的同学学习。

543次学习
GO语言核心编程课程

本课程采用真实案例，全面具体可落地，从理论到实践，一步一步将GO核心编程技术、编程思想、底层实现融会贯通，使学习者贴近时代脉搏，做IT互联网时代的弄潮儿。

516次学习
简单聊聊mysql8与网络通信

如有问题加微信：Le-studyg；在课程中，我们将首先介绍MySQL8的新特性，包括性能优化、安全增强、新数据类型等，帮助学生快速熟悉MySQL8的最新功能。接着，我们将深入解析MySQL的网络通信机制，包括协议、连接管理、数据传输等，让

500次学习
JavaScript正则表达式基础与实战

在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。

487次学习
从零制作响应式网站—Grid布局

本系列教程将展示从零制作一个假想的网络科技公司官网，分为导航，轮播，关于我们，成功案例，服务流程，团队介绍，数据部分，公司动态，底部信息等内容区块。网站整体采用CSSGrid布局，支持响应式，有流畅过渡和展现动画。

485次学习

查看更多

AI推荐

ljg-skills

ljg-skills 是李继刚开源的 AI 技能与提示词集合，面向大模型使用者整理了一批可复用的 prompt、角色设定和任务技能模板，适合用于学习提示词设计、搭建个人 AI 工作流和沉淀团队常用智能体能力。

2661次使用
MELO音乐

MELO音乐是一站式AI视频与音乐制作助手，对标suno, udio的高品质体验。提供伴奏生成、原创写词、无损导出、哼唱识曲、混音变声等全套音频与短视频编辑工具。无论是流行Kpop、电音说唱、民谣古风、摇滚儿歌还是商用轻音乐，MELO为你免费谱曲，轻松做同款！

2455次使用
UniScribe

UniScribe 是一款 AI 音视频转文字与内容整理工具，支持上传音频、视频文件或粘贴 YouTube 链接，自动生成转写文本、摘要、思维导图和关键问题，并支持多格式导出，适合会议记录、课程学习、访谈整理和内容创作复盘。

2396次使用
剧云

剧云是专业中文剧本创作平台，安全稳定运行十余年，集成AI编剧、剧本医生审核、人物小传、剧情关系图、大纲编写、多人协作、Word导入导出、版权管控功能，数据安全防护，轻松高效创作剧本。

2628次使用
万象有声

万象有声，一个专为有声创作者打造的新一代智能有声内容创作平台。平台提供专业的智能拆章、智能画本编辑、AI配音、AI生成音效、后期制作、智能对轨、智能审听等有声创作全流程工具，可以帮助创作者高效、低成本创作出引人入胜的有声作品。立即体验，让有声书制作更简单！

2578次使用

查看更多

相关文章

AI写作工具免费版安装教程（含豆包Clawdbot）

2026-05-30 501浏览
WPS AI能自动生成PPT吗？输入主题一键制作演示文稿

2026-05-27 501浏览
Canva手机闪退解决方法及适配指南

2026-05-25 501浏览
Hermes Agent依赖的工具链有哪些必备工具链介绍

2026-05-05 501浏览
千问AI官网地址链接入口_千问AI官方网站登陆入口

2026-05-05 501浏览

Golang学习网：公益在线Go学习平台，帮助Go学习者快速成长！

技术交流群

Copyright 2023 http://www.17golang.com/ All Rights Reserved ｜苏ICP备2023003363号-1

关注公众号

Golang学习网

微信登录更方便

密码登录
注册账号

登录即同意用户协议和隐私政策

返回登录

重置密码