首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

【一手实测】Tripo 2.0：AI 3D生成天花板再拉升！

文摘 2024-09-26 13:57 江苏

长期以来，3D大模型领域虽然不如语言模型和视频模型那样受人瞩目，但全球的3D大模型开发者们却一直在暗中较劲，不断推进技术的发展。

从风投机构a16z支持的Yellow，到李飞飞领导的World Labs，3D大模型的迭代速度从未放缓。

最近，国内领先的3D大模型公司VAST 更新了其旗舰产品Tripo，这是一个基于千万级高质量原生数据库训练的高性能版本。

该3D生成工具不仅支持文字输入，还可以接受单张或多张图片作为输入。在几何精细度和图片还原度方面，新工具的表现都令人印象深刻。

Tripo建模效果

Tripo 2.0实测

此次更新的Tripo 2.0可以在几秒内生成几何形状的预览，紧接着再用几秒为其生成纹理和PBR。

用户既可以通过输入文本提示（prompt）生成3D模型，也可以输入单张图片生成模型，每次都可以生成4个模型，从中挑选。此外， Tripo 1.4 还支持从正视、侧视、后视等多张图片生成3D模型。

目前，Tripo 2.0 已正式上线，事不宜迟直接开测。

#构建现实中的物体

首先测试一波对真实物品的还原程度，比如手边的一个玩偶熊，输入一段描述词：” 一个坐着的穿着红色毛衣红色帽子和棕红色背带裤的毛茸茸的玩偶熊 “，确实是细节满满，所有提及的特征都有显现。就文生模型而言，没法苛求太多。

玩偶熊文生模型，来源：Tripo 官网

接下来测试一下单张图片生成模型，可以看到大体上做到了几何和外观的准确还原，但是细看之下帽子、衣服的细节还有不少优化空间，不过最惊艳的是背部的建模，在只有单张正视图片输入的情况下，几乎完美还原了玩偶的背部特征，比如背带和露出来的小短尾，好评！

玩偶熊图生模型，来源：Tripo 官网

#构建虚拟世界中的物体

下面我们来试试能不能直接构建电影世界中的神奇生物。

输入“神奇动物在哪里中的嗅嗅”，可以发现产出的模型确实和嗅嗅有着微妙的联系，比如都有黑色的毛发、扁长的嘴巴，但仔细一看又是天差地别，完全是不同的生物。

嗅嗅文生模型，来源：Tripo 官网

如果说文生模型可能存在版权问题，那么再试试图生模型，直接给定一张嗅嗅的剧照，尽管输入图片的质量有点糟糕，环境十分昏暗，但生成的模型意外的相当靠谱，背部细节也是有模有样。

嗅嗅图生模型，来源：Tripo 官网

此外，生成好的模型还支持一键绑定骨骼和风格化，并且支持包括glb、fbx、obj、stl等多种主流格式输出。

模型调整与输出，来源：Tripo 官网

Tripo 2.0如何炼成？

从技术层面深入剖析，可以发现Tripo 2.0 在实现过程中几乎全面贯彻了“3D Scaling Law”的理念。

首先，它基于一个包含千万级高质量3D数据的大型数据库，采用概率生成式建模方法，通过学习大规模数据中的几何和材质分布，从而确保输出的质量、增强模型的鲁棒性和泛化能力。

其次，Tripo 2.0 采用了 DiT 和 U-Net 模型的复杂混合架构。DiT 擅长捕捉3D结构中的全局上下文和长距离依赖关系，而 U-Net 则擅长保留精细的细节和局部特征。这种架构的融合使 Tripo 2.0 能够在全局和局部层面都表现出色。

此外，Tripo 2.0 采用了最先进的训练算法。其几何和材质生成模型都基于最先进的大规模流模型，拥有数十亿参数。同时，通过采用 guidance distillation 和 step distillation 技术，Tripo 2.0 在不牺牲质量的前提下大幅优化了性能，提高了效率。

在这些技术的加持下，Tripo 2.0 在3D形状生成、纹理质量、细节表现、输入条件的遵循性以及输出多样性等方面都取得了新的SOTA成绩，货真价实的“六边形战士”。

Tripo与其它SOTA模型定量对比

槿墨AI

产品服务

结合大模型通用知识及在交通、社会治理、安全生产、自然资源等行业领域的知识，深入业务场景，精确捕获用户意图，为用户提供智能问答、数据分析、报表生成、工作任务理解与执行等一系列服务

📞若您有相关需求，欢迎点击下方链接与我们沟通洽谈

🗨️也可以在公众号后台给我们留言

http://mp.weixin.qq.com/s?__biz=MzkwMjY0ODMwNA==&mid=2247486862&idx=1&sn=babd8cc22f9d97a81c815f4abbb0470c

开启探索人类未来命运的旅程，拥抱如槿似墨的无限可能。

最新文章

【文生智界】WonderWorld：一图在手，世界我有

【文生智界】介绍一下，Stable Diffusion！文生图的稳定之选

【文生智界】AI将3D建模带入大众视野，创意如何突破技术壁垒？

告别预设剧本，“人生”永无止境：Unbounded

国庆节火遍抖音的AI雷军从何而来——GPT-SoVits

ChatGPT终于变AI搜索引擎了！网页/手机/桌面版同时上线，即将人人可用

7天开发一个AI Agent应用！秘密武器：一体化数据库

苹果AI上线，ChatGPT免费用！首款M4 Mac诞生

大模型“投资热”降温，下半场转向“应用落地”

POINTS多模态大模型亮相：微信团队打造，高效简洁性能强

港大最新开源LightRAG：更快、更强、更经济的RAG系统

AIGC丨ChatGPT的流式输出技术SSE实践！

Claude 3.5深夜觉醒，学会模仿人类用电脑！编程干翻o1，Agent一夜变天

切，这玩意儿不就是一眼 AI …… 吧？

字节：不做眼镜做耳机，揭秘Ola Friend核心技术

YOLO11：重新定义性能极限！对比YOLO8如何？

H100价格大跌！GPU供需失衡，真过剩？

大语言模型垂直领域融合的最优解：微调or检索增强生成?

长文本、语音、视觉全覆盖，中国移动抬上大招：九天善智！

李飞飞「数字表兄弟」破解机器人训练难题！零样本sim2real成功率高达90%

LLM（大语言模型），我们距离应用还差什么？

特斯拉首款无人驾驶出租问世，马斯克掀翻全场！无方向盘、无踏板，3万美元26年量产

诺贝尔物理和化学奖都颁给了AI，意味着什么？

双向奔赴！什么是大模型和数据库的双向赋能？

Meta首款多模态Llama 3.2开源！1B羊驼宝宝，跑在手机上了

RT-DETRv3横空出世！探究实时目标检测的尽头

【一手实测】Tripo 2.0：AI 3D生成天花板再拉升！

聊聊3DGS，各应用方向的最新进展是？

李飞飞创业后的首个专访：空间智能是下一个“北极星”

CoT神话破灭，并非LLM标配！三大学府机构联手证实，CoT仅在数学符号推理有用

用AI和宠物闲聊，解锁「毛孩子」语言，铲屎官心动！

Qwen2.5登上全球开源王座！72B模型击败LIama3 405B，轻松胜过GPT-4o-mini

【盘点】AI视觉算法主流部署方式，到底怎么选？

会领路、能聊天，现在的导航已经next level了

深夜空降！OpenAI草莓正式发布，命名o1， GPT-4o被碾压！

对话Qwen2-VL：多模态大模型背后的逻辑

上交大：让代码自动成长！培养你的专属宝可梦

PyTorch官宣去CUDA推理！Triton时代来了

Andrej Karpathy最新采访：认知核心模型10亿参数就够了，AI会打破教育不公的僵局

FairMOT：解锁复杂环境下多目标跟踪的难题！

Cursor：开发者的新质生产力，人人都是程序员？

机器人身穿衣服做家务，逼真到被质疑是人类套壳

大模型应用新战场：揭秘终端侧AI竞争关键｜智在终端

全国首个上手机的AI视频通话来了！《黑神话：悟空》经文也能破译

【深度解读】政务大模型的产业图谱、企业布局与落地应用

又创新？U-KAN：专注图像边界细节优化的网络架构！

AI开启“城市漫步”，这Citywalk够不够贴心！

【梳理】主流推荐算法：如何让AI更精准地“猜你喜欢”？

Midjourney地位不稳？AI绘图又一黑马出现，附4款产品一手实测

实测！30秒即可生成工业级Mesh，媲美人工建模？

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉