SwiftTailor：利用几何图像表示实现高效的 3D 服装生成

张

张建站

2026/5/8 13:21:17

10分钟阅读

来源专知本文约1000字建议阅读5分钟这项工作为下一代 3D 服装生成提供了一个可扩展、可解释且高性能的解决方案。逼真且高效的 3D 服装生成一直是计算机视觉和数字时尚领域的长期挑战。现有方法通常依赖大型视觉语言模型来生成 2D 缝制样板的序列化表示然后使用 GarmentCode 等服装建模框架将其转换为可仿真的 3D 网格。虽然这些方法产出了高质量结果但它们往往面临推理速度慢的问题耗时在 30 秒到 1 分钟之间。在这项工作中我们推出了 SwiftTailor这是一个新颖的两阶段框架通过紧凑的几何图像表示统一了缝制样板推理和基于几何的网格合成。SwiftTailor 包含两个轻量化模块PatternMaker一个能从多种输入模态预测缝制样板的高效视觉语言模型和 GarmentSewer一个高效的密集预测 Transformer可将这些样板转换为新颖的服装几何图像在统一的 UV 空间中编码所有服装裁片的 3D 表面。最终的 3D 网格通过高效的逆映射过程重建该过程结合了重网格化和动态缝合算法来直接组装服装从而抵消了物理仿真的开销。在 Multimodal GarmentCodeData 上的广泛实验表明SwiftTailor 在显著缩短推理时间的同时实现了最先进的准确度和视觉逼真度。这项工作为下一代 3D 服装生成提供了一个可扩展、可解释且高性能的解决方案。关于我们数据派THU作为数据科学类公众号背靠清华大学大数据研究中心分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识努力建设数据人才聚集平台、打造中国大数据最强集团军。新浪微博数据派THU微信视频号数据派THU今日头条数据派THU

Cursor + Claude 3.7：解锁高效编程新范式

1. 为什么开发者需要CursorClaude 3.7组合最近在重构一个遗留的电商系统时，我遇到了所有程序员都头疼的问题：面对20万行混杂着jQuery和Vue的祖传代码，光是理清支付模块的业务逻辑就花了三天。直到同事推荐了CursorClaude 3.7这个组合&#x…...

2026/4/2 10:23:39 阅读更多 →

Visual C++运行库深度修复指南：从问题诊断到系统优化

Visual C运行库深度修复指南：从问题诊断到系统优化【免费下载链接】vcredist AIO Repack for latest Microsoft Visual C Redistributable Runtimes 项目地址: https://gitcode.com/gh_mirrors/vc/vcredist 一、问题溯源：运行库故障的本质与影响…...

2026/4/2 10:23:35 阅读更多 →

从YOLOv5到GraspNet：手把手教你用Python实现机械臂的‘眼睛’和‘大脑’（附避坑指南）

从YOLOv5到GraspNet：手把手教你用Python实现机械臂的‘眼睛’和‘大脑’（附避坑指南） 机械臂的智能化抓取一直是工业自动化和机器人领域的核心挑战。想象一下，当你面对一堆杂乱摆放的零件，需要机械臂准确识别、定位并抓…...

2026/4/2 10:23:25 阅读更多 →

C语言RTOS多核协同失效真相：Cache一致性缺失、内存序乱序、GCC -O2优化陷阱——三重危机诊断工具链实战

更多请点击： https://intelliparadigm.com 第一章：C语言RTOS多核协同失效的系统性认知在嵌入式实时系统中，基于C语言开发的RTOS（如FreeRTOS、Zephyr或RT-Thread）常被移植至ARM Cortex-A/R系列或多核RISC-V SoC平台。…...

2026/5/8 3:27:44 阅读更多 →

Zotero GPT终极指南：用AI轻松读懂学术文献的研究态度与情感倾向

Zotero GPT终极指南：用AI轻松读懂学术文献的研究态度与情感倾向【免费下载链接】zotero-gpt GPT Meet Zotero. 项目地址: https://gitcode.com/gh_mirrors/zo/zotero-gpt 你是否曾被海量学术文献淹没？是否在阅读论文时难以快速把握作者的研究立场…...

2026/5/8 1:39:53 阅读更多 →