YOLOv13模型导出教程：一键转换为ONNX/TensorRT格式

张

张建站

2026/4/18 18:50:15

10分钟阅读

YOLOv13模型导出教程一键转换为ONNX/TensorRT格式1. 环境准备与快速验证1.1 激活预置环境YOLOv13官版镜像已包含完整的运行环境无需额外配置# 激活conda环境 conda activate yolov13 # 进入项目目录 cd /root/yolov131.2 验证基础功能运行快速测试确保环境正常from ultralytics import YOLO # 使用镜像内置权重避免网络下载 model YOLO(/root/yolov13/weights/yolov13n.pt) results model.predict(https://ultralytics.com/images/bus.jpg) print(results[0].boxes)预期输出应包含检测到的物体信息如xyxy: tensor([[ 23.45, 145.67, 456.78, 345.89], ...]) conf: tensor([0.92, 0.85, ...]) cls: tensor([2, 5, ...])2. ONNX格式导出详解2.1 基础导出命令将PyTorch模型转换为ONNX格式model YOLO(/root/yolov13/weights/yolov13s.pt) model.export(formatonnx)关键参数说明dynamicTrue启用动态输入尺寸默认Falseopset17指定ONNX算子集版本默认17simplifyTrue应用ONNX简化优化默认True2.2 动态维度设置适用于可变输入尺寸场景model.export( formatonnx, dynamicTrue, batch1, # 动态batch imgsz[640, 640], # 固定尺寸 devicecpu # 导出设备 )生成文件yolov13s.onnx导出的模型文件yolov13s.onnx.prototxt模型结构描述2.3 ONNX模型验证使用ONNX Runtime进行验证import onnxruntime as ort sess ort.InferenceSession(yolov13s.onnx) input_name sess.get_inputs()[0].name output_names [out.name for out in sess.get_outputs()] # 模拟输入数据 import numpy as np dummy_input np.random.randn(1, 3, 640, 640).astype(np.float32) # 运行推理 outputs sess.run(output_names, {input_name: dummy_input}) print(fONNX输出形状: {[o.shape for o in outputs]})预期输出示例ONNX输出形状: [(1, 84, 8400)]3. TensorRT引擎导出指南3.1 基础引擎导出转换为TensorRT格式model.export( formatengine, device0, # 指定GPU halfTrue, # FP16量化 workspace4 # GB为单位 )关键参数int8True启用INT8量化需校准数据calibdata.yamlINT8校准数据集配置simplifyTrue应用图优化3.2 INT8量化实战实现极致推理加速model.export( formatengine, int8True, calibcoco128.yaml, # 校准数据集 batch32, # 校准批次 device0 )生成文件yolov13s.engine序列化引擎文件calib.cache校准缓存可复用3.3 TensorRT性能测试使用trtexec工具基准测试/usr/src/tensorrt/bin/trtexec \ --loadEngineyolov13s.engine \ --shapesinput:1x3x640x640 \ --useCudaGraph典型输出[TRT] 平均延迟: 2.3ms [TRT] 吞吐量: 435 FPS [TRT] 显存占用: 1.2GB4. 生产环境部署建议4.1 ONNX部署方案4.1.1 OpenVINO推理from openvino.runtime import Core core Core() model core.compile_model(yolov13s.onnx, CPU) output model.infer_new_request({0: input_array})4.1.2 ONNX Runtime优化sess_options ort.SessionOptions() sess_options.graph_optimization_level ort.GraphOptimizationLevel.ORT_ENABLE_ALL sess ort.InferenceSession(yolov13s.onnx, sess_options)4.2 TensorRT部署方案4.2.1 Python接口调用import tensorrt as trt with open(yolov13s.engine, rb) as f: runtime trt.Runtime(trt.Logger(trt.Logger.WARNING)) engine runtime.deserialize_cuda_engine(f.read())4.2.2 C集成示例nvinfer1::IRuntime* runtime nvinfer1::createInferRuntime(logger); std::ifstream engineFile(yolov13s.engine, std::ios::binary); engineFile.seekg(0, std::ios::end); size_t size engineFile.tellg(); engineFile.seekg(0, std::ios::beg); std::vectorchar engineData(size); engineFile.read(engineData.data(), size); nvinfer1::ICudaEngine* engine runtime-deserializeCudaEngine(engineData.data(), size);5. 常见问题解决方案5.1 导出失败排查问题ONNX导出时报shape错误解决方法model.export( formatonnx, simplifyFalse # 先禁用简化 ) # 成功后重新尝试简化问题TensorRT导出时显存不足解决方法export CUDA_MODULE_LOADINGLAZY # 延迟加载CUDA模块5.2 精度下降处理FP16精度问题model.export( formatengine, halfFalse # 禁用FP16 )INT8校准建议model.export( int8True, calibyour_dataset.yaml, # 使用目标领域数据 calibBatch64, calibEp3 )6. 总结与最佳实践6.1 格式选择建议格式适用场景优势注意事项ONNX多平台部署通用性强支持CPU/GPU动态shape需测试TensorRTNVIDIA GPU极致性能低延迟需对应CUDA版本FP16边缘设备节省显存加速推理检查精度损失INT8大规模部署最大加速比需校准数据集6.2 导出流程检查清单[ ] 验证原始模型精度[ ] 选择合适的分辨率imgsz[ ] 设置动态维度如需[ ] 执行导出命令[ ] 验证导出模型精度[ ] 测试目标平台推理6.3 性能优化技巧批处理优化适当增大batch参数如4/8/16内存管理调整workspace大小4-8GBIO绑定使用CUDA Graph减少启动开销持久化缓存复用校准结果.cache文件获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

在 Linux 中查询最耗费 CPU 资源的前 10 个进程的常用脚本

方法一：使用 ps 命令（推荐，最通用）#!/bin/bash # 查看CPU占用最高的10个进程 ps aux --sort-%cpu | head -n 11 | tail -n 10或者更详细的版本：#!/bin/bash echo " CPU使用率最高的10个进程 " printf "…...

2026/4/18 18:48:41 阅读更多 →

Unity开发者效率翻倍：一键自动化Cocoapods集成与Xcode工程构建全流程

Unity-iOS开发效率革命：全自动Cocoapods集成与Xcode工程构建实战指南每次Unity导出Xcode工程后，你是否还在重复执行pod install？当团队协作时，是否常因环境配置差异导致构建失败？本文将彻底改变你的工作流——通过一套…...

2026/4/18 18:43:22 阅读更多 →

从GitHub Copilot到企业级CodeOps：智能生成代码的资源画像建模、实时监控与自动熔断（附开源ResourceGraph工具链）

第一章：智能代码生成代码资源管理 2026奇点智能技术大会(https://ml-summit.org) 智能代码生成正从单点补全迈向系统级资源协同治理，其核心挑战在于如何统一纳管模型提示（Prompts）、上下文模板、领域知识库、历史生成片段及合规…...

2026/4/18 18:39:22 阅读更多 →

终极AssetStudio指南：轻松提取Unity游戏资源的完整教程

终极AssetStudio指南：轻松提取Unity游戏资源的完整教程【免费下载链接】AssetStudio AssetStudio is an independent tool for exploring, extracting and exporting assets. 项目地址: https://gitcode.com/gh_mirrors/ass/AssetStudio 🚀 你是…...

2026/4/16 10:26:51 阅读更多 →

Spring with AI (): 定制对话——Prompt模板引入技

插件化架构 v3 版本最大的变化是引入了模块化插件系统。此前版本中集成在核心包里的原生功能，现在被拆分成独立的插件。每个插件都是一个独立的 Composer 包，包含 Swift 和 Kotlin 代码、权限清单以及原生依赖。开发者只需安装实际用到的插件&#xff0…...

2026/4/18 12:31:27 阅读更多 →

终极指南：如何让微信网页版重新可用？wechat-need-web插件全面解析

终极指南：如何让微信网页版重新可用？wechat-need-web插件全面解析【免费下载链接】wechat-need-web 让微信网页版可用 / Allow the use of WeChat via webpage access 项目地址: https://gitcode.com/gh_mirrors/we/wechat-need-web 还在为微信网…...

2026/4/15 22:38:10 阅读更多 →