YOLOv8-OBB C++工程部署实战：从模型转换到多场景推理

张

张建站

2026/5/7 18:25:10

10分钟阅读

1. YOLOv8-OBB模型部署全景指南旋转目标检测OBB在遥感图像分析、自动驾驶和工业质检等领域应用广泛。YOLOv8-OBB作为最新一代旋转框检测模型相比传统水平框检测能更精确地定位倾斜物体。但在实际工程落地时很多开发者会遇到模型转换和C部署的难题。本文将手把手带你完成从PyTorch模型到C生产环境的完整部署流程。我最近在一个无人机巡检项目中部署了YOLOv8-OBB模型实测在Intel i7-11800H CPU上能达到45FPS的推理速度。整个过程踩过不少坑比如ONNX导出时的节点不兼容问题、旋转框NMS的实现细节等。下面就把这些实战经验分享给大家。2. 模型转换从PyTorch到ONNX2.1 准备训练好的模型首先确保你有一个训练好的.pt模型文件。YOLOv8-OBB的训练可以使用Ultralytics官方代码库python train.py --data custom.yaml --weights yolov8s-obb.pt --img 640 --batch 32 --epochs 100训练完成后会得到best.pt文件。这里有个关键点官方代码默认输出的是角度范围为[-90°, 0°]的旋转框如果需要[0°, 180°]的范围需要修改utils/ops.py中的旋转框编码逻辑。2.2 导出ONNX模型使用官方export.py脚本转换时有几个参数需要特别注意python export.py --weights best.pt --include onnx --opset 12 --dynamic Falseopset版本建议使用12或更高低版本可能不支持某些算子dynamic参数部署到C环境时设为False可以简化推理流程简化ONNX模型使用onnx-simplifier优化计算图python -m onnxsim best.onnx best_sim.onnx我遇到过因为动态维度导致OpenCV读取失败的情况错误提示Failed to read onnx model。解决方法就是导出时加上--dynamic False参数。3. C工程环境配置3.1 基础依赖安装推荐使用Ubuntu 20.04 LTS系统主要依赖包括OpenCV 4.5.0必须包含dnn模块ONNX Runtime 1.8CMake 3.10安装命令示例sudo apt install build-essential cmake wget https://github.com/opencv/opencv/archive/4.5.5.tar.gz tar -xvf 4.5.5.tar.gz cd opencv-4.5.5 mkdir build cd build cmake -DCMAKE_BUILD_TYPERELEASE -DWITH_OPENMPON .. make -j8 sudo make install3.2 CMake工程配置完整的CMakeLists.txt配置如下cmake_minimum_required(VERSION 3.10) project(YOLO_OBB_DEPLOY) set(CMAKE_CXX_STANDARD 14) # OpenCV配置 find_package(OpenCV REQUIRED) include_directories(${OpenCV_INCLUDE_DIRS}) # ONNX Runtime配置 set(ONNXRUNTIME_ROOT /path/to/onnxruntime) set(ONNXRUNTIME_INCLUDE ${ONNXRUNTIME_ROOT}/include) set(ONNXRUNTIME_LIB ${ONNXRUNTIME_ROOT}/lib) link_directories(${ONNXRUNTIME_LIB}) # 可执行文件 add_executable(yolo_obb_infer src/main.cpp) target_link_libraries(yolo_obb_infer ${OpenCV_LIBS} onnxruntime )关键点说明OpenCV必须启用dnn模块ONNX Runtime建议使用Linux预编译版本C标准需要至少C144. 核心推理代码实现4.1 图像预处理YOLOv8-OBB的输入需要归一化到0-1范围并保持长宽比resize到640x640cv::Mat preprocess(const cv::Mat src, cv::Size target_size) { cv::Mat dst; cv::Vec4d params; // 保持长宽比的resize float r min(target_size.width / (float)src.cols, target_size.height / (float)src.rows); cv::Size new_size(src.cols * r, src.rows * r); cv::resize(src, dst, new_size); // 计算填充边界 int dw target_size.width - new_size.width; int dh target_size.height - new_size.height; int top dh / 2, bottom dh - top; int left dw / 2, right dw - left; // 填充灰色边框 cv::copyMakeBorder(dst, dst, top, bottom, left, right, cv::BORDER_CONSTANT, cv::Scalar(114, 114, 114)); // 保存缩放和填充参数用于后处理 params[0] r; params[1] r; params[2] left; params[3] top; // 归一化并转换为NCHW格式 dst.convertTo(dst, CV_32F, 1.0 / 255.0); cv::dnn::blobFromImage(dst, dst); return dst; }4.2 ONNX Runtime推理初始化ONNX Runtime会话Ort::Env env(ORT_LOGGING_LEVEL_WARNING, YOLOv8-OBB); Ort::SessionOptions session_options; session_options.SetIntraOpNumThreads(1); // 使用CUDA加速可选 // Ort::ThrowOnError(OrtSessionOptionsAppendExecutionProvider_CUDA(session_options, 0)); Ort::Session session(env, best_sim.onnx, session_options); // 获取输入输出信息 Ort::AllocatorWithDefaultOptions allocator; std::vectorconst char* input_names {session.GetInputName(0, allocator)}; std::vectorconst char* output_names {session.GetOutputName(0, allocator)};执行推理// 准备输入张量 std::vectorint64_t input_shape {1, 3, 640, 640}; Ort::MemoryInfo memory_info Ort::MemoryInfo::CreateCpu( OrtArenaAllocator, OrtMemTypeDefault); Ort::Value input_tensor Ort::Value::CreateTensorfloat( memory_info, blob.ptrfloat(), blob.total(), input_shape.data(), input_shape.size()); // 运行推理 auto outputs session.Run(Ort::RunOptions{nullptr}, input_names.data(), input_tensor, 1, output_names.data(), output_names.size()); // 获取输出数据 float* output_data outputs[0].GetTensorDatafloat();4.3 旋转框后处理旋转框NMS是部署中最复杂的部分需要自己实现struct RotatedBox { cv::RotatedRect rect; float score; int class_id; }; float rotatedIoU(const cv::RotatedRect box1, const cv::RotatedRect box2) { std::vectorcv::Point2f intersection; cv::rotatedRectangleIntersection(box1, box2, intersection); if(intersection.empty()) return 0.0f; float inter_area cv::contourArea(intersection); float union_area box1.size.area() box2.size.area() - inter_area; return inter_area / union_area; } std::vectorRotatedBox postprocess( float* output, const cv::Size img_size, float conf_thresh0.25, float iou_thresh0.5) { std::vectorRotatedBox boxes; int num_classes 1; // 根据你的模型调整 int num_proposals 8400; // yolov8默认值 // 解析输出 for(int i 0; i num_proposals; i) { float* ptr output i * (5 num_classes); float cx ptr[0] * img_size.width; float cy ptr[1] * img_size.height; float w ptr[2] * img_size.width; float h ptr[3] * img_size.height; float angle ptr[4] * 180 / CV_PI; // 弧度转角度 // 找到最大类别分数 float max_score 0; int class_id -1; for(int c 0; c num_classes; c) { float score ptr[5 c]; if(score max_score) { max_score score; class_id c; } } if(max_score conf_thresh) { boxes.push_back({ cv::RotatedRect(cv::Point2f(cx, cy), cv::Size2f(w, h), angle), max_score, class_id }); } } // 旋转框NMS std::vectorint indices; cv::dnn::NMSBoxes(boxes, conf_thresh, iou_thresh, indices); std::vectorRotatedBox results; for(int idx : indices) { results.push_back(boxes[idx]); } return results; }5. 多场景推理实现5.1 单张图像推理基础流程如下cv::Mat img cv::imread(test.jpg); cv::Mat blob preprocess(img, cv::Size(640, 640)); // 运行推理 auto outputs session.Run(...); // 后处理 auto detections postprocess(outputs[0].GetTensorDatafloat(), img.size()); // 可视化结果 for(const auto det : detections) { cv::Point2f vertices[4]; det.rect.points(vertices); for(int j 0; j 4; j) { cv::line(img, vertices[j], vertices[(j1)%4], cv::Scalar(0, 255, 0), 2); } } cv::imwrite(result.jpg, img);5.2 实时视频流处理视频推理需要处理帧率问题cv::VideoCapture cap(0); // 打开摄像头 cv::VideoWriter writer(output.mp4, cv::VideoWriter::fourcc(M,J,P,G), 30, cv::Size(640, 480)); while(true) { cv::Mat frame; cap frame; if(frame.empty()) break; auto start std::chrono::high_resolution_clock::now(); // 预处理推理后处理 cv::Mat blob preprocess(frame, cv::Size(640, 640)); auto outputs session.Run(...); auto detections postprocess(...); auto end std::chrono::high_resolution_clock::now(); auto duration std::chrono::duration_caststd::chrono::milliseconds(end - start); // 显示FPS std::string fps FPS: std::to_string(1000.0 / duration.count()); cv::putText(frame, fps, cv::Point(10, 30), cv::FONT_HERSHEY_SIMPLEX, 1, cv::Scalar(0, 0, 255), 2); writer.write(frame); cv::imshow(YOLOv8-OBB, frame); if(cv::waitKey(1) 27) break; // ESC退出 }5.3 批量图像处理对于工业质检等场景可能需要处理整个文件夹的图片std::vectorcv::String filenames; cv::glob(dataset/*.jpg, filenames); #pragma omp parallel for for(size_t i 0; i filenames.size(); i) { cv::Mat img cv::imread(filenames[i]); // ...处理逻辑... std::string result_path results/ filenames[i].substr(filenames[i].find_last_of(/\\) 1); cv::imwrite(result_path, img); }6. 性能优化技巧6.1 多线程加速使用OpenMP实现数据并行#pragma omp parallel for for(int i 0; i batch_size; i) { // 预处理 cv::Mat blob preprocess(images[i], input_size); // 创建输入张量 Ort::Value input_tensor ...; // 推理 #pragma omp critical { outputs session.Run(...); } // 后处理 auto detections postprocess(...); }6.2 内存复用避免频繁申请释放内存// 预分配内存 cv::Mat blob(cv::Size(640, 640), CV_32FC3); std::vectorOrt::Value output_tensors; while(true) { // 复用blob内存 preprocess(frame, blob); // 复用output_tensors session.Run(..., output_tensors); }6.3 量化加速将FP32模型转为INT8量化模型python export.py --weights best.pt --include onnx --int8C端需要对应的量化推理支持Ort::SessionOptions session_options; session_options.SetGraphOptimizationLevel(GraphOptimizationLevel::ORT_ENABLE_ALL); session_options.SetExecutionMode(ExecutionMode::ORT_SEQUENTIAL); session_options.SetIntraOpNumThreads(1);7. 常见问题排查7.1 模型加载失败错误现象[ERROR] Failed to load model best.onnx解决方案检查ONNX模型路径是否正确使用onnxruntime的模型检查工具import onnx onnx_model onnx.load(best.onnx) onnx.checker.check_model(onnx_model)确保ONNX Runtime版本与模型兼容7.2 推理结果异常可能原因预处理与训练时不一致后处理参数错误图像通道顺序问题BGR vs RGB调试方法// 检查预处理后的blob数据 cv::imwrite(preprocess.jpg, blob * 255); // 打印推理输出 float* output outputs[0].GetTensorDatafloat(); for(int i 0; i 100; i) { std::cout output[i] ; }7.3 内存泄漏使用valgrind工具检测valgrind --leak-checkfull ./yolo_obb_infer常见泄漏点没有释放ONNX Runtime资源OpenCV矩阵未释放后处理中的临时vector8. 工程化部署建议8.1 跨平台编译使用CMake实现跨平台支持# Windows特定配置 if(WIN32) set(ONNXRUNTIME_LIB ${ONNXRUNTIME_ROOT}/lib/onnxruntime.lib) # Linux配置 elseif(UNIX) set(ONNXRUNTIME_LIB ${ONNXRUNTIME_ROOT}/lib/libonnxruntime.so) endif()8.2 动态库封装将核心功能封装成动态库class YOLOv8OBB { public: YOLOv8OBB(const std::string model_path); std::vectorRotatedBox detect(const cv::Mat image); private: Ort::Session session_; // ...其他成员变量... };8.3 日志系统集成添加日志记录功能#include fstream class Logger { public: static void log(const std::string message) { std::ofstream logfile(deploy.log, std::ios::app); logfile getCurrentTime() message std::endl; } private: static std::string getCurrentTime() { auto now std::chrono::system_clock::now(); auto in_time_t std::chrono::system_clock::to_time_t(now); std::stringstream ss; ss std::put_time(std::localtime(in_time_t), %Y-%m-%d %X); return ss.str(); } };

如何利用高端SEO提升网站的品牌影响力

引言：高端SEO在品牌影响力提升中的核心作用在当今数字化时代，拥有一个成功的网站不仅仅是一个企业的门面，更是其在市场中的重要竞争力。随着互联网技术的不断进步，搜索引擎优化（SEO）成为了提升网站品牌影…...

2026/4/4 3:18:53 阅读更多 →

【Unity】Damage Numbers Pro插件实战：从预制体到脚本赋值的全流程解析

1. Damage Numbers Pro插件初探：为什么选择它？ 第一次在游戏里看到炫酷的伤害数字效果时，我就被深深吸引了。那些跳动的数字不仅仅是简单的UI显示，而是带有动画、颜色渐变甚至物理效果的视觉盛宴。经过多次尝试不同方案后&#xf…...

2026/4/4 3:18:37 阅读更多 →

MATLAB Appdesigner应用打包实战：从Runtime选择到桌面部署

1. MATLAB Appdesigner应用打包入门指南第一次用MATLAB Appdesigner做完界面设计时，那种成就感简直爆棚。但当我兴冲冲想把作品分享给同事使用时，却发现对方电脑上压根没有装MATLAB。这时候我才意识到，应用打包才是真正让作品发挥价值的临门…...

2026/4/4 3:15:36 阅读更多 →

C语言RTOS多核协同失效真相：Cache一致性缺失、内存序乱序、GCC -O2优化陷阱——三重危机诊断工具链实战

更多请点击： https://intelliparadigm.com 第一章：C语言RTOS多核协同失效的系统性认知在嵌入式实时系统中，基于C语言开发的RTOS（如FreeRTOS、Zephyr或RT-Thread）常被移植至ARM Cortex-A/R系列或多核RISC-V SoC平台。…...

2026/5/4 6:26:56 阅读更多 →

Zotero GPT终极指南：用AI轻松读懂学术文献的研究态度与情感倾向

Zotero GPT终极指南：用AI轻松读懂学术文献的研究态度与情感倾向【免费下载链接】zotero-gpt GPT Meet Zotero. 项目地址: https://gitcode.com/gh_mirrors/zo/zotero-gpt 你是否曾被海量学术文献淹没？是否在阅读论文时难以快速把握作者的研究立场…...

2026/5/4 15:30:50 阅读更多 →