Docker部署YOLOv8训练+推理完整教程(含报错解决)
说明1、本教程适配Windows10/Ubuntu20.04/22.04全程一键复制命令无需配置Python、CUDA、PyTorch2、使用Ultralytics官方GPU镜像环境纯净、无版本冲突3、包含环境安装、容器部署、数据集制作、训练、推理、模型导出、全套报错解决方案4、训练必须Nvidia独立显卡CPU仅能推理训练速度极慢不推荐一、前置硬件软件要求1、硬件Nvidia独立显卡驱动版本≥515、空闲硬盘≥20G、内存≥8G2、软件无预装依赖仅需安装Docker3、核心优势容器隔离环境一次部署永久使用不会污染本地电脑环境二、安装Docker环境2.1 Windows系统安装Docker1、下载Docker Desktophttps://www.docker.com/products/docker-desktop/2、默认路径安装安装完成重启电脑3、打开PowerShell输入以下命令验证安装成功docker --version4、Docker设置开启GPU支持Settings → Features → 勾选【Use the WSL 2 based engine】、【Enable GPU support】重启Docker2.2 Ubuntu系统安装Docker复制全部命令一键执行sudo apt update sudo apt install docker.io -y sudo systemctl start docker sudo systemctl enable docker2.3 安装Nvidia GPU容器支持必装Ubuntu系统一键安装curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg distribution$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/libnvidia-container/$distribution/libnvidia-container.list | sed s#deb https://#deb [signed-by/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g | sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list sudo apt update sudo apt install -y nvidia-container-toolkit sudo systemctl restart docker2.4 验证GPU环境是否正常通用验证命令Windows/Ubuntu通用docker run --rm --gpus all nvidia/cuda:11.8.0-base-ubuntu22.04 nvidia-smi输出显卡信息 环境正常报错 显卡驱动过低/未开启GPU支持查看文末排错方案三、拉取YOLOv8官方镜像官方镜像内置CUDA、PyTorch、YOLOv8全部依赖一键拉取docker pull ultralytics/ultralytics:latest四、创建本地工作目录持久化数据作用容器删除后数据集、训练权重、结果依然保存在本地4.1 Windows创建目录手动新建文件夹D:\yolo_workspace内部新建三个子文件夹datasets、runs、weights4.2 Ubuntu一键创建目录mkdir -p ~/yolo_workspace/datasets mkdir -p ~/yolo_workspace/runs mkdir -p ~/yolo_workspace/weights五、启动YOLOv8容器核心命令5.1 Windows启动命令PowerShell执行docker run -it --gpus all ^ -v D:\yolo_workspace:/usr/src/ultralytics ^ -p 8080:8080 ^ ultralytics/ultralytics:latest5.2 Ubuntu启动命令docker run -it --gpus all \ -v ~/yolo_workspace:/usr/src/ultralytics \ -p 8080:8080 \ ultralytics/ultralytics:latest出现rootxxx:/usr/src/ultralytics#即进入训练环境部署完成后续重新进入容器命令docker start -ai 容器ID六、环境测试确保可正常运行6.1 测试推理yolo predict modelyolov8n.pt sourcebus.jpg6.2 测试快速训练5轮快速验证yolo train modelyolov8n.pt datacoco8.yaml epochs5 imgsz640运行无报错、生成结果文件 环境完全正常七、自定义数据集配置标准YOLO格式7.1 固定数据集目录结构将数据集放入yolo_workspace/datasets/自定义文件夹名示例my_datasetmy_dataset/ ├── images/ │ ├── train/ # 训练集图片 │ └── val/ # 验证集图片 ├── labels/ │ ├── train/ # 训练集txt标签 │ └── val/ # 验证集txt标签 └── data.yaml # 数据集配置文件7.2 编写data.yaml配置文件直接复制修改path: /usr/src/ultralytics/datasets/my_dataset train: images/train val: images/val nc: 2 names: 0: cat 1: dog修改说明nc为类别总数names对应自己的目标类别其余内容无需改动八、自定义数据集训练命令小白通用yolo train \ modelyolov8n.pt \ datadatasets/my_datset/data.yaml \ epochs100 \ imgsz640 \ batch8 \ device0参数解释model预训练权重n/s/m/l/x从小到大速度递减、精度递增epochs训练轮数通用100-300轮imgsz推理尺寸固定640即可batch批次大小显存4G改4、2G改2device指定0号GPU训练训练结果路径本地yolo_workspace/runs/train/exp自动递增文件夹best.pt最优模型权重实际部署使用last.pt最后一轮模型权重继续训练使用九、模型推理、验证、导出命令9.1 模型推理测试yolo predict \ modelruns/train/exp/weights/best.pt \ sourcedatasets/my_dataset/images/val \ saveTrue9.2 模型精度验证yolo val modelruns/train/exp/weights/best.pt datadatasets/my_dataset/data.yaml9.3 导出ONNX/TensorRT部署模型# 导出ONNX yolo export modelruns/train/exp/weights/best.pt formatonnx # 导出TensorRT高速推理 yolo export modelruns/train/exp/weights/best.pt formatengine十、继续上次未完成的训练yolo train modelruns/train/exp/weights/last.pt resumeTrue原因未开启GPU支持/显卡驱动版本过低解决更新Nvidia官方驱动≥515Windows开启Docker GPU支持重启Docker