YOLOv8 训练代码集成 RGB、近红外 NIR、深度多模态【（直拍）番茄果实成熟度多模态检测数据集 half 半成熟 immature 未成熟 ripe成熟 YOLO多模态数据集的训练及应用

张

张建站

2026/4/19 4:01:24

10分钟阅读

YOLOv8 训练代码集成 RGB、近红外 NIR、深度多模态【（直拍）番茄果实成熟度多模态检测数据集 half 半成熟 immature 未成熟 ripe成熟 YOLO多模态数据集的训练及应用

智慧农业-多模态**【直拍番茄果实成熟度多模态检测数据集3类目标 | 红外和可见光及深度depth各4000张图像共12000副图片】**主要由RGB-D 深度相机集成 RGB、近红外 NIR、深度与独立红外相机配合采集设备为Intel RealSense D435i数据集详情数据量共12000张图像.jpg格式txt标签文件**目标类别共3类 | nc3half 半成熟immature 未成熟ripe成熟1111适配多模态/多源数据的YOLOv8 训练代码。由于该数据集包含RGB可见光、NIR近红外和Depth深度三种模态且来源于 Intel RealSense D435i通常有两种处理策略数据混合训练将三种模态的图片视为独立样本混合训练增强模型对不同光照和纹理的鲁棒性。多流融合如果图片是配准对齐的可以使用多输入网络代码较为复杂。以下代码采用最通用且高效的“数据混合训练”策略即把所有模态的数据统一格式放入训练流中让模型学习不同模态下的番茄特征。数据集规格描述表属性详细参数数据集名称直拍番茄果实成熟度多模态检测数据集采集设备Intel RealSense D435i (RGB-D NIR) 独立红外相机图像总数12,000 张(.jpg)模态构成RGB (可见光): 4,000 张NIR (近红外): 4,000 张Depth (深度): 4,000 张标注格式YOLO 格式 (.txt)包含归一化坐标目标类别数3 类 (nc3)类别详情1.half(半成熟)2.immature(未成熟)3.ripe(成熟)适用场景农业机器人采摘、温室作物成熟度监测、多光谱图像分析训练代码与配置1. 目录结构准备为了让代码正确运行请将你的数据集整理为以下标准 YOLO 结构假设训练集/验证集已划分例如 9:1Tomato_Multimodal/ ├── data.yaml -- 配置文件 ├── images/ │ ├── train/ -- 放入所有模态的训练图片 (RGBNIRDepth) │ └── val/ -- 放入所有模态的验证图片 └── labels/ ├── train/ -- 对应的 txt 标签 └── val/ -- 对应的 txt 标签2. 配置文件 (data.yaml)在数据集根目录下创建此文件。# Tomato_Multimodal/data.yaml# 数据集根路径path:.# 训练集和验证集路径train:images/trainval:images/val# 类别数量nc:3# 类别名称 (顺序必须与你的 txt 标签中的 ID 对应)names:0:half1:immature2:ripe3. Python 训练脚本 (train.py)这段代码使用了ultralytics库支持自动加载预训练权重并进行迁移学习。fromultralyticsimportYOLOimportosdeftrain_tomato_model():# 1. 加载模型# 建议使用 yolov8n.pt 或 yolov8s.pt因为多模态数据量大小模型也能训练得很好# 如果是深度图建议增加训练轮数因为深度图纹理较少modelYOLO(yolov8n.pt)print( 开始训练番茄成熟度检测模型 (多模态)...)# 2. 开始训练resultsmodel.train(datadata.yaml,# 指定配置文件epochs300,# 训练轮数 (多模态建议 300)imgsz640,# 图像尺寸batch16,# 批次大小 (根据显存调整如 24G 显存可设 32)device0,# 使用 GPU (0号卡)若无 GPU 设为 cpuworkers8,# 数据加载线程数projectruns/train,# 结果保存目录nametomato_multimodal_v1,# 实验名称patience50,# 早停机制 (50轮无提升则停止)verboseTrue,# 显示详细日志# 针对深度图和红外图的特殊增强建议# 深度图通常缺乏纹理过多的马赛克增强可能会破坏几何信息# 如果效果不佳可以尝试关闭 mosaic (mosaic0.0)mosaic1.0,# 马赛克增强比例 (0-1)pretrainTrue# 加载预训练权重)print(f✅ 训练完成模型保存在: runs/train/tomato_multimodal_v1/weights/best.pt)if__name____main__:# 检查配置文件是否存在ifnotos.path.exists(data.yaml):print(❌ 错误找不到 data.yaml请检查路径。)else:train_tomato_model() 针对多模态数据的训练建议数据预处理直方图均衡化深度图和近红外图往往对比度较低。建议在训练前对 Depth 和 NIR 图片进行 CLAHE (限制对比度自适应直方图均衡化) 处理以增强果实边缘特征。伪彩色映射YOLO 默认处理 3 通道 RGB 图像。如果你的 Depth 或 NIR 是单通道灰度图训练脚本会自动将其复制 3 份作为输入或者你可以将其转换为伪彩色如 Jet 颜色映射以利用预训练模型的 RGB 特征提取能力。超参数调整由于包含深度信息目标通常具有较好的几何轮廓。如果发现模型对小目标远处番茄检测效果不好可以在model.train()中添加close_mosaic10参数即在最后 10 轮关闭马赛克增强专注于原始图像的边缘对齐。推理应用训练完成后你可以将 RGB、NIR 和 Depth 三张图片分别送入模型进行检测然后使用加权框融合算法将三个结果合并从而获得比单一模态更精准的定位结果。

老电脑6G内存也能跑RNA-seq？我的Linux双系统实战避坑记录（附完整代码）

6G内存旧电脑玩转RNA-seq：双系统环境搭建与全流程优化指南当实验室的高性能服务器排期爆满，而手头只有一台6G内存的老旧笔记本电脑时，许多生物信息学初学者会陷入两难境地。本文将分享如何在资源受限环境下，通过WinLinux双系统方…...

2026/4/19 3:58:17 阅读更多 →

Verilog有符号运算避坑指南：从`3‘sd5`到`-4‘d10`，这些常量赋值细节你搞懂了吗？

Verilog有符号运算避坑指南：从3sd5到-4d10的常量赋值细节解析在FPGA和数字IC设计中，Verilog的有符号运算一直是工程师们容易踩坑的重灾区。特别是当涉及到常量赋值时，像3sd5和-4d10这样的写法常常会导致仿真结果与预期不符。本文将深入剖析这…...

2026/4/19 3:58:16 阅读更多 →

苹果营销元老斯坦·吴退休，可穿戴业务营收下滑下领导层密集调整何去何从？

斯坦吴：31年苹果营销生涯的谢幕当地时间4月16日，苹果负责可穿戴设备、家居及配件业务的营销副总裁斯坦吴（Stan Ng）在社交平台宣布正式退休。他于1995年以系统工程师身份加入苹果，历经乔布斯未回归时公司的转型阵痛期。…...

2026/4/19 3:57:10 阅读更多 →

前端三剑客 vs Vue.js：核心区别解析

好的，这是一个关于前端技术的常见问题。我们来理清 HTML CSS JavaScript（通常称为“前端三剑客”）与 Vue.js（一个流行的 JavaScript 框架）之间的区别：核心概念不同HTML CSS JavaScript： 这是…...

2026/4/19 0:02:26 阅读更多 →

【SAP Basis】从SU01出发：深入解析SAP用户账号管理的核心配置与实战

1. SU01入门：SAP用户管理的核心入口第一次接触SAP Basis管理时，我被满屏的事务码搞得晕头转向。直到导师指着SU01说："这是你未来每天都要打交道的老朋友"，我才意识到用户管理的重要性。SU01就像SAP系统的门禁控制台&am…...

2026/4/19 0:02:30 阅读更多 →

AI代码配额管理实战指南：7大行业真实配额模型+3类超限预警SOP（附2026大会未发布白皮书节选）

第一章：AI代码配额管理的范式跃迁与大会使命 2026奇点智能技术大会(https://ml-summit.org) 传统资源配额模型正面临根本性挑战：当大语言模型驱动的代码生成器每秒产出数百行可执行逻辑，静态CPU/内存阈值已无法表征真实开发意图与语义负载。…...

2026/4/19 0:02:31 阅读更多 →

7-Zip终极指南：免费开源的文件压缩神器如何改变你的文件管理方式

7-Zip终极指南：免费开源的文件压缩神器如何改变你的文件管理方式【免费下载链接】7z 7-Zip Official Chinese Simplified Repository (Homepage and 7z Extra package) 项目地址: https://gitcode.com/gh_mirrors/7z1/7z 你是否曾为电脑空间不足而烦恼&…...

2026/4/19 0:24:21 阅读更多 →