Objectron开发者指南：如何扩展数据集支持新的物体类别

张

张建站

2026/4/22 8:54:58

10分钟阅读

Objectron开发者指南如何扩展数据集支持新的物体类别【免费下载链接】ObjectronObjectron is a dataset of short, object-centric video clips. In addition, the videos also contain AR session metadata including camera poses, sparse point-clouds and planes. In each video, the camera moves around and above the object and captures it from different views. Each object is annotated with a 3D bounding box. The 3D bounding box describes the object’s position, orientation, and dimensions. The dataset contains about 15K annotated video clips and 4M annotated images in the following categories: bikes, books, bottles, cameras, cereal boxes, chairs, cups, laptops, and shoes项目地址: https://gitcode.com/gh_mirrors/ob/ObjectronObjectron是一个以物体为中心的短视频片段数据集包含约15K个带注释的视频剪辑和4M张带注释的图像目前支持自行车、书籍、瓶子等9个物体类别。本指南将详细介绍如何为Objectron数据集添加新的物体类别帮助开发者轻松扩展数据集功能。1. 准备新类别数据采集扩展Objectron数据集的第一步是为新物体类别准备高质量的视频数据。数据采集需遵循以下规范视频要求每个视频片段应包含物体从不同角度的视图建议时长5-10秒帧率30fps环境要求选择光照充足、背景简单的场景确保物体清晰可见相机移动围绕物体进行多角度拍摄包括俯视、侧视等视角AR元数据必须包含相机姿态、稀疏点云和平面信息可使用ARCore或ARKit采集2. 标注新物体3D边界框新类别数据需要标注3D边界框描述物体的位置、方向和尺寸。图Objectron数据集中不同物体的3D边界框标注示例展示了自行车、书籍、瓶子等物体的3D空间定位标注过程中需要定义物体中心点在世界坐标系中的位置3x3旋转矩阵描述物体方向3D尺度向量表示物体长、宽、高单位米8个顶点的3D坐标遵循object.proto定义的格式3. 修改数据模式定义要支持新类别需要更新协议缓冲区定义文件更新物体类别枚举编辑object.proto文件在Object消息的category字段中添加新类别名称message Object { // ...现有字段... string category 2; // 添加新类别名称如backpack // ...其他字段... }定义新类别关键点为新物体定义3D关键点模板包括中心点和边界框顶点message Skeleton { string category 2; // 新类别名称 repeated KeyPoint keypoints 3; // 定义关键点坐标 // ...其他字段... }重新生成Python代码使用protoc编译更新后的proto文件protoc --python_out. objectron/schema/object.proto protoc --python_out. objectron/schema/annotation_data.proto4. 创建新类别索引文件在index目录下为新类别创建三个索引文件[new_category]_annotations- 完整标注数据[new_category]_annotations_train- 训练集划分[new_category]_annotations_test- 测试集划分索引文件格式应与现有类别保持一致每行包含视频片段的元数据和标注文件路径。可参考现有索引文件如index/bike_annotations的格式。5. 更新数据集解析代码修改数据集解析模块以支持新类别更新类别列表在objectron/dataset/parser.py中添加新类别到类别列表SUPPORTED_CATEGORIES [bike, book, bottle, ..., new_category]调整3D边界框处理确保iou.py中的3D交并比计算支持新类别的边界框形状def compute_3d_iou(box1, box2): 计算两个3D边界框的交并比 # 确保支持新类别的边界框尺寸计算6. 验证新类别集成添加新类别后使用提供的notebooks验证集成是否成功运行数据加载测试使用notebooks/Parse Annotations.ipynb加载新类别的标注数据检查是否能正确解析3D边界框可视化验证使用notebooks/objectron-geometry-tutorial.ipynb可视化新类别物体的3D边界框确认标注正确性评估指标检查运行notebooks/3D_IOU.ipynb验证新类别3D边界框的交并比计算是否正常7. 提交贡献指南完成新类别的添加后可按照以下步骤贡献到Objectron项目确保所有代码遵循项目编码规范提供新类别数据集的样本和说明文档创建Pull Request描述新类别添加的详细信息参与代码审查并根据反馈进行修改通过以上步骤你可以成功为Objectron数据集添加新的物体类别扩展其在3D物体检测和姿态估计任务中的应用范围。如有疑问可参考项目中的CONTRIBUTING.md获取更多帮助。【免费下载链接】ObjectronObjectron is a dataset of short, object-centric video clips. In addition, the videos also contain AR session metadata including camera poses, sparse point-clouds and planes. In each video, the camera moves around and above the object and captures it from different views. Each object is annotated with a 3D bounding box. The 3D bounding box describes the object’s position, orientation, and dimensions. The dataset contains about 15K annotated video clips and 4M annotated images in the following categories: bikes, books, bottles, cameras, cereal boxes, chairs, cups, laptops, and shoes项目地址: https://gitcode.com/gh_mirrors/ob/Objectron创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

MuJoCo物理仿真实战：从机械臂轨迹规划到稳定抓取的完整解决方案

MuJoCo物理仿真实战：从机械臂轨迹规划到稳定抓取的完整解决方案【免费下载链接】mujoco Multi-Joint dynamics with Contact. A general purpose physics simulator. 项目地址: https://gitcode.com/GitHub_Trending/mu/mujoco 在机器人仿真与控制领域&…...

2026/4/22 17:44:18 阅读更多 →

如何快速掌握Simple Faster R-CNN PyTorch：从数据准备到模型评估的完整指南

如何快速掌握Simple Faster R-CNN PyTorch：从数据准备到模型评估的完整指南【免费下载链接】simple-faster-rcnn-pytorch 项目地址: https://gitcode.com/gh_mirrors/si/simple-faster-rcnn-pytorch Simple Faster R-CNN PyTorch是一个基于PyTorch框架实现…...

2026/4/20 17:31:19 阅读更多 →

如何利用Casibase的BPMN工作流引擎构建自动化AI业务流程：企业级指南

如何利用Casibase的BPMN工作流引擎构建自动化AI业务流程：企业级指南【免费下载链接】casibase ⚡️AI Cloud OS: Open-source enterprise-level AI knowledge base and MCP (model-context-protocol)/A2A (agent-to-agent) management platform with admin UI, use…...

2026/4/20 17:30:21 阅读更多 →

前端三剑客 vs Vue.js：核心区别解析

好的，这是一个关于前端技术的常见问题。我们来理清 HTML CSS JavaScript（通常称为“前端三剑客”）与 Vue.js（一个流行的 JavaScript 框架）之间的区别：核心概念不同HTML CSS JavaScript： 这是…...

2026/4/20 15:14:20 阅读更多 →

【SAP Basis】从SU01出发：深入解析SAP用户账号管理的核心配置与实战

1. SU01入门：SAP用户管理的核心入口第一次接触SAP Basis管理时，我被满屏的事务码搞得晕头转向。直到导师指着SU01说："这是你未来每天都要打交道的老朋友"，我才意识到用户管理的重要性。SU01就像SAP系统的门禁控制台&am…...

2026/4/20 6:34:12 阅读更多 →

AI代码配额管理实战指南：7大行业真实配额模型+3类超限预警SOP（附2026大会未发布白皮书节选）

第一章：AI代码配额管理的范式跃迁与大会使命 2026奇点智能技术大会(https://ml-summit.org) 传统资源配额模型正面临根本性挑战：当大语言模型驱动的代码生成器每秒产出数百行可执行逻辑，静态CPU/内存阈值已无法表征真实开发意图与语义负载。…...

2026/4/20 13:56:02 阅读更多 →

7-Zip终极指南：免费开源的文件压缩神器如何改变你的文件管理方式

7-Zip终极指南：免费开源的文件压缩神器如何改变你的文件管理方式【免费下载链接】7z 7-Zip Official Chinese Simplified Repository (Homepage and 7z Extra package) 项目地址: https://gitcode.com/gh_mirrors/7z1/7z 你是否曾为电脑空间不足而烦恼&…...

2026/4/20 22:09:38 阅读更多 →