2025年5.1 数据集概览

前言：

总算找到了自己的数据集如何处理的教程了，有意思。

5.1 数据集概览

Ultralytics支持的数据集

Ultralytics为各种计算机视觉任务提供了丰富的数据集支持，包括检测、实例分割、姿态估计、分类和多目标跟踪。以下是主要的Ultralytics数据集列表，以及每个计算机视觉任务和相应数据集的概述。

观看视频：Ultralytics数据集概览

Ultralytics Explorer 🚀 新功能

创建数据集的嵌入，搜索相似图片，运行SQL查询，进行语义搜索，甚至使用自然语言进行搜索！您可以使用我们的GUI应用程序入门，或使用API构建自己的应用程序。了解更多信息这里。

试用GUI演示 了解更多关于Explorer API的信息

对象检测

边界框对象检测是一种计算机视觉技术，通过在图像中为每个对象绘制边界框来检测和定位对象。

Argoverse：一个包含城市环境中3D跟踪和运动预测数据的数据集，具有丰富的注释。
COCO：常见物体上下文（COCO）是一个大型对象检测、分割和标注数据集，包含80个对象类别。
LVIS：一个大型对象检测、分割和标注数据集，包含1203个对象类别。
COCO8：COCO训练集和验证集中的前4张图片的小型子集，适合快速测试。
COCO128：COCO训练集和验证集中的前128张图片的小型子集，适合测试。
Global Wheat 2020：用于全球小麦挑战赛2020的小麦头部图像数据集。
Objects365：一个高质量的大规模对象检测数据集，包含365个对象类别和超过60万张标注图片。
OpenImagesV7：Google提供的一个综合数据集，包含170万张训练图片和4.2万张验证图片。
SKU-110K：一个零售环境中密集对象检测的数据集，包含超过1.1万张图片和170万个边界框。
VisDrone：一个包含无人机拍摄的图像和视频序列的对象检测和多目标跟踪数据集，包含超过1万张图片。
VOC：用于对象检测和分割的Pascal视觉对象类（VOC）数据集，包含20个对象类别和超过1.1万张图片。
xView：一个用于高空图像对象检测的数据集，包含60个对象类别和超过100万个标注对象。
Roboflow 100：一个包含100个数据集的多样化对象检测基准测试，涵盖七个图像领域，用于综合模型评估。
Brain-tumor：用于检测脑肿瘤的数据集，包括MRI或CT扫描图像，详细标注了肿瘤的存在、位置和特征。
African-wildlife：一个包含非洲野生动物图像的数据集，包括水牛、大象、犀牛和斑马。
Signature：一个包含各种文档中签名的图像数据集，用于文档验证和欺诈检测研究。

实例分割

实例分割是一种计算机视觉技术，通过在像素级别上识别和定位图像中的对象来进行分割。

COCO：一个大型数据集，专为对象检测、分割和标注任务设计，包含超过20万张标注图像。
COCO8-seg：用于实例分割任务的小型数据集，包含8张COCO图像及其分割注释。
COCO128-seg：用于实例分割任务的小型数据集，包含128张COCO图像及其分割注释。
Crack-seg：专门用于检测道路和墙体裂缝的数据集，适用于对象检测和分割任务。
Package-seg：用于在仓库或工业环境中识别包裹的定制数据集，适用于对象检测和分割应用。
Carparts-seg：用于识别汽车零部件的专用数据集，适合设计、制造和研究需求，适用于对象检测和分割任务。

姿态估计

姿态估计是一种用于确定物体相对于相机或世界坐标系姿态的技术。

COCO：一个包含人类姿态注释的大型数据集，专为姿态估计任务设计。
COCO8-pose：用于姿态估计任务的小型数据集，包含8张COCO图像及其人类姿态注释。
Tiger-pose：一个包含263张专注于老虎的图像的小型数据集，每只老虎标注了12个关键点，用于姿态估计任务。
Hand-Keypoints：一个包含超过2.6万张人类手部图像的简明数据集，每只手标注了21个关键点，专为姿态估计任务设计。

定向边界框（OBB）

定向边界框（OBB）是一种用于图像中检测倾斜对象的计算机视觉方法，通常用于航空和卫星图像。

DOTA-v2：一个流行的航空图像OBB数据集，包含170万个实例和11268张图像。
DOTA8：DOTA v1分割集的前8张图像的小型子集，4张用于训练，4张用于验证，适合快速测试。

多目标跟踪

多目标跟踪是一种计算机视觉技术，用于在视频序列中检测和跟踪多个对象。

Argoverse：一个包含城市环境中3D跟踪和运动预测数据的数据集，具有丰富的注释，用于多目标跟踪任务。
VisDrone：一个包含无人机拍摄图像和视频序列的对象检测和多目标跟踪数据集，包含超过1万张图片。

贡献新数据集

贡献新数据集需要几个步骤，以确保其与现有基础设施良好对接。以下是贡献新数据集的必要步骤：

贡献新数据集的步骤

收集图像：收集属于数据集的图像，这些可以从各种来源获取，例如公共数据库或您自己的收集。
标注图像：根据任务需要，为这些图像标注边界框、分割或关键点。
导出注释：将这些注释转换为Ultralytics支持的YOLO *.txt 文件格式。
组织数据集：将您的数据集整理为正确的文件夹结构。您应该有 train/ 和 val/ 顶级目录，在每个目录下有 images/ 和 labels/ 子目录。

dataset/
├── train/
│   ├── images/
│   └── labels/
└── val/
    ├── images/
    └── labels/

创建data.yaml文件：在数据集的根目录下创建一个data.yaml文件，描述数据集、类别及其他必要信息。
优化图像（可选）：如果希望减少数据集的大小以提高处理效率，可以使用下面的代码优化图像。此步骤不是必须的，但建议用于较小的数据集尺寸和更快的下载速度。
压缩数据集：将整个数据集文件夹压缩为一个zip文件。
文档和提交PR：创建一个文档页面，描述您的数据集以及它如何适应现有框架。之后，提交一个Pull Request（PR）。有关如何提交PR的更多详细信息，请参阅Ultralytics贡献指南。

优化和压缩数据集的示例代码

Python代码

from pathlib import Path
from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# 定义数据集目录
path = Path("path/to/dataset")

# 优化数据集中的图像（可选）
for f in path.rglob("*.jpg"):
    compress_one_image(f)

# 将数据集压缩为 'path/to/dataset.zip'
zip_directory(path)

通过这些步骤，您可以贡献一个与Ultralytics现有结构良好集成的新数据集。

常见问题解答

1. Ultralytics支持哪些对象检测数据集？

Ultralytics支持多种对象检测数据集，包括：

COCO：一个包含80个对象类别的大型对象检测、分割和标注数据集。
LVIS：一个包含1203个对象类别的广泛数据集，专为更细粒度的对象检测和分割设计。
Argoverse：一个包含城市环境中3D跟踪和运动预测数据的数据集，具有丰富的注释。
VisDrone：一个包含无人机拍摄图像的对象检测和多目标跟踪数据集。
SKU-110K：一个零售环境中密集对象检测的数据集，包含超过1.1万张图片。

这些数据集有助于训练出用于各种对象检测应用的稳健模型。

2. 如何向Ultralytics贡献新数据集？

贡献新数据集需要几个步骤：

收集图像：从公共数据库或个人收藏中收集图像。
标注图像：应用边界框、分割或关键点，具体取决于任务。
导出注释：将注释转换为YO