Python深度学习:【开源数据集系列】ImageNet数据集
ImageNet 是一个大规模的视觉数据集
,是计算机视觉领域最重要
的基准数据集
之一。该数据集由普林斯顿大学和斯坦福大学的研究人员发起,于 2009 年
推出。ImageNet 是用于物体分类
、目标检测
、图像分割
、姿势估计
等多种任务的通用数据集
,尤其在深度学习和计算机视觉的突破性研究中具有重要地位。
ImageNet 数据集的主要特点:
-
数据规模:
- ImageNet 数据集包含超过 1400 万张标注的图片,覆盖了
20,000 多个类别
(具体类别数因任务不同而不同)。 - 每个类别有数百到数千张图片,图片分辨率通常较高且包含自然场景中的物体。
- ImageNet 数据集包含超过 1400 万张标注的图片,覆盖了
-
WordNet 层次结构:
- ImageNet 的
分类体系
基于WordNet
,这是一个语言学上组织的词汇库,其中的每个词(synset)表示一个特定的概念或对象。ImageNet 为每个 synset 提供一组相关的
- ImageNet 的