当前位置: 首页 > news >正文

6 大经典机器学习数据集,3w+ 用户票选得出,建议收藏

内容一览:本期汇总了超神经下载排名众多的 6 个数据集,涵盖图像识别、机器翻译、遥感影像等领域。这些数据集质量高、数据量大,经历人气认证值得收藏码住。
关键词:数据集 机器翻译 机器视觉

数据集是机器学习模型训练的基础,优质的公开数据集对于模型训练效果、研究成果可靠度等具有重要意义。

HyperAI超神经自上线以来,为数据科学从业者提供了大量优质的公开数据集。本期内容分享,我们筛选出了 6 个热门数据集,其总下载次数已达到 32,569 次。希望这些数据集能进一步为广大开发者服务~

注:本文梳理的数据集均来自网站:
https://hyper.ai/datasets

在这里插入图片描述
在这里插入图片描述

Tanks Temple 图像数据集提供高分辨率的视频,研究人员可以从视频中采集图像,依据图像进行三维重建。该数据集包括训练数据和测试数据两类,其中测试数据分为中级组和高级组。

在这里插入图片描述
在这里插入图片描述

DOTA 全称为 A Large-scale Dataset for Object DeTection in Aerial Images,是一个包含 2,806 张航拍图的图像数据集,被用于在航拍图像中进行目标检测,发现和评估图像中的物体。

这些图像来源包含不同传感器和平台。每张图像的像素尺寸在 800800 到 40004000 的范围内,其中包含不同尺度、方向和形状的物体。

往期推送请访问:
DOTA 数据集:2806 张遥感图像,近 19 万个标注实例

在这里插入图片描述
在这里插入图片描述

VGG-Face2 是一个人脸图像数据集,包含共计 9131 个人的面部数据,图像均来自 Google 的图片搜索。数据集中的人在姿势、年龄、种族和职业方面有很大差异。该数据集由牛津大学的工程科学系视觉几何组于 2015 年发布,相关论文有《Deep Face Recognition》。

在这里插入图片描述
在这里插入图片描述

UCAS-AOD 是一个遥感影像数据集,用于飞机和车辆检测。该数据集由国科大于 2014 年首次发布,并于 2015 年补充,相关论文有《Orientation Robust Object Detection in Aerial Images Using Deep Convolutional Neural Network》

在这里插入图片描述
在这里插入图片描述

OpenMantra 是一个针对日文漫画的机器翻译评估数据集,包含五种不同风格(fantacy、romance、battle、mystery、slice of life)的漫画。数据集中共包含 1593 个句子,848 个场景画面和 214 页漫画,由东京大学 Mantra 团队发布。

往期推送请查看:
漫画翻译、嵌字 AI,东京大学论文被 AAAI’21 收录

在这里插入图片描述
在这里插入图片描述

ImageNet 是目前世界上最大的图像识别数据库,由斯坦福大学教授李飞飞等人创建。主要用于机器视觉领域的图像分类和目标检测。

数据集根据 WordNet 层次结构组织,其中每个节点(也称为类别)由数百甚至数千张图像组成。该数据集共包含 2.2 万个图像类别,约 1500 万张图片。

往期推送请访问:
当年这个决定,让李飞飞奠定 AI 江湖的女王地位

以上就是本期推荐的 6 个 hyper.ai 高频下载数据集,更多数据科学优质公开数据集,可点击文末阅读原文,或访问以下链接下载:

https://hyper.ai/datasets

—— 完 ——

http://www.lryc.cn/news/13708.html

相关文章:

  • Logview下载
  • macos 下载 macOS 系统安装程序及安装U盘制作方法
  • c++动态内存分布以及和C语言的比较
  • 软考高级信息系统项目管理师系列之三十一:项目变更管理
  • 【Vue3源码】第二章 effect功能的完善补充
  • CHAPTER 2 Web Server - apache(httpd)
  • 【Vagrant】下载安装与基本操作
  • 常用类(五)System类
  • Navicat Premium 安装 注册
  • 回溯算法总结
  • ccc-pytorch-基础操作(2)
  • 独居老人一键式报警器
  • 软考案例分析题精选
  • 基于SpringBoot+vue的无偿献血后台管理系统
  • 详解js在事件中,如何传递复杂数据类型(数组,对象,函数)
  • 高并发架构 第一章大型网站数据演化——核心解释与说明。大型网站技术架构——核心原理与案例分析
  • VPP接口INPUT节点运行数据
  • RabbitMQ学习(九):延迟队列
  • TCP并发服务器(多进程与多线程)
  • 第1章 Memcached 教程
  • 【2022.12.9】Lammps+Python 在计算g6(r)时遇到的问题
  • MySQL使用C语言连接
  • JavaScript随手笔记---比较两个数组差异
  • 【C++修炼之路】21.红黑树封装map和set
  • 下载ojdbc14.jar的10.2.0.1.0版本的包
  • 关于欧拉角你需要知道几个点
  • git ssh配置
  • Linux进程概念(三)
  • 新手福利——x64逆向基础
  • 虚幻c++中的细节之枚举类型(enum)