当前位置: 首页 > news >正文

OpenBayes 一周速览|TripoSR 开源:1 秒即 2D 变 3D、经典 GTZAN 音乐数据集上线

公共资源速递

This Weekly Snapshots !
5 个数据集:

FER2013 面部表情识别数据集

GTZAN 音乐流派分类数据集

MVTec-AD 工业异常检测数据集

UCAS-AOD 遥感目标检测数据集

Oxford 102 Flowers 花卉图片数据集

3 个教程:

Latte 全球首个开源文生视频 DiT

在线运行 TripoSR 模型 Demo

深度学习入门教程:语音识别数字 0-9

访问官网立即使用:http://openbayes.com

公共数据集

1. FER2013 面部表情识别数据集

该数据集包含大约 30,000 张不同表情的面部 RGB 图像,图像的尺寸均为 48×48 像素,主要标注了 7 种类型的表情:0 = 愤怒,1 = 厌恶,2 = 恐惧,3 = 快乐,4 = 悲伤,5 = 惊奇,6 = 中立。

直接使用:

https://go.openbayes.com/DPK80

2. GTZAN 音乐流派分类数据集

GTZAN 数据集包含了 10 个不同类型的音乐样本,每个类型包含 100 个样本。这个数据集最初由 Marsyas 音乐信息检索工具包创建,并被广泛用于评估音乐分类算法的性能。

直接使用:

https://go.openbayes.com/La1f2

3. MVTec-AD 工业异常检测数据集

MVTec-AD 是用于对异常检测方法进行基准测试的数据集,重点是工业检测。它包含 15 个不同的对象和纹理类别的超过 5,000 个高分辨率图像。

直接使用:

https://go.openbayes.com/sopj8

4. UCAS-AOD 遥感目标检测数据集

UCAS-AOD 是一个遥感影像数据集,包含汽车、飞机以及背景负样本。

直接使用:

https://go.openbayes.com/7zPYQ

5.Oxford 102 Flowers 花卉图片数据集

该数据集包含 102 个花的类别,每个类包含 40 到 258 个图像,主要用于图像分类。

直接使用:

https://go.openbayes.com/3PSqZ

公共教程

1. Latte 全球首个开源文生视频 DiT

Latte 是 2023 年 11 月开源的一种用于视频生成的创新模型,Latte 作为全世界首个开源文生视频 DiT,已经取得了很有前景的结果。该教程为 Latte 项目的效果实现 Demo。

在线运行:

https://go.openbayes.com/Mkm0f

2.  在线运行 TripoSR 模型 Demo

TripoSR 由 Stability AI 和 Tripo AI 合作开发,可在 1 秒钟内根据单张图像生成高质量的 3D 模型,并且对算力的需求很低,因此普通用户也可以轻松在本地设备上使用它。该教程已经搭建好了环境,方便大家运行体验。

在线运行:

https://go.openbayes.com/AOPcQ

3. 深度学习入门教程:语音识别数字 0-9

该教程是使用深度学习把语音文件转译为文本数据,检测数字 0-9 的语音,例如把英语「eight」的发音转译为文本「eight」。

在线运行:

https://go.openbayes.com/dBWzn

小贝还建立了「Stable Diffusion 教程交流群」,欢迎小伙伴们入群探讨各类技术问题、分享应用效果~扫描下方二维码添加小贝总微信(微信号:OpenBayes001),备注「SD 教程交流」,即可加入群聊。

以上就是小贝上周在 OpenBayes 的全部更新内容啦~

创作者激励计划第二期活动已开始招募,最高可得 300 元现金奖励,欢迎扫码报名↓

此外,OpenBayes 平台还提供超过 500 个精选公共数据集、模型、教程等优质资源,并已经整合到「公共资源」模块中。OpenBayes 平台支持一键 Input,开箱即用!

http://www.lryc.cn/news/355030.html

相关文章:

  • 【论文笔记】advPattern
  • 【鱼眼镜头11】Kannala-Brandt模型和Scaramuzza多项式模型区别,哪个更好?
  • 微信小程序仿胖东来轮播和背景效果(有效果图)
  • 10.SpringBoot 统一处理功能
  • 【八股系列】为什么会有webpack配置?webpack的构建流程是什么?
  • sdf 测试-2-openssl
  • 头歌springboot初体验
  • 矩阵对角化在机器学习中的奥秘与应用
  • 操作MySQL数据库
  • Linux shell 文件生成文件脚本(模拟生成文件、生成大量文件)
  • theharvester一键收集域名信息(KALI工具系列十)
  • 「动态规划」删除并获得点数
  • MongoDB CRUD操作:内嵌文档数组查询
  • 【C++】每日一题 50 Pow(x,n)
  • HG/T 6088-2022 透水道路用涂料检测
  • linux定时清理docker日志脚本
  • ROS学习笔记(16):夹缝循迹
  • 【MySQL精通之路】SQL语句(3)-锁和事务语句
  • 211大学计算机专业不考408,新增的交叉专业却考408!南京农业大学计算机考研考情分析!
  • 利用java8 的 CompletableFuture 优化 Flink 程序,性能提升 50%
  • 香橙派 AIpro综合体验及AI样例运行
  • 通过域名接口申请免费的ssl多域名证书
  • 【JAVA WEB实用与优化技巧】如何自己封装一个自定义UI的Swagger组件,包含Swagger如何处理JWT无状态鉴权自动TOKEN获取
  • 理解大语言模型(二)——从零开始实现GPT-2
  • SSH远程登录时常见问题解决
  • 工业级3D开发引擎HOOPS:创新与效率的融合!
  • IDEA创建Spring Boot项目
  • mysql实战——xtrabackup全量备份/增量备份及恢复
  • 探索演进:了解IPv4和IPv6之间的区别
  • Python 实现Word (DOC或DOCX)与TXT文本格式互转