当前位置: 首页 > news >正文

[论文笔记] Open-sora 2、视频数据集介绍 MSR-VTT

MSR-VTT

COVE - Computer Vision Exchange

论文参考:https://www.microsoft.com/en-us/research/wp-content/uploads/2016/06/cvpr16.msr-vtt.tmei_-1.pdf

        用于视频理解的大规模视频基准,特别是将视频翻译为文本的新兴任务。这是通过从商业视频搜索引擎收集 257 个热门查询(每个查询对应 118 个视频)来实现的。

        目前版本,MSR-VTT提供了 10K个网络视频片段,总计 41.2小时和20万个片段-句子对,涵盖了最全面的类别和最丰富的视觉内容,代表了最大的句子和词汇数据集。

http://www.lryc.cn/news/312220.html

相关文章:

  • 【Windows 常用工具系列 14 -- windows 网络驱动映射】
  • Java中使用Jsoup实现网页内容爬取与Html内容解析并使用EasyExcel实现导出为Excel文件
  • 闫震海:腾讯音乐空间音频技术的发展和应用 | 演讲嘉宾公布
  • Java基础 - 6 - 面向对象(二)
  • SpringCloud-MQ消息队列
  • 代码随想录算法训练营第三十八天|509. 斐波那契数、70. 爬楼梯、746. 使用最小花费爬楼梯
  • [python] 代码工具箱
  • Linux——网络基础
  • Vue:双token无感刷新
  • 实现一个作用域插槽的场景
  • Qt QPainter的使用方法
  • 低代码:数智化助力新农业发展
  • 3d模型怎么镜像?3d模型镜像的步骤---模大狮模型网
  • 笔记本hp6930p安装Android-x86补记
  • 为什么MySQL中多表联查效率低,连接查询实现的原理是什么?
  • 从下一代车规MCU厘清存储器的发展(2)
  • Redis(理论版)
  • 【NR 定位】3GPP NR Positioning 5G定位标准解读(四)
  • Docker容器化解决方案
  • Docker安装+基础命令
  • 构建高性能Linux Virtual Server(LVS)集群
  • Linux:线程的概念
  • 如何在jupyter notebook 中下载第三方库
  • Linux下du命令和df命令的使用
  • AIGC笔记--条件自回归Transformer的搭建
  • 数据结构->链表分类与oj(题),带你提升代码好感
  • unity-unity2d基础操作笔记(三)0.5.000
  • 【精华】AIGC启元2024
  • js对象解构语法
  • flowable使用taskService.addComment新增评论需要full_msg字段进行读取