当前位置: 首页 > news >正文

讲座 | 颠覆传统摄像方式乃至计算机视觉的“脉冲视觉”

传统相机拍摄视频时其实是以一定帧率进行采样,视频其实还是一串图片的集合,因此低帧率时会觉得视频卡,拍摄高速运动物体时会有运动模糊等等问题。然而你能想象这一切都可以被“脉冲视觉”这一前沿技术改变吗?

今天下午听了北京大学黄铁军教授的演讲,颇感震撼。黄教授团队的“脉冲视觉”研究从基础理论方面突破,变革了已经沿用两个世纪的传统感光方式,使得每个新型感光元器件可以每个像素单独对光子进行捕获,并可以重现拍摄时任意时刻的清晰图像。也就是说,有了脉冲相机,也许以后都不会再谈帧率了,因为拍摄到的信息将无限接近现实的光的运动,其时域采样率为4万赫兹,这是以前所有动辄上百万的高帧率相机都无法比拟的。此外,脉冲相机的感光元件可以利用现有的CMOS制造技术上进行制造,使得成本可以控制得比较低。这项技术可以说意义非凡,前景广泛。

接着,黄教授还介绍了脉冲相机在高铁检修、涡轮停机检修等方面的应用。我比较感兴趣的是基于脉冲的视觉任务。传统计算机视觉基于的图像、视频等基本是用传统相机拍摄的(当然也不排除用特殊成像方式的),在计算机中图像通常以像素矩阵存储,而脉冲相机拍摄的脉冲序列我认为其实可以看做光子的到达时间序列,提供了更接近物理现实的记录。在脉冲序列上黄教授团队也做了一系列研究,将光流与深度估计、检测跟踪、目标识别等视觉任务基于脉冲序列进行了实现,得到了成倍的速度提升与SOTA的效果。我觉得在脉冲相机的基础上未来可以实现更类脑的神经网络并实现更接近人类视觉能力的方法。

基于脉冲的视觉任务方面,黄教授团队设计并开源了SpikeCV,即在OpenCV的基础上,针对脉冲序列进行了设计,还额外提供了脉冲相机的接口和已经拍摄好的数据集。地址:https://openi.pcl.ac.cn/Cordium/SpikeCV

有同学问了两个比较关心的问题,即脉冲相机的功耗会不会由于高速采样而很高?以及,脉冲相机拍摄的视频占用存储空间会不会很大?黄教授的回答基本上是,首先功耗确实会比正常大,但可以接受。其次存储由于对脉冲进行了编码,其占用带宽在Gbps,存储空间需求虽然大但也可以在现有硬件上可以得到满足。

总之,黄教授的这次演讲干货满满,相信不久的将来可以从前沿研究真正上到我们手机上。研究项目地址:https://spikecv.github.io/

http://www.lryc.cn/news/261254.html

相关文章:

  • uniGUI学习之UniHTMLMemo1富文本编辑器
  • 详细教程 - 从零开发 鸿蒙harmonyOS应用 第四节 (鸿蒙Stage模型 登录页面 ArkTS版 推荐使用)
  • uniapp怎么实现授权登录
  • 从零开始:前端架构师的基础建设和架构设计之路
  • 椋鸟C语言笔记#26:数据在内存中的存储(大小端字节序)、浮点数的存储(IEEE754)
  • 设计模式——组合模式(结构型)
  • 鸿蒙小车之多任务调度实验
  • 【报错栏】(vue)Module not found: Error: Can‘t resolve ‘element-ui‘ in xxx
  • seaborn库图形进行数据分析(基于tips数据集)
  • AC843. n皇后问题--60
  • Js WebSocket类,收发Json,带心跳,断线重连
  • VBA技术资料MF96:单字段多条件高级筛选
  • 电子取证中Chrome各版本解密Cookies、LoginData账号密码、历史记录
  • Axure元件基本介绍进阶
  • 安卓11添加切换以太网动态静态方法
  • 初级数据结构(五)——树和二叉树的概念
  • pdf读取内容缺失(漏字/文字丢失)问题
  • c#面试基础语法——现有⼀个整数number,请写⼀个⽅法判断这个整数是否是2的N次⽅
  • 27系列DGUS智能屏发布:可实时播放高清模拟信号摄像头视频
  • YOLOv8改进 | 2023主干篇 | 替换LSKNet遥感目标检测主干 (附代码+修改教程+结构讲解)
  • 【工具】VUE 前端列表拖拽功能代码
  • 人工智能与量子计算:开启未知领域的智慧之旅
  • 2023了,前端实现AI电子秤思路分析
  • CSS学习
  • Flask基本用法:一个HelloWorld,搭建服务、发起请求
  • Tomcat-安装部署(源码包安装)
  • 【Hadoop_06】MapReduce的概述与wc案例
  • Qt点击子窗口时父窗口标题栏高亮设计思路
  • 掌握iText:轻松处理PDF文档-高级篇-添加水印
  • 深度学习基本概念