当前位置: 首页 > news >正文

【北邮鲁鹏老师计算机视觉课程笔记】01 introduction

1 生活中的计算机视觉

在这里插入图片描述

生活中的各种计算机视觉识别系统已经广泛地应用起来了。

2 计算机视觉与其他学科的关系

在这里插入图片描述

认知科学和神经科学是研究人类视觉系统的,如果能把人类视觉系统学习得更好,可以迁移到计算机视觉。是计算机视觉的理论基础。
算法、系统、框架、机器学习等是计算机视觉的工具。
光学设备采集图像给计算机视觉提供输入
图像处理强调的是:我输入的是图像,输出的也是图像,比如增强亮度、去噪
计算机视觉系统:输入的图像,输出的不只是图像。
应用:①图像检索。文字搜图,计算机视觉识别后给图像打了标签。在互联网上占领大的流量的还是图像和视频。②机器人。

3 计算机视觉的介绍

在这里插入图片描述

首先谈谈智能的概念,1997年的人工智能系统“深蓝”,战胜了国际象棋的世界冠军。2015年和2017年AlphaGo战胜了李世石和柯洁。
但是这是不是真的智能,现在的人工智能系统能下棋,但是它不能创作诗歌超过人类最优秀的诗人。从这个角度看,这并不是真的智能,它有一个很好的搜索算法,去搜索出最优解。因此,现在只能在数理和数学计算上部分实现人类的智能。

4 三维重构

在这里插入图片描述

计算机视觉系统还不够完善。

5 什么是视觉系统

在这里插入图片描述

感知 + 解释

人类的视觉系统
机器视觉系统

在这里插入图片描述

机器看到的是什么?是一个灰度图,是一个二维矩阵300 * 400

语义鸿沟:从像素到语义内容。存在的极大的差距

我们首先会从人类的视觉系统中去借鉴

6 人类的视觉系统是什么样的

在这里插入图片描述

在这里插入图片描述

诺贝尔奖成果:让猫去看图片。确定视觉和大脑皮层的关系。
给猫看了大量的图片,但是猫的大脑皮层没有反应。
给猫看简单的图形,某些神经元会有反应。通过后续实验,发现大脑对视觉信息的处理事分层的。
人类的视觉系统非常优秀。

在这里插入图片描述
任务:人类能以多快的速度和多高的精度去区分动物和非动物

在这里插入图片描述
过了150ms,区分动物和非动物的脑电波信号就不一样了。

7 运动视盲

在这里插入图片描述

8 利用上下文去理解语义

在这里插入图片描述
在这里插入图片描述
上下文背景引导了我们理解图像的过程。

在这里插入图片描述
在这里插入图片描述
实际上A、B的颜色是一样的。人类的视觉系统会对B进行自动增强。

在这里插入图片描述

9 计算机视觉的起源

在这里插入图片描述
MIT的研究生暑期项目
1966年,计算机视觉从图像处理中独立出来

在这里插入图片描述
先驱人物:马尔

计算机视觉的框架:①计算理论:任务是什么?②表达和算法:输入和输出是什么?③硬件实现:

10 我们能从图像中获取什么信息

在这里插入图片描述
在这里插入图片描述
3D信息更多地是用于定位
①SLAM
②三维重建
③漫游:一天建成罗马

在这里插入图片描述
从这个角度,计算机视觉分为两个大方向:从图像中恢复3D结构信息、从图像中恢复语义信息

11 计算机视觉的发展历程

在这里插入图片描述

12 为什么要做计算机视觉

在这里插入图片描述
三维重建

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
人脸识别:计算机识别的第一个真正的应用
虹膜识别

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
检测与跟踪:

在这里插入图片描述
VR:虚拟现实

在这里插入图片描述

13 课程资源

在这里插入图片描述

14 路线图

在这里插入图片描述

http://www.lryc.cn/news/297250.html

相关文章:

  • maven依赖报错处理(或者maven怎么刷新都下载不了依赖)
  • [VulnHub靶机渗透] dpwwn: 1
  • Android14音频进阶:MediaPlayerService如何启动AudioTrack 下篇(五十六)
  • Python基础篇_修饰符(Decorators)【下】
  • C#,十进制展开数(Decimal Expansion Number)的算法与源代码
  • Vue3快速上手(一)使用vite创建项目
  • 使用navicat导出mysql离线数据后,再导入doris的方案
  • re:从0开始的CSS学习之路 1. CSS语法规则
  • npm install express -g报错或一直卡着,亲测可解决
  • 机器学习11-前馈神经网络识别手写数字1.0
  • vscode wsl远程连接 权限问题
  • VED-eBPF:一款基于eBPF的内核利用和Rootkit检测工具
  • 配置ARM交叉编译工具的通用步骤
  • 相机图像质量研究(5)常见问题总结:光学结构对成像的影响--景深
  • 使用django构建一个多级评论功能
  • 测试管理_利用python连接禅道数据库并自动统计bug数据到钉钉群
  • Python 小白的 Leetcode Daily Challenge 刷题计划 - 20240209(除夕)
  • BFS——双向广搜+A—star
  • LLM之LangChain(七)| 使用LangChain,LangSmith实现Prompt工程ToT
  • 新零售的升维体验,摸索华为云GaussDB如何实现数据赋能
  • vscode +git +gitee 文件管理
  • 【力扣】用栈判断有效的括号
  • 【目录】CSAPP的实验简介与解法总结(已包含Attack/Link/Architecture/Cache)
  • 【机器学习】数据清洗之识别缺失点
  • 【Vue】Vue基础入门
  • 正点原子-STM32通用定时器学习笔记(1)
  • Redis篇之redis是单线程
  • 随机MM引流源码PHP开源版
  • 【C++修行之道】(引用、函数提高)
  • 从零开始手写mmo游戏从框架到爆炸(十一)— 注册与登录