当前位置: 首页 > news >正文

【11-计算机视觉介绍】

计算机视觉 computer vision application

现有一张照片,其像素为1000*1000,该照片像素强度值在0~255,将所有的像素值平铺开来就得到了一个包含1000,000个元素的列,或者说向量;

能否训练一个神经网络,输入为1000,000个像素亮度值的特征向量,输出为人物身份;
在这里插入图片描述

如果你去观察那些经过大量图片训练的神经网络模型的隐藏层的神经元,你会发现,在第一个隐藏层中,你可能会发现一个神经元在寻找一个小的垂直线或垂直边缘,第二个神经元在寻找一个有方向的线或边缘,第三个神经元在寻找一个特定方向的线,在第一层中,神经元在图像中寻找非常短的线条或边缘,在第二个隐藏层中,你会发现这些神经元可能学会将许多小短线组合在一起,以便寻找面部的部分(比如眼睛鼻子等),第三层中,神经网络正在聚合面部的不同部分,然后尝试检测是否存在更大更粗略的面部形状,最后检测面部于不同面部形状的对应程度会创建一组特征,这些特征可以帮助输出层尝试确定人物的身份。

神经网络的一个显著特点是,它可以自己在不同的隐藏层学习这些特征检测器,在这个例子中,没人 告诉它应该在第一层寻找短线,第二层找鼻子眼睛,第三层组合面部特征,神经网络可以从数据中自行找出这些东西。这些小神经元的可视化实际上对应于图像中不同大小的区域,
在这里插入图片描述

如果要求检测汽车,对于同样的模型和算法,它在每个隐藏层中几乎做着相同的事情。所以只需要提供不同的数据,神经网络就会自动学习检测非常不同的特征。

http://www.lryc.cn/news/617980.html

相关文章:

  • 【代码随想录day 17】 力扣 654.最大二叉树
  • LeetCode151~188题解
  • Apache RocketMQ:消息可靠性、顺序性与幂等处理的全面实践
  • Docker 详解(保姆级安装+配置+使用教程)
  • MySQL高可用改造之数据库开发规范(大事务与数据一致性篇)
  • C++方向知识汇总(三)
  • Git 常用命令总结
  • 泰国文字识别技术:从精准识别字符向深度理解语义的方向不断进化
  • 日本VPS内存溢出了如何优化
  • 数据变而界面僵:Vue/React/Angular渲染失效解析与修复指南
  • 稠密检索:基于神经嵌入的高效语义搜索范式
  • 【LeetCode 热题 100】(七)链表
  • 数据结构——树(02构造二叉树,代码练习)
  • 【网络基础】深入理解 TCP/IP 协议体系
  • 无人机航拍数据集|第11期 无人机人员行为目标检测YOLO数据集1868张yolov11/yolov8/yolov5可训练
  • libwebsockets 服务端获取过代理的真实连接IP
  • [4.2-1] NCCL新版本的register如何实现的?
  • AI(领域)应用落地技术决策指南:从双路径架构到系统性实施
  • Oracle 23AI 稳定执行计划:SQL Profile
  • 训练苹果风格Emoji生成模型的技术方案
  • Docker-09.Docker基础-Dockerfile语法
  • 数据上云有什么好处?企业数据如何上云?
  • Flutter Provider 状态管理全面解析与实战应用:从入门到精通
  • priority_queue(优先级队列)和仿函数
  • 关于linux系统编程2——IO编程
  • 内网依赖管理新思路:Nexus与CPolar的协同实践
  • redis常见的性能问题
  • Redis 数据倾斜
  • day072-代码检查工具-Sonar与maven私服-Nexus
  • Qt 5.14.2安装教程