当前位置: 首页 > news >正文

(论文阅读14/100)End-to-end people detection in crowded scenes

文献阅读笔记

简介

题目

End-to-end people detection in crowded scenes

作者

Russell Stewart, Mykhaylo Andriluka

原文链接

https://arxiv.org/pdf/1506.04878.pdf

关键词

Null

研究问题

当前的人员检测器要么以滑动窗口的方式扫描图像,要么对一组离散的提议进行分类。

这项任务是具有挑战性的,因为它既需要将物体从背景中区分开来,又需要正确估计不同物体的数量和它们的位置。

要避免对同一对象的多次检测。

对象实例重叠时根据边界框的属性进行推理往往会得出错误的结果。

拥挤场景中,多个人常常近距离出现,使得区分附近的个体变得尤为困难。

研究方法

提出了一种基于图像解码的人员检测模型。要求以一幅图像作为输入,从而能够直接输出一组不同的检测假设。由于是联合生成预测,因此不需要非极大值抑制等常见的后处理步骤。

本文贡献一个使用一个新的损失函数来端到端地训练模型,该损失函数对检测集进行操作。

另一个技术贡献是表明可以成功地利用LSTM单元链将图像内容解码为可变长度的相干实值输出。

图像解码:首先使用来自谷歌公司的表达性图像特征。然后使用该图像的中间表示使用lstm进行训练得到一组预测对象。

研究结论

该方法在拥挤场景中检测人群这一具有挑战性的任务上非常有效。能够生成任意距离的预测。

额外知识

Bounding box regression:Region Proposal经过fine-tuning跟Ground Truth更加接近的方法

人脸检测中的bounding box regression详解-CSDN博客

http://www.lryc.cn/news/218495.html

相关文章:

  • Go的错误处理
  • 云原生相关概念
  • 【JS】this指向
  • SpringCloud Alibaba Demo(Nacos,OpenFeign,Gatway,Sentinel)
  • 基于nodejs+vue畅听校园点歌系统的设计与实现
  • IDEA 设置代码注释模板
  • emoji对齐 特殊字符对齐 文本对齐
  • Selenium Python 中的动作链
  • OceanBase:03-集群部署
  • PTA: 矩阵的乘法运算
  • 4K Video Downloader Pro v4.28.0(视频下载器)
  • java pdf,word,ppt转图片
  • map set
  • Fourier分析导论——第3章——Fourier级数的收敛性(E.M. Stein R. Shakarchi)
  • 解决ruoyi-vue部署到域名子路径静态资源404
  • 游戏引擎中为什么要用四元数表示旋转而不用欧拉角旋转?
  • E-Office(泛微OA)前台任意文件读取漏洞复现
  • 前端小案例 | 喵喵大王立大功 | 一个带便利贴功能的todolist面板
  • 算法训练营第十一天 | 20. 有效的括号、 1047. 删除字符串中的所有相邻重复项、150. 逆波兰表达式求值
  • Python unittest单元测试框架 TestSuite测试套件
  • FSB逮捕为乌克兰网络部队工作的俄罗斯黑客
  • 【PC电脑windows-学习样例tusb_serial_device-ESP32的USB模拟串口程序+VScode建立工程+usb组件添加+-基础样例学习】
  • LeetCode75——Day26
  • 面试算法53:二叉搜索树的下一个节点
  • 2023SHCTF web方向wp
  • 从物理磁盘到数据库 —— 存储IO链路访问图
  • 基于java+springboot+vue在线选课系统
  • GO学习之 同步操作sync包
  • NUUO网络摄像头(NVR)RCE漏洞复现
  • 一款快速获取目标网站关键信息的工具