当前位置: 首页 > news >正文

Halcon深度学习网络模型简介

        HALCON为分类和语义分割提供了预训练的神经网络。当训练自定义网络时,这些神经网络是很好的起点。它们已经在一个大型图像数据集上进行了预训练。对于异常检测,HALCON提供了初始模型。

     

用于 3D 抓取点检测的模型

       为 3D 抓取点检测提供了以下网络:

'pretrained_dl_3d_gripping_point.hdl'

       网络最多需要 5 个类型的图像 :real

       'image':强度(灰度值)图像

       'x':X 图像(值需要从左到右增加)

       'y':Y 图像(值需要从上到下增加)

       ‘z’: z图像(值需要从靠近传感器的点增加到远点;例如,如果数据是在相机坐标系中给出的情况)

       ' normals':2D 映射

       此外,网络需要某些图像属性(对于上面提到的所有输入图像)。可以使用get_dl_model_param检索相应的值。默认值:

       “image_width”: 640

       “image_height”: 480

       网络架构允许对图像尺寸进行更改。

异常检测模型

      异常检测主要检测数据中的离群点,异常数据的特征值与正常数据的特征值距离较远。

      提供了以下网络用于异常检测:

'initial_dl_anomaly_medium.hdl'

      此神经网络旨在提高内存和运行时效率。

      网络期望图像是这种类型的。此外,网络需要某些图像属性。可以使用realget_dl_model_param检索相应的值。默认值:       

      “image_width”:480

      “image_height”: 480

      “image_num_channels”: 3

      “image_range_min”: -2

      “image_range_max”: 2

      网络架构允许更改图像尺寸,但是‘image_width’和‘image_height’的大小必须是32像素的倍数,因此最少为32像素

'initial_dl_anomaly_large.hdl'

      这种神经网络被认为更适合于更复杂的异常检测任务。这样做的代价是需要更多的时间和内存。

    网络期望图像是这种类型的。此外,网络需要某些图像属性。可以使用realget_dl_model_param检索相应的值。默认值:  

      “image_width”: 480

      “image_height”: 480

      “image_num_channels”: 3

      “image_range_min”: -2

      “image_range_max”: 2

      网络架构允许更改图像尺寸,但是‘image_width’和‘image_height’的大小必须是32像素的倍数,因此最少为32像素。

全局上下文异常检测模型

       “全局上下文异常值检测”是一种独一无二的技术,能够“理解”整个图像的逻辑内容。 与 HALCON 先前异常值检测功能一样,新的“全局上下文异常检测”只需要训练无缺陷图像,无需数据标记。 这项技术可以检测组件缺失、变形或者排布错位等异常,在半导体生产中的印刷电路板检测场景、印刷痕迹的检测场景也有非常优秀的表现。

      为全局上下文异常检测提供了以下网络:

“pretrained_dl_anomaly_global_context.hdl”

      网络期望图像是这种类型的。此外,网络需要某些图像属性。可以使用realget_dl_model_param检索相应的值。默认值:

      “image_width”:256

      “image_height”:256

      “image_num_channels”:3

      “image_range_min”:-127.0

      “image_range_max”:128.0

分类模型:

      提供以下预训练神经网络用于分类,并可作为检测的骨干:

'pretrained_dl_classifier_alexnet.hdl':

      这个神经网络是为简单的分类任务而设计的。它的特点是第一层卷积核比其他具有类似分类性能的网络(例如pretrained_dl_classifier_compact.hdl)中的卷积核要大。这可能有利于特征提取。

      此分类器期望图像属于该类型。此外,该网络是为某些图像属性设计的。可以使用realget_dl_model_param检索相应的值。默认值:

      “image_width”: 224

      “image_height”: 224

      “image_num_channels”: 3

      “image_range_min”: -127.0

      “image_range_max”: 128.0

      网络架构允许对图像尺寸进行更改。‘image_width’和‘image_height’不应小于29像素。没有最大图像大小限制,但是大的图像大小会显著增加内存需求和运行时间。改变图像大小将重新初始化完全连接层的权重,因此需要重新训练。

      请注意,可以通过融合卷积层和ReLU层来改善该网络的运行时间,参见set_dl_model_param和参数‘fuse_conv_relu’。

“pretrained_dl_classifier_compact.hdl”:

      这种神经网络被设计成具有更高的内存和运行效率。

      分类器期望图像属于该类型。此外,网络需要某些图像属性。可以使用realget_dl_model_param检索相应的值。默认值:

      “image_width”:224

      “image_height”:224

      “image_num_channels”:3

      “image_range_min”:-127.0

      “image_range_max”:128.0

      该网络不包含任何完全连接的层。网络架构允许对图像尺寸进行更改。‘image_width’和‘image_height’不应小于15像素。

“pretrained_dl_classifier_enhanced.hdl”:

      这个神经网络比pretrained_dl_classifier_compact有更多的隐藏层。因此被认为更适合于更复杂的分类任务。这样做的代价是需要更多的时间和内存。

      分类器期望图像属于该类型。此外,网络需要某些图像属性。可以使用realget_dl_model_param检索相应的值。默认值:

      “image_width”:224

      “image_height”:224

      “image_num_channels”:3

      “image_range_min”:-127.0

      “image_range_max”:128.0

      网络架构允许对图像尺寸进行更改。‘image_width’和‘image_height’不应小于47像素。没有最大图像大小限制,但是大的图像大小会显著增加内存需求和运行时间。改变图像大小将重新初始化完全连接层的权重,因此需要重新训练。

'pretrained_dl_classifier_mobilenet_v2.hdl':

      这个分类器是一个小而低功耗的模型,因为什么原因它更适合于移动和嵌入式视觉应用。

      分类器期望图像属于该类型。此外,网络需要某些图像属性。可以使用realget_dl_model_param检索相应的值。默认值:

      “image_width”:224

      “image_height”:224

      “image_num_channels”:3

      “image_range_min”:-127.0

      “image_range_max”:128.0

      网络架构允许对图像尺寸进行更改。‘image_width’和‘image_height’不应小于32像素。没有最大图像大小限制,但是大的图像大小会显著增加内存需求和运行时间。

      在GPU上,网络架构可以从特殊的优化中受益匪浅,没有这些优化,网络就会明显变慢。

'pretrained_dl_classifier_resnet18.hdl':

      随着神经网络pretrained_dl_classifier_enhanced。这个分类器适用于更复杂的任务。然而,由于其特殊的结构,它提供了使训练更稳定和内部更鲁棒的优势。与神经网络pretrained_dl_classifier_resnet50相比。它不那么复杂,推理时间也更快。

      分类器期望图像属于该类型。此外,网络需要某些图像属性。可以使用realget_dl_model_param检索相应的值。默认值:

      “image_width”:224

      “image_height”:224

      “image_num_channels”:3

      “image_range_min”:-127.0

      “image_range_max”:128.0

      网络架构允许对图像尺寸进行更改。‘image_width’和‘image_height’不应小于32像素。没有最大图像大小限制,但是大的图像大小会显著增加内存需求和运行时间。尽管是完全连接层,图像大小的改变并不会导致权重的重新初始化。

'pretrained_dl_classifier_resnet50.hdl':

        随着神经网络pretrained_dl_classifier_enhanced。这个分类器适用于更复杂的任务。然而,由于其特殊的结构,它提供了使训练更稳定和内部更鲁棒的优势。

      分类器期望图像属于该类型。此外,网络需要某些图像属性。可以使用realget_dl_model_param检索相应的值。默认值:

      “image_width”:224

      “image_height”:224

      “image_num_channels”:3

      “image_range_min”:-127.0

      “image_range_max”:128.0

      网络架构允许对图像尺寸进行更改。‘image_width’和‘image_height’不应小于32像素。没有最大图像大小限制,但是大的图像大小会显著增加内存需求和运行时间。尽管是完全连接层,图像大小的改变并不会导致权重的重新初始化。

语义分割模型

      语义分割结合了图像分类、目标检测和图像分割,通过一定的方法将图像分割成具有一定语义含义的区域块,并识别出每个区域块的语义类别,实现从底层到高层的语义推理过程,最终得到一幅具有逐像素语义标注的分割图像。

      以下预训练神经网络用于语义 分割:

'pretrained_dl_edge_extractor.hdl':

      该神经网络是为边缘提取而设计和预训练的。因此,该模型适用于两类问题,一类用于边缘,一类用于背景。

      该网络期望图像是该类型的。此外,该网络是为某些图像属性设计的。可以使用realget_dl_model_param检索相应的值。默认值:

      “image_width”:512

      “image_height”:512

      “image_num_channels”:1

      “image_range_min”:-127.0

      “image_range_max”:128.0

      “num_classes”:2

      网络架构允许更改图像尺寸,但是‘image_width’和‘image_height’的大小必须是16像素的倍数,因此最少为16像素。

“pretrained_dl_segmentation_compact.hdl”:

      该神经网络设计用于处理具有详细结构的分割任务,并且仅使用少量内存并且运行时效率高。

      网络架构允许更改图像尺寸,但要求最小的“image_width”和“image_height”为21像素。

“pretrained_dl_segmentation_enhanced.hdl”:

      ​​​​​​​ 这个神经网络比pretrained_dl_segmentation_compact有更多的隐藏层。因此更适合于包括更复杂场景在内的分割任务。

      网络架构允许更改图像尺寸,但要求最小的image_width和image_height为47像素。

Deep OCR 模型

      为 Deep OCR 提供了以下预训练神经网络:

'pretrained_deep_ocr_recognition.hdl':

      该神经网络是深度OCR模型的预训练识别组件。它被设计用来识别被裁剪成单个单词的图像上的单词。这是深度OCR的识别部分,可以再训练。

      该网络期望图像是该类型的。此外,该网络是为某些图像属性设计的。可以使用realget_dl_model_param检索相应的值。默认值:

      “image_width”:120

      “image_height”:32

      “image_num_channels”:1

      “image_range_min”:-1.0

      “image_range_max”:1.0

      网络架构允许改变图像宽度‘image_width’。图像高度‘image_height’不能更改。参数‘image_width’非常重要:它的值可以减少或增加以适应单词的预期长度,例如,由于每个字符的平均宽度。更大的image_width将消耗更多的时间和内存资源。图像宽度‘image_width’可以在训练后更改。

http://www.lryc.cn/news/483037.html

相关文章:

  • ROM修改进阶教程------安卓14 安卓15去除app签名验证的几种操作步骤 详细图文解析
  • 基于集成Whisper 与 Pepper-GPT改进人机交互体验并实现顺畅通信
  • C++设计模式精选面试题及参考答案
  • Linux下的vim和gdb
  • (蓝桥杯C/C++)——搜索
  • 【网页设计】HTML5 和 CSS3 提高
  • FastGPT部署通义千问Qwen和智谱glm模型|OneAPI配置免费的第三方API
  • https网站 请求http图片报错:net::ERR_SSL_PROTOCOL_ERROR
  • 攻防世界38-FlatScience-CTFWeb
  • 探索 JNI - Rust 与 Java 互调实战
  • 网络安全-Linux基础(bash脚本)
  • Lucene 和 Elasticsearch 中更好的二进制量化 (BBQ)
  • jmeter基础05_第1个http请求
  • C++builder中的人工智能(25):AI中的C++多线程std::thread
  • RestSharp基本使用方法
  • MySQL与Oracle对比及区别
  • NCC前端调用查询弹框
  • 【高中生讲机器学习】25. AdaBoost 算法详解+推导来啦!
  • 第三十七章 Vue之编程式导航及跳转传参
  • vue 版本升级
  • 探索Copier:Python项目模板的革命者
  • 云原生后端深度解析
  • 本地 SSL 证书生成神器,自己创建SSL
  • HCIP-快速生成树RSTP
  • 企业级RAG(检索增强生成)系统构建研究
  • MATLAB基础应用精讲-【数模应用】Google Caffeine算法
  • 第十九届中国国际中小企业博览会将在粤开展
  • 云计算在智能交通系统中的应用
  • b4tman / docker-squid 可快速安装运行的、容器型代理服务器 + podman
  • 脉冲神经网络(Spiking Neural Network,SNN)学习(1)