当前位置: 首页 > news >正文

综述|探究深度学习在园艺研究中的应用

深度学习作为一种极具潜力的多功能工具,在图像处理及大数据分析领域展现出显著优势。该技术融合大量异构数据,能够为复杂多变现象提供可靠的预测结果。近年来,园艺研究者们越来越多地应用深度学习技术解析种植与采后过程中产生的大规模数据。今天我们为大家分享一篇发表在Horticulture Research关于深度学习的综述《Applications of deep-learning approaches in horticultural research: a review》。

该综述介绍了深度学习方法,并回顾了71项将深度学习应用于园艺领域的最新研究成果,涵盖品种识别、产量估计、品质检测、胁迫表型检测、生长监测等内容。通过详细阐述相关文献中的应用场景、应用模型与框架、用的数据及其性能表现,全面解析了该技术的实际应用成效。最后讨论了当前面临的挑战及未来发展趋势,以期为我们充分理解深度学习在园艺领域的优势与潜在局限提供参考。

图片1.png

园艺作物不仅为人类提供重要的经济价值,还塑造了文化与景观。随着科技进步,许多先进的自动化仪器和设备已被开发并应用于园艺。园艺作物的快速、准确和自动化识别以及种植和采后数据的获取,是智能园艺的重要方向。随着无人机遥感、物联网、热成像、近红外和X射线等传感技术的普及,海量异构数据的采集变得前所未有地便捷,但也带来了冗余信息处理的挑战。

为解决这一难题,研究者先后应用了传统机器学习方法,并迅速引入深度学习,对RGB、光谱等多源图像进行分层特征提取与精准预测。深度网络凭借更深的卷积结构,在园艺作物生长监测、产量预测与管理决策支持等方面已显著优于传统方法。本综述将全面回顾这些深度学习在园艺科学中的最新应用和研究进展,为学界与产业界提供系统指导。

  深度学习概述 

机器学习是一种具有前景的数据处理工具。然而,传统的机器学习方法通常还需要人工进行特征提取。随着大型数据集数量的增加以及图形处理单元(GPU)的出现,算法技术与方法不断得到改进。

深度学习是在传统机器学习的基础上扩展而来,通过在模型中添加一些“更深”(更复杂)的结构,可以自动化从原始数据中提取特征,并在某些分类和预测问题上表现出比传统机器学习更好的性能。通过应用不同层次的抽象层,可以引入多种非线性函数,使数据能够以层次化的方式表示。这一特性已被证明有助于提升许多大规模数据分析任务的建模性能。

高度层次化的结构特性以及深度学习模型强大的学习能力,使它们能够以良好的灵活性和适应性,在众多复杂的数据分析任务中尤其擅长进行预测和分类。凭借深度学习方法强大的自动特征学习能力,园艺科学领域的许多复杂问题都能高效、快速地得到解决,包括各种识别、产量估算、质量检测、胁迫表型检测、生长监测等。

  • 卷积神经网络

卷积神经网络(CNN)及其衍生模型被认为是人工智能领域中的关键深度学习方法,并在图像处理与分析方面取得了突破。CNN是一类多层神经网络,属于前馈人工神经网络(ANN)范畴,已成功应用于计算机视觉领域。在调研的文献中,CNN及其衍生方法在园艺学中的应用占比较大,共65篇,约占 92.86%。

CNN通常由若干常见组件构成,包括卷积层、池化层和全连接层,它们以不同的配置依次连接,以完成一些复杂的学习任务。典型深度卷积神经网络(DCNN)架构如图1所示。为正确分类不同种类的花卉图像,基于LeCun等和Prasad等的前期研究,研究者提出了一种多阶段CNN架构。典型CNN的输入通常为二维图像数据,其核心卷积层由多个具有可变权重的二维卷积核构成,这些卷积核通过滑动扫描图像实现特征提取功能。

图片2.png

图1:一种 DCNN 架构

在图1中,四个卷积核的尺寸分别设为16×16、9×9、5×5和5×5。卷积之后,可通过池化层压缩信息量并降低输入维度,以避免过拟合。该过程是在子采样窗口内用一个输出神经元替代多个神经元。在图1中采用的是2×2随机池化,即在原始层每个2×2的神经元区域中随机选取一个数值作为新层对应位置的神经元,从而使新层神经元数量减少4倍,并加快计算收敛。最后,这些提取的特征被送入若干全连接层进行分类。

尽管自创的网络架构可能具有创新性和突破性,但它们通常需要较高的计算机能力,普通园艺研究者难以使用。因此,研究人员通常从已被证明在多种数据结构和问题上表现良好的预训练架构入手,并将其针对具体问题进行调整,这已被证明是一种可靠且可行的常见做法。

如图2所示,预训练网络为菊花识别创建了特征提取器;分类器由两个全连接层(每层具有4096个隐藏神经元)组成;使用了批量归一化单元以提高DCNN的性能和稳定性;引入了适用于不同输入尺寸图像的全局平均池化层;并使用Dropout层来防止CNN模型过拟合。

图片3.png

图2:DCNN框架

表1:典型CNN及其对应参数

图片4.png

用于分类或回归任务的CNN架构示例包括LeNet、AlexNet、VGGNet、GoogLeNet和 ResNet(典型的CNN及其对应参数见表1)。例如,图3展示了视觉几何组网络16(VGG-16)在菊花品种识别过程中各步骤后的花卉图像可视化示例。

图片5.png

图3:VGG-16图像识别模型

  • 循环神经网络

另一种广泛用于处理序列或时间序列数据的深度学习模型是循环神经网络(RNN),该网络已被广泛应用于价格预测、自然语言处理、语音识别及其他领域。RNN的基本原理是网络能够记忆先前信息,并将其用于计算当前输出。图4展示了用于预测园艺产品价格的RNN结构示意图。

图片6.png

图4:RNN的结构

图5展示了另一种名为SAE-FNN的深度学习架构,该架构由堆叠自编码器(SAE)和全连接前馈神经网络(FNN)组成。该网络用于预测梨的可溶性固形物含量(SSC)和硬度。SAE采用无监督学习方法,其基础结构为自编码器,通过深度神经网络的非线性处理从输入数据中提取特征。如图5a所示,输入数据被编码为低维向量,随后通过解码器再次扩展以重构原始输入。因此,去除解码部分并保留编码部分后的向量将作为输入数据的特征表示。从训练网络中输出的特征被输入至FNN,形成用于预测任务的SAE-FNN网络(如图5c所示)。

图片7.png

图5:SAE-FNN架构

除了用于分类和回归任务之外,深度学习技术也被用于图像分割任务。R-CNN方法是一种两阶段深度学习目标检测方法,它将卷积神经网络与区域提议方法相结合。当前,Mask R-CNN(基于掩码的区域卷积神经网络)是图像分割领域最先进的R-CNN方法。图6展示了Mask R-CNN的网络架构,该架构由两部分组成:用于特征提取的骨干网络,以及用于边界框识别和掩膜预测的网络头部。图中可见,该模型能够自动检测并分割水果,输出的掩膜图像带有标识水果的边界框。此外,Mask R-CNN具备在像素级别将目标物体从背景中精确分离的能力。

图片8.png

图6:Mask R-CNN架构

从上述对几种常用模型的简要介绍中可以看出,深度学习技术在图像分类、回归和分割方面具有强大的作用。除此之外,还有许多其他类型的网络结构被应用,例如单次多框检测 (SSD)、长短期记忆网络 (LSTM)、you only look once (YOLO)目标检测算法、区域卷积神经网络 (R-CNN)、快速区域卷积神经网络 (Fast R-CNN)、更快的区域卷积神经网络 (Faster-RCNN) 等等。此外,所处理的数据类型不仅限于RGB图像,还可以包括其他任何形式的数据,如视频、高光谱图像和光谱数据。

最后,介绍并描述一些用于评估网络性能的评价指标十分有帮助。文章所回顾的论文中使用的一些性能指标定义如下:

  • 分类准确率 (CA):衡量分类结果中正确分类的图像或类别数量占图像或类别总数的比例。对于多类分类问题,分类准确率在所有类别上取平均值。

  • 精确率:真阳性(TP)与真阳性和假阳性(FP)之和的比值,计算公式为 P = TP/(TP + FP)。  

  • 召回率:真阳性与真阳性和假阴性(FN)之和的比值,计算公式为 R = TP/(TP + FN)。  

  • F1值(F1):精确率与召回率的调和均值(加权平均值),其范围在0(最差)到1(最佳)之间,计算公式为 F1 = 2 * (TP * FP)/(TP + FP)。 

  • 均方根误差(RMSE):预测值与观测值之差的均方根。

  深度学习在园艺作物中的应用 

深度学习技术已在园艺领域成功应用,并取得了良好成效。深度学习方法在园艺领域的应用包括品种识别、产量估算、质量检测、胁迫表型检测、生长监测等。文章回顾了文献中所研究的具体问题、所实现的网络架构与模型、所使用的数据来源、基于所采用指标的整体性能表现、与其他方法的比较,以及部分示例原始代码的链接或来源。

01 园艺作物的鉴定与分类

根据不同特征对园艺作物进行自动识别和分类是园艺研究的主要挑战。由于作物类型多样,园艺作物的识别任务非常艰巨。目前至少有91种水果作物,超过200种蔬菜作物和超过6000种观赏性栽培品种,而且每年都有大量新品种涌现,也有大量品种被淘汰。此外,园艺作物可能发生多种形式的变异,导致同一类别内存在显著的差异性。尽管人工分类具备可行性,但在处理海量样本时,这种方法通常耗时冗长且容易产生错误。将深度学习方法应用于物种或品种的识别和分类,将是园艺研究中的一个前所未有的突破。

当前,由于卷积神经网络(CNNs)的成功应用,图像分类和事件预测的准确性得到了极大提升。文章中提到几个案例,比如利用开放数据库ImageNet的5类蔬菜训练了1个深度卷积神经网络,准确率达到了92.1%;利用来自KLUFD和OUFD花卉数据训练了一个CNN模型,花卉识别准确率为97.78%。还有利用自有数据集训练模型的,Liu等人提出了一个基于 VGG-16网络的深度学习模型,用于识别本团队收集的两个数据集中的大花菊花。数据集A校准准确率(top-5率超过98%),数据集B(top-5率超过78%)。此外,还有一些针对水果比如李子、葡萄、橄榄品种分类的应用,均有不错的表现。

除了使用 RGB 图像外,Fernandes 等人还利用光谱信息对两种主要葡萄品种进行了区分。为构建分类模型,收集了来自64个品种、626株植株的共35,833条光谱数据。结果表明各模型各有所长:在TNvar 的分类中,SVM模型优于CNN,对TNvar光谱的正确分类率为81.9%,对非TNvar光谱的正确分类率为63.0%;在TFvar的分类中,CNN取得最佳效果,TFvar光谱和非TFvar光谱的正确分类率分别为93.8%和91.6%。

除了品种识别之外,深度学习还被广泛应用于果园水果的自动检测。开发一个可靠且精确的水果检测系统是构建自主采摘系统的第一步,而自主采摘系统是未来农业应用中一个极具前景的方向。为了在果园环境中开发高效且稳健的水果检测系统,许多研究者开展了相关研究,以应对工作环境中光照变化、叶片遮挡和外观变化等复杂情况。

为在苹果园中实现稳健高效的水果与枝条检测分割,Kang团队基于深度学习提出了一系列神经网络框架。实验结果表明,其中ResNet-101版LedNet在果园苹果检测任务中取得了86.4%的准确率、0.849的F1分数和84.1%的召回率;ResNet-101版DaSNet在枝条与苹果的语义分割任务中分别达到77.2%和87.6%的精度。

表2:深度学习在园艺作物识别与分类中的应用

图片9.jpg

图片10.jpg

图片11.jpg

02 园艺作物产量估计

生产者和农业公司通常需要对园艺产品的收获前产量进行早期且准确的估算,以指导采收和营销流程。产量估算实际上可归结为计算机视觉中的目标计数问题,该领域在群体计数问题和其他与植物相关的计数问题中已展现出良好性能。在当前研究中,此类产量估算方法已被应用于园艺作物。综述主要回顾了柑橘、香蕉、芒果等水果产量估算的应用案例。

为估算柑橘产量,Apolo-Apolo等人开发了一种基于Faster R-CNN模型的方法学,用于检测柑橘果实存在状态、统计果实数量并测量果实尺寸,同时建立了基于LSTM的网络进行产量估算。结果显示,将人工计数结果与模型检测结果进行对比时,平均标准误差(SE)仅为6.59%。此外,在比较单株实际产量与估算产量时,标准误差为4.53%,标准差(SD)为0.97千克。

有两个团队分别将深度学习应用于香蕉,Rebortera 等人构建了一个深度多功能系统,集成了多层 LSTM(长短期记忆网络)层以预测香蕉收获产量。在另一项研究中,Neupane团队开发了基于Faster R-CNN Inception-V2模型的深度学习算法,该算法能精准检测无人机采集的高分辨率RGB图像中的香蕉并完成计数任务。

此外,由于单视角图像可能低估果实产量(果实可能被叶片或其他果实遮挡),有研究还提出了一种应用视频跟踪系统的方法。与手动计数方法相比,所提出的基于视频的跟踪模型通过增加额外的成像视角检测到2050个果实(占收获总量的62%),偏差校正后的均方根误差为每棵树18.0个果实;而双面双视角图像模型检测到1322个果实(40%),偏差校正后的均方根误差为每棵树21.7个果实。

从回顾的园艺产品采收前产量估算的应用示例中可以看出,研究人员取得了一些良好成果。在科学家们的努力下,未来这些技术将应用于实际生产,以指导种植方案、收获计划和营销决策。本小节提到的研究技术细节已汇总于表3。

表3:深度学习在园艺作物产量估计中的应用

图片12.jpg

03 园艺作物质量检测

随着生活水平的提高,人们对日常水果和蔬菜的品质提出了越来越高的期望。然而,在生产、种植、储藏、运输、销售等环节,水果和蔬菜容易受到病害、虫害、机械损伤以及不当采后处理的影响。一旦发生损伤,园艺产品的食用价值和经济价值都会降低。因此,园艺产品,尤其是水果和蔬菜的品质检测,已成为一个具有挑战性且备受关注的热点研究领域。

在最新研究中,结合RGB图像或光谱技术的深度学习方法已被广泛用作有效且非侵入式的园艺产品质量检测手段,成功解决了采后分级分类、成熟度检测、损伤检测及营养成分预测等实际问题。相较于传统机器学习方法,深度学习方法在处理图像数据、光谱数据或声音数据方面展现出更优的分类性能。

Nasiri等人提出了一种基于RGB图像和VGG-16架构应用于有缺陷枣与健康枣辨别方法。该团队所提出的CNN模型分类准确率高达96.98%。在另一项研究中,Rosanna等人探讨了结合深度学习与图像处理的香蕉分级分类方法,并取得了超过90%的准确率。枣和香蕉的分级主要依赖可见的表面缺陷,这些特征可以在RGB图像数据中清晰呈现。然而,果蔬的内部或皮下损伤以及食用品质无法通过视觉识别。

无损检测技术,如近红外光谱仪、高光谱成像仪和热成像仪,可在不破坏物体的情况下检测其内部状态,被认为是传统检测与分析技术的可行解决方案。快速而准确地处理大量高光谱图像数据是一大挑战。作为一种流行的机器学习方法,深度学习已被用于处理复杂、海量数据。

Wang等利用深度学习技术结合高光谱透射数据,聚焦于蓝莓内部隐形的机械损伤。ResNet架构被选用于该卷积神经网络(CNN)模型。此外,还使用了五种传统机器学习算法进行对比,即线性回归(LR)、序列最小优化(SMO)、集成学习算法(Bagging) 与多层感知机(BMP)以及随机森林(RF)算法。微调后的ResNet平均准确率达到88.0%,F1分数为0.90。该深度学习框架在检测水果内部机械损伤方面具有巨大潜力。另外,还有一个研究基于深度学习的全卷积网络(FCN)模型和高光谱透射图像(HSTI)来精确检测蓝莓的内部挫伤。此外,还有一些冬枣、黄瓜的研究也是用于检测果实损伤。

可溶性固形物含量(SSC)和硬度是园艺产品食用品质最重要的属性,直接影响消费者满意度。可见/近红外高光谱成像技术因其高灵敏度和高精度,已被用于果实内部质量特性和化学成分的无损检测。光谱检测方法的原理是测量果实表面反射或透射光谱,并建立所测光谱与果实化学成分之间的关系。然后,可依据某些化学计量学方法,利用所获得的光谱来指示可溶性固形物含量和/或硬度。

Bai等人关注对采自多个地理产区苹果可溶性固形物的精确预测。通过将近红外(NIR)分析、光谱指纹特征提取、最优波长选择、模型搜索策略、产地识别与基于深度学习的多元回归分析相结合,开发了一种多产地苹果SSC预测方法。该模型获得的预测相关系数(Rp)和预测均方根误差(RMSEP)分别为99.0%和27.4%。

激光背散射法是另一种可用于果实样品无损检测的光学技术。Wu等构建了一个11层结构的AlexNet模型,通过激光诱导的光背散射成像识别苹果的缺陷区域、正常区域、果柄区域和萼片区域,识别率达到92.5%,准确度优于传统机器学习算法。

表4:深度学习在园艺产品质量检测中的应用

图片13.jpg

图片14.jpg

04 园艺作物生物/非生物胁迫检测

传统植物胁迫识别与分类主要依赖人工观察进行主观判断,存在人为误差且效率低下等问题。计算机视觉与机器学习技术结合可实现自动化识别分类,具备精准、可扩展和高通量表型分析能力。在众多机器学习方法中,深度学习因其显著提升目标检测与识别性能的优势,被认为是优化植物胁迫表型分析的有效手段。文章中对番茄、黄瓜、茄子、洋葱、苹果等植物的病虫害进行了回顾。

为识别番茄所受的各类生物和非生物胁迫,研究人员利用不同类型的深度学习方法进行了尝试。Fuentes等将Faster R-CNN、基于区域的全卷积网络(R-FCN)和SSD三种深度学习元架构,与两种深度特征提取网络(ResNet和VGGNet)相结合,用于检测番茄病虫害。在病害检测方面,Karthik等基于包含叶霉病、早疫病和晚疫病三种番茄病害的PlantVillage数据集,提出了一种在残差卷积神经网络中引入注意力门控机制的模型。在另一项研究中,从开源的PlantVillage数据库获取了番茄图像;图像包含多种细菌性(细菌性斑点病)、病毒性(番茄花叶病毒和番茄黄化卷叶病毒)和真菌性(叶霉病、靶斑病、早疫病和晚疫病)疾病及害虫(如蜘蛛螨)。所提出的框架在GoogLeNet上达到99.18%的准确率,而AlexNet的准确率为98.66%。

在黄瓜病害(包括炭疽病、白粉病、霜霉病、灰霉病、靶斑病和黑斑病等)识别方面,深度学习技术同样得到应用。林等提出了一种基于卷积神经网络(CNN)的语义分割方法用于识别黄瓜叶片白粉病,取得如下检测效果:平均像素精度达96.08%,Dice准确率为83.45%,交并比达72.11%。另一项针对黄瓜病害识别模型的研究中,深度卷积神经网络(DCNN)模型实现了93.4%的准确率。

在另一项应用中,研究者提出采用AlexNet和VGG-16神经网络对五种茄子病害(小叶病、茄二十八星瓢虫侵扰、尾孢叶斑病、烟草花叶病毒(TMV)和二斑叶螨)及健康植株进行分类,所用图像来自智能手机拍摄。改进的VGG-16模型取得了93.33%的准确率。

另有研究通过将扩张卷积神经网络与全局池化相结合,提出了一种新型的全局池化扩张卷积神经网络(GPDCNN)架构,用于识别黄瓜叶部病害(灰霉病、白粉病、炭疽病、霜霉病、黑斑病和角斑病)。实验结果表明,与深层卷积神经网络(DCNNs)和AlexNet相比,GPDCNN具有更高的识别准确率和更短的训练时间。

在近期一项研究中,研究人员开发了基于图像的田间监测系统与弱监督训练方法相结合的技术,用于实时自动检测洋葱病害并监测其生长状况。实验结果显示,在交并比(IoU)阈值为50%(即50%重叠度)的条件下,该系统平均精度均值(mAP)达到现有所有模型中的最高水平,数值介于74.1%至87.296%之间。另一项研究则利用卷积神经网络(CNN)对马铃薯块茎病害进行五分类识别(包含四类病害和健康类别),取得了96%~97%的准确率。

Alruwaili等学者提出改进型AlexNet卷积神经网络模型用于橄榄病害检测与分类,该方法整体准确率、召回率、精确率和F1分数分别达到99.11%、99.11%、99.49%和0.9929%。在苹果叶部病害检测领域,研究团队基于DenseNet-121深度卷积神经网络提出了三种方法:回归分析法、多标签分类法及焦点损失函数法。这三种方法在测试集上的准确率分别为93.5%、93.3%和93.7%,均优于传统多分类方法的检测效果。

为实现病害自动识别与分类,有研究提出了一种多层卷积神经网络(MCNN),用于检测芒果叶片炭疽真菌病害的分类准确率达到97.13%。LeNet架构被应用于香蕉叶片病害的分类与识别41。针对郁金香碎色病毒(TBV)的检测,研究提出的Faster R-CNN架构检测效率达到每幅图像0.13秒。基于494个特征的深度信念网络(DBN)模型实现了对轻微腐烂、中度腐烂和重度腐烂桃子的分类,结果显示上述三类桃病害的最高分类准确率分别为82.5%、92.5%和100%。

植物病害的早期准确检测被认为是维持并提高作物品质、最大限度减少产量损失的有效方法。因此,深度学习技术凭借其在田间植物病害检测方面的高精度与高效性,已在全球范围内获得广泛认可。表5对本小节所述研究的技术细节进行了汇总总结。

表5:深度学习在园艺作物胁迫检测中的应用

图片15.jpg

05 园艺作物生长监测

作物性状对植物育种者及生产者的栽培管理、基于产量性状或品质性状进行优异基因型选择的智能决策均具有重要意义。提前自动采集园艺作物生长信息,可为果蔬成熟过程中种植者监测生长状态并规划采收时间线提供依据。

Lu及其团队提出了蘑菇定位与生长监测方法,其采用YOLO算法实现图像中蘑菇的定位,并提出定位校正方法优化定位结果。在准确定位蘑菇后,开发了基于图像测量的菌盖直径记录系统,通过持续拍摄的蘑菇图像,采用YOLO-V3+SP算法计算菌盖圆形区域并记录生长信息,该方法性能优于传统的圆形霍夫变换方法(基于OpenCV内置算法实现)。

在果园自动化与智能化管理中,自动检测和识别不同生长阶段的水果和花卉极为关键。Tian等人提出了一种实例分割模型(MASU R-CNN),通过在Mask Scoring R-CNN中引入U-Net主干,实现对苹果花花蕾期、半开期和全开期三个阶段的检测与分割。此外,Tian等人提出了一种改进的YOLO-V3模型,用于在复杂背景下检测果园中幼果期、膨大期和成熟期的苹果。所提出的YOLO-V3-dense模型的检测性能优于原始YOLO-V3和基于VGG-16网络的Faster R-CNN模型。

Wang等人还在苹果园中开发了一种自动化生长监测系统,用于在疏果期和果实成熟期监测苹果生长。他们使用融合卷积特征(FCF)模型对苹果图像进行分割,该方法测得苹果水平直径的平均绝对误差为0.90毫米。在另一项研究中,Tu等人结合自然户外RGB-D图像,利用DSIFT(稠密尺度不变特征变换)算法和LLC(局部约束线性编码)方法,开发了一种用于检测百香果并识别其成熟度的机器视觉模型。最后,将RGB-DSIFT-LLC提取的特征输入 SVM 分类器,用于识别果实成熟度的五个等级:幼果、近幼果、近成熟、成熟 和过熟。所提方法在目标检测上的准确率为 92.7%,在成熟度分类上的准确率为 91.5%。Ni等人采用了另一种基于 Mask R-CNN 模型和迭代标注策略的深度学习方法,对蓝莓果实进行检测和分割,以监测其成熟度。所提模型取得了较好的预测性能:检测果实数量与真实值之间的决定系数 (R2) 为 88.6%,均方根误差 (RMSE) 为1.484。

重要的是要将与花序相关的图像区域大小和花序数量视为开花指标。Wang等人开发了一种机器视觉评估系统,用于检测芒果植株不同发育阶段的花序,从绿色到淡黄色、淡粉色再到棕红色,这些颜色对应了花序从早期到晚期的发育阶段。在另一项研究中,Koirala等人基于深度学习方法提出了四种架构,用于对芒果花序的三种不同阶段进行分类:花序中花朵尚未完全开放(呈白色)、花序中花朵已开放,以及出现落花和坐果的花序。

虽然YOLO-V3-rotated模型在总穗数统计方面具有更高的准确度,但R2 CNN-upright模型在穗期分类任务中表现更优。为从生菜田采集的大规模航拍图像中提取生长与数量信息,Bauer等学者提出了AirSurf-Lettuce平台,该平台采用基于CNN的深度学习模型。该平台能够自动测量田间结球莴苣的产量相关性状,包括田间尺寸分布、莴苣大小分级、植株数量统计以及带有GPS标签的收割区域定位,在支持智能化精准农业监测方面展现出巨大潜力。

从上述研究可知,深度学习方法已应用于园艺作物生长监测,并取得了较好的预测和分类效果,具体技术细节见表6。

图片16.jpg

图片17.jpg

06 其他应用

基因组预测(Genomic Prediction,GP)是通过全基因组范围的分子标记信息预测未检测优良遗传特性的技术方法。近年来,深度学习技术作为一种强大的机器学习工具,无需深入分析即可定量预测表型,为处理日益增长的遗传与基因组数据提供了新途径。尽管基因组预测技术已被广泛用于提升动植物的育种效率,但其在园艺作物中的应用仍处于初步探索阶段。Zingaretti等评估了深度学习技术对两种常见且重要的园艺水果—同源四倍体蓝莓和异源八倍体草莓的基因组预测效果。这两套数据集共包含1802例同源多倍体蓝莓(2n=4x=48)和1358例异源多倍体草莓(2n=8x=112)个体,通过基因分型分别构建了73,045个和9908个单核苷酸多态性(SNP)标记,并通过果实大小、硬度、采痕、重量和产量五个不同农艺性状进行表型分析。深度学习在基因组预测(GP)中可能优于某些标准线性方法的一个潜在优势在于,它能够全面考量包括上位性和显性效应在内的所有可能遗传互作机制,而这些机制在大多数多倍体中尤为重要。

园艺产品的销售是产品供应链中的重要环节。由于农户生产与真实市场信息之间,以及产品供需社会信号之间都存在不对称性,园艺产品价格波动较大。因此,在制定种植计划时对园艺产品价格进行预测显得尤为重要。Weng等人采用自回归积分滑动平均(ARIMA)模型、BP神经网络和循环神经网络(RNN)方法,对不同园艺产品(黄瓜、西红柿和茄子)的日、周及月平均价格进行预测。通过网络爬虫技术,他们从网站上收集了大量园艺产品价格数据。结果表明,包括BP神经网络和RNN在内的神经网络方法在价格预测准确性方面优于ARIMA模型。他们认为,深度学习方法将在不久的将来成为园艺产品价格预测的主流方法。

  深度学习技术的优缺点 

深度学习技术最显著的优势在于其自动化的特征提取、分类和预测过程。一般而言,随着模型层数的增加,深度学习模型的预测精度会随之提升,但这也伴随着计算复杂度的增加。此外,构建一个良好的特征提取器并非易事。事实上,针对园艺植物(包括花卉和果实)开展的大量预测与分类研究,多采用现有模型或仅对其进行微调,且主要贡献者大多来自计算机科学和图像处理领域的研究人员。

因此,人们更多关注于图像通用特征提取和分类技术,而非特定园艺产品的特征。例如,在作物产量估算的应用中,手动提取可能显著影响作物生长的特征几乎不可能。因此,设计能够专注于此类特征提取流程的深度学习模型,以更高效、低成本地将深度学习模型应用于园艺科学,显得尤为重要。

幸运的是,深度学习还有另一个有用特性:迁移学习能力。利用该技术,研究人员可以利用已用大量源数据训练好的现有模型来解决类似问题。通过这样做,他们通常只需调整部分层,并使用目标数据(即他们要学习的数据)来微调已训练模型。通过微调,可提高后续任务建模的效率和性能。例如,在上述研究中,有些案例利用基于大规模数据集(如ImageNet)预先设计的网络(如VGGNet或AlexNet),并通过微调将其应用于所需数据量远小于原始数据集的特定学习任务,从而获得优于以往的结果。

深度学习由于包含更复杂的模型结构且需要更高的计算需求,其发展及应用在一定程度上受到非计算机专家的限制。所幸的是,全球范围内的计算机科学家和深度学习爱好者等贡献者已开发出众多软件和硬件工具,帮助非专业研究者轻松快捷地开发深度学习技术。在软件支持方面,一些流行模型及其变体经过专门设计以降低编程难度,使非专业研究者能快速构建所需网络。前文提及的AlexNet、CNN-SSAE、DaSNet、LedNet和VGGNet等模型仅是其中代表。除了这些现成的模型,还存在大量可供园艺领域研究人员学习的网站资源,通过这些平台他们可以提升深度学习技能并构建专属模型。

在硬件支持方面,搭配NVIDIA推出的CUDA(Compute Unified Device Architecture)工具包的GPU是加速深度学习计算的理想选择。此外,还有一些专门为加速深度学习流程而设计的硬件,包括Google开发的张量处理单元(TPU)、Intel的AI处理器、视觉处理单元(VPU)和神经计算棒 2(NCS 2)、斯坦福大学的高效推断引擎(EIE),以及麻省理工学院面向深度卷积神经网络的节能可重构加速器(Eyeriss),它们都是强有力的加速工具。所提出的网络框架与硬件加速工具可协同使用,能够大幅缩短计算时间,并具备出色的预测和/或分类能力,以满足数据处理实时应用的需求。

尽管如此,不可否认深度学习也有其自身的缺点。首先,由于数据集庞大、需要调整的权重数量众多,优化任务有时非常复杂且耗时;此外,还存在硬件限制以及如第"深度学习概述"部分所述模型中需要调整的大量复杂超参数。再者,要复现某项研究并与其他研究进行对比,必须公开源代码/算法和模型参数,同时应将衡量性能的评估指标进行标准化。

通过梳理已有研究发现,不同文献采用的方法所对应的性能指标存在较大差异。例如,文献中常用准确率、精确率、召回率、F1分数、mAP、RMSE和IoU等性能指标来评价模型效果。然而,若要对已报道的模型进行横向比较并提升现有研究的模型性能,未来研究需要统一和标准化这些性能指标的应用。此外,不同物种或对象的建模过程中采用的模型结构、学习算法、超参数或验证流程均存在差异,这种特异性限制了所提出技术在特定研究领域之外的广泛应用。未来需通过技术标准化突破瓶颈,构建鲁棒性强且易于操作的模型。届时,园艺科学家等非计算机专家也能在实际应用中便捷地调用这类用户友好型模型。

另一局限性在于,大规模可靠数据集的收集与清晰的数据标注工作不可避免地具有繁琐性,这使得研究者完成任务的复杂性显著增加。若缺乏标注数据的支持,深度学习的成功将难以实现。数据采集与标注既至关重要又耗时费力,因此全球科研人员应当共同致力于数据收集工作。此外,由于个人、研究团队乃至机构的数据采集能力均存在局限性,收集到的数据应当上传至开放访问数据库,以降低准入门槛并加速科研数据资源共享。值得关注的是,目前在GitHub等由技术爱好者开发的类Git平台上,已有众多持续更新的代码共享范例,为非专业用户提供了模型共享与数据校验的途径。因此,只有通过园艺学家与计算机科学家的协同攻关,才能在智慧园艺领域的关键挑战中取得实质性突破。

  总结、讨论和未来展望 

  • 总结和讨论

通过对现有研究的系统梳理发现,当前研究重点主要集中在深度学习模型开发及其在园艺研究领域的潜在应用。深度学习技术在园艺领域的应用仍处于起步阶段,但正处于快速发展期。2016年至今(文章发表于2021),针对园艺作物领域共有71篇相关文献,研究内容除综述性论文(占2.82%)外,主要集中于物种识别与品种分类(33.80%)、品质检测(18.31%)、产量预测(9.86%)、病虫害管理(21.13%)和生长监测(14.08%)等方向的深度学习方法应用。其中2019年发文量较2018年增长了130%(2018年13篇,2019年30篇)。由于多数研究基于图像处理技术,92.96%的文献选择使用卷积神经网络及其变体进行建模。本文梳理过的文献(表2-6),78.87%(71篇中的56篇)的研究通过合理实验设计,将所提方法与同类先进技术在相同问题上进行了有效、正确且直接的对比。研究结果表明,深度学习在诸多农业任务中相比传统机器学习方法表现出更优性能。

在模型性能评估方面,原始作者采用了多种性能指标,各项指标均与对应研究中采用的模型相关联。对于部分未明确说明准确率/正确识别率定义的研究,文章默认其引用的是分类准确率(CA)。由表2至表6可知,CA是最常用的评价指标(43篇文献,占比60.56%),其次是F1值(18篇文献,占比25.35%)。部分文献采用均方根误差(8篇)、决定系数R²(3篇)或其他指标。在71项研究中,有27项(38.03%)通过组合多个性能指标来评估结果,通常会在CA指标的基础上,同时采用F1值、精确率、召回率或交并比(IoU)等指标对模型的预测性能进行综合评价。

由于每篇论文采用的数据集、性能指标、预处理方法、模型及参数各不相同,因此很难对不同论文的研究结果进行横向比较和泛化分析。文章中的比较归纳严格限定在单篇文章。综述最后仍然尝试对不同技术进行评价和对比,但需要提醒读者的是,由于各研究者采用的数据集和其他参数可能并不一致,相关结论需持谨慎态度看待。在使用分类准确率(CA)作为评估指标的71篇论文中,有43篇报告的准确率超过90%,显示出良好的性能表现。最高的分类准确率(CA)均超过98%,表现十分优秀,分别由以下研究获得:Amara 等(LeNet 模型,99.72%)、Feng 等(卷积神经网络(CNN),99.62%–100%)、Zeng 等(改进的 LeNet 模型,99.25%)、Brahimi 等(GoogLeNet,99.18%;AlexNet,98.66%)、Alruwaili 等(改进的 AlexNet 模型,99.11%)、Neupane 等(Faster R-CNN Inception-V2 模型,98.7%)、Giefer 等(VGG-16 模型,98.36%)、Karthik 等(残差卷积神经网络,98%)、Bauer 等(卷积神经网络,超过98%)以及 Sun 等(深度置信网络(DBN),93.3%–100%)。

另一方面,在43篇以CA作为度量指标的论文中,AlexNet是采用最多的模型(10 篇,占 23.2%),其次是 VGGNet(8篇,占18.6%)和 ResNet(5篇,占 11.6%)。在 18 篇以 F1 作为度量指标的论文中,有6篇的F1值超过 0.90;最高值分别由 Ampatzidis 等人(YOLO-V3 模型,0.998)、Amara 等人(LeNet模型,0.9971)和 Alruwaili 等人(改进的AlexNet模型,0.9929)获得,均在0.99以上,表明其性能优异。Wang等人的研究虽获得了最低的F1 分数(FCF模型,0.531),但在GPU上的平均运行时间大幅缩短,仅为每张图像 0.075 秒。

  • 园艺领域深度学习的未来展望

随着科学研究的进展,深度学习方法及其应用将在园艺行业产生重大影响,并有潜力克服农业行业中的各种挑战(如生产力挑战、环境变化、粮食安全和可持续性)。表2–6列出了园艺科学中深度学习方法的多种现有应用,表明在物种分类、品质检测、产量预测和病虫害管理方面已有尝试。

尽管在大多数研究中深度学习表现优异,但读者要迅速为特定任务选择合适的模型并不容易。这一困难不仅源于深度学习模型的选择,还与硬件和软件条件、权重初始化、学习算法、学习率、激活函数、超参数、验证流程、数据来源及数据预处理方法等多方面因素有关。因此,与其说深度学习是一门科学,不如说它更像一门高度依赖个人经验的艺术。如果要将已建立的模型广泛应用于普通农场和果园,就必须接受检测精度可能会降低的现实。由于大多数研究都将深度学习用于图像目标检测,最终选择了卷积神经网络(CNN)并成功应用于园艺植物及产品的识别和产量估算。

基于卷积神经网络(CNN)的目标检测方法主要分为三类。第一类是以目标识别为主的核心CNN架构,包括LeNet、AlexNet、VGGNet、GoogLeNet和ResNet等经典模型。第二类方法在第一类基础上,结合区域提议方法实现两阶段深度学习目标检测,在提升检测率的同时加速检测速度,主要包括R-CNN、Faster R-CNN和Mask R-CNN等系列方法。第三类为端到端的单阶段深度学习目标检测算法,可直接输出多目标的类别与定位框,典型代表包括YOLO和SSD等方法。基于这些模型,可实现水果产量的自动估算、自动实施疏花疏果等园艺作业,并完成植物胁迫的早期检测。

然而,对于园艺产品的品质检测和园艺植物的胁迫检测,例如一些隐形质量指标或早期淤伤检测,单纯的视觉分析方法效果较差。从表4和表5可见,研究者不仅采用了常规的卷积神经网络(CNN)方法,还使用了SAE-FNN、CNN-SSAE、DBN等网络,以实现对大量高光谱图像数据的快速精准特征提取,并检测果实品质(如可溶性固形物SSC和硬度)及植物胁迫(如早期淤伤检测和病害识别)。此外,可见/近红外高光谱成像可在人眼察觉症状之前,实现对植物胁迫或果实内部淤伤的早期检测,因而深度学习方法在该领域也大有可为。因此,应将深度学习技术与这些快速无损检测技术相结合,充分挖掘其在直接缺陷检测中实现高效特征提取的巨大潜力。另外,RNN或LSTM模型结合高性能回归算法或分类器,也是未来园艺研究(尤其是园艺产品产量和价格预测)的有前景选择。本综述中给出了一个应用LSTM预测香蕉收获产量的示例,以实现有效且高效的决策制定和前瞻性规划。

此外,由于硬件计算能力的提升和硬件供应的完善,训练过程可在更短时间内完成。随着面向人工智能的高通神经处理SDK(软件开发工具包)及其他移动平台的商业化普及,手持智能设备和移动端深度学习应用将在不久的将来服务于普通农场和果园。部分已在植物科学应用中成功部署深度学习概念的案例——如园艺产品图像识别与质量评估、植物胁迫早期检测系统以及产量预测等——可进一步转化为园艺领域的实际应用。根据文献调研,部分学者在模型训练完成后,进一步将树干、枝条或果实识别算法集成至移动设备。然而,要真正实现移动端深度学习仍需解决诸多难题,例如如何将模型嵌入移动设备、如何实现传感设备的小型化等。因此,达成这一目标仍需更多研究投入。

当前,深度学习技术已能为复杂的园艺工作打开智能园艺的大门。基于这些精确的表型数据,我们可准确监测作物在关键生长期的生长特征及与产量相关的重要性状,并实施精准的农业决策管理。如表1所示,深度学习与图像数据结合的性能持续提升,相关模型也已在园艺科学中成功应用。然而,如前所述,在迄今提出的各类技术中为园艺科学特定应用场景选择最适模型仍是艰巨任务。此外,亟需构建包含植物图像的大型数据集以创建稳健模型。我们强烈建议在采集植物表型数据时使用田间真实环境下的图像数据(如含不同遮光、光照及相互遮挡条件)构建训练集。正确标注并开源共享这些数据集可避免重复采集工作。随着园艺学家与计算机科学家之间的协作研究与日俱增,我们坚信深度学习技术将具备更大潜力,以更智能精准的方式赋能园艺产业,提升产量与品质,并优化植物胁迫与病害的检测能力。

  结    论  

随着园艺科学数据量的激增,深度学习技术已成为研究热点,并开辟了人工智能新领域。深度学习方法为数据同化提供了强大工具,其在客观记录植物生长、精准判断植株状态以及快速检测产品品质等方面展现出巨大潜力,有望突破园艺科学领域现有挑战。该技术成功实现规模化应用的关键,在于计算机科学与园艺学领域科学家的通力合作,以及数据采集与高效管理流程的无缝衔接。此类努力将有助于构建一个计算生态系统,为促进种植、实现果园智能化管理及解决其他问题提供巨大机遇。本文讨论的部分解决方案也有望在不久的将来实现商业化应用,例如搭载基于区域的快速卷积神经网络(CNN)的自动机器人可被用于移栽、果实采摘或产量预估。本综述旨在介绍这一相对新颖且高效的工具,使园艺领域的研究者和从业者能够有效管理研究中可能产生的大量数据,同时激励研究者利用或优化数据解决实际问题,逐步推动园艺产业向智慧化方向发展

2024.10.28产品总览.png

http://www.lryc.cn/news/570578.html

相关文章:

  • Turbo C 3.0安装及使用说明
  • Spring是如何实现有代理对象的循环依赖
  • linux操作系统各版本直接的区别?
  • Junit Test a getter
  • Spring+Quartz实现定时任务的配置方法
  • 拯救OIBH总部
  • 甘特图工具和资源。你了解多少?
  • 62、数据访问-druid数据源starter整合方式
  • Python小酷库系列:Python中的JSON工具库(3)
  • DeepSeek提示词指南:从基础到高阶的全面解析
  • C++ 01背包问题
  • Agentic Workflow是什么?Agentic Workflow会成为下一个AI风口吗?
  • win7系统怎么打开Windows PowerShell
  • MySQL-DCL数据控制语言详解
  • 双击ctrl搜索 意在颠覆用户的习惯
  • RPG29:制作ui基础
  • 蜘蛛日志分析工具_如何分析网站日志 - 360蜘蛛池
  • 免费遥感影像数据下载网址汇总
  • 医学病例关键词抽取与信息拼凑系统
  • Java正则分组:高效捕获与引用技巧
  • 微信小程序引入iconfont
  • js写txt文件及js数组的有关操作
  • 模型上下文协议(MCP)使用指南
  • 项目工时估算PERT法
  • 数学建模网站汇总
  • 1688 API 接口接入说明与文档
  • java中的异常(带你全面了解异常)
  • 计量经济学期末考试
  • 学习笔记-协议
  • PWM调节输出可控直流电压