论文学习——进化动态约束多目标优化:测试集和算法
论文题目:Evolutionary Dynamic Constrained Multiobjective Optimization: Test Suite and Algorithm
进化动态约束多目标优化:测试集和算法(Guoyu Chen ,YinanGuo , Member, IEEE, Yong Wang , Senior Member, IEEE, Jing Liang , Senior Member, IEEE, Dunwei Gong , Senior Member, IEEE, and Shengxiang Yang , Senior Member, IEEE)IEEE TRANSACTIONS ON EVOLUTIONARY COMPUTATION, VOL. 28, NO. 5, OCTOBER 2024
刚开始学习多目标优化算法,不作商业用途,如果有不正确的地方请指正!
个人总结:
摘要
- 以往的测试集没有充分考虑真实世界场景的一些特性,如可行域的大小、位置和形状的时变性,可控的变化剧烈程度,以及较小的可行域。
- 针对这些问题,提出了一种具有两阶段多样性补偿策略的动态约束多目标进化算法( DCMOEA )。
- 在第一阶段随机产生一些初始个体来代替历史个体,提高了全局多样性。
- 在第二阶段,计算过去两个环境中Pareto解集中心点之间的增量,并将其用于自适应扰动解,形成对新环境具有良好多样性的初始种群。
引言
本文提出的想法
- 在目标函数和约束的生成器的基础上,提出了一组关于DCMOPs的基准函数,称为DCP。DCP涵盖了真实世界DCMOPs的典型特征,如可行域变化复杂、变化剧烈程度可控、可行域较小等。
- 提出一种两阶段多样性补偿策略( TDCEA ),在新环境出现时产生初始种群。在第一阶段,产生一组随机个体。在可行集中引入的随机个体的数量由当前种群中可行个体的比例决定。其余随机产生的解替换可行解。然后,在第二阶段为每个个体增加一个由目标的可行性和动态性决定的增量项。与现有的用随机解代替解的方法不同,我们的方法充分利用了可行性信息和动态环境的特征来增强种群的多样性。
背景及相关工作
A.DCMOP基础
根据目标函数和约束条件的动态性,可以将DCMOPs分为三种类型。
Ⅰ型:目标函数随时间变化,约束条件固定。
第二类:目标函数固定,约束条件随时间变化。
第三类:目标函数和约束条件均随时间变化。
B.现有的方法
DCMOPs产生于DMOPs和CMOPs的交集。求解DMOPs的变化响应策略和求解CMOPs的约束处理技术作为它们常用的问题求解器,可以为求解DCMOPs提供有价值和潜力的方法。现将三种主流的变革应对策略总结如下:
- 动态响应中的 基于多样性,存档和预测策略
- 基于惩罚函数的技术通过在目标函数中添加与约束违反度成比例的惩罚项来构造适应度函数
- 分离技术通过个体的约束违反程度和目标值来评价个体
- 在基于多目标优化的技术中,约束条件被视为优化目标。
DCMOPs的设计
A.DCMOPs的特征
首先,随着时间变化的约束可能会形成形状、大小和位置动态变化的不可行区域。
其次,不连通可行域作为现实世界中广泛存在的一类约束优化问题,可能会出现形成具有多段的真实PF。在动态环境下,分段的分布、位置和数量可能会随着时间的变化而变化。
第三,在有限的计算资源下,小的可行域,特别是具有时变大小和位置的可行域是很难被检测到的。
B.基本框架
目标函数生成器:回顾已有的多目标优化测试集,真实的PFs表现出丰富的特性,如线性,非线性,凸凹性,平移性等。先前的研究指出,这些特性可以通过引入含有理参数的三角函数来产生
C.一般约束
为了产生具有平移、断开、小尺寸、非线性等多种动态特性的可行域,在其他问题的的基础上开发了一种改进的约束生成器
D.提出的测试问题
DCP1
DCP2
DCP3
所提出的TDCEA算法
1基本框架
2环境检测
检测10%个体目标值或者约束>1e-10就认为环境发生了变化
3.双阶段多样性补偿
阶段1
第一阶段:在新的环境下,重新评估上一个环境中得到的所有Pareto最优解,并将其分别划分为可行集FS和不可行集IS。根据它们的大小,我们定义可行性比率为ρ = ( | FS | / N )。然后,随机生成ωN个个体。其中,ρ ω N随机替换FS中的解,其余随机替换IS中的解。FS和IS分别被定义为FS和IS中的替换方案
阶段2
记μ t - 1和μ t - 2分别为PSt - 1和PSt - 2的中心点,= μ t - 1 - μ t - 2为对应的增量。在此基础上,生成[ 0、0 .]中服从均匀分布U( 0、0 .)的n维随机向量。根据可行性比率,对可行或不可行个体添加不同的扰动项