当前位置: 首页 > news >正文

动态规划从入门到精通-蓝桥杯

一、了解动态规划

1.简单来说动态规划是一种状态转移与递推

2.例题引入——最少硬币问题

有多个不同面值的硬币(任意面值);
数量不限;
输入金额S,输出最少硬币组合。
(回顾用贪心求解硬币问题。)

贪心法

  • 硬币面值1、2、5。支付13元,要求硬币数量最少。

  • 贪心法:

(1) 5元硬币,2个

(2) 2元硬币,1个

(3) 1元硬币,1个

  • 正确! 答案是:2枚5元硬币+1枚2元硬币+1枚1元硬币。


  • 硬币面值1、2、4、5、6。支付9元,要求硬币数量最少。

  • 贪心法:

(1) 6元硬币,1个

(2) 2元硬币,1个

(3) 1元硬币,1个

  • 错误! 答案是:1枚5元硬币+1枚4元硬币。


======>硬币问题的正解是动态规划


动态规划

给定1,5,10,25,50这5种面值的硬币;
数量不限;
输入金额S,输出最少硬币组合。
  • 首先定义数组Min[ ] 记录最少硬币数量。

  • 对输入的某个金额i,Min[i]是最少的硬币数量。

  • 1. 只考虑1元面值的硬币。

  • i=1元时,等价于:i=i-1 = 0元需要的硬币数量,加上1个1元硬币。

------>其中把Min[ ]叫做“状态”;把Min[ ]的变化叫做“状态转移”。

  • 2.所有金额仍然都只用1元硬币。

  • i=2元时,等价于:i=i-1 = 1元需要的硬币数量,加上1个1元硬币。

  • i=3元时,...

  • i=4元时,...

  • 3.在1元硬币的计算结果基础上,再考虑加上5元硬币的情况。从i=5开始就行了。

  • i=5元时,等价于:

(1) i = i-5 = 0元需要的硬币数量,加上1个5元硬币。Min[5]=1

(2) 原来的Min[5]=5。

取 (1) (2)的最小值,所以Min[5]=1。

  • i=6元时,等价于:

(1) i = i-5 = 1元需要的硬币数量,加上1个5元硬币。Min[6]=2

(2) 原来的Min[6]=6。

取 (1) (2)的最小值,所以Min[6]=2。

  • i=7元时,...

  • i=8元时,...


  • 动态规划总结

  • 用1元和5元硬币,结果:

  • 递推关系(状态转移方程):

Min[i] = min(Min[i], Min[i - 5] + 1)

继续处理其它面值硬币。

  • 动态规划实现代码(实现递推关系)

上面代码状态名是Min[ ],但是其实习惯上把状态命名为dp[ ]更好。

二、动态规划的两个特征

1.重叠子问题

子问题是原大问题的小版本,计算步骤完全一样;计算大问题的时候,需要多次重复计算小问题。

一个子问题的多次计算,耗费了大量时间。用DP处理重叠子问题,每个子问题只需要计算一次,从而避免了重复计算,这就是DP效率高的原因。

2.最优子结构

首先,大问题的最优解包含小问题的最优解。

其次,可以通过小问题的最优解推导出大问题的最优解。

三、记忆化

  • 如果各个子问题不是独立的,如果能够保存已经解决的子问题的答案,在需要的时候再找出已求得的答案,可以避免大量的重复计算。

  • 基本思路:用一个表记录所有已解决的子问题的答案,不管该问题以后是否被用到,只要它被计算过,就将其结果填入表中。

四、动态规划求解过程图解

五、最经典的动态规划问题——0/1背包

给定n种物品和一个背包:
物品i的重量是wi,
其价值为Vi,
背包的容量为C。背包问题: 
选择装入背包的物品,使得装入背包中物品的总价值最大。
如果在选择装入背包的物品时,对每种物品i只有两种选择:
装入背包或不装入背包,称为0/1背包问题。
  • 设xi表示物品i装入背包的情况:

xi=0,表示物品i没有被装入背包x;

i=1,表示物品i被装入背包。


有5个物品,重量分别是{2,2,6,5,4},
价值分别为{6,3,5,4,6},
背包的容量为10。定义一个(n+1)X(C+1)的二维表dp[ ][ ]。
dp[i][i]表示把前i个物品装入容量为j的背包中获得的最大价值。
  • 填表:按只放第1个物品、只放前2个、只放前3个......一直到放完,这样的顺序考虑。(从小问题扩展到大问题)

  • 1、只装第1个物品。(横向是递增的背包容量)

  • 2、只装前2个物品

如果第2个物品重量比背包容量大,那么不能装第2个物品,情况和只装第1个一样。

如果第2个物品重量小于等于背包容量,那么:

  • (1)如果把物品2装进去(重量是2),那么相当于只把1装到(容量-2)的背包中。

需要用到前面的需要用到前面的结果,即已经解决的子问题的答案经解决的子问题的答案。

  • (2)如果不装2,那么相当于只把1装到背包中。

------>取(1) 和 (2)的最大值。

  • 3、只装前3个物品

如果第3个物品重量比背包容量大,那么不能装第3个物品,情况和只装第1、2个一样。

如果第3个物品重量小于等于背包容量,那么:

  • (1)如果把物品3装进去(重量是6),那么相当于只把1、2装到(容量-6)的背包中。

  • (2)如果不装3,那么相当于只把1、2装到背包中。

------>取(1) 和 (2)的最大值。


  • 按这样的规律一行行填表,直到结束。现在回头考虑,装了哪些物品。

  • 看最后一列,15>14,说明装了物品5,否则价值不会变化。

六、蓝桥杯真题(1174号)


1.DP状态设计

  • DP状态: 定义二维数组dp[ ][ ],大小为N * C。

  • dp[i][j]:把前i个物品(从第1个到第i个) 装入容量为j的背包中获得的最大价值。

  • 把每个dp[i][j]看成一个背包: 背包容量为j,装1~i这些物品。最后得到的dp[N][C]就是问题的答案:把N个物品装进容量C的背包的最大价值。

2.DP状态转移方程(递推公式)

  • 递推计算到dp[i][j],分2种情况:

  • (1)第i个物品的体积比容量j还大,不能装进容量的背包。那么直接继承前i-1个物品装进容量j的背包的情况即可: dp[i][j] = dp[i-1][j]。

  • (1)第i个物品的体积比容量j小,能装进背包。又可以分为2种情况: 装或者不装第i个。

  • 1)装第i个。从前i-1个物品的情况下推广而来,前i-1个物品是dp[i-1][j]。第i个物品装进背包后,背包容量减少c[i],价值增加w[i]。有:

dp[i][j] = dp[i-1][j-c[i]] + w[i]。

  • 2)不装第i个。那么:dp[i][j] = dp[i-1][j]。

  • 取1)和2)的最大值,状态转移方程:

dp[i][j] = max(dp[i- 1][j],d[i- 1][j- c[i]] + w[i])

3.代码

七、空间优化:滚动数组

  • 把dp[ ][ ]优化成一维的dp[ ],以节省空间。

  • Dp[i][]是从上面一行dp[i-1]算出来的,第i行只跟第i-1行有关系,跟更前面的行没有关系:

dp[i][j] = max(dp[i - 1][j], dp[i - 1][j - c[i]] + w[i])

  • 优化:只需要两行dp[0][]、dp[1][],用新的一行覆盖原来的一行,交替滚动。

  • 经过优化,空间复杂度从O(N*C)减少为O(C)

1.交替滚动

  • 定义:dp[2][i]: 用dp[O][]和dp[1][]交替滚动。

  • 优点:逻辑清晰、编码不易出错,建议初学者采用这个方法。

  • 代码:

  • now始终指向正在计算的最新的一行,old指向已计算过的旧的一行。

  • 对照原递推代码,now相当于i,old相当于i - 1

  • 对照:

  • 未经优化

  • 优化之后

2.自我滚动

  • 继续精简:用一个一维的dp[ ]就够了,自己滚动自己。

dp[i][j] = max(dp[i - 1][j], dp[i - 1][j - c[i]] + w[i])

  • 对照:

  • 未经优化

  • 优化之后

  • 注意:自我滚动时j从小往大循环是错误的

  • 优化之前填表的过程

  • 自我滚动填表的过程

  • 例如i = 2时,左图的dp[5]经计算得到dp[5] = 9,把dp[5]更新为9。

  • 右图中继续往后计算,当计算dp[8]时,得dp[8] = dp[5]’ + 3 = 9+3 = 12。

  • 这个答案是错的。

  • 错误的产生是滚动数组重复使用同一个空间引起的。

  • 注意:自我滚动时j从大往小循环是正确的

  • 优化之前填表的过程

  • 自我滚动填表的过程

  • 例如i = 2时,首先计算最后的dp[9] = 9,它不影响前面状态的计算。

http://www.lryc.cn/news/15762.html

相关文章:

  • Docker部署Prometheus
  • JavaScript的执行顺序
  • C++11智能指针std::shared_ptr介绍及使用
  • 华为OD机试 - 数字的排列(Python) | 机试题+算法思路+考点+代码解析 【2023】
  • Android 事件分发机制(4)-常见面试题
  • 计算机四级 [操作系统] | 选择题 2 重点标注版
  • 想玩好ChatGPT?不妨看看这篇文章
  • day31 IO流
  • Linux 防火墙配置(iptables和firewalld)
  • 深度学习基础(一)
  • Maven 常用命令
  • 2023年100道最新Android面试题,常见面试题及答案汇总
  • [JavaEE系列] 详解面试中HTTP协议HTTPS协议
  • mac 好用的类似Xshell工具
  • 浅谈SQL中的union和union all
  • P6软件应用的核心收益
  • 性能测试中,我遇到的8个常见问题总结
  • kafka架构体系
  • 【Kafka】三.Kafka怎么保证高可用 学习总结
  • Python学习笔记7:再谈抽象
  • 钣金行业mes解决方案,缩短产品在制周期
  • 【Linux】——git和gdb的简单使用技巧
  • Fiddler的简单使用
  • MySql 事务
  • 微信社区小程序/h5/圈子论坛贴吧交友/博客/社交/陌生人社交/宠物/话题/私域/同城交友
  • Python os和sys模块
  • JS中数组如何去重(ES6新增的Set集合类型)+经典two sum面试题
  • HDLC简介及相应hdlc实训
  • 公司技术团队为什么选择使用 YApi 作为 Api 管理平台?
  • ts知识点整理