当前位置: 首页 > news >正文

训练贪吃蛇ai的后续记录

发现可以结合遗传算法的思路,产生更好的效果。
即每训练一段时间,就停下来测试一下新模型的效果。如果效果优于记录中最好的,则继续导入该模型并训练。重复几次,效果可能更好。
例如,昨晚我便通过唯一一个在十次测试中通关一次的模型,得到了三个通过率为20%(每个都测试十次)的新模型。在其中选出平均分和平均奖励最高的,再次训练一晚上后,得到以下结果
在这里插入图片描述

通关分数为1410
在这里插入图片描述
最高通过率足足有50%!当时我都不太敢相信,还去看了看代码,确保没有把测试种子设为固定值。
在这里插入图片描述

作为小白,总感觉这通过率进步的有点离谱。

http://www.lryc.cn/news/455551.html

相关文章:

  • WPF 手撸插件 八 操作数据库一
  • 代数结构基础 - 离散数学系列(八)
  • 函数的arguments为什么不是数组?如何转化为数组?
  • Java之反射
  • 3dsMax添加天空盒
  • C语言的类型提升机制
  • Pandas和Seaborn数据可视化
  • 爬虫(Python版本)
  • 【分布式训练 debug】VS Code Debug 技巧:launch.json实用参数
  • pycharm连接linux服务器需要提前安装ssh服务
  • 通信工程学习:什么是LAN局域网、MAN城域网、WAN广域网
  • LeetCode热题100速通
  • Python代码编写KDJ指标
  • 传统少数民族物品检测系统源码分享
  • 深度学习中的迁移学习:预训练模型微调与实践
  • 原生input实现时间选择器用法
  • 对象的概念
  • ARIMA|基于自回归差分移动平均模型时间序列预测
  • sqli-labs靶场第三关less-3
  • 泡沫背后:人工智能的虚幻与现实
  • 旅游管理智能化:SpringBoot框架的应用
  • 基于方块编码的图像压缩matlab仿真,带GUI界面
  • 不同jdk版本间的替换
  • 408算法题leetcode--第28天
  • 【无人机设计与控制】无人机三维路径规划,对比蚁群算法,ACO_Astar_RRT算法
  • 毕设 大数据电影数据分析与可视化系统(源码+论文)
  • 10月7日刷题记录
  • 苍穹外卖学习笔记(十五)
  • 知识图谱入门——5:Neo4j Desktop安装和使用手册(小白向:Cypher 查询语言:逐步教程!Neo4j 优缺点分析)
  • 35个数据分析模型