当前位置: 首页 > news >正文

2024人工智能大会_强化学习论坛相关记录

求解大规模数学优化问题

规划也称为优化

四要素:数据、变量、目标、约束

将一个简单的数学规划问题项gpt进行提问,GPT给了一个近似解,但不是确切的解。

大模型的训练本身就是一个优化问题。

大模型是如何训练的?大模型训练通常使用Adam优化器。Adam优化器在大模型训练中占据了主导地位,因为它能够有效地处理大规模数据集和复杂的模型结构,同时减少梯度消失或梯度爆炸的问题

国家电网用的是国外的求解器

华为原来用的IBM求解器,用于排产,但是2019年起,不让用了,所以找到了杉树科技去做求解器

上述中为国内外的优化算法求解器,国内的第一家为COPT

上述的1:指的是问题平均求解的时间为1秒

考虑如何将优化和GPU相结合,优化一般需要高性能和高准确性

上述为欧洲的物流问题,在不同时间解的时间

半定规划,量子计算、物理计算上很有用

肝移植配对用的是线性规划

智能计算与大模型求解:理论与实践

上述为CPU与GPU的区别

CPU:中央处理单元,设计用于处理各种类型的计算任务,包括复杂的逻辑和算术运算。通常用于执行程序的流程控制和数据处理,CPU通常包含少量的核心(通常4-32个),每个核心能够处理复杂的任务和多任务操作。

GPU:图形处理单元,最初设计用于处理图像和视觉渲染任务,但随着技术的发展,GPU也被广泛用于并行计算任务,特别是在深度学习和大规模数据处理领域。GPU包含成千上万个小核心,这些核心专门用于并行处理大量相对简单的计算任务。这种设计是的GPU在处理大规模big你小姑娘任务时比CPU更高效。

CUDSS:库函数,实现矩阵分解,但是性能不是很好,性能不稳定,分解的结果很随机,无法实现多卡并联

GPU无法实现矩阵求逆

CPU——CPU+GPU混合架构

CPU与GPU共享一个显存(在研究中)

都是在英伟达芯片上实现的

最大的问题,CUDA生态,库函数件

80%的是整数规划

现在,用GPT4或者4o去做,稍微麻烦的问题,还是无法解

ORLM:可以私有化部署,任何基座,可以用LLM,可以用合成数据,让大模型建模,COPT求解

比GPT4有明显优势

http://www.lryc.cn/news/394764.html

相关文章:

  • Android SurfaceFlinger——创建EGLContext(二十五)
  • python 10个自动化脚本
  • 填报高考志愿,怎样正确地选择大学专业?
  • Java 使用sql查询mongodb
  • WIN32核心编程 - 线程操作(二) 同步互斥
  • web自动化(六)unittest 四大组件实战(京东登录搜索加入购物车)
  • 鸿蒙语言基础类库:【@ohos.process (获取进程相关的信息)】
  • 华为笔试题
  • 【MySQL基础篇】函数及约束
  • YOLOv9报错:AttributeError: ‘list‘ object has no attribute ‘view‘
  • Bert入门-使用BERT(transformers库)对推特灾难文本二分类
  • 【DFS(深度优先搜索)详解】看这一篇就够啦
  • java-spring boot光速入门教程(超详细!!)
  • 一、Prometheus和Grafana搭建
  • 从零开始的python学习生活
  • MSP学习
  • 生产力工具|Endnote X9如何自动更新文件信息
  • 【python】字典、列表、集合综合练习
  • 超融合服务器挂载硬盘--linux系统
  • Kafka如何防止消息重复发送
  • 数据库设计原则介绍
  • 反馈神经网络与不同类型的神经网络:BP神经网络,深度感知机,CNN,LSTM
  • 轮播图案例
  • Spring 泛型依赖注入
  • C++ Linux调试(无IDE)
  • FFmpeg——视频拼接总结
  • springboot项目怎么样排除自带tomcat容器使用宝蓝德bes web中间件?
  • 响应式ref()和reactive()
  • 运维系列.Nginx中使用HTTP压缩功能
  • vue3项目图片压缩+rem+自动重启等plugin使用与打包配置