当前位置: 首页 > news >正文

NPCon:AI模型技术与应用峰会北京站 (参会感受)

8月12日,我有幸参加了在北京皇家格兰云天大酒店举行的“AI模型技术与应用峰会”。

 

这次会议邀请了很多技术大咖,他们围绕:

六大论点

大模型涌现,如何部署训练架构与算力芯片

LLM 应用技术栈与Agent全景解析

视觉GPU推理服务部署 架构优化实践

AI大模型算力系统分析

InsCode

AI 时代的研发新范式与开发者能力演进

 

12:40,我准时到达签到,环顾四周,当时人还不多随着时间流逝越来越多的同行到了。

 

13:00 - 13:30 活动签到


第一次参加这样的会议达现场的我,感受到了这场会议的规模与氛围。皇家格兰云天大酒店挤满了来自各地的参会者。

走进这次活动的会场,宽敞的会议大厅,整齐的排列着每一张椅子,投影屏幕正在播放着滚动的活动日程,每个细节都透露出了严谨与专业。这也是我没有想到的,见识少了。

随着时间主持人也是宣布开始


第一位是知乎科技领域答主@陈巍谈芯、千芯科技董事长、人工智能算法-芯片协同设计专家陈巍带来了分享《大模型涌现,如何部署训练架构与算力芯片》

他认为在大模型训练和部署中,减少数据传输冗余,可以降低计算芯片之间的通信成本,从而提升整体训练效率他还探讨了不同算力芯片CPU、GPU、DSA、TPU。的应用,以及如何通过合理的降低使用成本等等。

第二位是Dify.AI 创始人张路宇

张路宇提到MetaPrompt 的概念,将其描述为一种结构化的方式可以引导模型进行复杂的推理和行动是引导大模型执行任务的关键工具他强调在设计应用之前应先考虑模型的输入提示,并用这种方式引导模型执行任务。

接着,美团基础研发平台视觉智能部软件开发工程师张旭在发表《美团视觉 GPU 推理服务部署架构优化的实践》主题演讲中表示拆分微服务、优化部署架构以及综合考虑多个优化层面,将模型 CPU 和 GPU 运算部分解耦,能实现模型部署工程的性能优化从而提升服务

张旭向观众透露,业界的真实 GPU 利用率怕只有 20% 左右。造成服务 GPU 利用率低下的重要原因是模型服务本身存在性能瓶颈,在极限压力情况下也无法充分利用 GPU 资源。模型中 CPU 和 GPU 运算之间还存在相互影响的问题。张旭提出了解决,将模型中的 CPU 和 GPU 运算部分分别拆分为独立的微服务,从而实现了更高的 GPU 利用率和整体性能。

浪潮信息人工智能与高性能应用软件部 AI 架构师Owen以《AI 大模型算力系统分析》为主题,强调了算力、算法、数据和系统架构等多个方面

                              浪潮信息人工智能与高性能软件 AI 架构师 Owen

浪潮信息早就开始布局和投入AI大模型技术的研发,讲解了大模型研发过程中的数据、算力和算法,他强调了 GPT-3 和 GPT-4 等模型的重要,成熟的算法、数据产业链,配套工具链及丰富的生态链是关键因素。

CSDN 研发副总监梁灏他要介绍的 是InsCode

CSDN推出的Inscode服务是一个在线编程工具,旨在为开发者提供一个便捷的编写、运行和分享代码的环境,让开发者无需在本地搭建编程环境,即可快速编写和运行代码。

作为国内的一个在线的代码运行平台,博客分享,在线进行代码运行,学习简单的语法都具有一个很高的实用性。用户可以通过InsCode实现代码的演示,共享,存储,学习等功能基本满足了一个程序员对于代码社区的大部分需求。InsCode支持的语言比较多,更有利于解决代码的环境配置等繁杂的问题,这样的平台比较适合于在小组会议时进行临时的代码演示的时候使用,减少环境搭建,配置等时间的损耗。
 

梁灏强调了 InsCode 在 AI 时代的地位专业的程序员可以借助 InsCode 提高开发效率和创造能力。

开谈:AI 时代的研发新范式与开发者能力演进

CSDN 人工智能技术编辑团队主持,华为诺亚方舟实验室技术专家董振华,投研机构 INP(Infra Native Partners)创始人丁宁,CodeGeeX 团队算法专家沈磊,聆心智能创始人& CTO 郑叔亮作为嘉宾的圆桌对话正式展开这是今天最为重要的一环,多位行业专家齐聚一堂,针对AI时代的研发模式和开发者能力进行了深入讨论。这是一场跨领域的大讨论。

当天参会受益良多虽然遗憾没有和各位大佬对话但是我很期待下一次峰会,新程序员 不能成为浪潮的奠基者,一定要成为其中的弄潮儿,愿CSDN更多的举报更多成功的活动。愿新程序员们携手共进创造我们这一代人的篇章。

加油

http://www.lryc.cn/news/124734.html

相关文章:

  • 为什么爬虫要用高匿代理IP?高匿代理IP有什么优点
  • 【JavaWeb】MySQL约束、事务、多表查询
  • 【并发编程】自研数据同步工具优化:创建线程池多线程异步去分页调用其他服务接口获取海量数据
  • 七、dokcer-compose部署springboot的jar
  • k8s 使用 containerd 运行时配置 http 私服
  • 【新品发布】ChatWork企业知识库系统源码
  • 疫情打卡 vue+springboot疾病防控管理系统java jsp源代码
  • python --连接websocket
  • 数据库内日期类型数据大于小于条件查找注意事项
  • 网易有道押宝大模型,打响智能硬件突围战
  • KAFKA第二课之生产者(面试重点)
  • Mybatis 源码 ∞ :杂七杂八
  • 堆的实现以及应用
  • MySql011——检索数据:过滤数据(使用正则表达式)
  • 数据结构与算法-栈(LIFO)(经典面试题)
  • NSI45030AT1G LED驱动器方案为汽车外部及内部照明恒流稳流器(CCR)方案
  • uni-app中使用pinia
  • Spring之事务管理
  • linux常见的mysql问题
  • 常见分辨率时序信息
  • 机器人CPP编程基础-05完结The End
  • 数据库应用系统DBAS功能设计与实施(三级数据库)
  • 快速幂典型
  • 计算机竞赛 python+opencv+机器学习车牌识别
  • 解决电脑声音正常但就是某些游戏没声音问题
  • 【UniApp开发小程序】小程序首页(展示商品、商品搜索、商品分类搜索)【后端基于若依管理系统开发】
  • Redis 持久化及集群架构
  • FPGA + WS2812采灯控制
  • 【视频】使用OBS将MP4推流至腾讯云直播
  • Vue基本知识