当前位置: 首页 > news >正文

The Connector 周刊#10:你真的知道什么是DevOps文化吗?

AI 探索

  1. 用 LLM 构建企业专属的用户助手:很好的 LLM 应用工程实践,主要介绍了 PingCAP 如何使用大型语言模型(Large Language Model,LLM)构建一个搭载企业专属知识库的智能客服机器人。除了采用行业内通行的基于知识库的问题解答方法,还尝试让模型在“小样本(Few-Shot)”学习下进行不良(毒性)内容识别,如何对机器人性能进行优化以提高准确度,包括解决“不准确的不良(毒性)内容识别”、“上下文理解错误”、“语义搜索结果不精确”以及“文档信息不足或过时”等问题。
  2. LightLLM:纯Python超轻量高性能LLM推理框架:大语言模型受到越来越多的关注,极大的提高了人们的工作效率,然而如何低成本、高吞吐的将参数量动辄千亿的模型部署到各类服务器上,成为将技术进一步大范围推广的关键,本文比较了LightLLM,FasterTransformer,Text-Generation-Inference(简称TGI),vLLM几个流行推理框架。
  3. AI 推理加速原理解析与工程实践分享:AI 推理是指将用户输入的数据,通过训练好的模型产生有价值信息的过程。具体的是将训练好的 AI 模型部署到提供算力的硬件上,并通过 HTTP/RPC 等接口对外提供服务,对 AI 算法工程师来说,他们希望自己训练的复杂模型可以更快的提供服务,而对于基础架构工程师来说,他们则希望可以将价格昂贵的 GPU 资源发挥出最好的效能,本文就探讨了这两类问题的解决思路。

开源推荐

  1. NLP民工的乐园:一个markdown项目,几乎是最全的中文NLP资源库索引了。
  2. guidance:一个解决LLM可控输出的项目,通过“模板语言”来定义 LLM 的输出结构,以确保输出格式的正确性。

工程师工具

  1. ReadPaper:集翻译、阅读、搜索、管理等于一体的专业科研神器,特别是多人共读论文场景,协作方面很强大。
  2. DevPod:Github Codespaces,Jetbrains Spaces或Google Cloud Workstation这一类产品可选替代,支持VSCode和完整的Jetbrains套件,支持主流的云厂商服务器、Kubernetes 集群,以及本地笔记本电脑。
  3. llm.report:可以通过对 OpenAI 的 API 请求日志进行记录,能够分析成本并改进提示,此类的产品现在很多,但是这款做的最好看,数据分析的也最全面。
  4. Cerelyze:将技术研究论文转化为可用的代码,ReadPaper Copilot工具,值得关注。

值得一看

  1. 《DevOps实践指南》:以流动、反馈、持续学习和实验 三步工作法作为 DevOps的基础原则,然后针对每个环节遇到的问题针对性提出一些技术实践,适合有一定工作经验的软件工程参与者阅读,才会对一些问题感同深受。DevOps是一种很好的团队文化,但是不得不说对个人的要求很高,我的理解就是能流程化的一定要通过技术改造为自动化,价值流上参与的每个个人做到凡事有交代,件件有着落,事事有回音,这样的团队肯定会高效,方法论固然好,还是在于人的执行,很值得一读。在团队协作中,以这样的理念来要求自己,做齿轮,不做螺丝钉。
  2. Matrices and graphs:作者把矩阵转换为有向加权图,进行定理推导,思路很有意思。
http://www.lryc.cn/news/141745.html

相关文章:

  • leetcode438. 找到字符串中所有字母异位词(java)
  • 【锐捷】OSPF 多区域配置
  • Linux常用命令_权限管理命令
  • 【黑马头条之热点文章kafkaStream】
  • 【SpringSecurity】三、访问授权
  • 你对SPA单页面的理解,它的优缺点分别是什么?如何实现SPA应用呢?
  • 【LeetCode75】第三十七题 二叉树中的最长交错路径
  • 百度Apollo学习心得:探索自动驾驶技术的前沿之旅
  • kafka原理之springboot 集成批量消费
  • 【GeoDa实用技巧100例】024:geoda计算全局(局部)莫兰指数Moran‘s I,LISA聚类地图,显著性地图
  • Java进阶(7)——手动实现LinkedList 内部node类的实现 增删改查的实现 toString方法 源码的初步理解
  • CPU总线的理解
  • Spring Boot 中的 AOP,到底是 JDK 动态代理还是 Cglib 动态代理
  • 记录一下在工作中使用 LayUI bug的问题
  • 手机自动无人直播,实景无人直播真的有用吗?
  • python 面试题--2(15题)
  • kafka复习:(11)auto.offset.reset的默认值
  • 【javaweb】学习日记Day7 - Mysql 数据库 DQL 多表设计
  • 线程的生命周期
  • GAN | 论文精读 Generative Adversarial Nets
  • Yolo系列-yolov2
  • Linux下的系统编程——vim/gcc编辑(二)
  • 2023年国赛 高教社杯数学建模思路 - 案例:最短时间生产计划安排
  • 芯科科技推出专为Amazon Sidewalk优化的全新片上系统和开发工具,加速Sidewalk网络采用
  • Kotlin 丰富的函数特性
  • Node.js怎么搭建HTTP服务器
  • 基于Redisson的联锁(MultiLock)
  • 人脸识别平台批量导入绑定设备的一种方法
  • MySQL—MySQL的NULL值是怎么存放的
  • sql server删除历史数据