当前位置: 首页 > news >正文

大型语言模型微调 新进展-4篇 论文

1. Brevity is the soul of wit: Pruning long files for code generation

  • 发布时间:2024-06-29
  • 链接:https://arxiv.org/abs/2407.00434
  • 机构:伦敦大学学院 (UCL)

本研究针对大型语言模型的代码生成任务中的数据清理问题进行了探索。研究发现,仅仅剔除过长的代码文件就能显著提高模型训练的效率和性能,甚至优于基于嵌入(embedding)的复杂方法。这种方法不仅能在训练效率上带来两倍的提升,在HumanEval上的表现也提高了3.5%。然而,这也可能导致模型处理长代码文件时的困惑度增加,从而引发关于代码生成模型评估方法的思考。

2. InverseCoder: Unleashing the Power of Instruction-Tuned Code LLMs with Inverse-Instruct

  • 发布时间:2024-07-08
  • 链接:https://arxiv.org/abs/2407.05700
  • 机构:中国科学院 (CAS)

本文介绍了一种名为 INVERSE-INSTRUCT 的方法,该方法通过利用代码本身来生成指令,从而进一步提升了指令微调的代码大型语言模型的能力。基于一个核心观察:将代码(形式语言)翻译成自然语言(非形式语言)比反向操作更为容易。INVERSE-INSTRUCT 利用代码大型语言模型生成代码片段的摘要,从而生成高质量的指令。通过结合原始数据集与自动生成的指令,该方法能够有效提升代码大型语言模型指令微调后的性能,在多个代码生成任务中取得了超越现有模型的成绩。

3. Curriculum Learning for Small Code Language Models

  • 发布时间:2024-07-14
  • 链接:https://arxiv.org/abs/2407.10194
  • 机构:法国国立高等计算机学院 (ENSI)

本文发现课程学习能够显著提高小型代码语言模型在代码执行任务上的准确率,尽管它对代码补全的影响并不显著。研究人员提出了一种新的代码难度评估指标,并设计了一种新的课程学习时间表,证明了课程学习方法在训练代码语言模型上的有效性,为未来研究代码语言模型的课程学习应用提供了新的思路。

4. Genetic Instruct: Scaling up Synthetic Generation of Coding Instructions for Large Language Models

  • 发布时间:2024-07-29
  • 链接:https://arxiv.org/abs/2407.21077
  • 机构:英伟达 (NVIDIA)

本文提出了一种名为 Genetic-Instruct 的方法,该方法利用自指令学习,从少量种子数据中生成大量的合成指令,从而提高大型语言模型的代码生成能力。这种方法能够有效地扩展指令生成过程,并且在多个代码生成模型的微调实验中,使用合成指令训练的模型表现出显著的性能提升。

http://www.lryc.cn/news/420546.html

相关文章:

  • 专业课140+杭电杭州电子科技大学843信号与系统考研经验电子信息与通信工程真题,大纲,参考书。
  • php 中 (0 == ‘abc‘) 为真
  • MacOS Anaconda 安装教程及虚拟环境创建
  • Mac快速配置ADB环境变量
  • Kylin的工作原理及使用分享
  • python 使用seleniumwire获取响应数据
  • 用C语言实现双向链表
  • Github 2024-08-10 Rust开源项目日报Top10
  • 深入解析 ESLint 配置:从零到精通
  • BTC连续拉涨,击碎空头幻想
  • 【Spring】Sping笔记01
  • Gridcontrol纵向/横向合并单元格
  • 从周杰伦的《青花瓷》三次更名看方文山的国学情怀与工匠精神
  • HATS:分层图注意力神经网络用于股票预测
  • 【日常记录-MySQL】MySQL设置root用户密码
  • 高级Web安全技术(第二篇)
  • 前端实现文件下载常用几种方式
  • Isaac Lab 安装 (ubuntu22.04环境)
  • todoList清单(HTML+CSS+JavaScript)
  • LVS集群实现四层负载均衡详解(以nat,dr模式为例)
  • 七夕表白网页效果实现与解析
  • 人工智能算法工程师(高级)课程11-自然语言处理之NLP的语言模型-seq2seq模型,seq+注意力与代码详解
  • 从PyTorch官方的一篇教程说开去(6.2 - 张量 tensor 矩阵运算等)
  • 【网络层】直连路由、静态路由、动态路由
  • tkinter用法总结
  • iOS基础-Block
  • 本地图片瀑布流浏览器asonry Image Viewer
  • macos重装系统 启动U盘制作方法 - createinstallmedia 命令使用方法总结
  • 八问八答搞懂Transformer内部运作原理
  • MySQL增删改查(基础)