当前位置: 首页 > news >正文

Google Gemma 2B 微调实战(IT科技新闻标题生成)

本文我将使用 Google 的 Gemma-2b 模型来微调一个基于IT科技新闻正文来生成对应标题的模型。并且我将介绍如何使用高度集成的训练框架来进行快速微调。

开始前

为了尽可能简化整个流程,我将使用 linux-cn 数据集[1]作为本次训练任务的训练数据。

模型选择使用 Gemma-2b[2],在目前这个任务中 2b 级别的参数模型已经完全能满足当前的需求,当然你也可以尝试使用 7b 的模型。

我们在这里将直接使用 LLaMA-Factory[3] 训练框架来直接完成监督微调部分工作。当然该框架不仅支持监督微调(SFT)也支持预训练(PT)、奖励模型(RM)以及 PPO/DPO 的训练。

数据整理

linux-cn 数据集本身已经进行了数据的清洗和格式化,这一步我们只需要把我们需要的字段提取出后来后根据一定格式转换为 LLaMA-Factory 监督微调格式即可。

在本任务中,我们只需要数据集中的“title”和“content”两个字段即可。而 LLaMA-Factory 监督微调格式是如下格式的json文件。

[  {    "instruction": "What are the three primary colors?",    "input": "",    "output": "The three primary colors are red, blue, and yellow. These colors are called primary because they cannot be created by mixing other colors and all other colors can be mad
http://www.lryc.cn/news/348900.html

相关文章:

  • RabbitMQ:深入理解高性能消息队列
  • 【北京迅为】《iTOP-3588开发板源码编译手册》-第4章 Android12/Linux设备树简介
  • C++ C# 贝塞尔曲线
  • 勒索软件漏洞?在不支付赎金的情况下解密文件
  • 实时“秒回”,像真人一样语音聊天,GPT-4o模型强到恐怖
  • Properties配置文件和源码
  • redis原生命令及项目使用
  • 使用VSCode生成代码、查询数据表
  • 使用 PXE+Kickstart 批量网络自动装机
  • 微信小程序交互增强:实现上拉加载、下拉刷新与一键返回顶部【代码示例】
  • leetcode刷题指南
  • hadoop学习---基于Hive的数据仓库相关函数机制及其优化方案
  • 【MySQL数据库】丨高可用之MHA集群部署
  • uniapp的底部弹出层实现保姆式教程
  • 国外IP代理免费试用技巧
  • vue-cropper裁剪图片 vue
  • 算法-卡尔曼滤波之基本数学的概念
  • NeoVim配置文件基本的
  • Qt学习笔记1.3.4 QtCore-Qt资源系统
  • 同城组局同城活动找搭子小程序JAVA源码面芽组局的实现方案
  • Unable to locate the .NET SDK
  • C++STL初阶(1):string的使用及初阶原理
  • Day41-Java基础之反射和动态代理
  • Tomcat的实现
  • RK3576 Camera:资源介绍
  • Symfony DomCrawler库在反爬虫应对中的应用
  • 1Panel应用推荐:Uptime Kuma
  • 传输文件协议FTP与LFTP
  • expdp和impdp 实战
  • 知了汇智引领未来:全新AIGC系列课程,打造数字时代人才新标杆