当前位置: 首页 > news >正文

[论文笔记] CT数据配比方法论——1、Motivation

我正在写这方面的论文,感兴趣的可以和我一起讨论!!!!!!

Motivation

1、探测原有模型的配比: 配比 与 ppl, loss, bpw, benchmark等指标 之间的关系。

2、效果稳定的配比:配比 与 模型效果 之间的规律。

Experiments

1、主语言(什么语言作为主语言,几种主语言?双主语言是否可行?)

DATA_CONFIG_PATH=/mnt/data/pretrain/code/Megatron-LM/scripts/train_scripts/data_configs/jinglei/CT_Qwen14B_22lan.txt

我在3期数据基础上调的新配比,13种语言只占0.13。由于重要语种的更改,把图中的de换成ja,占比0.046。

2、主语言占比

单主语言:主语言占比

双主语言:双主语言占比

3、阶梯配比

阶梯配比(9种语言扩到22种语言时,如果保持9种语言的配比,则会效果很差,扩充到22种语言需要用阶梯配比)

  • 第0

http://www.lryc.cn/news/403594.html

相关文章:

  • 某4G区域终端有时驻留弱信号小区分析
  • 【体外诊断】ARM/X86+FPGA嵌入式计算机在免疫分析设备中的应用
  • Linux上启动和停止jar
  • 浏览器缓存:强缓存与协商缓存实现原理有哪些?
  • 持续集成04--Jenkins结合Gitee创建项目
  • 【Node.js基础02】fs、path模块
  • 牛客TOP101:单链表的排序
  • 数据可视化配色新工具,颜色盘多达2500+类
  • SpringAI简单使用(本地模型+自定义知识库)
  • 为什么要从C语言开始编程
  • [数据集][目标检测]导盲犬拐杖检测数据集VOC+YOLO格式4635张2类别
  • 数据结构(稀疏数组)
  • python 爬虫技术 第02节 基础复习
  • 数据结构-C语言-排序(3)
  • 【分布式事务】怎么解决分布式场景下数据一致性问题
  • C# 中的委托
  • 通过docker构建基于LNMP的WordPress项目
  • 2024新版IntelliJ IDEA修改包名 全网最简单最粗暴的方法
  • C#中处理Socket粘包
  • 7.19IO
  • 【Vue】深入了解 Axios 在 Vue 中的使用:从基本操作到高级用法的全面指南
  • 【Qt】窗口
  • 代码随想录训练营【贪心算法篇】
  • Spark中的JOIN机制
  • WebRTC QOS方法十三.1(TimestampExtrapolator接收时间预估)
  • 深入了解 GCC
  • vscode 打开远程bug vscode Failed to parse remote port from server output
  • 前端组件化技术实践:Vue自定义顶部导航栏组件的探索
  • PyTorch Autograd内部实现
  • 微信小程序 vant-weapp的 SwipeCell 滑动单元格 van-swipe-cell 滑动单元格不显示 和 样式问题 滑动后删除样式不显示