当前位置: 首页 > news >正文

大模型中常见 loss 函数

loss 函数

首先,Loss 是允许不降到 0 的,模型计算的 loss 最终结果可以接近 0。

可以成为 loss 函数的条件在这里插入图片描述## 常用 loss

以下函数调用基于 Pytorch,头文件导入:
import torch.nn as nn

  • 均方差(MSE)
    nn.functional.mse_loss
    定义
    预测值与真实值之差的平方的平均值
    应用场景
    主要用于回归问题
  • 交叉熵(Cross Entropy)
    nn.functional.cross_entropy 要求二维的输入,一维的输出
    nn.CrossEntropyLoss 中已经实现了softmax功能
    对于 y_pred 的要求是:n * class_num,对于 y 的要求是 n
    交叉熵计算逻辑的例子在这里插入图片描述
    定义
    衡量概率分布之间的差异
    应用场景
    • 主要用于分类问题,尤其是二分类和多分类问题
    • 适用于输出层使用 sigmoid 或 softmax 激活函数的情况,因为这些函数的输出可以解释为概率分布
    • 计算逻辑
      -log(预测值与正确标签对位相乘,再相加)
    • 使用前提
      1. 交叉熵的输入是一个概率值
      2. 预测场景概率空间和结果为1(log函数在x小于0时无定义)
        特点
      3. 目前,在分类问题上,基本都采用交叉熵。
      4. 使模型输出易于比较(通过交叉熵损失)
      5. 通过归一化(指将模型输出转换为概率分布)来评估模型性能

记录应用不多的其他 loss(以下 loss 有使用心得之后再做记录)

  • 0/1损失(BCELoss)
    通常与 sigmoid 函数一起使用
  • 指数损失
  • 对数损失
  • Hinge损失
http://www.lryc.cn/news/442639.html

相关文章:

  • (十六)Ubuntu 20.04 下搭建PX4+MATLAB 仿真环境(HITL)
  • Matlab simulink建模与仿真 第十七章(补充离散库和补充数学库)
  • Android Glide:让图片加载从未如此简单
  • YOLOv9改进策略【注意力机制篇】| 2024 SCSA-CBAM 空间和通道的协同注意模块
  • Obsidian 全部笔记共享配置文件,obsidian仓库-文件夹配置统一化
  • c++可视化打印树
  • ElementUI 快速入门:使用 Vue 脚手架搭建项目
  • 算法打卡:第十一章 图论part02
  • 广度优先搜索算法及其matlab程序详解
  • 力扣 438找到字符串中所有字母异位词
  • 图像滤波---各项异性扩散滤波使用笔记及代码
  • 用Go语言构建健壮的并发系统:深入理解错误传播与处理
  • 掌握C#中的动态规划技术
  • C语言进阶【5】---数据在内存中的存储【2】(小数存储很难吗?)
  • 如何更新至CDS-Beta下载ERA5数据
  • SQL编程题复习(24/9/20)
  • react crash course 2024 (1)理论概念
  • 有关JS下隐藏的敏感信息
  • Kafka 基于SASL/SCRAM动态认证部署,kafka加账号密码登录部署
  • 富格林:积攒经验阻挠欺诈套路
  • 51单片机-红外遥控器(NEC标准)-实验(红外遥控及调速电机)
  • 云手机的便捷性和安全性体现在哪?
  • 漫谈由标准输入\输出\错误输出引发的思考
  • 利用 IDEA 快速管理 k8s 集群
  • 【自然语言处理】实验三:新冠病毒的FAQ问答系统
  • 「C++系列」文件和流
  • 视频美颜SDK核心功能解析:打造高效直播美颜工具方案详解
  • 深入解析:高性能 SSE 服务器的设计与实现
  • C#为任意组件开发登录功能的记录
  • AI免费UI页面生成