当前位置: 首页 > news >正文

TensorFlow入门(二十、损失函数)

损失函数

        损失函数用真实值与预测值的距离指导模型的收敛方向,是网络学习质量的关键。不管是什么样的网络结构,如果使用的损失函数不正确,最终训练出的模型一定是不正确的。常见的两类损失函数为:①均值平方差②交叉熵

均值平方差

        均值平方差(Mean Squared Error,MSE),也称"均方误差",在神经网络中主要用于表达预测值与真实值之间的差异,针对的是回归问题。其数学计算公式如下:

                                

        可以看出,均值平方差是对每一个真实值与预测值相减后的差的平方取平均值。在具体模型中,它的值越小,表明模型越好。除此之外,类似的损失算法还有均方根误差RMSE(即将MSE开平方)、平均绝对值误差MAD(对一个真实值与预测值相减的绝对值取平均值)等。

        注意 : 在神经网络计算时,预测值要和真实值控制在同样的数据分布内,例如将预测值经过Sigmoid激活函数得到的值控制在0~1之间,那么真实值也需要归一化在0~1之间。这样,进行loss计算时才会有较好的效果。

        在TensorFlow中,没有提供单独的MSE函数。由于公式简单,可以自己组合,例如:

MSE = tf.reduce_mean(tf.pow(tf.sub(logits,outputs),2.0))

        其中,logits代表标签值,即真实值,outputs代表预测值。

        同理,均方根误差RMSE和平均绝对值误差MAD也可以手动组合,例如:

RMSE = tf.sqrt(tf.reduce_mean(tf.pow(tf.sub(logits,outputs),2.0)))
MAD = tf.reduce_mean(tf.complex_abs(tf.sub(logits,outputs)))

交叉熵

        交叉熵(crossentropy),一般针对的是分类问题,主要用于预测输入样本属于某一类的概率。其数学计算公式如下:

                        

        其中y代表真实值分类(0或1),a代表预测值。

        注意 : 用于计算的a也是通过分布统一化处理的(或者是经过Sigmoid函数激活的),取值范围在0~1之间。如果真实值和预测值都是1,前面一项y*ln(a)就是1*ln(1)等于0,后一项(1-y)*ln(1-a)也就是0*ln(0)等于0,loss为0,反之loss函数为其他数。

        在TensorFlow中常见的交叉熵函数有:

                ①Sigmoid交叉熵

                        Sigmoid交叉熵,即tf.nn.sigmoid_cross_entropy_with_logits(_sentinel = None,labels = None,logits = None,name = None),该函数对logits计算sigmoid的交叉熵。logits是神经网络模型中的w*x矩阵,也是神经网络最后一层的输出,还没有经过sigmoid激活函数计算,而labels是实际的标签值,它的shape和logits相同。

                        具体计算公式如下:

                

                ②softmax交叉熵

                        softmax交叉熵,即tf.nn.softmax_cross_entropy_with_logits(logits,labels,name = None),该函数的参数logits和labels,与Sigmoid交叉熵函数的一样。函数的计算过程一共分为两步:

                                ①将logits通过softmax计算转换成概率,公式如下:

                                        

                                ②计算交叉熵损失,把softmax的输出向量[y1,y2,y3...]和样本的实际标签做一个交叉熵,公式如下:

                                        

                                        其中,y'i指代实际的标签中第i个的值,yi是上一步softmax的输出向量[y1,y2,y3...]中,第i个元素的值。非常明显,预测越准确,计算得出的值越小,最后再通过求平均值,得到最终的loss。注意:该函数的返回值是一个向量,不是一个数。

                ③sparse交叉熵

                        sparse交叉熵,即tf.nn.sparse_softmax_cross_entropy_with_logits(logits,labels,name = None),该函数用于计算logits和labels之间的稀疏softmax交叉熵。计算流程和softmax交叉熵一样,区别在于sparse交叉熵的样本真实值与预测结果不需要one-hot编码,但是要求分类的个数一定要从0开始。比如,如果分两类,标签的预测值只有0和1两个数。如果是五类,预测值有0,1,2,3,4共五个数。

                ④加权Sigmoid交叉熵

                        加权Sigmoid交叉熵,即tf.nn.weighted_cross_entropy_with_logits(targets,logits,pos_weight,name = None),该函数用于计算加权交叉熵。计算方式与Sigmoid交叉熵基本一样,只是加上了权重的功能,是计算具有权重的Sigmoid交叉熵函数。

                        计算公式如下:

  

                        使用时,直接调用对应的API即可。

小结

        在实际的模型训练过程中,损失函数的选取取决于输入标签数据的类型:如果输入的是实数、无界的值,损失函数使用平方差;如果输入标签是位矢量(分类标志),使用交叉熵会更合适。

http://www.lryc.cn/news/193829.html

相关文章:

  • MySQL中死锁
  • 【LeetCode刷题(数据结构)】:给定一个链表 每个节点包含一个额外增加的随机指针 该指针可以指向链表中的任何节点或空节点 要求返回这个链表的深度拷贝
  • uniapp封装loading 的动画动态加载
  • Kopler.gl笔记:可视化功能总览
  • rust学习Cell、RefCell、OnceCell
  • 基于SSM的摄影约拍系统
  • 分析智能平台VMware Greenplum 7 正式发布!
  • 动态规划算法(3)--0-1背包、石子合并、数字三角形
  • Linux C/C++ 嗅探数据包并显示流量统计信息
  • Vitis导入自制IP导致无法构建Platform
  • SQLAlchemy 使用封装实例
  • Android Framework通信:Binder
  • 如何用精准测试来搞垮团队?
  • 暴力递归转动态规划(十)
  • 深度学习-房价预测案例
  • 【26】c++设计模式——>命令模式
  • ElasticSearch容器化从0到1实践(一)
  • 【Vue面试题二十四】、Vue项目中有封装过axios吗?主要是封装哪方面的?
  • 旅游票务商城小程序的作用是什么
  • LabVIEW在安装了其它的NI软件之后崩溃了
  • 基于Java的个人健康管理系统设计与实现(源码+lw+部署文档+讲解等)
  • nginx https的配置方法
  • 使用WebDriver采样器将JMeter与Selenium集成
  • flink教程
  • 视频监控系统/安防视频平台EasyCVR广场视频细节优化
  • 电脑上播放4K视频需要具备哪些条件?
  • 测试除了点点点,还有哪些内容呢?
  • HTTP的本质理解
  • 微信小程序获取公众号的文章
  • 【算法|动态规划No.20】leetcode416. 分割等和子集