当前位置: 首页 > news >正文

神经网络|(二)sigmoid神经元函数

【1】引言

在前序学习进程中,我们已经了解了基本的二元分类器和神经元的构成,文章学习链接为:

神经网络|(一)加权平均法,感知机和神经元-CSDN博客

在此基础上,我们认识到神经元本身在做二元分类,是一种非此即彼的选择。

由于不同的数据所占的权重不同,二元分类结果也一定收到权重的影响,为此,必须使用数学表达这种影响力。

在神经网络相关研究的漫长发展进程中,研究范围从单个因素到多个因素,必须关注无数的二元分类结果同时作用后获得的最终分类结果,于是sigmoid()函数被提出。

【2】二元分类结果数学表达

认识感知机的二元分类本质,是研究sigmoid()函数的基础。

这里先创造四个矩阵,这三个矩阵分别代表元素1,元素2,元素1和权重和元素2的权重。

import numpy as np #引入numpy模块
import matplotlib.pyplot as plt #引入matplotlib模块#创造矩阵
a = np.random.randint(5,9,size=(1,5)) #矩阵
b = np.random.randint(1,5,size=(1,5)) #矩阵
c = np.random.randn(1,5) #矩阵
d = np.random.randn(1,5) #矩阵
#阈值开关
k=1
#空矩阵
e =np.zeros((1,5),np.uint8) #用来存储二元分类的计算结果

进行二元分类计算:

#二元分类计算
for i in range (5):if a[0,i]*c[0,i]+b[0,i]*d[0,i]-k>0: #阈值计算,满足条件时取1,否则取0e[0,i]=1else:e[0,i]=0print('e[0,',i,']=',e[0,i]) #输出阈值计算结果

绘制二元分类的效果:

#绘制二元分类计算的结果
print('a=',a) #输出矩阵
print('b=',b) #输出矩阵
print('c=',c) #输出矩阵
print('d=',d) #输出矩阵
x=np.arange(0,5,1) #定义一个自变量
plt.plot(x,e[0,x]) #对阈值计算结果绘图
plt.savefig('ganzhiji.png') #保存图像
plt.show() #输出图像

这里使用的阈值判断函数为:

for i in range (5):if a[0,i]*c[0,i]+b[0,i]*d[0,i]-k>0: #阈值计算,满足条件时取1,否则取0e[0,i]=1else:e[0,i]=0

代码运行后的输出图像为:

图1

图1真实地反映了非此即彼的二元分类效果。

需要注意的是,由于元素的权重使用随机数生成,所以每次运行上述程序,获得的效果可能不一样。

【3】sigmoid函数

实际上,二元分类效果可能不是两个元素算一次就进行判断,而是多个结果互相叠加在一起,也就是把阈值判断函数改为:

f=0 #用来存储二元分类的综合计算结果
#二元分类计算
for i in range (5):if i==0:e[0, i] = a[0, i] * c[0, i] + b[0, i] * d[0, i] - k  # 阈值计算else:e[0, i] = a[0, i] * c[0, i] + b[0, i] * d[0, i] - k+e[0,i-1]  # 阈值计算
if e[0,4]>0: #最后计算结果,超过阈值开关取1,否则取0f=1
else:f=0

代码运行后,获得的输出图像为:

图2

此时获得的数据分别为:

图3

由图3可见,因为最后的e[0,4]>0,所以f=1。

此时的完整代码为:

import numpy as np #引入numpy模块
import matplotlib.pyplot as plt #引入matplotlib模块#创造矩阵
a = np.random.randint(5,9,size=(1,5)) #矩阵
b = np.random.randint(1,5,size=(1,5)) #矩阵
c = np.random.randn(1,5) #矩阵
d = np.random.randn(1,5) #矩阵
#阈值开关
k=1
#空矩阵
e =np.zeros((1,5),np.uint8) #用来存储二元分类的计算结果
f=0 #用来存储二元分类的综合计算结果
#二元分类计算
for i in range (5):if i==0:e[0, i] = a[0, i] * c[0, i] + b[0, i] * d[0, i] - k  # 阈值计算else:e[0, i] = a[0, i] * c[0, i] + b[0, i] * d[0, i] - k+e[0,i-1]  # 阈值计算
if e[0,4]>0: #最后计算结果,超过阈值开关取1,否则取0f=1
else:f=0#绘制二元分类计算的结果
print('a=',a) #输出矩阵
print('b=',b) #输出矩阵
print('c=',c) #输出矩阵
print('d=',d) #输出矩阵
print('e=',e) #输出矩阵
print('f=',f) #输出矩阵
x=np.arange(0,5,1) #定义一个自变量
plt.plot(x,e[0,x]) #对阈值计算结果绘图
plt.savefig('ganzhiji.png') #保存图像
plt.show() #输出图像

sigmoid()函数就是在上述基础上,进一步优化函数表达式,把所有的加权计算结果变成指数函数的变量,并且指数函数还设置成分式的一部分。相应的,有如下函数:

f(x)=\frac{1}{1+exp(-\sum {w}_j{x}_j-b)}

如果把-w_{j}x_{j}-b简化为-x,该函数相应简化为:

f(x)=\frac{1}{1+exp(-x)}

函数对应的图像为:

图4

图4是平滑过渡图像,并且输出结果限定在(0,1)范围内。

绘制图4的代码为:

import numpy as np #引入numpy模块
import matplotlib.pyplot as plt #引入matplotlib模块#创造矩阵
t=np.linspace(-10,10,100) #自变量
y0=np.exp(-t) #指数函数
y=1/(1+y0) #因变量
plt.plot(t,y) #绘制图像
plt.title('sigmoid() function') #图像上设置图名
plt.savefig('sigmoid() function.png') #保存图像
plt.show() #显示图像

【4】函数验证

为验证sigmoid()函数,可以在上述示例中的代码plt.plot(x,e[0,x]) #对阈值计算结果绘图

修改为:

plt.plot(x,1/(1+np.exp(-e[0,x]))) #对阈值计算结果绘图

此时运行代码获得的图像为:

图5

由图5可见,复杂多变的实际情况中,sigmoid()函数的输出结果也是在(0,1)范围内。所以,sigmoid()函数本身具有很强的实用性。

此时的完整代码为:

import numpy as np #引入numpy模块
import matplotlib.pyplot as plt #引入matplotlib模块#创造矩阵
a = np.random.randint(5,9,size=(1,5)) #矩阵
b = np.random.randint(1,5,size=(1,5)) #矩阵
c = np.random.randn(1,5) #矩阵
d = np.random.randn(1,5) #矩阵
#阈值开关
k=1
#空矩阵
e =np.zeros((1,5),np.uint8) #用来存储二元分类的计算结果
f=0 #用来存储二元分类的综合计算结果
#二元分类计算
for i in range (5):if i==0:e[0, i] = a[0, i] * c[0, i] + b[0, i] * d[0, i] - k  # 阈值计算else:e[0, i] = a[0, i] * c[0, i] + b[0, i] * d[0, i] - k+e[0,i-1]  # 阈值计算
if e[0,4]>0: #最后计算结果,超过阈值开关取1,否则取0f=1
else:f=0#绘制二元分类计算的结果
print('a=',a) #输出矩阵
print('b=',b) #输出矩阵
print('c=',c) #输出矩阵
print('d=',d) #输出矩阵
print('e=',e) #输出矩阵
print('f=',f) #输出矩阵
x=np.arange(0,5,1) #定义一个自变量
plt.plot(x,1/(1+np.exp(-e[0,x]))) #对阈值计算结果绘图
plt.savefig('sigmoid.png') #保存图像
plt.show() #输出图像

需要注意的是,由于元素的权重使用随机数生成,所以每次运行上述程序,获得的效果可能不一样。

【5】总结

探究了sigmoid()函数,研究了多因素的综合作用。

http://www.lryc.cn/news/525616.html

相关文章:

  • w-form-select.vue(自定义下拉框组件)(与后端字段直接相关性)
  • 【JVM】垃圾收集器详解
  • python创建一个httpServer网页上传文件到httpServer
  • 【Maui】提示消息的扩展
  • 租车骑绿岛
  • Pytorch - YOLOv11自定义资料训练
  • 微服务与docker
  • 1.23 消息队列
  • 【华为路由的arp配置】
  • 绘制决策树的尝试1
  • 概率论里的特征函数,如何用卷积定理去理解
  • Spring 是如何解决循环依赖问题
  • Linux 目录操作详解
  • Elasticsearch的经典面试题及详细解答
  • Linux-arm(1)ATF启动流程
  • C#编程:List.ForEach与foreach循环的深度对比
  • C语言文件操作:标准库与系统调用实践
  • 代码随想录 栈与队列 test 7
  • C语言练习(21)
  • 智能手机“混战”2025:谁将倒下而谁又将突围?
  • 计算机图形学:实验一 OpenGL基本绘制
  • 二分查找题目:快照数组
  • 深度学习|表示学习|卷积神经网络|参数共享是什么?|07
  • 基于相机内参推导的透视投影矩阵
  • 浅析Dubbo 原理:架构、通信与调用流程
  • 03垃圾回收篇(D3_垃圾收集器的选择及相关参数)
  • 一、引论,《组合数学(第4版)》卢开澄 卢华明
  • Vue3+TS 实现批量拖拽文件夹上传图片组件封装
  • 二叉树的所有路径(力扣257)
  • Python OrderedDict 实现 Least Recently used(LRU)缓存