当前位置: 首页 > news >正文

LLM春招准备(1)

llm排序

在这里插入图片描述

GPT4V

GPT-4V可以很好地理解直接绘制在图像上的视觉指示。它可以直接识别叠加在图像上的不同类型的视觉标记作为指针,例如圆形、方框和手绘(见下图)。虽然GPT-4V能够直接理解坐标,但相比于仅文本坐标,GPT-4V在有视觉指示帮助下能够更可靠地执行任务。


在这里插入图片描述

在这里插入图片描述

位置编码

相对位置编码
在这里插入图片描述
在这里插入图片描述

手写

手写softmax,

def softmax(x):exp_x = np.exp(x - np.max(x, axis=-1, keepdims=True))sm = exp_x/np.sum(exp_x, axis=-1, keepdims=True)return sm

手写crossentropy

def cross_entropy(predictions, targets, epsilon=1e-12):predictions = np.clip(predictions, epsilon, 1.-epsilon)N = predictions.shape[0]ce = - np.sum(targets*np.log(predictions)) / Nreturn ce

在这里插入图片描述
手写attention

def saled_dot_product_attention(Q,K,V):dk = K.shape[-1]scores = np.dot(Q,K.T)/np.sqrt(dk)weights = softmax(scores)output = np.dot(weight,V)return weight, output

标签平滑label smoothing

在这里插入图片描述

标签平滑其实就是将硬标签(hard label)转化为软标签(soft label),也就是将标签的one hot编码中的1转化为比1稍小的数,将0转化为比0稍大的数,这样在计算损失函数时(比如交叉熵损失函数),损失函数会把原来值为0的标签也考虑进来,其实就相当于在标签的one hot编码中的每一维上增加了噪声。本质上是向训练集中增加了信息,使得训练集的信息量增大了,更加接近真实分布的数据集的信息量,所以有利于缓解过拟合

解决Transformer处理长序列

稀疏注意力

和Linformer,Longformer类似,Sparse Attention也是为了解决Transformer模型随着长度的增加,Attention部分所占用的内存和计算呈平方比增加的问题。

http://www.lryc.cn/news/311305.html

相关文章:

  • 网络安全知识点总结
  • 服务完善的智能组网系统?
  • VS2022如何添加行号?(VS2022不显示行号解决方法)
  • 125.验证回文字符串
  • Spring Boot的启动流程(个人总结,仅供参考)
  • 用BIO实现tomcat
  • JS逆向进阶篇【去哪儿旅行登录】【下篇-逆向Bella参数JS加密逻辑Python生成】
  • 【机器学习】生成对抗网络GAN
  • centos7安装kafka、zookeeper
  • 基于 STM32U5 片内温度传感器正确测算温度
  • 【比较mybatis、lazy、sqltoy、mybatis-flex、easy-query操作数据】操作批量新增、分页查询(三)
  • Leetcode 3068. Find the Maximum Sum of Node Values
  • 用 Dockerfile为镜像添加SSH服务
  • Maven能解决什么问题?为什么要用?
  • 【Golang星辰图】探索网络和HTTP的奇妙世界:使用Go语言打造高性能应用
  • [C语言]——操作符
  • iview碰到的一些问题总结
  • 【Python笔记-FastAPI】后台任务+WebSocket监控进度
  • 力扣hot100:15.三数之和(双指针/哈希表)
  • VMware虚拟机使用Windows共享的文件夹
  • 利用Python自动化日常任务
  • Android的多线程和异步处理
  • MySQL-----视图
  • LeetCode-02
  • 瑞_Redis_Redis的Java客户端
  • Cmake的使用
  • linux系统ELK组件介绍
  • 回归预测 | Matlab实现BiTCN基于双向时间卷积网络的数据回归预测
  • Tailscale中继服务derper使用docker-compose部署
  • Spring Cloud 实战系列之 Zuul 微服务网关搭建及配置