当前位置: 首页 > news >正文

transformer学习

transformer

李宏毅老师的课:https://www.youtube.com/watch?v=ugWDIIOHtPA&list=PLJV_el3uVTsOK_ZK5L0Iv_EQoL1JefRL4&index=60

知乎上的文章:Transformer模型详解(图解最完整版)

主要参考tensorflow的官方文档:理解语言的 Transformer 模型

还有一篇英文文章讲得也不错:The Illustrated Transformer

google官方的blog里面有动画也不错:Transformer:一种用于语言理解的新型神经网络架构,建议翻译着看

根据tensorflow的官方文档写的代码,包含了数据集:

关于新机器测试,李沐老师也有在做:https://t.bilibili.com/695161992084717573?tab=2

bert

知乎bert简介:什么是BERT?

ensorflow的官方文档(还没有中文版):使用 BERT 对文本进行分类

bert源码实现:从零实现BERT网络模型

gpt

http://www.lryc.cn/news/112765.html

相关文章:

  • 基于LNMP架构搭建Discuz论坛
  • 乐鑫科技2021笔试题
  • VL 模型 Open-Set Domain Adaptation with Visual-Language Foundation Models 论文阅读笔记
  • 在IDEA同一个窗口中同时打开多个独立项目
  • flask-session、数据库连接池
  • 基于EEGLAB的ICA分析
  • Pytorch深度学习-----神经网络之线性层用法
  • 代码随想录算法训练营day58
  • Grafana集成prometheus(4.Grafana添加预警)
  • 宏观上看Spring创建对象的过程
  • Jtti:linux如何配置dns域名解析服务器
  • 上网速度慢解决方案
  • 解决 “fatal: Could not read from remote repository.
  • TypeScript知识点总结
  • Map简单介绍
  • Linux文本处理工具和正则表达式
  • 【WebRTC---源码篇】(二十三)JitterBuffer
  • 基于SpringBoot+Vue的在线考试系统设计与实现(源码+LW+部署文档等)
  • 用Rust实现23种设计模式之 外观模式
  • 使用一个python脚本抓取大量网站【1/3】
  • Session与Cookie的区别(五)
  • 【Linux】网络编程套接字
  • 【C++】语法小课堂 --- auto关键字 typeid查看实际类型 范围for循环 空指针nullptr
  • Vercel 部署的项目发现APIkeys过期了怎么办
  • 【HMS Core】推送报错907135701、分析数据查看
  • Air32 | 合宙Air001单片机内部FLASH读写示例
  • C语言基本语法-第一章
  • 八、Spring 整合 MyBatis
  • Flutter Flar动画实战
  • A stop job is running for xxxxxx