当前位置: 首页 > news >正文

Harvard transformer NLP 模型 openNMT 简介入门

项目网址:

OpenNMT - Open-Source Neural Machine Translation

logo:

一,从应用的层面先跑通 Harvard transformer

GitHub - harvardnlp/annotated-transformer: An annotated implementation of the Transformer paper.

​git clone https://github.com/harvardnlp/annotated-transformer.git
cd annotated-transformer/​

1. 环境搭建

 conda create --name ilustrate_transformer_env python=3.9conda activate ilustrate_transformer_envpip install -r requirements.txt  -i https://pypi.tuna.tsinghua.edu.cn/simple

问题:TypeError: issubclass() arg 1 must be a class

原因: 这是由python中的后端包之一的兼容性问题引起的问题,包“pydantic”

执行下面命令可以解决

python -m pip install -U pydantic spacy


 

会遇到下载不到数据的问题,因为有个网址废弃了:www.quest......

改成最新版本的torchtext的内容即可:

/home/hipper/anaconda3/envs/ilustrate_transformer_env/lib/python3.9/site-packages/torchtext/datasets/multi30k.py

 13 '''LL::14 URL = {15     "train": r"http://www.quest.dcs.shef.ac.uk/wmt16_files_mmt/training.tar.gz",16     "valid": r"http://www.quest.dcs.shef.ac.uk/wmt16_files_mmt/validation.tar.gz",17     "test": r"http://www.quest.dcs.shef.ac.uk/wmt16_files_mmt/mmt16_task1_test.tar.gz",18 }1920 MD5 = {21     "train": "20140d013d05dd9a72dfde46478663ba05737ce983f478f960c1123c6671be5e",22     "valid": "a7aa20e9ebd5ba5adce7909498b94410996040857154dab029851af3a866da8c",23     "test": "0681be16a532912288a91ddd573594fbdd57c0fbb81486eff7c55247e35326c2",24 }25 '''26 # TODO: Update URL to original once the server is back up (see https://github.com/pytorch/text/issues/1756)27 URL = {28     "train": r"https://raw.githubusercontent.com/neychev/small_DL_repo/master/datasets/Multi30k/training.tar.gz",29     "valid": r"https://raw.githubusercontent.com/neychev/small_DL_repo/master/datasets/Multi30k/validation.tar.gz",30     "test": r"https://raw.githubusercontent.com/neychev/small_DL_repo/master/datasets/Multi30k/mmt16_task1_test.tar.gz",31 }3233 MD5 = {34     "train": "20140d013d05dd9a72dfde46478663ba05737ce983f478f960c1123c6671be5e",35     "valid": "a7aa20e9ebd5ba5adce7909498b94410996040857154dab029851af3a866da8c",36     "test": "6d1ca1dba99e2c5dd54cae1226ff11c2551e6ce63527ebb072a1f70f72a5cd36",37 }

运行:

未完待续 ...

__________________________________________________

参考:

《The Annotated Transformer》翻译——注释和代码实现《Attention Is All You Need》_神洛华的博客-CSDN博客

图解transformer | The Illustrated Transformer_Ann's Blog的博客-CSDN博客

GitHub - harvardnlp/annotated-transformer: An annotated implementation of the Transformer paper.

OpenNMT - Open-Source Neural Machine Translation

flash attention 1,2:

Stanford CRFM

GitHub - Dao-AILab/flash-attention: Fast and memory-efficient exact attention

http://www.lryc.cn/news/134652.html

相关文章:

  • 【数据结构OJ题】用栈实现队列
  • 通达信指标公式15:除权除息数据统计分析
  • day-27 代码随想录算法训练营(19)回溯part03
  • CSDN编程题-每日一练(2023-08-22)
  • 使用 KubeBlocks 为 K8s 提供稳如老狗的数据库服务
  • SFL212B-10-21-15、SFL212B-20-21-40喷嘴挡板伺服阀
  • 阿里云100元预算可选的云服务器配置2核2G3M带宽
  • Linux问题--docker启动mysql时提示3306端口被占用
  • 2023年中秋月饼市场趋势分析(月饼京东销售数据分析)
  • A Survey on Model Compression for Large Language Models
  • 读取/加载 properties/yml 配置文件
  • UG\NX二次开发 创建中心线
  • 用java语言写一个网页爬虫 用于获取图片
  • 三数之和-LeetCode
  • ubuntu 对多CPU统一设置高性能模式
  • 志凌海纳 SmartX 携手灵雀云推出全栈云原生联合解决方案
  • 排名前 6 位的数学编程语言
  • arm:day6
  • MyBatis快速入门以及环境搭建和CRUD的实现
  • 基于Pytorch实现的声纹识别系统
  • Fast DDS (2)
  • HarmonyOS/OpenHarmony应用开发-ArkTS语言渲染控制if/else条件渲染
  • 飞天使-k8s基础组件分析-pod
  • css题库
  • 中文医疗大模型汇总
  • smiley-http-proxy-servlet 实现springboot 接口反向代理,站点代理,项目鉴权,安全的引入第三方项目服务
  • Java集合利器 Map Set
  • HJ106 字符逆序
  • sentinel的基本使用
  • 【STM32】串口通信乱码(认识系统时钟来源)