当前位置: 首页 > news >正文

使用transformers过程中出现的bug

1. The following model_kwargs are not used by the model: ['encoder_hidden_states', 'encoder_attention_mask'] (note: typos in the generate arguments will also show up in this list)

使用text_decoder就出现上述错误,这是由于transformers版本不兼容导致的

from transformers import AutoModel, AutoConfig, BertGenerationDecoder
decoder_config = AutoConfig.from_pretrained(args['text_checkpoint'])text_decoder = BertGenerationDecoder(config=decoder_config)output = self.text_decoder.generate(input_ids=cls_input_ids, encoder_hidden_states=encoder_hidden_states, encoder_attention_mask=encoder_attention_mask,  max_length=self.args['max_seq_length'], do_sample=True, num_beams=self.args['beam_size'], length_penalty=1.0, use_cache=True,)

解决办法:将transformer的版本换到以下范围, 4.15.0<=transformers<4.22.0,transformers>=4.25.0

比如:pip install transformers==4.25.1 or pip install transformers==4.20.1

2. No module named 'transformers.generation_beam_constraints' (其中transformers==4.28.1)

(1)解决办法

将:from transformers import generation_beam_constraints

改为:from transformers.generation import beam_constraints

(2)其他例子

有问题的代码:

# 可以在transformers == 4.23.1版本上面运行
from transformers.generation_beam_constraints import Constraint
from transformers.generation_beam_search import BeamScorer, BeamSearchScorer
from transformers.generation_logits_process import (EncoderNoRepeatNGramLogitsProcessor,ForcedBOSTokenLogitsProcessor,ForcedEOSTokenLogitsProcessor,HammingDiversityLogitsProcessor,InfNanRemoveLogitsProcessor,LogitsProcessorList,MinLengthLogitsProcessor,NoBadWordsLogitsProcessor,NoRepeatNGramLogitsProcessor,PrefixConstrainedLogitsProcessor,RepetitionPenaltyLogitsProcessor,TemperatureLogitsWarper,TopKLogitsWarper,TopPLogitsWarper,)
from transformers.generation_stopping_criteria import (MaxLengthCriteria,MaxTimeCriteria,StoppingCriteria,StoppingCriteriaList,validate_stopping_criteria,
)

修正后的代码:

# 可以在transformers == 4.28.1版本上面运行
from transformers.generation.beam_constraints import Constraint
from transformers.generation.beam_search import BeamScorer, BeamSearchScorer
from transformers.generation.logits_process import (EncoderNoRepeatNGramLogitsProcessor,ForcedBOSTokenLogitsProcessor,ForcedEOSTokenLogitsProcessor,HammingDiversityLogitsProcessor,InfNanRemoveLogitsProcessor,LogitsProcessorList,MinLengthLogitsProcessor,NoBadWordsLogitsProcessor,NoRepeatNGramLogitsProcessor,PrefixConstrainedLogitsProcessor,RepetitionPenaltyLogitsProcessor,TemperatureLogitsWarper,TopKLogitsWarper,TopPLogitsWarper,)
from transformers.generation.stopping_criteria import (MaxLengthCriteria,MaxTimeCriteria,StoppingCriteria,StoppingCriteriaList,validate_stopping_criteria,
)

http://www.lryc.cn/news/197804.html

相关文章:

  • Hadoop3教程(二十二):Yarn的基础架构与工作流程
  • 离线 notepad++ 添加到右键菜单
  • 怎么让英文大语言模型支持中文?--构建中文tokenization--继续预训练--指令微调
  • 笙默考试管理系统-MyExamTest----codemirror(35)
  • MMKV(2)
  • Spring Boot项目中使用 TrueLicense 生成和验证License(附源码)
  • ES6 Iterator 和 for...of 循环
  • ubuntu20.04 nvidia显卡驱动掉了,变成开源驱动,在软件与更新里选择专有驱动,下载出错,调整ubuntu镜像源之后成功修复
  • 华为FAT模式无线AP配置实例
  • nodejs基于vue 学生论坛设计与实现
  • 017 基于Spring Boot的食堂管理系统
  • 常用的二十种设计模式(下)-C++
  • C#桶排序算法
  • 快速了解服务器单CPU与双CPU
  • c# Dictionary、ConcurrentDictionary的使用
  • 大数据中间件——Kafka
  • HarmonyOS/OpenHarmony原生应用-ArkTS万能卡片组件Slider
  • SpringCloud: sentinel链路限流
  • UML 中的关系
  • ChatGPT技术或加剧钓鱼邮件攻击
  • 哨兵1号后向散射系数土壤水分反演
  • day3:Node.js 基础知识
  • 【RDMA】librdmacm库和连接建立过程
  • 如何使用Python抓取PDF文件并自动下载到本地
  • 人脸写真FaceChain的简单部署记录(一)
  • linux虚机新增加磁盘后在系统中查不到
  • js中隐式类型转换与toPrimitive
  • 家政系统预约小程序具备哪些功能?
  • 【LeetCode】46. 全排列
  • 宏电股份RedCap产品亮相迪拜华为MBBF,并参与RedCap全球商用阶段性成果发布