当前位置: 首页 > news >正文

ChatGPT可以作为一个翻译器吗?

论文地址:https://arxiv.org/abs/2301.08745.pdf

背景

自从OpenAI2022年11月30日发布ChatGPT以来,基本上把NLP所有任务大统一了,那么在机器翻译的表现到底如何呢?腾讯AI Lab在翻译Prompt多语言翻译以及翻译鲁棒性三方面做了一些实验,并且与Google Translate(133种语言), DeepL Translate(29种语言)Tencent TranSmart(16种语言)三款商业翻译软件进行了对比。

核心结论

1、在高资源语言上的翻译效果和主流商业翻译软件(Google翻译,deepl等)相当;

2.在低资源语言上的翻译效果差强人意,通过pivot prompting方法可以提升效果;

3.在翻译的鲁邦稳定性上落后于主流商业翻译软件;

4.ChatGPT在口语翻译上是一个潜在的好工具;

ChatGPT机器翻译评估

评估数据

由于翻译数据需要手动去和ChatGPT交互得到,比较耗时,因此作者每个种类的数据集都随机采样了50个样本进行评估

评估指标

BLEU、ChrF++、TER,这三种评估指标可以在如下链接找到实现方案:https://github.com/mjpost/sacrebleu

翻译的Prompts

首先作者使用如下Prompt在ChatGPT上生成翻译需要的Prompts

如上图所示,发现生成的Prompt是合理的,但基本都很类似的,作者重新进行了归类,如下表所示:

[SRC]表示源语言,[TGT]表示目标语言。由于在Figture1中生成的Prompt中都带有“引号”,作者在Tp2中增加了去掉生成“引号”的Prompt,不过这样偶尔导致生成不稳定。

从上述三种翻译Prompt的实验来看,Tp3是最佳的,因此后面的实验都使用Tp3 Prompt。

翻译的语言

作者使用了四种语言进行两两之间进行翻译,以BLEU为平均指标,结果如下图所示:

从上图可以看出,在低资源的罗马语言到英语的效果要比高资源的德文到英语的翻译差,所谓高资源,低资源是从他们的翻译语料多少来定的。

一般来说,低资源或者不同语种直接的翻译,传统商业软件是比较难的,而ChatGPT一个模型解决多任务的能力可以通过高资源的语料和NLP其他任务弥补这种不足。

为了解决不同语种的翻译,提出了一种叫Pivot Prompting的方法,具体做法就是先把一种语言翻译成中间语言,然后再翻译成目标语言,一般中间语言默认是英语。形式如下:Please provide the [PIV] translation first and then the [TGT] translation for these sentences one by one:

使用这种方法,Tp3可以修改成如下形式:

使用Pivot Prompting方法,并且对低资源语言翻译进行BLEU评估,结果如下Table 5所示。

ChatGPT在翻译任务的鲁棒性

从Table 6可以看出,ChatGPT在这些翻译数据上不如商业软件Google Translate 和 DeepL Translate好。
下面看一些具体的case

参考文献:

[1] https://github.com/wxjiao/Is-ChatGPT-A-Good-Translator
[2] https://translate.google.com
[3] https://www.deepl.com/translator
[4] https://transmart.qq.com/zh-CN/index
[5] https://github.com/facebookresearch/flores
[6]https://github.com/hsing-wang/WMT2020_BioMedical/tree/master/Bio-18-19-testset 
[7] https://github.com/mjpost/sacrebleu

http://www.lryc.cn/news/26838.html

相关文章:

  • 详述java的设计模式(三)
  • Linux命令·pwd
  • 以图搜图服务快速搭建
  • 【TensorFlow安装踩坑记录】
  • 03.03回溯法
  • I.MX6ULL内核开发0:linux内核模块
  • qsort快速排序的实现以及模拟实现qsort的功能(狠狠的拿捏)
  • [Java·算法·中等]LeetCode215. 数组中的第K个最大元素
  • xgboost:算法数学原理
  • map、multimap、unordered_map
  • 2023年全国最新会计专业技术资格精选真题及答案11
  • Centos7搭建NFS
  • ThreadLoca基本使用以及与synchronized的区别
  • 【C++】纯虚函数、纯虚析构
  • Python 进阶小技巧:7招展开嵌套列表
  • 【Spring6】| Bean的作用域
  • Qt界面美化之自定义qss样式表
  • 春招进行时:“211文科硕士吐槽工资5500” HR:行情和能力决定价值
  • 【DaVinci Developer专题】-45-自动生成SWC中所有Runnable对应的C文件
  • redis启动和关闭服务脚本
  • windows CMD快捷键:
  • 【C/C++语言】刷题|双指针|数组|单链表
  • Leetcode.1487 保证文件名唯一
  • python-星号(*)-双星号(**)-函数动态参数匹配-解包操作
  • 面试官:为什么说ArrayList线程不安全?
  • STP详解
  • linux AWK常用命令 —— 筑梦之路
  • SpringCloud:服务拆分及远程调用
  • 网络应用之javascript函数定义和调用
  • 使用VNC远程连接Ubuntu - 内网穿透实现公网远程办公