当前位置: 首页 > news >正文

景联文科技可为多模态语音翻译模型提供数据采集支持

8月22日Facebook的母公司Meta Platforms发布了一种能够翻译和转录数十种语言的人工智能模型——SeamlessM4T,可以在日常生活中或者商务交流中为用户提供更便捷的翻译和转录服务。

相较于传统的文本翻译,这项技术的最大区别在于它可以实现端到端的语音翻译,即将一种语言的语音直接翻译成另一种语言,使得人们可以直接交流,而无需经过复杂的中间转换过程。

SeamlessM4T支持:

1、近100种语言的语音识别。

2、近100种输入和输出语言的语音到文本翻译。

3、支持近100种输入语言和36种输出语言的语音到语音翻译。

4、支持近100种语言的文本到文本翻译。

5、支持近100种输入语言和35种输出语言的文本到语音翻译。

SeamlessM4T支持的语音到语音翻译模型需要大量高质量的端到端数据。满足近100种语言语音翻译的需求,仅依靠人工转录和翻译语音是困难的,因为构建语音翻译数据集的流程既复杂又成本高昂。在获得授权音频的前提下,需要进行对应的转录和翻译,然后将音频、转录和翻译进行切分,最后进行对齐和过滤以获得有效数据。

景联文科技拥有丰富的语音数据采集标注项目经验,自建专业语音采集录音室有高度还原真实场景能力,在全国30多个省市有近一万人的被采集人员储备,全球范围内也有采集渠道,支持多语种、多方言语音采集。自有的数据管理平台,打通数据闭环,可有序进行数据分发、清洗、标注、质检、等环节,交付高质量的训练数据,提高企业AI数据训练效率,加速人工智能相关应用的落地迭代周期。

景联文科技|数据采集|数据标注

助力人工智能技术,赋能传统产业智能化转型升级

文章图文著作权归景联文科技所有,商业转载请联系景联文科技获得授权,非商业转载请注明出处。

http://www.lryc.cn/news/163594.html

相关文章:

  • 定时器分批请求数据
  • 【华为OD机试python】报数游戏【2023 B卷|100分】
  • 【深度学习实战—6】:基于Pytorch的血细胞图像分类(通用型图像分类程序)
  • 华清远见第六课程day4作业
  • 【广州华锐互动】AR远程智慧巡检在化工行业中的应用
  • easyui-sidemenu 菜单 后台加载
  • Python总结上传图片到服务器并保存的两种方式
  • 【ETH】以太坊合约智能合约逆向方案
  • C高级Day5
  • AI绘画:Midjourney超详细教程Al表情包超简单制作,内附关键词和变现方式
  • Linux dup dup2函数
  • 设计模式系列-外观模式
  • DBeaver 下载、安装与数据库连接(MySQL)详细教程【超详细,保姆级教程!!!】
  • 使用adjustText解决标签文字遮挡问题python
  • [论文笔记]SiameseNet
  • 只有个体户执照,可以用来在抖音开店吗?抖店开通问题解答
  • 微服务高可用容灾架构设计
  • 记录docker 部署nessus
  • qt 正则表达式
  • l8-d13 UNIX域套接字
  • @RequiredArgsConstructor(onConstructor=@_(@Autowired))是什么语法?
  • FL Studio Producer Edition 21.0.3.3713中文完整破解版功能特点及安装激活教程
  • Mybatis 动态语言 - mybatis-velocity
  • Fourier傅里叶变换的线性性质和位移性质
  • # 磁盘引导方式相关知识之BIOS、msdos、MBR、UEFI、gpt、esp、csm
  • Java中同时POST文件和提交JSON数据的方法
  • 【React】React获取URL参数,根据URL参数隐藏页面元素
  • 第68步 时间序列建模实战:ARIMA建模(Matlab)
  • Gin学习记录3——模版与渲染
  • Python算法练习 9.11