当前位置：首页 > news >正文

全球首个多语种手语视频生成模型诞生：SignLLM

news 2025/6/28 10:56:23

近日，一项名为 SignLLM 的新型 AI 技术取得了突破性进展，或将彻底改变听障人士的沟通方式。作为全球首个多语种手语生成模型，SignLLM 能够将输入的文本或语音指令，实时转化为对应的手语手势视频，为打破语言障碍、促进信息无障碍传播带来了革命性希望。

全球首个文本转多语种手语视频模型生成视频

长期以来，由于手语本身的复杂性和多样性，以及缺乏高质量数据的支持，手语翻译一直是人工智能领域极具挑战性的难题。而 SignLLM 的出现，成功克服了这两大技术瓶颈。

据研究团队发布的论文介绍，SignLLM 的成功主要归功于两项关键创新：

首个多语言手语数据集 Prompt2Sign 的构建

该数据集包含海量来自不同手语体系的视频数据，并经过精心处理和标注，转化为 AI 模型易于学习的格式，为 SignLLM 的训练提供了强大的数据基础。

独创的“视觉符号化”和“代码本重建”技术

SignLLM 通过将手语视频分解为一系列离散的字符级符号标记，并将其映射到与文本语言相似的表达形式，巧妙地将手语翻译任务转化为现有的文本翻译模型可以处理的形式，从而有效利用了大型语言模型 (LLM) 强大的语义理解和生成能力。

研究团队表示，SignLLM 在八种不同语言的手语生成任务中均取得了目前最优的性能表现，显著超越了过去基于传统方法开发的模型。

SignLLM 的诞生，为 AI 手语翻译领域的技术突破带来了新的希望。随着研究的深入和应用的拓展， SignLLM 有望为听障人士带来更便捷、更高效的沟通体验，在促进信息无障碍和社会包容方面发挥积极作用。

SignLLM github地址：https://signllm.github.io/

结语

本文首发于同名宫棕号，欢迎关注获取最新快讯。

查看全文

http://www.lryc.cn/news/358146.html

初学C语言100题：经典例题节选（源码分享）

C++设计模式之策略模式、迭代器模式、适配器模式、工厂模式、超级工厂模式、享元模式、代理模式

18 js时间对象

安卓赤拳配音v1.0.2Ai配音神器+百位主播音色

前端面试题日常练-day40 【面试题】

UG NX二次开发(C#)-UFun函数-利用UFPart.Export导出模型中的对象并创建一个新的part

SFOS2：组件介绍

交换机的三层交换技术

探秘URL的奥义：JavaScript中轻松获取页面参数值的N种姿势【含代码示例】

VSCode小技巧，忽略不想格式化的代码行

揭秘网络编程：同步与异步IO模型的实战演练

在Visual Studio Code和Visual Studio 2022下配置Clang-Format，格式化成Google C++ Style

民国漫画杂志《时代漫画》第32期.PDF

RTKLIB学习--前向滤波

利用C++与Python调用千帆免费大模型，构建个性化AI对话系统

VTK9.2.0+QT5.14.0绘制三维显示背景

Vue.js2+Cesium1.103.0 十六、多模型轨迹运动

Matlab|基于PMU相量测量单元进行电力系统电压幅值和相角状态估计

【C++】---二叉搜索树

FastAPI - 依赖注入3

【网络运维的重要性】

YOLOv5改进 | 注意力机制 | 添加双重注意力机制 DoubleAttention【附代码/涨点能手】

自用网站合集

【Golang】gin框架如何在中间件中捕获响应并修改后返回

电脑同时配置两个版本mysql数据库常见问题

Java | Leetcode Java题解之第112题路径总和

HaloDB 的 Oracle 兼容模式

【Python】解决Python报错：TypeError: ‘xxx‘ object does not support item assignment

Spring-注解

旧手机翻身成为办公利器——PalmDock的介绍也使用

首个多语言手语数据集 Prompt2Sign 的构建

独创的“视觉符号化”和“代码本重建”技术

结语

相关文章：