当前位置: 首页 > news >正文

夏至之日,共赴实时 AI 之约:RTE Open Day@AGI Playground 2025 回顾

在这里插入图片描述

每年 RTE 开发者社区的重磅活动—— RTE Open Day ,也在六月的 AGI Playground 现场开启今年的行程。这是 RTE Open Day 第五期现场,这期我们的关键词是 「Real-Time AI」 和 「Voice Agent」,不仅有来自社区的 16 个项目,还有两场对话式 AI workshop。

在这里插入图片描述

对话式 AI workshop:感受语音 AI 市场爆发点

两场对话式 AI workshop,由开源框架 TEN Framework 和 RTE 开发者社区联合主办。

一场是前沿讨论,拆解 YC 押注的 Voice Agent 新浪潮 ,从到开源框架、模型、到真实产品落地,来自 TENMiniMaxFolotoy 的嘉宾对技术和场景进行分享。

一场是动手实践,一小时极速构建你的实时语音对话 Avatar ,基于 TEN、阶跃星辰Trulience 构建语音数字人。

策划这两场对话式 AI workshop,不仅是因为我们在关注语音领域,而且是因为它是市场的真实爆发点。RTE 开发者社区的 Voice Agent 学习笔记就有提到,「自 2020 年以来,Y Combinator 已经孵化了 90 家语音智能体公司,且这一趋势正在加速,最新的尚未完全公布的 W25 批次中就有 10 家。值得注意的是,在 2023 年之前成立的公司中,大部分都是在过去一年内转型进入语音智能体领域的。」 所以,在模型、通用平台、垂直场景等方向,还有很多问题可以讨论。

RTE 开发者社区发起人、声网生态运营中心负责人杨慧,首次公开 《对话式 AI 白皮书》 计划,分享了 Voice Agent 关键框架与行业趋势,并现场发起开源共建者招募。如果你对共创白皮书感兴趣,请加入我们!

在这里插入图片描述

Plutoless,开源 Agent 框架 TEN Framework 联合发起人,介绍了 TEN 开源框架的核心理念与应用场景,展示了 TEN 如何快速构建具备多模态能力的 Voice Agent。

在这里插入图片描述

MiniMax 架构师冯雯,深入解析了 TTS 在 Voice Agent 时代下的技术演进,特别强调在真实语音交互中,MiniMax Speech 02 模型实现了 Zero-Shot 的音色定制能力,并将首包延时压缩到300ms,极大地提升了交互体验。

在这里插入图片描述

郭兴华,Folotoy 联合创始人,从实际产品落地角度出发,分享了在儿童陪伴场景中的技术取舍与产品经验,尤其是「把技术隐藏起来」这一点引发了大家的思考共鸣。

在这里插入图片描述

最后一个 lightning demo 环节,欢迎观众即兴上台,现场有两位观众分别分享了自己做儿童英文绘本教育项目 Metabooks 和旅行助手的产品与想法。

在这里插入图片描述

RTE Open Day 展区:创新与商业潜力兼具的 Real-Time AI 是怎样的?

这次 RTE Open Day 展区共有 16 家社区里成长的项目参展,覆盖 AI 语音顾客访谈智能体、AI 玩具、AI 陪伴、AI 外呼、AI 教育、语音模型与记忆层等诸多实时互动上下游场景。

其中有今年新涌现的项目,也有在过去一年不断迭代成长的产品,更集中围绕「Real-Time AI」 和 「Voice Agent」两个关键词提供了全局视野。

在这里插入图片描述

游园打卡的「夸夸贴纸」和「拼图打卡」玩法返场,为展商提供一些「情绪价值」,也是一种「催更」,希望产品能早日被更多人体验到。同时现场观众也能把最终拼好的 「RTE Open Day」 带回家,期待下一次我们会有什么主题呢?

在这里插入图片描述

RTE Dev Party:聊聊 Voice Agent&Real-Time AI

Dev Party@RTE Open Day 是我们为社区开发者准备的固定的环节,在第一天的灵感和技术交流后,总需要换一个轻松氛围认识新朋友、分享新想法。

3 分钟,分享你的项目——来自 Tmind AI(心理咨询师 AI 培训)、deepsip.cn(AI+SIP )、RWKV、赛博创力(语音互动硬件)、ANP 开源社区(智能体通讯协议)、星连资本、MiBai 空间交互桌面机器人、Lemon.ai、openmcp.app 等项目的开发者做了分享。

在这里插入图片描述

当一群人聚在 RTE Open Day 现场,就会有新的灵感和机会出现!

听见 AI,看见 2025。RTE Open Day 期待在年底的 RTE 大会上与大家再次相见!

点击👇查看过往 RTE Open Day

在这里游玩和创造,见证实时互动和 AI 的融合爆发丨年末场 RTE Open Day@RTE2024 回顾

当一群人聚在 RTE Open Day 现场|S 创上海 2024 回顾

不一样的 RTE Open Day,对话最专业的 RTE+AGI Builders!丨AGI Playground 现场回顾

在这里插入图片描述

更多 Voice Agent 学习笔记:

11Labs 增长负责人分享:企业级市场将从消费级或开发者切入丨Voice Agent 学习笔记

实时多模态如何重塑未来交互?我们邀请 Gemini 解锁了 39 个实时互动新可能丨Voice Agent 学习笔记

级联vs端到端、全双工、轮次检测、方言语种、商业模式…语音 AI 开发者都在关心什么?丨Voice Agent 学习笔记

a16z 最新报告:AI 数字人应用层即将爆发,或将孕育数十亿美金市场丨 Voice Agent 学习笔记

a16z合伙人:语音交互将成为AI应用公司最强大的突破口之一,巨头们在B2C市场已落后太多丨Voice Agent 学习笔记

ElevenLabs 33 亿美元估值的秘密:技术驱动+用户导向的「小熊软糖」团队丨Voice Agent 学习笔记

端侧 AI 时代,每台家居设备都可以是一个 AI Agent丨Voice Agent 学习笔记

世界最炙手可热的语音 AI 公司,举办了一场全球黑客松,冠军作品你可能已经看过

多模态 AI 怎么玩?这里有 18 个脑洞

AI 重塑宗教体验,语音 Agent 能否成为突破点?

在这里插入图片描述

http://www.lryc.cn/news/574914.html

相关文章:

  • CentOS 6 Linux 系统添加永久静态路由的方法详解!
  • CentOS 8 安装第二个jdk隔离环境
  • LLaMA-Factory 合并 LoRA 适配器
  • vscode管理go多个版本
  • GO 语言学习 之 运算符号
  • YOLOv13发布 | 超图高阶建模+轻量化模块,保证实时性的情况下,检测精度再创新高!
  • OpenCV——cv::floodFill
  • 环保法规下的十六层线路板创新:猎板 PCB 如何实现无铅化与可持续制造
  • 玛哈特机械矫平机:精密制造的“应力消除师”与“平整度雕刻家”
  • IDEA高效开发指南:JRebel热部署
  • EloqCloud for KV 初体验:兼容redis的云原生KV数据库
  • 机器学习基础 线性回归与 Softmax 回归
  • zlib库使用
  • 51c嵌入式~CAN~合集2
  • Java动态调用DLL
  • 数据结构?AVL树!!!
  • 2200、找出数组中的所有K近邻下标
  • SoC仿真环境中自定义printf函数的实现
  • Sivers毫米波产品系列全景图:覆盖通信、工业、交通、航天
  • Android14音频子系统-Audio HAL分析
  • 【Elasticsearch】es初识,在项目架构中的用途,与mysql和kafka的配合使用,
  • 基于Kafka实现企业级大数据迁移的完整指南
  • 数据结构篇-二分图
  • 【世纪龙科技】新能源汽车VR虚拟体验展示馆-解锁认知新维度
  • 计算机网络 网络层:数据平面(二)
  • Excel基础:选择和移动
  • java 对接ETH(以太坊) 交易相关资料
  • 量学云讲堂2025朱永海慢牛开启第58期视频课程
  • 物流涂层科技赋能仓储:创冷科技引领高温环境下的仓储物流安全升级
  • 了解笔记本电脑制造:从品牌到代工厂的全产业链