当前位置: 首页 > news >正文

docker启动paddlespeech服务,并使用接口调用

一、检查docker容器是否启动

1.输入命令  systemctl status docker

启动        systemctl start docker
守护进程重启   sudo systemctl daemon-reload
重启docker服务   systemctl restart  docker
重启docker服务  sudo service docker restart
关闭docker service docker stop
关闭docker systemctl stop docker
检查docker状态  systemctl status docker

若docker正常启动则显示界面如下

2.启动服务时可能出现报错

可能为权限不够导致

输入su,并输入当前用户登录密码即可进入root权限模式,再次启动即可

Docker启动失败报错Failed to start Docker Application Container Engine解决方案

二、docker启动paddlespeech镜像

1.安装

初始需要下载镜像到本地,参照官方文档docker安装paddlespeech,并启动服务

#下载并启动服务
docker run --name dev -v $PWD:/mnt -p xxxx:xxxx -it paddlecloud/paddlespeech:develop-cpu-fb4d25 /bin/bash

其中xxxx:xxxx,前为端口映射端口,后为实际请求端口

比如想启动paddlespeech基础服务需要将实际请求设置为8090,包含中文语音识别,中文语音合成等等

        但此服务语音识别和合成只能识别中文以及数字,字母及英文无法识别,使用需要注意

2.二次使用

docker run  -p XXXX:XXXX -it paddlecloud/paddlespeech:develop-cpu-fb4d25 /bin/bash

使用此命令即可启动paddlespeech镜像

若想查看当前有哪些镜像,使用  docker images  命令即可查看

三、启动paddlespeech服务

1.官方文档说明有三种服务启动方式

#启动AI Studio服务,即包括语音识别,语音合成,音频分类等多种服务
paddlespeech_server start --config_file ./speech_server/conf/application.yaml
#启动完毕,即可看到启动端口为8090
#需要在启动docker镜像时指定实际端口
#启动流式tts服务
paddlespeech_server start --config_file ./demos/streaming_tts_server/conf/tts_online_application.yaml
#启动流式asr服务
paddlespeech_server start --config_file ./demos/streaming_asr_server/conf/application.yaml

启动成功后应该显示

[2023-05-02 07:16:34,644] [    INFO] - start to init the engine
[2023-05-02 07:16:34,644] [    INFO] - asr : python engine.
W0502 07:16:37.497296  1187 gpu_resources.cc:61] Please NOTE: device: 0, GPU Compute Capability: 8.9, Driver API Version: 12.1, Runtime API Version: 11.7
W0502 07:16:37.502528  1187 gpu_resources.cc:91] device: 0, cuDNN Version: 8.8.
2023-05-02 07:16:38.195 | INFO     | paddlespeech.s2t.modules.embedding:__init__:153 - max len: 5000
[2023-05-02 07:16:39,064] [    INFO] - Initialize ASR server engine successfully on device: gpu:0.
[2023-05-02 07:16:39,064] [    INFO] - tts : python engine.
...
[2023-05-02 07:16:55] [INFO] [on.py:61] Application startup complete.
INFO:     Uvicorn running on http://127.0.0.1:8090 (Press CTRL+C to quit)
[2023-05-02 07:16:55] [INFO] [server.py:212] Uvicorn running on http://127.0.0.1:8090 (Press CTRL+C to quit)

2.若想使用中英文混合语音合成可以使用飞浆另一个产品PP-TTS飞浆文档

这里不多做说明,需要自行文档查阅

四、使用服务

1.使用以上服务可以有三种方法验证

        1、命令行

        2、api接口

        3、python程序调用

此文档  paddlespeech正常服务使用方法  具体说明每一种使用方式

若想使用流式tts和流式asr服务请参考以下文档

https://github.com/PaddlePaddle/PaddleSpeech/wiki/PaddleSpeech-Server-RESTful-API

PaddleSpeech Server WebSocket API · PaddlePaddle/PaddleSpeech Wiki · GitHub

使用postman请求,并带body参数请求服务,需要注意请求类型,正常服务一般为post请求

2.请求返回数据

audio数据为base64码,需要转为wav编码即可听到合成音频

到此服务启动->调用接口->使用数据结束

                                                                                                                        结束

http://www.lryc.cn/news/150429.html

相关文章:

  • 如何训练ChatGPT以生成音乐和创意艺术作品?
  • 北约报告:2023-2043,下一代量子技术的发展与挑战
  • arm版Linux下安装es集群
  • vConsole调试工具的三种使用方式
  • 不用订阅,不用破解,永久免费使用Axure最新版教程
  • 合宙Air724UG LuatOS-Air LVGL API控件--复选框 (Checkbox)
  • 使用nps实现内网穿透
  • 时序预测 | MATLAB实现TCN-BiGRU时间卷积双向门控循环单元时间序列预测
  • websocket和uni-app里使用websocket
  • Opencv-C++笔记 (18) : 轮廓和凸包
  • 【半监督医学图像分割】2022-MedIA-UWI
  • python发送邮件
  • gitee上传本地项目bug
  • 自然语言处理2-NLP
  • 穿上App外衣,保持Web灵魂——PWA温故
  • 【跟小嘉学 Rust 编程】二十六、Rust的序列化解决方案(Serde)
  • 菜鸟教程《Python 3 教程》笔记(14):函数
  • SEC推迟ETF,BTC跌破26k,十年之约#6逢跌加仓
  • c++20 多线程并发 latch barrier semaphore
  • 【8 排序】简单选择排序。
  • 中国太保首席数据库专家林春:先难后易,核心系统数据库升级复盘
  • 数字孪生智慧工厂:电缆厂 3D 可视化管控系统
  • 使用WebSocket实现聊天功能
  • Ubuntu升级Cmake、gcc、g++
  • 8月28日上课内容 第四章 MySQL备份与恢复
  • es字段查询加keyword和不加keyword的区别
  • 前端JavaScript将数据转换成JSON字符串以及将JSON字符串转换成对象的两个API
  • Spring——Spring Boot基础
  • Python基础之基础语法(二)
  • docker常见面试问题详解