当前位置: 首页 > news >正文

python调用GPT-4o实时音频 Azure OpenAI GPT-4o Audio and /realtime

发现这块网上信息很少,记录一下

微软azure入口

https://learn.microsoft.com/zh-cn/azure/ai-services/openai/realtime-audio-quickstart?pivots=programming-language-ai-studio
在这里插入图片描述

sdk文档

https://github.com/azure-samples/aoai-realtime-audio-sdk?tab=readme-ov-file#summary-of-commands
在这里插入图片描述

  1. 创建虚拟环境,自己用conda创建也行

  2. 安装依赖项,这一步如果下载 .whl 文件有问题,自己从仓库releases手动下载一下:
    https://github.com/Azure-Samples/aoai-realtime-audio-sdk/releases
    在这里插入图片描述

  3. 设置虚拟环境:在这里插入图片描述
    第三步,设置虚拟环境也可以在代码里,通过os库设置

os.environ["AZURE_OPENAI_API_KEY"] = "xxxx"
os.environ["AZURE_OPENAI_ENDPOINT"] = "https://nlp-gpt4o-realtime-eastus2.openai.azure.com"
os.environ["AZURE_OPENAI_DEPLOYMENT"] = "gpt-4o-realtime-preview"
os.environ["AZURE_OPENAI_API_VERSION"] = "2024-10-01-preview"

后续的就直接跑 xxx_sample.py 测试用例就可以了。

python low_level_sample.py ./input/arc-easy-q237-tts.wav

http://www.lryc.cn/news/496997.html

相关文章:

  • Hadoop生态圈框架部署 伪集群版(四)- Zookeeper单机部署
  • LuaJava
  • Maven下载安装、环境配置(超详细)(包括Java环境配置(Windows)、在IDEA中配置Maven)
  • Python中的实例方法、静态方法和类方法三者区别?
  • 【学习Go编程】
  • Linux系统:网络
  • shodan2-批量查找CVE-2019-0708漏洞
  • 面向对象(二)——类和对象(上)
  • Redis3——线程模型与数据结构
  • linux 获取公网流量 tcpdump + python + C++
  • C++知识整理day3类与对象(下)——赋值运算符重载、取地址重载、列表初始化、友元、匿名对象、static
  • pytest(二)excel数据驱动
  • python蓝桥杯刷题3
  • 基于PySpark 使用线性回归、随机森林以及模型融合实现天气预测
  • Day 30 贪心算法 part04
  • dns实验3:主从同步-完全区域传输
  • 数据结构 (20)二叉树的遍历与线索化
  • 【docker】Overlay网络
  • 基于智能语音交互的智能呼叫中心工作机制
  • Linux条件变量线程池详解
  • 有趣的Docker
  • 深入探讨锁升级问题
  • MySQL篇—通过官网下载linux系统下多种安装方式的MySQL社区版软件
  • 6.824/6.5840(2024)环境配置wsl2+vscode
  • 【乐企文件生成工程】搭建docker环境,使用docker部署工程
  • 常见的数据结构---队列、树与堆的深入剖析
  • leetcode--螺旋矩阵
  • JavaScript(JS)的对象
  • 基于BM1684的AI边缘服务器-模型转换,大模型一体机
  • git推送多个仓库