当前位置: 首页 > news >正文

MoneyPrinter国内版改造

在这里插入图片描述

背景:

MoneyPrinter 是一个自动生成短视频的开源项目。只需要输入短视频主题,然后就可以生成视频。
在国内环境运行时,框架中使用的youtube、抖音文字转语音等功能无法使用,需要对框架进行国内版改造,使其使用国内网络环境。

实现原理:

MoneyPrinter根据输入的主题,调用AI生成视频文案,然后生成检索关键字,去pixel网站检索相关的视频,然后调用语音合成工具生成音频,调用moviepy生成字符,最后将生成的音频、视频、字幕进行合并,完成视频拼接。

关键步骤:

  • AI文案:调用g4f,自动检索可用的AI接口。你可以替换成自己付费的API模型,也可以让他自己检索可用的免费AI在这里插入图片描述
  • pixel网站:需要你配置自己的账号秘钥,以供接口调用时使用,完全免费的。国内可访问。
    在这里插入图片描述
  • 语音合成工具:将视频脚本转换为语音。
  • moviepy:拼接视频

国内版改造:

  1. youtube 自动上传功能

  2. 文字转音频,需要换替换国内可用服务器。之前分享的文章

  3. 字幕转换,需要转换为中文版

    def generate_response(prompt: str, ai_model: str) -> str:"""Generate a script for a video, depending on the subject of the video.Args:video_subject (str): The subject of the video.ai_model (str): The AI model to use for generation.Returns:str: The response from the AI model."""if ai_model == 'g4f':# 使用最新版本的调用方法client = g4f.client.Client()response = client.chat.completions.create(model='gpt-3.5-turbo',messages=[{"role": "user", "content": prompt}],).choices[0].message.contentelif ai_model in ["gpt3.5-turbo", "gpt4"]:model_name = "gpt-3.5-turbo" if ai_model == "gpt3.5-turbo" else "gpt-4-1106-preview"response = openai.chat.completions.create(model=model_name,messages=[{"role": "user", "content": prompt}],).choices[0].message.contentelif ai_model == 'gemmini':model = genai.GenerativeModel('gemini-pro')response_model = model.generate_content(prompt)response = response_model.textelse:raise ValueError("Invalid AI model selected.")return responsedef translate_text(txt: str, /, *, language='Chinese', ai_model: str) -> str:logger.debug(f'待翻译的内容: {txt} \n'f'待翻译为的语言:{language}')prompt = f"translate the following text into {language}: {txt}"logger.debug(f'使用的AI模型:{ai_model}')response = generate_response(prompt, ai_model)logger.info(f'翻译结果:: {response}')return response
  4. 最终输入的视频存在只显示第一帧画面的问题(调用moviepy模块后补充close()方法
    在这里插入图片描述

  5. 使用loguru进行日志管理。
    在这里插入图片描述

国内版项目使用步骤:

  1. 项目代码

  2. 安装ImageMagick

  3. 修改项目配置文件:

    1. ImageMagick, 指定安装路径
    2. PEXELS_API_KEY,填写账号token
    3. 如果有,AI模型token
    # Necessary API Keys
    # -------------------# ImageMagick Binary Path 
    # Download ImageMagick from https://imagemagick.org/script/download.php
    IMAGEMAGICK_BINARY="/Downloads/ImageMagick/iMagick/usr/local/bin/magick"# Pexels API Key
    # Register at https://www.pexels.com/api/ to get your API key.
    PEXELS_API_KEY=""# Optional API Keys
    # -----------------# OpenAI API Key
    # Visit https://openai.com/api/ for details on obtaining an API key.
    #OPENAI_API_KEY=""# AssemblyAI API Key
    # Sign up at https://www.assemblyai.com/ to receive an API key.
    #ASSEMBLY_AI_API_KEY=""
    
  4. 后端服务启动 /Backend$ python main.py
    在这里插入图片描述

  5. 前端服务启动 python -m http.server 3000
    在这里插入图片描述

  6. 浏览器调用 http://127.0.0.1:3000/
    在这里插入图片描述

  7. 输入主题,生成第一个视频

  8. 查看视频http://127.0.0.1:3000/static/temp/
    在这里插入图片描述在这里插入图片描述

http://www.lryc.cn/news/348101.html

相关文章:

  • C++ 派生类的引入与特性
  • Poe是什么?怎样订阅Poe?
  • 基于FPGA的视频矩阵切换方案
  • .NET周刊【5月第1期 2024-05-05】
  • springcloud -nacos实战
  • 第十五章 数据管理成熟度评估练习
  • tcpdump速查表
  • 单元测试与集成测试:软件质量的双重保障
  • 孙宇晨对话大公网:香港Web3政策友好环境示范意义重大
  • Python运维之多线程!!
  • milvus插入数据时,明明不超长,但总是报长度错误?
  • 怎么把图片大小缩小到1M?教你几招图片你压缩
  • python数据分析常见命令
  • 等保测评技术方案(五)
  • Redis缓存的基本概念和使用
  • MATLAB模拟退火算法、遗传算法、蚁群算法、粒子群算法
  • git自用随笔
  • CorelDRAW2024设计界的隐藏宝藏
  • 【JAVA】递归
  • MacOS java多版本安装与管理
  • NSSCTF | [LitCTF 2023]我Flag呢?
  • PostgreSQL-常用函数和操作符
  • 河南大学大礼堂火灾事故引发安防监控对智能分析技术应用的思考
  • 自动化中遇到的问题归纳总结
  • UE4_照亮环境_不同雾效的动态切换
  • 【解决】Android APK文件安装时 已包含数字签名相同APP问题
  • layui的treeTable组件,多层级上传按钮失效的问题解决
  • HashMap在JDK1.8的优化
  • Kotlin标准函数和静态方法
  • RabbitMQ(四种使用模式)