当前位置: 首页 > news >正文

古诗词多媒体内容生成工作流文档操作流程

文末分享文档

文章目录

    • 效果
    • 文档解析
      • 一、核心目标
      • 二、关键节点及功能
        • 1. 内容生成类节点
        • 2. 媒体制作类节点
        • 3. 整合合成类节点
      • 三、整体流程逻辑
    • 使用方法
      • 1、打开coze平台工作空间
      • 2、添加工作流
      • 3、全选拷贝文档内容
      • 4、直接ctrl+V粘贴到空白工作流中即可达到下面的效果
      • 5、修改工作流
      • 6、注册一个账号获取api_token
      • 7、执行过程

效果

在这里插入图片描述

在这里插入图片描述

文档解析

这份文档是一个基于大语言模型和各类工具插件的古诗词多媒体内容生成工作流配置,主要用于将古诗词转化为包含图片、视频、语音、字幕的完整多媒体作品。以下从核心目标、关键节点功能、流程逻辑三方面进行解读:

一、核心目标

通过自动化流程,将古诗词相关内容(如诗句、作者、意境)转化为适配儿童的可爱风格多媒体内容,最终生成包含3D动漫卡通画面、语音朗诵、字幕(含诗句、拼音、解释)、背景音乐的完整视频。

二、关键节点及功能

工作流包含多个节点,按功能可分为内容生成、媒体制作、整合合成三大类,核心节点功能如下:

1. 内容生成类节点
  • 生成文案及标题(id:171065)
    作为流程起点,调用大模型检索并输出古诗词核心信息:

    • 提取用户输入的关键信息(如主题、关键词);
    • 输出包含“诗词名称、朝代作者(格式如[唐]·李白)、完整诗句(每句单独输出)”的结构化数据;
    • 数据分别存入fengjing(数组,含完整信息)、yuyin(数组,含名称和作者)、mingcheng(单独名称)。
  • 文生图提示词(id:126794)
    基于fengjing中的诗句和意境,生成适配3D动漫风格的图片提示词:

    • 统一设定“古代可爱女孩”为主角,详细描述服饰(款式、颜色、材质)、发型(发髻、配饰)、神态;
    • 要求全景景别,明确人物与场景的位置关系;
    • 兼顾古诗词韵味与儿童向的“可爱、萌动”风格。
2. 媒体制作类节点
  • 图片生成(id:168220)
    批处理节点,基于文生图提示词批量生成图片:

    • 调用图像生成工具,按提示词生成3D动漫画面;
    • 处理图片地址,去除重复、补充空项,输出到tupian(主图)和beiyong(备用图)。
  • 图示视频提示词(id:168231)
    生成图生视频的动效提示词:

    • 结合诗句文本和生成的图片,描述元素运动(如雪花飘落、人物动作)、光影变化;
    • 强调“可爱萌动”效果,人物动作幅度稍大以增强生动性。
  • 图生视频(id:163367)
    批处理节点,将图片转化为视频:

    • 调用“豆包图生视频”工具,基于图片和动效提示词生成视频片段;
    • 包含任务状态检查(task_info)和定时等待(time_wait),确保视频生成完成;
    • 输出视频地址,经“视频地址整合”节点处理后去除重复。
  • 语音合成(id:190740)
    将诗句转为语音:

    • 调用语音合成工具,使用“甜美悦悦”音色,语速0.7倍;
    • 批量生成语音文件,输出音频链接。
3. 整合合成类节点
  • 拆分字幕(id:149899)
    fengjing中的数据拆分为三个数组:

    • 诗词名称(格式《名称》)、朝代作者(格式[唐]·李白)、单句诗句,为后续字幕制作做准备。
  • 挑选BGM(id:134848)
    根据诗词风格从指定列表中挑选适配背景音乐(如“古风唯美浪漫”“可爱温馨 中国风Beat”),并调用“背景音乐库”工具获取音频链接。

  • 视频合成(多个节点协同)

    • 创建草稿(id:199058):初始化视频草稿,设定尺寸(1920×1080);
    • 添加音频:将语音和BGM按时间线添加到视频;
    • 添加字幕:分别添加诗句、拼音(由“翻译”节点生成)、解释文本,设置字体(兰亭圆、鸣翠体)、颜色、动画(冰雪飘动);
    • 云渲染(id:129761):最终生成完整视频文件,输出视频URL。

三、整体流程逻辑

  1. 输入触发:用户提供与古诗词相关的输入(如主题、关键词);
  2. 内容提取:检索并结构化输出古诗词核心信息(名称、作者、诗句);
  3. 视觉生成:生成图片提示词→生成图片→生成视频动效提示词→生成视频片段;
  4. 音频生成:将诗句转为语音,挑选并获取BGM;
  5. 整合合成:拆分字幕→按时间线整合视频、音频、字幕→渲染生成最终视频。

整个流程通过节点间的连接(edges)实现数据传递,形成“文本→图片→视频→多媒体作品”的完整闭环,专注于将古诗词以儿童友好的形式可视化呈现。

使用方法

1、打开coze平台工作空间

https://www.coze.cn/space

2、添加工作流

在这里插入图片描述
在这里插入图片描述
空白工作流
在这里插入图片描述

3、全选拷贝文档内容

在这里插入图片描述

4、直接ctrl+V粘贴到空白工作流中即可达到下面的效果

在这里插入图片描述

5、修改工作流

有几个问题
在这里插入图片描述
将开始节点连接到生成文案及标题节点
在这里插入图片描述
开始节点添加一个api_token变量
在这里插入图片描述

云渲染节点连接到结束节点
在这里插入图片描述
结束节点添加输出为云渲染的video_url
在这里插入图片描述
这样就不会报错,可以执行试运行了
在这里插入图片描述

6、注册一个账号获取api_token

https://www.51aigc.cc/#/userInfo
拷贝下面的api_token到上面的参数中,如果账户余额为0在执行过程是会报错的,所以需要充值
在这里插入图片描述
可以充值个20试一下
在这里插入图片描述

7、执行过程

试运行后输入参数
在这里插入图片描述
在这里插入图片描述

文档链接
https://download.csdn.net/download/yilvyangguang520/91662887

http://www.lryc.cn/news/620146.html

相关文章:

  • 杂记 01
  • reactive和ref使用方法及场景
  • 基于通用优化软件GAMS的数学建模和优化分析(GAMS安装和介绍、GAMS程序编写、GAMS程序调试)
  • Python 类元编程(元类基础知识)
  • 正则表达式解析(三)
  • (50)QT 绘图里,视图 QGraphicsView、场景 QGraphicsScene 及图形项 QGraphicsRectItem 的举例
  • Unity:GUI笔记(二)——工具栏和选择网格、滚动列表和分组、窗口、自定义皮肤样式、自动布局
  • 面试实战 问题二十七 java 使用1.8新特性,判断空
  • 机器学习-----DBSCAN算法
  • 电子电气架构 --- 软件项目文档管理
  • mysql的快照读与当前读的区别
  • 云电竞游戏盒子相比传统PC有什么优势?
  • YOLO-v2-tiny 20种物体检测模型
  • Unity中启用DLSS 【NVIDIA】
  • 循序渐进学 Spring (上):从 IoC/DI 核心原理到 XML 配置实战
  • AWS Bedrock Claude模型费用深度分析:企业AI成本优化指南
  • HarmonyOS Navigation路由跳转的完整示例
  • 天猫商品评论API:获取商品热门评价与最新评价
  • 销售数据预处理与分析学习总结
  • 基于UniApp的智能在线客服系统前端设计与实现
  • Github desktop介绍(GitHub官方推出的一款图形化桌面工具,旨在简化Git和GitHub的使用流程)
  • 公司项目用户密码加密方案推荐(兼顾安全、可靠与通用性)
  • Python day43
  • 【易错题】C语言
  • NTUSER.DAT是什么文件
  • Vue内置组件全解析:从入门到面试通关
  • docker安装centos
  • 接口添加了 @Transactional 注解并开启事务,而其中一个小方法启动了新线程并手动提交数据,会有什么影响?
  • 服务器安全笔记
  • 学习:JS进阶[10]内置构造函数