当前位置: 首页 > news >正文

调用百度API实现图像风格转换

目录

  • 1、作者介绍
  • 2、基本概念
    • 2.1 人工智能云服务与百度智能云
    • 2.2 图像风格转换
  • 3、调用百度API实现图像风格转换
    • 3.1 配置百度智能云平台
    • 3.2 环境配置
    • 3.3 完整代码实现
    • 3.4 效果展示
    • 3.5 问题与分析

1、作者介绍

张元帮,男,西安工程大学电子信息学院,2022级研究生
研究方向:语音信号处理
电子邮件:2899460070@qq.com

陈梦丹,女,西安工程大学电子信息学院,2022级硕士研究生,张宏伟人工智能课题组
研究方向:机器视觉与人工智能
电子邮件:1169738496@qq.com

2、基本概念

2.1 人工智能云服务与百度智能云

人工智能云服务是一种基于云计算、虚拟化和分布式处理技术的在线服务,提供了各种人工智能相关的功能,包括自然语言处理(NLP)、图像识别、声音识别、机器学习、深度学习等。人工智能云服务通过API的方式对外提供接口,用户可以通过调用这些API来使用相应的人工智能功能,而无需在本地搭建和维护复杂的人工智能系统,可以简化开发流程,缩短研发时间,并且具有良好的可扩展性和兼容性。目前,市面上存在多种人工智能云服务提供商,例如百度、阿里、腾讯、华为等。百度智能云是百度提供的一系列云端API接口,其中就包括人工智能云服务,可以用于实现文本分析、图像识别、语音识别和自然语言处理等各种应用场景。

2.2 图像风格转换

图像风格转换是一种利用深度学习和神经网络模型来实现图片风格转换的技术。该技术可以将一张图片按照指定的艺术风格进行重构,使得原图片的内容保留不变,同时又呈现出了与所选艺术风格相似的视觉效果。
在这里插入图片描述
通俗地说,就是将一张照片做成另一个不同风格的照片。例如:将一张普通的花卉照片以著名画作《向日葵》的风格呈现出来。这种技术常常被应用于数字艺术、电影制作、游戏动画等领域。

其中,百度智能云的API支持将图像转化成卡通画、铅笔画、彩色铅笔画,或者哥特油画、彩色糖块油画、呐喊油画、神奈川冲浪里油画、奇异油画、薰衣草油画等共计9种风格。下面演示如何使用百度智能云的API接口实现图像风格转换。

3、调用百度API实现图像风格转换

3.1 配置百度智能云平台

注册并登录百度智能云账号进入下图界面,选择右上角“控制台”模块:
在这里插入图片描述
选择“产品服务”中“人工智能”模块的“图像增强与特效”项目:在这里插入图片描述
点击领取免费的接口资源(实名认证后可获取):
在这里插入图片描述

选择全部可领接口,然后点击0元领取(这里已经领取,不能再领)在这里插入图片描述
“应用列表” 中点击 “创建应用”,免费创建图像风格转换模块:
在这里插入图片描述
创建成功的应用模块如下,从中可以获取个人应用模块的**API Key和Secret Key**:
在这里插入图片描述

3.2 环境配置

代码使用python3运行,导入的模块有Requests、base64、json、PIL、io、os。在运行代码前,需要检查运行环境是否齐全。以下是对这些导入模块的介绍:

  • Requests是Python编程语言第三方库,用于发送 HTTP 请求和处理响应。它是一个常用的Python HTTP客户端库,可以发送HTTP/1.1请求,包括GET、POST、PUT、DELETE等请求方法。
  • base64库是Python标准库之一,提供了一些用于将二进制数据(比如图片、音频、视频文件等)转换为 ASCII 字符集中可打印字符的编码方法,以便在网络中传输或存储。
  • Json库是Python语言自带的标准库之一,用于将Python对象(如列表、字典等)转换为JSON格式的字符串以及将JSON格式的字符串转换为Python对象。
  • PIL(Python Imaging Library)是Python编程语言中一个常用的图像处理库。这个库通过内置的图片格式扩展模块及自带的工具,可以对常见的图像文件进行读写并进行多种基本的图像处理操作。
  • Python标准库中的io库提供了一个通用的Python I/O体系结构,可以轻松地访问各种类型的文件(文本文件、二进制文件、管道和套接字等),并统一这些不同文件类型的输入输出操作。
  • os库是Python标准库提供的操作系统接口库,它封装了大量实用的函数来和操作系统交互。通过该库,我们可以实现一些常见的文件和目录相关的操作、操作系统平台相关功能的调用、进程相关操作等等。

3.3 完整代码实现

在代码的指定位置填入API_Key、Secret_Key、图片位置、风格,然后运行代码。其中可选风格如下:

  • cartoon:卡通画风格
  • pencil:铅笔风格
  • color_pencil:彩色铅笔画风格
  • warm:彩色糖块油画风格
  • wave:神奈川冲浪里油画风格
  • lavender:薰衣草油画风格
  • mononoke:奇异油画风格
  • scream:呐喊油画风格
  • gothic:哥特油画风格

代码实现:

import requests
import base64
import json
from PIL import Image
import io
import os###############修改这里,然后运行##################
"""
可选图片风格:
cartoon:卡通画风格
pencil:铅笔风格
color_pencil:彩色铅笔画风格
warm:彩色糖块油画风格
wave:神奈川冲浪里油画风格
lavender:薰衣草油画风格
mononoke:奇异油画风格
scream:呐喊油画风格
gothic:哥特油画风格
"""API_Key=' 你的API_Key '            #API_Key
Secret_Key=' 你的Secret_Key '      #Secret_Keyimg_location='picture.png'                      #图片放置位置
style="warm"                                    #图片风格
###############################################class BaiduImgStyleConv:def __init__(self, API_Key,	Secret_Key,request_url,headers):self.req_url = request_urlself.AK=API_Keyself.SK=Secret_Keyself.headers=headersdef set_para(self,img_location,style):'''该方法实现图片和风格设置'''try:f = open(img_location, 'rb')    #尝试打开图片except:print("错误:没有找到图片或者图片格式不支持,请检查图片路径")#无法打开图片exit()img = base64.b64encode(f.read())# 二进制方式打开图片文件if style in {'cartoon','pencil','color_pencil','warm','wave','lavender','mononoke','scream','gothic'}:#检测风格是否在列表中self.params = {"image": img, "option": style}else:print("错误:图像风格不对,请检查拼写")exit()def get_accessToken(self):'''该方法实现获得Token'''host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=' + self.AK + '&client_secret=' + self.SKresponse = requests.get(host, headers=self.headers)json_result = json.loads(response.text)try:print('token获取正常=',json_result['access_token'])return json_result['access_token']except:print('token获取出现问题,这是错误原因:',json_result['error'], json_result['error_description']+'\n建议先检查百度智能云的图像风格转换应用是否可用,其次保证上面的API_Key和Secret_Key填写正确')exit()def get_convImg(self):'''该方法实现图像风格转换'''access_token = self.get_accessToken()request_url = self.req_url + "?access_token=" + access_tokenresponse = requests.post(request_url, data=self.params, headers=self.headers)#获取响应if response:# 解码base64编码图片并保存为jpg格式img_data = base64.b64decode(response.json()['image'])pil_image = Image.open(io.BytesIO(img_data))pil_image.show()# 保存为jpg格式,并以log_id命名文件output_filename = str(response.json()['log_id']) + ".jpg"pil_image.save(output_filename, "JPEG")print("转换后的图片已保存在",os.getcwd()+'\\'+output_filename)else:print('错误:解析返回数据时出现问题')if __name__=='__main__':#实例化对象img_conv=BaiduImgStyleConv(API_Key=API_Key,Secret_Key=Secret_Key,request_url = "https://aip.baidubce.com/rest/2.0/image-process/v1/style_trans",headers={'content-type': 'application/x-www-form-urlencoded'})#设置图片和风格img_conv.set_para(img_location=img_location,style=style)#得到转换后的图片img_conv.get_convImg()

3.4 效果展示

下图为原图经不同风格(卡通、铅笔、呐喊)转换后的效果图:
在这里插入图片描述

3.5 问题与分析

  • 已对部分常见报错在代码中进行了解释,根据要求检查即可。
  • 弹出“token获取出现问题……”,这一般是因为百度智能云没设置好或者key填错了导致的,如果确定两个key没有填错,务必检查API调用的余量
http://www.lryc.cn/news/70475.html

相关文章:

  • 5个最好的WooCommerce商城自动化动作来增加销售量
  • 打开数据结构大门——实现小小顺序表
  • 一.RxJava
  • 如何使用 VSCode 软件运行C代码
  • C# 调用Matlab打包的 DLL文件(傻瓜式操作)
  • 微信小程序学习实录3(环境部署、百度地图微信小程序、单击更换图标、弹窗信息、导航、支持腾讯百度高德地图调起)
  • 【面试题】中高级前端工程师都需要熟悉的技能--前端缓存
  • 小红书数据分析:首播卖6亿,小红书直播开启新纪元!
  • Weex中,关于组件的水平排列竖直排列居中对齐居左对齐居右对齐低部对齐顶部对齐布局对齐说明
  • 服务(第二十八篇)rsync
  • Vue 3 第二十五章:插件(Plugins)
  • Android 系统内的守护进程 - main类服务(3) : installd
  • 华为OD机试真题 Java 实现【对称字符串】【2023Q2 200分】
  • day18文件上传下载与三层架构思想
  • Async/await详解
  • Mysql基础 — DDL、DML、DQL、DCL、函数、约束
  • 中国移动董宁:深耕区块链的第八年,我仍期待挑战丨对话MVP
  • AI孙燕姿项目实现
  • 传统机器学习(六)集成算法(2)—Adaboost算法原理
  • 性能优化常用的技巧,你都知道吗?
  • 机器学习——损失函数(lossfunction)
  • 小航助学2022年NOC初赛图形化(小高组)(含题库答题软件账号)
  • 软考中级数据库系统工程师-第6-7章 数据库技术基础关系数据库
  • 掌握RDD算子2
  • ORACLE-SQL性能优化(3)
  • 3年外包裸辞,面试阿里、字节全都一面挂,哭死.....
  • JavaEE(系列16) -- 多线程(信号量与CountDownLatch)
  • Tomcat配置https协议证书-阿里云,Nginx配置https协议证书-阿里云,Tomcat配置https证书pfx转jks
  • 抖音定位基本原理
  • 【Hbase 05】Hbase表的设计原则与优化方案