当前位置: 首页 > news >正文

gpt-4o看图说话-根据图片回答问题

问题:中国的人口老龄化究竟有多严重?

代码下实现如下:(直接调用openai的chat接口)

import os

import base64

import requests

def encode_image(image_path):

    """

    对图片文件进行 Base64 编码

    输入:

         - image_path:图片的文件路径

    输出:

         - 编码后的 Base64 字符串

    """

    # 二进制读取模式打开图片文件,

    with open(image_path, "rb") as image_file:

        # 将编码后的字节串解码为 UTF-8 字符串,以便于在文本环境中使用。

        return base64.b64encode(image_file.read()).decode("utf-8")

# 中文 Prompt 指令

question = "中国的人口老龄化究竟有多严重?"

prompt = (

    f"你的任务是根据图片回答问题,{question}详细回答。"

)

# 对本地多张图片进行 Base64 编码

images = os.listdir("./images")

images.sort()

images.remove('.ipynb_checkpoints')

print(images)

base64_images = [encode_image("./images/" + image) for image in images]

# 组织用户消息

user_content = [{"type": "text", "text": prompt}]

base64_images = [

    {

        "type": "image_url",

        "image_url": {

            "url": f"data:image/jpeg;base64,{base64_image}",

            "detail": "high",

        },

    }

    for base64_image in base64_images

]

user_content.extend(base64_images)

messages_template = [{"role": "user", "content": user_content}]

# 构造请求参数

payload = {

    "model": "gpt-4o",

    "messages": messages_template,

    "max_tokens": 1600,

    "temperature": 0,

    "seed": 2024,

}

# OpenAI API Key

api_key = "sk-xxx”

# 请求头

headers = {"Content-Type": "application/json", "Authorization": f"Bearer {api_key}"}

# 发送 POST 请求

response = requests.post(

    "https://api.openai.com/v1/chat/completions",

    headers=headers, json=payload

)

# 打印生成结果

print(response.json())

result = response.json()["choices"][0]["message"]["content"]

print(result)

输出结果:

http://www.lryc.cn/news/398874.html

相关文章:

  • 【MySQL】7.MySQL 的内置函数
  • 爬虫:Sentry-Span参数逆向
  • 音视频入门基础:H.264专题(12)——FFmpeg源码中通过SPS属性计算视频分辨率的实现
  • 基于颜色模型和边缘检测的火焰识别FPGA实现,包含testbench和matlab验证程序
  • golang json反序列化科学计数法的坑
  • 罗技K380无线键盘及鼠标:智慧互联,一触即通
  • 卸载wps office的几种方法收录
  • SpringCloud第一篇Docker基础
  • 从零开始学习PX4源码3(如何上传官网源码到自己的仓库中)
  • Docker Compose 启动容器例子
  • 守护服务之门:Eureka中分布式认证与授权的实现策略
  • 核密度估计KDE和概率密度函数PDF(深入浅出)
  • 免开steam 脱离steam 进行游戏的小工具
  • 深度学习--系统配置流程
  • 把Docker的虚拟磁盘文件移动到别的盘符
  • Oracle 19c RAC 心跳异常处理
  • 微信小程序引入自定义子组件报错,在 C:/Users/***/WeChatProjects/miniprogram-1/components/路径下***
  • 【图解大数据技术】流式计算:Spark Streaming、Flink
  • 启动完 kubelet 日志显示 failed to get azure cloud in GetVolumeLimits, plugin.host: 1
  • C语言基础and数据结构
  • 【超万卡GPU集群关键技术深度分析 2024】_构建10万卡gpu集群的技术挑战
  • RuntimeError: CUDA error: invalid device ordinal
  • 如何在Qt中添加文本
  • 解决打印PDF文本不清楚的处理办法
  • 【Cesium开发实战】火灾疏散功能的实现,可设置火源点、疏散路径、疏散人数
  • imx6ull/linux应用编程学习(16)emqx ,mqtt创建连接mqtt.fx
  • Debezium系列之:验证mysql、mariadb等兼容mysql协议数据库账号权限
  • Vue.js学习笔记(五)抽奖组件封装——转盘抽奖
  • 使用pip或conda离线下载安装包,使用pip或conda安装离线安装包
  • 产品访问分析