当前位置：首页 > news >正文

Node.js 多模态图像描述服务调用siliconflow：现代 JavaScript 实践

news 2025/6/20 21:32:39

Node.js 多模态图像描述服务：现代 JavaScript 实践

项目背景

本项目使用 Node.js 和 TypeScript 实现一个高性能的图像描述微服务，展示 JavaScript 在多模态 AI 应用中的强大能力。

技术栈

Node.js
TypeScript
Express.js
OpenAI API
dotenv
RxJS (可选，用于响应式编程)

项目初始化

# 创建项目目录
mkdir image-description-service
cd image-description-service# 初始化项目
npm init -y
npm install typescript ts-node @types/node
npm install express dotenv openai
npm install -D @types/express# 初始化 TypeScript 配置
npx tsc --init

环境配置 (.env)

# SiliconFlow API 配置
SILICONFLOW_API_KEY=sk-*******************************************
SILICONFLOW_BASE_URL=https://api.siliconflow.cn/v1

核心实现

1. 类型定义 (`types.ts`)

export interface ImageDescriptionRequest {imageUrl: string;language?: string;model?: string;
}export interface ImageDescriptionResponse {description: string;chunks: string[];metadata: {processingTime: number;model: string;};
}

2. 服务实现 (`imageDescriptionService.ts`)

import OpenAI from 'openai';
import dotenv from 'dotenv';
import { ImageDescriptionRequest, ImageDescriptionResponse 
} from './types';dotenv.config();export class ImageDescriptionService {private openai: OpenAI;constructor() {this.openai = new OpenAI({apiKey: process.env.SILICONFLOW_API_KEY,baseURL: process.env.SILICONFLOW_BASE_URL});}async describeImage(request: ImageDescriptionRequest): Promise<ImageDescriptionResponse> {const startTime = Date.now();try {const response = await this.openai.chat.completions.create({model: request.model || "Qwen/Qwen2-VL-72B-Instruct",messages: [{role: "user",content: [{type: "image_url",image_url: { url: request.imageUrl }},{type: "text",text: `用${request.language || '中文'}描述这张图片`}]}],stream: true});const chunks: string[] = [];let fullDescription = '';for await (const chunk of response) {const content = chunk.choices[0]?.delta?.content || '';if (content) {chunks.push(content);fullDescription += content;}}return {description: fullDescription,chunks,metadata: {processingTime: Date.now() - startTime,model: request.model || "Qwen/Qwen2-VL-72B-Instruct"}};} catch (error) {console.error('Image description error:', error);throw new Error('Failed to describe image');}}
}

3. Express 路由 (`app.ts`)

import express from 'express';
import { ImageDescriptionService } from './imageDescriptionService';const app = express();
const port = process.env.PORT || 3000;
const descriptionService = new ImageDescriptionService();app.use(express.json());app.post('/describe-image', async (req, res) => {try {const { imageUrl, language, model } = req.body;const result = await descriptionService.describeImage({imageUrl, language, model});res.json(result);} catch (error) {res.status(500).json({ error: error.message });}
});app.listen(port, () => {console.log(`服务运行在 http://localhost:${port}`);
});

4. 客户端调用示例 (`client.ts`)

import axios from 'axios';async function describeImage() {try {const response = await axios.post('http://localhost:3000/describe-image', {imageUrl: 'https://sf-maas-uat-prod.oss-cn-shanghai.aliyuncs.com/dog.png',language: '中文'});console.log('图像描述:', response.data.description);console.log('处理时间:', response.data.metadata.processingTime, 'ms');} catch (error) {console.error('调用失败:', error);}
}describeImage();

部署与扩展

Docker 容器化

FROM node:16-alpine
WORKDIR /app
COPY package*.json ./
RUN npm install
COPY . .
EXPOSE 3000
CMD ["npm", "start"]

性能优化

缓存响应
连接池
限流
异步处理

监控与日志

Winston 日志
Prometheus 指标
OpenTelemetry 追踪

安全最佳实践

输入验证
速率限制
错误处理
敏感信息保护

立即体验

快来体验 siliconflow 图像描述服务：https://cloud.siliconflow.cn/i/vnCCfVaQ

查看全文

http://www.lryc.cn/news/535281.html

机器学习数学基础：21.特征值与特征向量

【目标检测json2txt】label从COCO格式json文件转YOLO格式txt文件

强化学习之 PPO 算法：原理、实现与案例深度剖析

vue-点击生成动态值，动态渲染回显输入框

高性能：OpenAI Triton Open-source GPU programming Language LINUX 环境配置

TCP 端口号为何位于首部前四个字节？协议设计的智慧与启示

HTML之JavaScript函数声明

R 数组：高效数据处理的基础

git服务器搭建，gitea服务搭建，使用systemclt管理服务

Pdf手册阅读（1）--数字签名篇

嵌入式WebRTC压缩至670K，目标将so动态库压缩至500K，.a静态库还可以更小

百度高德地图坐标转换

ES 索引结构

HPM_SDK应用本地化——基于6750evkmini

【deepseek-r1本地部署】

查询语句来提取 detail 字段中包含 xxx 的 URL 里的 commodity/ 后面的数字串

堆排序

【MySQL】我在广州学Mysql 系列—— 数据备份与还原

【LeetCode Hot100 双指针】移动零、盛最多水的容器、三数之和、接雨水

HTML应用指南：利用POST请求获取接入比亚迪业态的充电桩位置信息

Android车机DIY开发之软件篇(十二) AOSP12下载编译

Jenkins+gitee 搭建自动化部署

【文本处理】如何在批量WORD和txt文本提取手机号码，固话号码，提取邮箱，删除中文，删除英文，提取车牌号等等一些文本提取固定格式的操作，基于WPF的解决方案

Linux系统引导与服务管理

网络工程师（30）以太网技术

react项目引入tailwindcss不生效解决方案

【C#】条件运算符

Windows11+PyCharm利用MMSegmentation训练自己的数据集保姆级教程

WPS计算机二级•文档的文本样式与编号

Word中Ctrl+V粘贴报错问题

Node.js 多模态图像描述服务：现代 JavaScript 实践

项目背景

技术栈

项目初始化

环境配置 (.env)

核心实现

1. 类型定义 (types.ts)

2. 服务实现 (imageDescriptionService.ts)

3. Express 路由 (app.ts)

4. 客户端调用示例 (client.ts)

部署与扩展

Docker 容器化

性能优化

监控与日志

安全最佳实践

立即体验

相关文章：

1. 类型定义 (`types.ts`)

2. 服务实现 (`imageDescriptionService.ts`)

3. Express 路由 (`app.ts`)

4. 客户端调用示例 (`client.ts`)