当前位置: 首页 > news >正文

Node.js 多模态图像描述服务 调用siliconflow:现代 JavaScript 实践

Node.js 多模态图像描述服务:现代 JavaScript 实践

项目背景

本项目使用 Node.js 和 TypeScript 实现一个高性能的图像描述微服务,展示 JavaScript 在多模态 AI 应用中的强大能力。

技术栈

  • Node.js
  • TypeScript
  • Express.js
  • OpenAI API
  • dotenv
  • RxJS (可选,用于响应式编程)

项目初始化

# 创建项目目录
mkdir image-description-service
cd image-description-service# 初始化项目
npm init -y
npm install typescript ts-node @types/node
npm install express dotenv openai
npm install -D @types/express# 初始化 TypeScript 配置
npx tsc --init

环境配置 (.env)

# SiliconFlow API 配置
SILICONFLOW_API_KEY=sk-*******************************************
SILICONFLOW_BASE_URL=https://api.siliconflow.cn/v1

核心实现

1. 类型定义 (types.ts)

export interface ImageDescriptionRequest {imageUrl: string;language?: string;model?: string;
}export interface ImageDescriptionResponse {description: string;chunks: string[];metadata: {processingTime: number;model: string;};
}

2. 服务实现 (imageDescriptionService.ts)

import OpenAI from 'openai';
import dotenv from 'dotenv';
import { ImageDescriptionRequest, ImageDescriptionResponse 
} from './types';dotenv.config();export class ImageDescriptionService {private openai: OpenAI;constructor() {this.openai = new OpenAI({apiKey: process.env.SILICONFLOW_API_KEY,baseURL: process.env.SILICONFLOW_BASE_URL});}async describeImage(request: ImageDescriptionRequest): Promise<ImageDescriptionResponse> {const startTime = Date.now();try {const response = await this.openai.chat.completions.create({model: request.model || "Qwen/Qwen2-VL-72B-Instruct",messages: [{role: "user",content: [{type: "image_url",image_url: { url: request.imageUrl }},{type: "text",text: `${request.language || '中文'}描述这张图片`}]}],stream: true});const chunks: string[] = [];let fullDescription = '';for await (const chunk of response) {const content = chunk.choices[0]?.delta?.content || '';if (content) {chunks.push(content);fullDescription += content;}}return {description: fullDescription,chunks,metadata: {processingTime: Date.now() - startTime,model: request.model || "Qwen/Qwen2-VL-72B-Instruct"}};} catch (error) {console.error('Image description error:', error);throw new Error('Failed to describe image');}}
}

3. Express 路由 (app.ts)

import express from 'express';
import { ImageDescriptionService } from './imageDescriptionService';const app = express();
const port = process.env.PORT || 3000;
const descriptionService = new ImageDescriptionService();app.use(express.json());app.post('/describe-image', async (req, res) => {try {const { imageUrl, language, model } = req.body;const result = await descriptionService.describeImage({imageUrl, language, model});res.json(result);} catch (error) {res.status(500).json({ error: error.message });}
});app.listen(port, () => {console.log(`服务运行在 http://localhost:${port}`);
});

4. 客户端调用示例 (client.ts)

import axios from 'axios';async function describeImage() {try {const response = await axios.post('http://localhost:3000/describe-image', {imageUrl: 'https://sf-maas-uat-prod.oss-cn-shanghai.aliyuncs.com/dog.png',language: '中文'});console.log('图像描述:', response.data.description);console.log('处理时间:', response.data.metadata.processingTime, 'ms');} catch (error) {console.error('调用失败:', error);}
}describeImage();

部署与扩展

Docker 容器化

FROM node:16-alpine
WORKDIR /app
COPY package*.json ./
RUN npm install
COPY . .
EXPOSE 3000
CMD ["npm", "start"]

性能优化

  1. 缓存响应
  2. 连接池
  3. 限流
  4. 异步处理

监控与日志

  • Winston 日志
  • Prometheus 指标
  • OpenTelemetry 追踪

安全最佳实践

  • 输入验证
  • 速率限制
  • 错误处理
  • 敏感信息保护

立即体验

快来体验 siliconflow 图像描述服务:https://cloud.siliconflow.cn/i/vnCCfVaQ

快来体验 siliconflow 图像描述服务:https://cloud.siliconflow.cn/i/vnCCfVaQ

快来体验 siliconflow 图像描述服务:https://cloud.siliconflow.cn/i/vnCCfVaQ

http://www.lryc.cn/news/535281.html

相关文章:

  • 机器学习数学基础:21.特征值与特征向量
  • 【目标检测json2txt】label从COCO格式json文件转YOLO格式txt文件
  • 强化学习之 PPO 算法:原理、实现与案例深度剖析
  • vue-点击生成动态值,动态渲染回显输入框
  • 高性能 :OpenAI Triton Open-source GPU programming Language LINUX 环境配置
  • TCP 端口号为何位于首部前四个字节?协议设计的智慧与启示
  • HTML之JavaScript函数声明
  • R 数组:高效数据处理的基础
  • git服务器搭建,gitea服务搭建,使用systemclt管理服务
  • Pdf手册阅读(1)--数字签名篇
  • 嵌入式WebRTC压缩至670K,目标将so动态库压缩至500K,.a静态库还可以更小
  • 百度高德地图坐标转换
  • ES 索引结构
  • HPM_SDK应用本地化——基于6750evkmini
  • 【deepseek-r1本地部署】
  • 查询语句来提取 detail 字段中包含 xxx 的 URL 里的 commodity/ 后面的数字串
  • 堆排序
  • 【MySQL】我在广州学Mysql 系列—— 数据备份与还原
  • 【LeetCode Hot100 双指针】移动零、盛最多水的容器、三数之和、接雨水
  • HTML应用指南:利用POST请求获取接入比亚迪业态的充电桩位置信息
  • Android车机DIY开发之软件篇(十二) AOSP12下载编译
  • Jenkins+gitee 搭建自动化部署
  • 【文本处理】如何在批量WORD和txt文本提取手机号码,固话号码,提取邮箱,删除中文,删除英文,提取车牌号等等一些文本提取固定格式的操作,基于WPF的解决方案
  • Linux系统引导与服务管理
  • 网络工程师 (30)以太网技术
  • react项目引入tailwindcss不生效解决方案
  • 【C#】条件运算符
  • Windows11+PyCharm利用MMSegmentation训练自己的数据集保姆级教程
  • WPS计算机二级•文档的文本样式与编号
  • Word中Ctrl+V粘贴报错问题