当前位置: 首页 > news >正文

【AI大模型】DeepSeek API大模型接口实现

目录

一、DeepSeek发展历程

2023 年:创立与核心技术突破

2024 年:开源生态与行业落地

2025 年:多模态与全球化布局

性能对齐 OpenAI-o1 正式版​

二、API接口调用

1.DeepSeek-V3模型调用

2.DeepSeek-R1模型调用

三、本地化部署接口调用

1.ollama本地化安装(略)

2.DeepSeek-R1本地化安装

3.本地ollama接口调用


一、DeepSeek发展历程

2023 年:创立与核心技术突破

  • 7 月:DeepSeek 由幻方量化支持成立,总部位于杭州。

  • 11 月:发布首个开源代码大模型 DeepSeek Coder,支持多种编程语言,在 HumanEval 任务中甚至超越了 GPT-3.5-turbo。

  • 11 月 29 日:推出参数规模达 670 亿的通用大模型 DeepSeek LLM,致力于自然语言处理、知识问答等任务。

2024 年:开源生态与行业落地

  • 5 月:发布第二代开源混合专家(MoE)模型 DeepSeek - V2,总参数达 2360 亿,支持 128K 长上下文,API 定价极具性价比。

  • 12 月:发布 DeepSeek - V3,总参数达 6710 亿,训练成本仅为 557.6 万美元,在百科知识、数学、编程等任务中全面超越了 Qwen2.5 - 72B 和 Llama - 3.1 - 405B。

2025 年:多模态与全球化布局

  • 1 月 20 日:发布新一代推理模型 DeepSeek - R1,性能与 OpenAI 的 o1 正式版持平,并开源。其 API 服务定价为每百万输入 tokens 1 元(缓存命中)/4 元(缓存未命中),每百万输出 tokens 16 元。

  • 1 月 26 日:DeepSeek 登顶美区 App Store 免费榜第六,超越 Google Gemini 和 Microsoft Copilot。

性能对齐 OpenAI-o1 正式版

  • DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。

二、API接口调用

1.DeepSeek-V3模型调用

# Please install OpenAI SDK first: `pip3 install openai`from openai import OpenAIclient = OpenAI(api_key="<DeepSeek API Key>", base_url="https://api.deepseek.com")response = client.chat.completions.create(model="deepseek-chat",messages=[{"role": "system", "content": "You are a helpful assistant"},{"role": "user", "content": "Hello"},],stream=False
)print(response.choices[0].message.content)

2.DeepSeek-R1模型调用

# Please install OpenAI SDK first: `pip3 install openai`from openai import OpenAIclient = OpenAI(api_key="<DeepSeek API Key>", base_url="https://api.deepseek.com")response = client.chat.completions.create(model="deepseek-reasoner",messages=[{"role": "system", "content": "You are a helpful assistant"},{"role": "user", "content": "Hello"},],stream=False
)print(response.choices[0].message.content)

三、本地化部署接口调用

1.ollama本地化安装(略)

2.DeepSeek-R1本地化安装

ollama run deepseek-r1:1.5b

3.本地ollama接口调用

# Please install OpenAI SDK first: `pip3 install openai`from openai import OpenAIclient = OpenAI(api_key="ollama", base_url="https://localhost:11434/v1/")response = client.chat.completions.create(model="deepseek-r1:1.5b",messages=[{"role": "system", "content": "You are a helpful assistant"},{"role": "user", "content": "Hello"},],stream=False
)print(response.choices[0].message.content)

http://www.lryc.cn/news/531661.html

相关文章:

  • Qt展厅播放器/多媒体播放器/中控播放器/帧同步播放器/硬解播放器/监控播放器
  • Kafka分区策略实现
  • 【归属地】批量号码归属地查询按城市高速的分流,基于WPF的解决方案
  • 为AI聊天工具添加一个知识系统 之78 详细设计之19 正则表达式 之6
  • 使用Java操作Redis数据类型的详解指南
  • 一表总结 Java 的3种设计模式与6大设计原则
  • Hive on Spark优化
  • Java集合面试总结(题目来源JavaGuide)
  • 计算机网络 应用层 笔记1(C/S模型,P2P模型,FTP协议)
  • ES6基础内容
  • DeepSeek本地部署的一些使用体会
  • 鲸鱼算法 matlab pso
  • 013-51单片机红外遥控器模拟控制空调,自动制冷制热定时开关
  • 在Vue3 + Vite 项目中使用 Tailwind CSS 4.0
  • Leetcode—922. 按奇偶排序数组 II【简单】
  • 一个开源 GenBI AI 本地代理(确保本地数据安全),使数据驱动型团队能够与其数据进行互动,生成文本到 SQL、图表、电子表格、报告和 BI
  • 使用Posix共享内存区实现进程间通信
  • 家政预约小程序12服务详情
  • 【C语言】指针详细解读2
  • MongoDB 聚合
  • LabVIEW涡轮诊断系统
  • 机器学习在地震预测中的应用
  • 总结11..
  • c++ 定点 new 及其汇编解释
  • Linux 传输层协议 UDP 和 TCP
  • springCload快速入门
  • 从 HTTP/1.1 到 HTTP/3:如何影响网页加载速度与性能
  • 人工智能导论-第3章-知识点与学习笔记
  • 游戏引擎 Unity - Unity 下载与安装
  • 鼠标拖尾特效