当前位置: 首页 > news >正文

Mistral AI 发布 Pixtral Large 模型:多模态时代的开源先锋

Mistral AI 最新推出的 Pixtral Large 模型,带来了更强的多模态能力。作为一款开源的多模态模型,它不仅在参数量上达到 1240 亿,更在文本和图像理解上实现了质的飞跃。


模型亮点

1. 多模态能力再升级

Pixtral Large 配备了 123B 参数的解码器1B 参数的视觉编码器,在语言理解基础上显著强化了视觉处理能力。这意味着它能够轻松处理图像、文档和复杂图表等多种形式的数据。

2. 超大上下文窗口

支持 128K Token,让它一次可处理多达 30 张高分辨率图像或长达数百页的复杂文档,无需频繁切换。

3. 丰富的数据处理能力

能解析多种输入格式,如 OCR(光学字符识别)、表格、公式、图形等,适合文档理解、图表分析等任务。


卓越的性能表现

1. 数学推理:MathVista

Pixtral Large 在数学推理任务中准确率达到 **69.4%**,领先所有同类模型。

2. 文档与图表问答:DocVQA 和 ChartQA

在复杂文档和图表的推理能力上,模型成功超越 GPT-4o 和 Gemini-1.5 Pro。

3. 多模态综合评估:MM-MT-Bench

在真实场景测试框架下,Pixtral Large 全面领先 Claude-3.5 Sonnet、GPT-4o 等顶级模型,特别是在图表、文档和图像处理能力方面表现尤为突出。

alt

应用场景

1. OCR 与多语言推理

示例问题:我买了咖啡和香肠,加上 18% 的小费后需要支付多少?
模型回复
解析账单内容,计算每项金额、总费用和小费后,清晰输出应付金额:36.58 CHF

alt

2. 图表分析

示例问题:Dark Dragon 模型在训练中什么时候出现问题?
模型回复:分析损失曲线后,准确指出模型在 10,000 步附近出现不稳定。

alt

3. 企业级支持

Pixtral Large 能显著提升知识共享、文档语义理解、任务自动化和客户体验等企业应用场景的效率。

alt

如何使用?

  • 在线调用:通过 API 使用,模型名称为 Pixtral-large-latest
  • 本地部署:访问 Mistral AI 官网下载,支持研究许可证(MRL)或商业用途。

Mistral AI 的更多新功能

  1. Le Chat 更新

    • 支持聊天中进行搜索、PDF 上传、编程和图像生成。
    • 图像生成基于 FLUX1.1 pro 模型,免费使用。
    • 新增 Canvas 画布功能,用户可实时协作,创建文档、代码、设计或演示文稿,并支持实时预览与导出。
  2. 相关资源

    • 技术报告: 技术报告链接
    • API 文档: API 文档链接
    • 模型下载: 模型下载链接
    • 在线体验: 在线体验链接

Pixtral Large 的发布,为多模态技术打开了新的可能。无论是科研、商业,还是日常场景,它都展现了强大的适配能力。未来,Mistral AI 是否会继续刷新多模态模型的上限?让我们拭目以待!

本文由 mdnice 多平台发布

http://www.lryc.cn/news/488536.html

相关文章:

  • Windows、Linux多系统共享蓝牙设备
  • C语言 | Leetcode C语言题解之第564题寻找最近的回文数
  • wsl虚拟机中的dockers容器访问不了物理主机
  • Spark RDD 的宽依赖和窄依赖
  • 二进制转十进制
  • 深度学习:神经网络中的非线性激活的使用
  • Python缓存:两个简单的方法
  • 原生微信小程序在顶部胶囊左侧水平设置自定义导航兼容各种手机模型
  • 经验笔记:远端仓库和本地仓库之间的连接(以Gitee为例)
  • 利用RAGflow和LM Studio建立食品法规问答系统
  • ffplay音频SDL播放处理
  • 自动化仪表故障排除法
  • WPF 中 MultiConverter ——XAML中复杂传参方式
  • 实验室管理现代化:Spring Boot技术方案
  • aws凭证(一)凭证存储
  • jmeter常用配置元件介绍总结之断言
  • JMeter监听器与压测监控之Grafana
  • MySQL8 安装教程
  • 聚焦 NLP 和生成式 AI 的创新与未来 基础前置知识点
  • 23种设计模式-访问者(Visitor)设计模式
  • ssm150旅游网站的设计与实现+jsp(论文+源码)_kaic
  • 【SKFramework框架】一、框架介绍
  • Arcgis地图实战三:自定义导航功能的实现
  • LLaMA-Factory 上手即用教程
  • 黑马点评 秒杀下单出现的问题:服务器异常---java.lang.NullPointerException: null(已解决)
  • 购物街项目TabBar的封装
  • C++游戏开发面试题及参考答案
  • 字符串的基本操作(C语言版)
  • C缺陷与陷阱 — 7 可移植性缺陷
  • 应急响应:玄机_Linux后门应急