据 MistralAI 官方消息,Mistral AI 推出了全新的多模态 AI 模型 Pixtral Large。该模型拥有 1240 亿参数,基于 Mistral Large 2,主要用于处理文本和图片。
- 原生多模态,使用交错图像和文本数据进行训练
- 在多模式任务上表现出色,在遵循指令方面表现出色
- 从头开始训练的新型 400M 参数视觉编码器
- 基于 Mistral Nemo 的 12B 参数多模态解码器
- 支持可变图像尺寸和长宽比
- 支持 128k token 的长上下文窗口中的多个图像
Pixtral Large 是 Mistral AI 多模态家族中的第二个模型,现已在 Mistral 研究许可证和商业许可证下提供,适用于研究、教育以及商业用途。
根据官方新闻稿,该模型在 MathVista、DocVQA 和 VQAv2 等标准多模态基准测试中表现出色,尤其在 MathVista 中达到了 69.4% 的准确率,超越了所有竞争对手。


暂无更多评论