子曰3-数学 (Confucius3-Math) 是专注于数学教育,可在单块消费级 GPU 上高效运行的开源推理模型。
Confucius3-Math 专门针对 K-12 数学教育场景进行优化。与通用模型不同,Confucius3-Math 具有以下特点:
- 数学任务上的顶尖性能:通过专门的强化学习训练,在中文 K-12 数学问题上的表现超越了参数规模更大的模型
- 高性价比的部署方案:可在单张消费级 GPU(如 RTX 4090D)上高效运行
- 文化与课程体系的深度契合:针对中国国家数学课程标准和解题方法论进行了优化
Confucius3-Math 采用纯强化学习的后期训练流程,结合创新的数据调度策略和改进的组相对优势估计器开发而成。
Confucius3-Math 在解决国内数学问题任务中展现出了显著优势。其通过大规模增强学习以及一系列的创新算法,训练成本仅为 2.6 万美元,推理性能约为 DeepSeek R1 的 15 倍。
评论