蚂蚁数科已正式发布金融推理大模型 Agentar-Fin-R1。该模型基于Qwen3研发,在FinEval1.0、FinanceIQ等权威金融评测基准上表现优异,超越同尺寸开源通用大模型及金融大模型。
「通用大模型和产业之间仍存在知识鸿沟,尤其在金融领域。」蚂蚁数科 CEO 赵闻飙在大会上表示,构建专业金融大模型,是推动金融智能体真正落地的必由之路。这不仅是科技挑战,更直接关系金融机构在未来的智能竞争中是否拥有核心抓手。
研发团队为其构建了一套业内极为全面和专业的金融数据语料。一个覆盖了银行、证券、保险、基金、信托等全场景的金融任务体系,包含 6 大类、66 个细分场景,构成了业内最系统、最真实的金融数据集。
训练中还引入「原则类合成数据」,让模型天然遵守金融监管红线,比如数据合规、身份校验、反洗钱等细节。

Agentar-Fin-R1 采用了创新的加权训练算法,这就像一个聪明的学习方法,能够动态地发现模型的薄弱环节并针对性地进行强化。
这样做的好处是,在后续的业务应用中,可以显著减少二次微调所需的数据和算力,有效降低了企业部署大模型的门槛和成本。
评测结果显示,Agentar-Fin-R1在金融基准测试中均取得最高评分。蚂蚁数科构建了全面的金融任务数据体系,覆盖银行、证券等全场景,通过可信数据合成技术显著提升模型处理复杂任务的能力。


目前,Agentar-Fin-R1 推出了 32B 和 8B 两种参数版本,此外还有基于百灵大模型的 MOE 架构模型以及 14B 和 72B 的非推理版本,以满足不同机构和场景的部署需求。
暂无更多评论