首页
开源软件
问答
博客
翻译
资讯
Gitee
众包
活动
专区
源创会
高手问答
开源访谈
周刊
公司开源导航页
登录
注册
资讯
软件
博客
动弹
专区
问答
活动
工具
培训
APP
Gitee
新媒体
OSC 公众号
硬核 + 嬉笑怒骂
OSC 微博
技术圈大 V 出没
OSC 视频号
AI 百科
OSC 今日头条
微头条显行业百态
LFOSSA 公众号
LF 开源软件学园
Gitee AI 公众号
大模型托管平台
Gitee 服务号
研发管理解决方案
登录
注册
万字解读:DeepSeek R1 是怎样炼成的
继 V3 模型奠定基座能力后,DeepSeek 再次推出颠覆性创新——R1 推理模型。它在仅需0.5% 标注数据量的极端条件下,通过 RLHF 三阶段训练实现推理能力跃迁;不仅 92.3% 的 GSM8K 数学推理准确率、89.7% 的 CodeX ...
作者:
AI4AI社区
万字解读:DeepSeek R1 是怎样炼成的
分享
复制链接
README badge(
)
社交分享
微信
QQ
微博
o
osc_24666924
02/18 10:41
这种纯纯翻译,也无总结也无见解也无拓展,就能叫万字解读???
回复
举报
o
osc_24666924
02/18 10:41
这种纯纯翻译,也无总结也无见解也无拓展,就能叫万字解读???
回复
举报
o
osc_24666924
02/18 10:41
这种纯纯翻译,也无总结也无见解也无拓展,就能叫万字解读???
回复
举报
回复 @
{{ emoji.type }}
{{emojiItem.symbol}}
评论用户
o
推荐博客
图灵数据洞察平台-TDF(Turing Data Finder)
百度Geek说
·
今天 11:29
3 评论
Apache Flink 2.0.0: 实时数据处理的新纪元
Flink_China
·
今天 11:13
0 评论
如何在IDEA中借助深度思考模型 QwQ 提高编码效率?
阿里云云原生
·
今天 10:45
0 评论
在 Elasticsearch 中扩展后期交互模型 - 第 2 部分 - 8.18
elasticstack
·
今天 09:59
0 评论
一行命令,就能搭一个后台管理系统,前后端还都有?
肖滢
·
昨天 21:37
3 评论
高并发场景下的库存管理,理论与实战能否兼得?
京东云开发者
·
昨天 16:52
0 评论
MCP 协议:LLM 应用开发的“适配器”
一君_
·
昨天 13:59
0 评论
3月31日截止|开源之夏2025社区报名火热进行中,一文带你读懂开源之夏社区参与指南
开源之夏OSPP
·
昨天 09:36
0 评论
Spring Boot 项目 90% 存在这 15 个致命漏洞!你的代码在裸奔吗?
风象南
·
昨天 09:04
0 评论
万字长文,带你读懂Anthropic MCP
梦朝思夕
·
昨天 07:58
0 评论
删除一条评论
评论删除后,数据将无法恢复
取消
确定
©OSCHINA(OSChina.NET)
工信部
开源软件推进联盟
指定官方社区
社区规范
深圳市奥思网络科技有限公司版权所有
粤ICP备12009483号
顶部
万字解读:DeepSeek R1 是怎样炼成的