开源日报 | DeepSeek-R1性能对标OpenAI o1;Kimi发布k1.5多模态思考模型;中国自主量子计算编程框架QPanda3发布;哪些AI产品在赚钱?

来源: OSCHINA
编辑:
2025-01-21 19:33:47

欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。

# 2025.1.21

今日要闻

DeepSeek-R1 发布,性能对标 OpenAI o1 正式版

据深度求索 DeepSeek 官方消息,DeepSeek-R1 大模型正式发布,并同步开源模型权重。

DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。

Kimi 全新 SOTA 模型 —— k1.5 多模态思考模型来了

月之暗面正式发布 Kimi 全新 SOTA 模型:k1.5 多模态思考模型,同时首次公开模型训练技术报告。

据官方介绍,从基准测试成绩看,k1.5 多模态思考模型实现了 SOTA(state-of-the-art)级别的多模态推理和通用推理能力。

在 short-CoT 模式下,Kimi k1.5 的数学、代码、视觉多模态和通用能力,大幅超越了全球范围内短思考 SOTA 模型 GPT-4o 和 Claude 3.5 Sonnet 的水平,领先达到 550%。

腾讯混元 3D 生成大模型 2.0 开源发布

腾讯混元3D生成大模型2.0现已开源,腾讯同步上线混元3D AI创作引擎,这也是业界首个一站式3D内容AI创作平台。

据悉,该版本针对3D生成过程中的几何和纹理两个大模型进行了升级。其中,几何大模型的任务就是捕捉3D物体的形状和结构。腾讯云采用Hunyuan3D-DiT和Hunyuan ShapeVAE技术,让生成的「白模」(没上色的模型)效果堪比设计师手工建模;纹理大模型Hunyuan3D-Paint如同专业的「化妆师」,可以根据文字或图片描述,为「白模」穿上各种高清纹理,科幻、卡通、写实,风格切换自如。

Meta 正计划推出 AI 编程助手,或将在年内问世

Meta CEO 马克·扎克伯格近日透露,Meta 公司正在研发一种 AI 编程助手,很可能在今年问世。

扎克伯格表示,Meta 正在朝着一个目标努力,届时“我们应用中的大量代码,甚至包括我们生成的 AI,将主要由 AI 工程师而非人类工程师编写”。这意味着,Meta 未来的技术开发将越来越依赖于 AI 的能力。

与此同时,Meta 也宣布将裁员约 5% 的员工,涉及 72000 人的庞大团队。不过,扎克伯格强调,AI 目前尚无法完全取代这些职位。

谷歌公布 Titans 系列 AI 模型架构:融合长短期记忆与注意力机制、突破 200 万上下文 Token

谷歌研究院发文,公布了“Titans”系列模型架构,相应模型架构最大的特点是采用仿生设计,结合了短期记忆、长期记忆和注意力机制,支持超过 200 万个 Token 的上下文长度,目前相关论文已发布在 arXiv 上,谷歌计划未来将 Titans 相关技术开源。

Titans 系列模型架构通过引入深度神经长期记忆模块(Neural Long-Term Memory Module)有效解决了相应问题,其设计灵感号称来自人类的记忆系统,结合了短期记忆的快速反应与长期记忆的持久特性,并通过注意力机制来着重执行当前的上下文。

第三代中国自主量子计算编程框架 QPanda3 发布,编译速度较美国 Qiskit 1.3.0 提升 320 倍

本源量子今日宣布升级推出第三代中国自主量子计算编程框架 QPanda3,根据相关测试结果,QPanda3 在量子线路编译方面的性能显著优于美国 Qiskit 1.3.0,在处理大规模量子线路时表现尤为突出,特定情况下,其编译速度提升高达 320 倍。

QPanda3(Quantum Programming Architecture for NISQ Device Application v3)是一个开源的量子计算编程框架,基于 C++ 开发,同时提供了 Python 接口,开发者在享受 C++ 高性能的同时,可以使用 Python 编写量子程序。

该框架是本源量子全栈式量子计算编程生态工具链的重要组成部分。工具链涵盖了量子编程框架、量子基础算法、量子机器学习、量子编程语言和量子计算集成开发环境等多个核心组件,能够为生物制药、量子人工智能、量子金融等前沿领域提供技术支持。


今日观察

社交观察

DeepSeek 完成了对 OpenAI 的从致敬到超越

昨晚看到一些对DeepSeek R1的讨论,早晨趁注意力好就阅读了一下,又一次被震惊了。如果说DeepSeek V3的思路还都在想象范围内,更多是惊艳的工程交付能力,DeepSeek R1就是纯粹的无人区探索和发现了(可能OpenAI已经这么做了,但没公开,也可能DeepSeek R1的做法比OpenAI还要好),从V3到R1 ,DeepSeek完成了对OpenAI的从致敬到超越,这让我有点相信梁文锋说的ASI了。

1,Zero 的做法太简洁了,简单直接有效;2,R1 一步一步cook ,确实像炼丹,像酿酒,像煲汤,勾勾兑兑,成了

可以预期开源大模型全面超越闭源模型。模型开源的一个好处是,全世界的人才都聚拢过来一起在这个路线上探索,譬如DeepSeek也不给我们钱,但我们整个团队都投入到优化DeepSeek部署性能上去了,在我们之外的大玩家就更多了。

- 微博 老师木

字节悄悄卖算法给 Meta?

TikTok的最大价值在哪里?当然1.7亿美国用户价值很高,但真正的核心竞争力是AI算法。没有AI算法就没有产品竞争力和用户粘性。这一点就连马斯克也是公开肯定的。

不妨想一下,但凡字节点头卖算法,TikTok封杀这事早就过去了。就是因为TikTok坚持不出售,才从2020年抗到了现在,甚至不惜服务直接下线,又怎么可能会在川普上台带来转机曙光的时候,轻易把最核心的资产让给幕后大黑手Meta?

- 微博 郑峻

到底哪些 AI 产品在赚钱?

 

- 微博 宝玉xp

DeepSeek 创始人梁文锋仅靠百名中国程序员,已赶超 OpenAI

难能可贵的是,梁文锋组建的还是一支纯粹的本土研发团队,只有中国程序员,没有海归人才。不少人都是应届毕业生和毕业一两年的年轻人。

甚至有报道称深度求索(DeepSeek)团队不招聘高级技术专业人员。员工的工作年限约为3到5年,而那些拥有8年以上研发经验的人还可能会被直接拒绝。因为他们害怕这样的人包袱太重、缺乏创新的动力。
 
- 微信  CEO来信

媒体观察

两部门连发三份文件 规范公共数据资源授权运营相关活动

公共数据资源开发利用是一项综合性、系统性工作,三份配套政策文件的贯彻落实需要各方协同发力。下一步,将从以下几个方面开展工作。一是强化工作统筹;二是加大宣贯培训;三是培育示范场景;四是抓好跟踪落实。

- 证券日报

周鸿祎迷失在“千万粉丝”里

热闹与质疑并存,也让我们不得不重新审视:周鸿祎的个人“网红之旅”,究竟能走多远,又能为360带来多大的转机?

- 市象

小米又是第一!智能门锁大战白热化,AI和营销成关键?

C端市场的快速崛起,给智能门锁行业带来了新的增长力,如何顺应C端市场的情况打造产品、投放营销,则是接下来智能门锁企业需要思考的首要问题。

- 雷科技

AI盈利难、机器人泡沫多,马库斯25年AI预测,隔空喊话马斯克

新年伊始,AI专家Gary Marcus发布长文,公布了他对2025年AI发展最新的25项预测,包括AGI、生成式AI、自动驾驶、人形机器人、视频生成、智能体等多个方向。虽然在2024年对OpenAI估值预测出错,但在最新的预测中仍不看好OpenAI。

- 新智元

特朗普将如何改变人工智能法规

华尔街预计特朗普宣誓就职后放松或废除拜登总统的人工智能法规。共和党全国委员会(Republican National Committee)的 2024 年政纲概括了他公开表达的观点,称拜登的人工智能政策是一项 “阻碍人工智能创新 ”的政策。

- 美股投资网

600亿,背后!

近日,大基金三期第三次出手,联手上海国资成立国家人工智能产业投资基金。头部机构投资人预计,其未来投资方向将会在半导体和人工智能(硬件+软件)这两大主线上。

- 创投日报


今日推荐

开源项目

BiglySoftware/BiglyBT

https://github.com/BiglySoftware/BiglyBT

BiglyBT 是一个基于 Vuze(原名 Azureus)的 Bittorrent 客户端,具有功能丰富、开源和无广告等特点。

每日一博

向量数据库真的能满足所有 AI Agent 的记忆需求吗?

文章首先介绍了 Agentic AI 系统的基本概念,以营销案例说明了其任务分解和执行能力。随后深入探讨了向量数据库在管理 AI 记忆方面的应用及其局限性,特别指出了数据质量问题。


开源之声

用户观点

《2024 中国开源开发者报告》正式发布

  • 观点 1:挺惊讶的,gitee 上一年新增150万用户数,500万新增仓库数量,40万开源组织。中国开源越来越顶了
  • 观点 2:大家赶紧学TypeScript+RAG,明年你就是老板的“AI驯兽师”!
  • 观点 3:现在AI工具对于编程的辅助作用确实越来越强了,用多了感觉已经离不开了
  • 观点 4:中国开源必须支持,祝开源中国越来越强大
  • 观点 5:看来以后真要失业了,工作都被AI代替了,烦恼
  • 观点 6:看个报告,还能有机会拿奖品,确实爽歪歪
  • 观点 7:玩玩AI生图,浅尝辄止,不过IDE的AI插件还挺好用
  • 观点 8:aieditor👍👍👍
  • 观点 9:chatgpt的发布不过才2年,但似乎已经过了很多年。这两年我们不停地接触到新技术名词,企图在这场洪流中抓住些什么。来到2025年,我们期待的杀手级ai应用会出现吗?
  • 观点 10:豆包,文心一言,通义,kimi,最终的王者应该是从这里产生
  • 观点 11:现在写代码用AI,写ppt用AI,写文案用AI,都被机器代替了,以后就业机会越来越少,焦虑
  • 观点 12:deepseek R1, 说与Openai o1比肩,试了一下,高中奥数题依就做不起!
  • 观点 13:AI在多个领域的应用加速落地了,25年预计是更加多的ai应用落地
  • 观点 14:模型的竞争已经从单纯的规模比拼转向应用场景细化,2025年拭目以待吧😃
  • 观点 15:AI在未来一定是大势所趋,25年拭目以待,加油
  • 观点 16:国内AI要看豆包,用户数据不缺,算力不缺,未来可期

---END---

 

展开阅读全文
点击引领话题📣 发布并加入讨论🔥
0 评论
1 收藏
分享
返回顶部
顶部