开源日报 | Qwen2开源;SJTUG下架Docker Hub镜像;Kubernetes十周年;西工大发现RISC-V漏洞;国内的开源模型一直很行

来源: OSCHINA
编辑:
2024-06-07 19:59:31

欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。

# 2024.6.7

今日要闻

阿里通义千问 Qwen2 大模型开源发布

6月7日凌晨,阿里云更新技术博客:重磅发布全球性能最强的开源模型——Qwen2-72B,据称性能超过美国最强的开源模型Llama3-70B,也超过文心4.0、豆包pro、混元pro等众多中国闭源大模型。亮点如下:

- 5个尺寸的预训练和指令微调模型, 包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B;
- 在中文英语的基础上,训练数据中增加了27种语言相关的高质量数据;
- 多个评测基准上的领先表现;
- 代码和数学能力显著提升;
- 增大了上下文长度支持,最高达到128K tokens(Qwen2-72B-Instruct)。

SJTUG(上海交通大学Linux用户组)下架 Docker Hub 镜像

Kubernetes 十周年

Kubernetes 的历史始于 2014 年 6 月 6 日的那次历史性提交,随后是 Google 工程师 Eric Brewer 在 2014 年 DockerCon 的 6 月 10 日主题演讲中宣布该项目(以及相应的 Google 博客)。

在接下来的一年里,主要来自 Google 和红帽的小型贡献者社区努力工作,最终在 2015 年 7 月 21 日发布了 1.0 版本。与 1.0 版同时,Google 宣布 Kubernetes 将捐赠给 Linux 基金会的一个新分支 —— 云原生计算基金会(CNCF)。

尽管达到了 1.0 版本,Kubernetes 项目仍然非常难以使用和理解。Kubernetes 贡献者 Kelsey Hightower 特别注意到了项目的易用性不足,并在 2016 年 7 月 7 日推送了他的著名“Kubernetes the Hard Way”指南的第一个提交。

自最初 1.0 版本发布以来,项目发生了巨大变化;经历了一系列重大胜利,例如自定义资源定义(CRD)在 1.16 中进入 GA 阶段,或在 1.23 中推出完全双栈支持,以及社区从 1.22 中移除广泛使用的 Beta API 或 Dockershim 的弃用中学到的“教训”。

西工大在 RISC-V 设计中发现可远程利用的中危漏洞

西北工业大学(简称“西工大”)近日发布新闻稿,称该校网络空间安全学院胡伟教授团队在 RISC-V SonicBOOM 处理器设计中挖掘出中危漏洞。据了解,该团队的研究人员在开源处理器架构 RISC-V 设计中发现了一个可远程利用的中危漏洞。它在 4 月 24 日报告给了国家计算机网络应急技术处理协调中心(CNCERT),5 月 24 日公开了更多细节。

西工大官方新闻稿称,这是国内首个自主挖掘的 RISC-V 处理器设计上可远程利用的中危漏洞,也是国内首个处理器硬件安全领域国家重点研发计划项目 —— 纳米级芯片硬件综合安全评估关键技术研究的重要进展。


今日观察

社交观察

AI的未来在哪里?

AI的未来在哪里?或者说,如何避开和chatgpt为首的基座大模型正面竞争?

RAG不是。RAG是最容易上手的方向,本地知识库没什么门槛,应用场景也很浅。RAG的地位类似于web1.0的cms一样,是个LLM工程师就得会的基本功。

AI agent是。function call是个好东西,多模交互是个好东西,ReAct更是个好东西。有了它们就有了贾维思的条件,连上硬件更可以得到幻视!问题的关键是,如果chatgpt这种基座大模型公司自己下场做agent呢?注意,chatgpt有最聪明的LLM,通过gpts它还有最全的tools,gpt4-o证明它还有最强的多模交互。做通用型的agent就像做通用大模型一样,一定干不过chatgpt这种公司。

- 微博 真阿当

国内的开源模型就是一直很行,国际上口碑也不错

在通用大模型里,国内发布的开源大模型也一直算是开源模型里第一梯队的。

比较有名的是Qwen系列大模型,Qwen的技术团队从去年夏天到现在一直在持续参与更新。系列模型里即有适合个人折腾玩的模型,也有超过千亿参数的大模型。去年发布的Qwen-72B口碑炸裂(产品发布的推文两千多赞),今年又连续推出了1.5版本的升级版,特别是还有110B这个参数过千亿的版本,吊打Llama2,口碑和Mistral的MoE模型差不多。

- 微博 蚁工厂

通义千问2的700亿参数版本果然好用

我也手动测试了几个之前的bad case,结果都是对的(见图2和图3)。。提升巨大,我们现在用大模型处理数据的场景还是蛮多的,比如要标注笔记的正负面,标注对话数据的甲乙方,标注文章里面提到的品牌名称,地名等等。现在开源的大模型真是福音,方便我们这种有大量数据处理业务的企业了。

又安排员工把之前发现的其他大模型跑数据遇到的bad case都跑一遍,发现这一版通义千问在其他大模型跑出的bad case里面的表现正确率超过了75.2% (当然也有一些是错的,见图4)。其他大模型跑通过的case里面正确率达到99%。因为我们是有正确答案的,比较好统计,其实我可以给各家大模型在数据标注方面做测评啊,是不是又一个发财的机会啊。。

- 微博 梁斌penny

AI会怎么写今年高考作文

分享一下让AI写高考作文的Prompt技巧吧,希望对你用大模型写其他文章也有帮助。
1. 先给他评分标准,告诉AI什么样的作文能得高分。(这里从网上搜一下高考作文评分标准,拷贝到你的提示词里)
2. 不要让AI直接写,先让他根据上面的提示词和作文要求,写出AI的写作思路,每一段怎么写,以及具体有哪些技巧可以。
3. 让AI根据写作思路来生成作文正文。
4. (可选项)让AI检查下自己的作文,是否符合上面的评分标准,列出可以改进的地方
5. (可选项)让AI根据检查的结果,修改作文,生成最终的作文稿。

- 微博 蚁工厂

今年信息最给力的paper——DeepSeekV2

【大模型扩吞吐】#CacheKV压缩 又添一员,MLA(Multi-head Latent Attention),低秩KV压缩;

1. 动机:压缩CacheKV的好处:①Cache小了就可加速MHA计算 ②memory省下来了可以加大batch增吞吐;

2. 标准CacheKV的大小:每个k和v的大小都是${n_h * d_h * t},即head头数(如8) * k和v的特征维数(如1024) * 序列长度;

- 微博 Rachel____Zhang

自己写的921芯级回收和载人登月器的着陆算法

全部都是KSP-RSS/RO仿真模拟条件下,燃料效率优先的算法。(非常屎山)

这是最基本的代码,有理由相信SpaceX其实在着陆船着陆的那部分使用了G-Flop算法(开源,网上有)。而猎鹰9和Ss/Sh星舰系统使用的更多依赖发射前模拟,把数据和坐标三维信息Mapping到控制器里的方式来控制火箭的,而不是飞行器实时根据自身状态计算的。(当然可能最后驳船着陆有可能有一部分G-Flop算法) 

- 微博 赵若泓rhZhao

你应该问HR什么问题

我觉得你至少要问四个问题。

第一:我们公司过去一两年晋升或者加薪的员工,都是因为什么原因晋升或者加薪的?
第二:咱们公司鼓励跨部门合作吗?有多少跨部门合作?
第三个问题:咱们公司员工平均年龄多少?
第四个问题:咱们公司过去一两年离职的人,他们平均在公司任期多长?

- 微博 思维螺旋

 

一次不成功的 pull request

昨天,我向 pgvector 提交的一个降维算法被拒绝了 Submit a simple vector dimensionality reduction function 。 这个结果对我来说,并不意外。顶多算是略有遗憾。我习惯使用ollama ,而ollama的embedding接口返回的是4096维度,远大于PGVector索引支持的最大维度2000。

关于这个问题,我第一个想法是修改PGVector的维度限制,不过这个issue很快被拒绝了 Increased max dimensions for index from 2000 to 4096 。原因也很简单,PGVector这个限制其实来自PostgreSQL,PG的索引页最大为8K,所以PGVector的索引维度最大不能超过2000。 在此之后,我就开始尝试实现一个实用的降维算法。 一般来说,PCA(主成分分析)总是被首先推荐的,这玩意儿甚至是花书的一个重要示例。

-  挖坑不填兽

媒体观察

全球最强开源模型Qwen2发布,阿里云为开闭源之争画下休止符

阿里云在1个月前刚刚发布中文场景性能超过GPT-4的闭源模型——通义千问2.5,从这个角度来看开闭源的路线选择,阿里云实际上是两条腿走路。既利用开源的优势进行广泛的技术传播和创新,又通过闭源的方式保障关键技术的领先和商业应用的稳定。这种类似于双轨制的策略,使得阿里云能够在技术创新和商业化应用中取得平衡,实现技术价值的最大化。

所以,开源与闭源并不矛盾,而是在不同的场景和需求下扮演着各自独特的角色,这并不是一道非此即彼的选择题,也是时候为两者的路线之争画下休止符了。

- 品玩

面向更大市场,重视合规发展,中国AI大模型正加速“出海”

2023年,知名人工智能模型中15个在中国。截至今年3月份,中国10亿参数规模以上的大模型数量已超100个,行业大模型深度赋能电子信息、医疗、交通等领域。得益于中国大模型市场的快速发展,AI出海的趋势愈发明显。无论是大厂还是初创企业,纷纷把目光投向海外。

- 环球时报

英伟达盘中“闪崩”近6%!美国监管机构将展开反垄断调查,耶伦发出AI“重大风险”警告

耶伦在演讲中透露,人工智能与金融稳定是拜登政府高度重视的话题,“在未来几年只会变得更加重要”。金融公司使用人工智能带来的“巨大机遇和重大风险”已成为美国财政部和金融稳定监督委员会的首要议题。

- 每日经济新闻

智能经济 未来可期

攻克关键核心技术。应用算法、智能芯片、开源框架……人工智能关键核心技术是行业发展的重中之重。国家发展改革委经济运行调节局局长黄勇建议,要加快建立关键共性技术攻关体系,打造国有企业、民营企业、高校及科研院所等广泛参与的产学研用创新联合体,着力实现算力芯片、高带宽内存等关键元器件的突破,加快突破人工智能关键核心技术。

人民日报海外版

AI 时代,苹果真的落后了?

人们似乎已习惯了苹果引领着行业,对苹果跟风别人嗤之以鼻。因此,相同的功能,苹果做得比其它公司更强,理所应当;在无人区里,苹果点燃了一盏不熄灭的油灯,才是大众所期待的结果。

若是从苹果的角度来说,iPhone 的销售额仍然占据苹果公司的 50% 以上,拿走了全球智能手机利润都 85%。苹果比任何人都希望 AI 上机后,能帮助 iPhone 卖得更好。尤其是在 Apple Car 项目取消,Vision Pro 失利的前提之下。

- 品玩

硬件软件背道而驰,港股当前的主线逻辑是什么?

交银国际发表报告指出,今年人工智能(AI)基础设施建设或将进一步加速,并建议投资者关注芯片在计算、存储和通信以及数据中心服务器等机会。该行认为,今年上半年市场表现符合预期,展望人工智能基础设施的旺盛需求或在下半年继续,而半导体或持续分化。

- 港股研究社

为什么说国产大模型的野心,都藏在 MaaS 的生态中

如果说,过去是单一算法找场景,拿着锤子找钉子,算法无法解决整体问题,导致除了人脸识别、自动驾驶外,明星场景寥寥。

MaaS 则意味着,在承认企业的需求不同、数字化能力不同的基础上,通过大模型的通用性以及生态优势,来解决这千变万化需求。

一定程度上,这是场技术你追我赶的闪电战,更是场生态与商业的持久战。

- 极客公园

黄仁勋深度访谈:十年时间,我是怎么带领 2.8 万人超越苹果的?

前不久,黄仁勋与美国移动支付巨头 Stripe CEO 帕特里克·克里森(Patrick Collison)进行了一场企业家之间的深度对谈,不仅畅聊自己曲折的成长史、与 AMD 董事长兼 CEO 苏姿丰的亲戚关系,而且点名夸奖 Llama 系列模型的重大意义和自己日常爱用的 AI 工具。黄仁勋还大谈管理经验,包括 60 位高管如何向他汇报、怎么安排日常工作、为何坚持不裁员,以及大家最关心的——这位兼具工作狂魔与魅力型领导者特质的创业者,当初如何做出卓有远见的判断,带领英伟达 2.8 万人走向伟大的成功?

- 芯东西

被扒用OpenAI牟私利, Altman到底在下哪一盘棋?

有没有一种可能,OpenAI的CEO才是Altman的“副业”,而投资则是他的主业。

从这个角度思考,Sam Altman何尝不是用一笔笔投资,建立一个未来的AI帝国。

- 36氪

今日推荐

开源项目

cyberbotics/webots

https://github.com/cyberbotics/webots

Webots 是用于模拟机器人的开放源代码和多平台桌面应用程序。它提供了一个完整的开发环境来对机器人进行建模,编程和仿真。

每日一博

万字长文详解降本增效利器 PikiwiDB (Pika) 混合存储原理

在大型键值(kv)存储系统中,用户访问的数据通常呈现明显的冷热分布特性。所谓热数据,即那些被频繁访问的数据;而冷数据则相反,它们被访问的频率极低。为了提高数据访问的效率,降低读取耗时,关键在于如何让热数据更多地驻留在内存层,减少不必要的磁盘 I/O 操作。

 


开源之声

用户观点

被美国列入制裁“实体清单”的西工大——在开源处理器架构RISC-V中发现可远程利用的中危漏洞

  • 观点 1:这个漏洞怕不是故意留的吧!!!
    • 观点 2:你去kimi 问问 龙芯有过安全漏洞没有。堵上就好。谁能保证设计的处理器 不经大量使用验证天生是安全的 。
    • 观点 3:普及下,我们用的是一套架构规范,这种架构规范全世界也在使用。架构规范的意思人家提出来了一套方案,具体实现你自己来做。任何方案都是有漏洞的,包括英特尔,amd 他们的芯片架构都有。唯一避免漏洞的办法就是彻底不再使用电脑。千万不要阴谋论啊。
  • 观点 4:这就是开源的好处
  • 观点 5:这玩意好像还没有流片。
  • 观点 6:换道超车,不是弯道

阿里云发布全球最强开源LLM“Qwen2”:性能超越众多闭源模型、火速登顶HuggingFace

  • 观点 1:这个和那个前几天刚发布的glm4哪个好啊
    • 观点 2:国内一概不用,全是阉割的,我用rwkv
    • 观点 3:RWKV也是中国团队搞的。。
  • 观点 4:以后应该加入普通人的测试体验,现在的榜单,好像不太真实
  • 观点 5:我都不敢想这后面的算法工程师一个月能挣多少钱
  • 观点 6:和GPT4哪个好
    • 观点 7:专业性强的问题,这两货都会瞎扯鸡爹蛋。但GPt在英文语料上有更好的答案,因为专业问题,很多只有英文社区才有答案
  • 观点 8:手机跑不了一点
  • 观点 9:为啥要手机看能跑?手机是天吗?顶天万把元的消费级玩具而已。

Java Solon v2.8.3 发布(打破 Java 资源浪费的传统印象)

  • 观点:1:开放原子开源基金会孵化了,赞
  • 观点 2:同时有开源版和收费版的一般开源版就是被放弃的命
    • 观点 3:mysql 好像一直就是 社区版 + 企业版。
  • 观点 4:你为何如此高产(」゜ロ゜)」

---END---

最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!

展开阅读全文
点击引领话题📣 发布并加入讨论🔥
0 评论
1 收藏
分享
返回顶部
顶部