开源日报 | RustDesk暂停国内服务;高中生自创开源编程语言;国产开源MoE指标炸裂;大模型开闭源之争的实质;iPad要为AI“练兵”?

来源: OSCHINA
编辑:
2024-05-07 18:27:35

欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。

# 2024.5.7

今日要点

RustDesk 由于诈骗猖獗,暂停国内服务

RustDesk 是一款开源远程桌面软件,然而也被诈骗分子频繁使用。

为了进一步应对诈骗,RustDesk 暂时决定停止中国地区的服务,如果用户现在通过公共服务器访问国内主机,将会收到被禁止的消息。针对海外,RustDesk 也只允许同城访问,未来也会屏蔽掉所有 VPN(等找到合适的数据源)。

高中生自创开源编程语言作为成人礼

一名高中生独立设计和开发了名为「Key Lang」的编程语言。他在 B 站上传视频分享了这门自创的编程语言,表示这是送给自己的成人礼,项目也已在 GitHub 开源。

国产开源MoE指标炸裂:GPT-4级别能力,API价格仅百分之一

最新国产开源MoE大模型,刚刚亮相就火了。DeepSeek-V2性能达GPT-4级别,但开源、可免费商用、API价格仅为GPT-4-Turbo的百分之一。从公布的性能指标来看,DeepSeek-V2的中文综合能力超越一众开源模型,并和GPT-4-Turbo、文心4.0等闭源模型同处第一梯队。英文综合能力也和LLaMA3-70B同处第一梯队,并且超过了同是MoE的Mixtral 8x22B。

DeepSeek-V2在模型架构也进行创新,采用了自研的MLA(Multi-head Latent Attention)和Sparse结构,可大幅减少模型计算量、推理显存。


今日观察

社交观察

听说 Windows 11 广告越来越多了,试试 OFGB 这个工具

OFGB 的完整名称是 Oh F**k Go Back [二哈],是一款开源应用程序,旨在为客户提供一种简单易用的方法来关闭 Windows 11 中的广告。OFGB 使用 Windows 注册表来关闭整个系统中的广告。其中包括以下可以禁用的内容:

文件浏览器广告
锁屏提示和广告
设置广告
一般提示和广告
“完成设置”广告
“欢迎体验”广告
个性化广告
“定制体验”
开始菜单广告

只需勾选所有方框即可禁用掉 Windows 11 系统中的广告。
Github:https://github.com/xM4ddy/OFGB/releases/tag/v0.3

- 微博 摇摆时间线ZHLMI

中科院出品的四个神器

1、紫东太初:taichu-web.ia.ac.cn
这是由中科院推出的千亿级参数的AI大模型。与其他AI模型相比,紫东太初能够跨越多个领域,执行文本创作、图像生成、音视频处理、3D理解等多元化任务,甚至涵盖PPT生成和文档分析等实用功能。值得一提的是,由于国家官方的大力支持,这一先进模型免费对公众开放。

2、Pubscholar:pubscholar.cn
中科院新推出的公益学术平台,汇聚了超过2亿篇的论文资料,内容涵盖了期刊、论文、专利、图书等多个方面,无需注册可以直接免费使用。

3、中科院GPT:github.com/binary-husky/gpt_academic
开源项目,中科院倾力打造的GPT学术版,不仅有论文润色、论文问答、文献总结、论文解读等功能,还可以一键生成摘要、自动翻译,学术人必备!

4、中国科普博览:www.kepu.net.cn
是中科院精心打造的科普平台,汇聚了众多顶尖科学家的智慧结晶,涵盖了天文地理、生命健康到数理化等多个领域,如果家里有孩子,必须要存一下。

- 微博 班叔

深度求索开源第二代MoE模型:DeepSeek-V2

DeepSeek-V2没有沿用主流的“类LLaMA的Dense结构”和“类Mistral的Sparse结构”,而是在模型架构方面作了如下创新:
- 在注意力方面,设计了 MLA(Multi-head Latent Attention,多头潜注意力),它利用低级 key-value 联合压缩来消除推理时 key-value 缓存的瓶颈,从而支持高效推理;
- 前馈网络(FFN)采用了 DeepSeekMoE 架构,这是一种高性能的 MoE 架构,能以更低的成本训练出更强大的模型。

官方表示,据不严谨估计,DeepSeek-V2 以 236B 总参数、21B 激活,大致达到70B~110B Dense 的模型能力,同时消耗的显存(KV Cache)只有同级别 Dense 模型的 1/5~1/100,每 token 成本大幅降低。实际部署在 8 卡 H800 机器上,输入吞吐量超过每秒 10 万 tokens,输出超过每秒 5 万 tokens。

定价方面,DeepSeek-V2 API的定价为每百万tokens输入1元、输出2元(32K上下文)。

- 微博 i陆三金

DeepSeek-V2 这个模型确实很强

DeepSeek-V2 这个模型确实很强,尝试了一下我日常的任务都能胜任。

主要是太便宜了,开放平台送的十块钱总共有 500 万 Token 。冲个五十块钱估计够我用好几年。

模型为 MOE 架构总参数 236B 激活参数 21B,开源版本上下文 128K,API 上下文 32K 。

在8卡H800机器上,输出吞吐量超过每秒 5 万 Token。

- 微博 歸藏的AI工具箱

媒体观察

人形机器人全球竞赛提速

随着特斯拉的加入,人形机器人产业的竞赛明显提速。5月5日,特斯拉Optimus人形机器人公布最新进展——已在一家工厂部署数台机器人,通过完成4680电池的分拣等工作来进行测试;行走速度较去年底提高30%以上,目前约为0.6米/秒;甚至能在工作中纠正自己的错误。Optimus的进展可谓当下全球人形机器人竞赛的一个缩影。

业界普遍认为,2024年将是具身智能的发展元年。具身智能是指一种基于物理身体进行感知和行动的智能系统,其通过智能体与环境的交互获取信息、理解问题、做出决策并实现行动,从而产生智能行为和适应性。人形机器人便是具身智能的代表产品。据工业和信息化部赛迪研究院数据显示,2026年中国人形机器人产业规模将突破200亿元。2024和2025年人形机器人产业将持续高速增长。

澎湃新闻

斯坦福20亿参数端测多模态AI Agent模型大升级,手机汽车机器人都能用

NEXA AI团队发布下一代多模态AI Agent模型Octopus V3,展现进一步突破:具有图像处理和多语言文本处理能力,为智能手机等端侧设备真正走向AI时代铺平了道路。Octopus V3不仅拥有多模态能力,在函数调用性能上远超同类模型,可媲美GPT-4V+GPT4;而且模型参数量不到10亿,具有多语言能力。

也就是说,相比传统的大型语言模型,它体积更小,能耗更低,能够更加轻松地在各种小型端设备上运行,比如树莓派,并做到高速且准确的函数调用。

这意味着,未来AI Agent能够广泛应用于智能手机、AR/VR、机器人、智能汽车等端侧设备,为用户交互体验更加流畅、智能。

另一方面,由于V3具有多模态处理能力,可同时处理文本和图像输入,再加上多语言能力,也将让用户体验更加丰富。

- 量子位

苹果手机销量跌出前五 iPad要为AI“练兵”?

实际上,苹果近年来在AI上的准备也较为充足,不过如何在产品上落地尚未可知,预计苹果今晚发行的新一代iPad,将搭载M4芯片,或许是其产品AI化的一次预演。

M4芯片之所以备受关注,主要因为其处理器将搭载全新的神经引擎,这几乎是为AI能力量身定做,算力相较上一代M3提升10%—15%,神经网络引擎主要负责机器学习部分,例如面容解锁、图像处理等,而搭载M4芯片的产品将在这些应用上大幅提升执行效率。

包括Wedbush在内的多家机构分析指出,M4芯片原计划在2025年才被应用,如今其上市时间提前,也意味着苹果在AI上的脚步有所加快。苹果有意让新款iPad成为真正由AI驱动的硬件,若新一代iPad能在办公、娱乐应用方面开辟出新的面貌,下一步苹果或许将AI成果移植到Mac电脑上,甚至在未来几年中,让Mac扮演更重要的角色,以挽救iPhone销量下滑带来的损失。

此前苹果已经发布了自研的OpenELM模型,包含了2.7亿、4.5亿、11亿和30亿四个参数版本,与微软刚刚开源的Phi-3较为相似。值得注意的是,OpenELM专为终端硬件设计,而并非像ChatGPT那样的开源大模型,换言之苹果选择了以“小模型”加入AI生态。

北京商报


今日推荐

开源项目

Microsoft/pyright

https://github.com/Microsoft/pyright

Pyright 是微软开发的一个 Python 代码类型检查工具。Pyright 的速度是 mypy 的 5 倍以上。Pyright 使用 TypeScript 开发,无需 Python 环境支持。

每日一博

高速服务框架 HSF 的基本原理

随着业务的不断发展,承载不同业务的应用数量以及单个应用下的服务数量都急剧膨胀,对于服务的管理变得愈发重要,在 RPC 框架刚开始使用的时候,可能只有几个应用,几十个服务,如果规模扩充到上万应用,几十万个服务,RPC 调用反而不是重头戏,而重要的是如何能高效的组织这些服务。


事件点评

全国首例 “AI 外挂” 案一审公开宣判

5 月 6 日下午,江西省鹰潭市余江区人民法院公开宣判全国首例 “AI 外挂” 案,对被告人王某合以提供侵入、非法控制计算机信息系统程序、工具罪判处有期徒刑三年,缓刑五年,并处罚金;已退缴的违法所得及扣押的作案工具予以没收,上缴国库;剩余未退缴的个人违法所得继续追缴。宣判后,被告人王某合表示服从判决,不上诉。

点评

这个判决再次强调了技术开发者在开发和销售软件产品时,必须遵守法律法规的重要性。任何侵入或非法控制计算机信息系统的行为,都将受到法律的严厉制裁。AI外挂通过未经授权获取游戏数据和修改鼠标指令,破坏了游戏的公平性。这不仅损害了其他玩家的权益,也对游戏公司的商业利益造成了影响。、

作为技术人员,不仅要追求技术的进步,还要考虑技术的伦理问题。这个案例也提醒我们,法律教育在技术领域的重要性。许多技术人员可能对法律规定和责任认识不足,因此加强法律教育,提高技术人员的法律意识,是非常必要的。

总的来说,这个判决对于整个IT行业都有着深远的影响,它提醒我们在追求技术创新的同时,也要尊重法律,尊重他人的权益。希望这个案例能引起大家的深思,让我们共同努力,创造一个更公平、更安全、更有道德的数字世界。

微软将推出 MAI-1 模型以挑战谷歌和 OpenAI

The Information 援引内部人士消息称,微软正准备推出一个大型语言模型,其规模足以与谷歌、Anthropic 和 OpenAl 的先进模型相抗衡。

此次发布将标志着微软自斥资 100 多亿美元收购 OpenAI 以来,首次在内部开发如此大规模的人工智能模型。

这一新模型在内部被称为 MAI-1,预计最早将于本月首次亮相。MAI-1 包含 5000 亿个参数,这表明它可以被定位为 GPT-3 和 ChatGPT-4 之间的中端选择。这样的配置可以让模型提供较高的响应精度,但使用的功率却大大低于 OpenAI 的旗舰 LLM。

点评

MAI-1 的推出标志着微软在人工智能领域的重大进展,表明人工智能领域的竞争正在加剧,尤其是在大型语言模型领域。

微软此举或将促使谷歌和 OpenAI 等竞争者加速其技术研发,增加在人工智能研发上的投资,以及在产品多样化和创新方面做出更多努力。为了保持在市场上的竞争优势,谷歌和 OpenAI 可能需要调整其市场策略,例如推出新产品或增强现有产品。同时寻求与更多合作伙伴建立合作关系,以增强其市场地位。

而微软在人工智能模型的商业化方面展现的积极态度,也可能为该公司带来新的商业机会和收入来源。然而随着人工智能技术的发展,监管和伦理考量变得越来越重要。微软在开发 MAI-1 时可能需要考虑这些因素,以确保其技术的负责任和可持续发展。

中法关于人工智能和全球治理的联合声明

中华人民共和国和法兰西共和国发布关于人工智能和全球治理的联合声明。

点评

中华人民共和国和法兰西共和国发布的关于人工智能和全球治理的联合声明,标志着两国在人工智能领域合作的重要里程碑,同时也映射出多个关键现象:

  1. 国际合作与全球挑战:声明强调了两国元首深信持续对话对于为全球挑战提供持久解决方案的重要性,这体现了国际合作在应对全球性挑战中的关键作用。

  2. 人工智能发展与安全:声明中提到,中法两国认识到人工智能在发展与创新中的关键作用,同时认识到人工智能发展可能带来的挑战,强调促进人工智能的开发与安全,推动适当的国际治理至关重要。

  3. 全球治理的必要性:声明指出,中法两国致力于采取有效措施应对人工智能技术带来的风险,并加强人工智能的全球治理,以促进服务于公共利益的开发和利用。

  4. 人权与伦理考量:声明中提到,为了充分利用人工智能带来的机遇,中法两国致力于深化关于人工智能国际治理模式的讨论,这一治理应顾及技术快速发展的灵活性,同时保护个人数据和用户权利。

  5. 国际合作的加强:声明强调,人工智能的机遇、风险和挑战本质上是全球性的,因此,加强国际合作以确保国际安全与稳定以及尊重主权和基本权利具有重要意义。

  6. 可持续发展与公共利益:声明中提到,人工智能必须为公共利益服务,各国开发和使用人工智能必须符合《联合国宪章》的宗旨和原则,这反映了人工智能技术在可持续发展中的重要作用。

  7. 文化多样性的尊重:考虑到人工智能技术的发展对尊重和保护文化和语言多样性的挑战,声明主张人工智能必须为所有人提供包容性接入,尊重多种语言和文化多样性。

  8. 工作与劳动者权益:声明指出,人工智能的广泛应用将给工作带来深远的变化,中法两国正批判性思考人工智能对未来工作的影响,以期抓住技术突破的全部潜力,防范其对工作和劳动者造成的风险。


开源之声

媒体观点

美科技股大涨,马斯克喊话巴菲特“买一点特斯拉股票”

当地时间周一,埃隆·马斯克邀请亿万富翁投资者沃伦·巴菲特投资特斯拉。这一邀请是在社交媒体上对一名用户评论的回复中提出的,该用户建议巴菲特出售其在苹果公司的股份,转而购买特斯拉的股票。马斯克对此进行了肯定的回复,并认为这对巴菲特来说是一个“显而易见的举动”。

证券时报

谁是中国版Sora

“面对Sora带来的挑战,不妨让子弹再飞一会儿。”两个多月前,OpenAI又一记深水炸弹,以文生视频大模型Sora引爆全球,当时谈及国内外文生视频大模型的差距,伽利略资本合伙人郑譞作出了这样一句评价。两个多月后,“预言”应验。先是生数科技联合清华大学发布了视频大模型Vidu,一度被外界形容为中国首个Sora级视频大模型,近日,亦有媒体报道称,智谱AI也正研发对标Sora的国产文生视频模型,最快年内发布。随着企业竞相入局,国内文生视频大模型明显进入加速阶段。但就像郑譞说的,Sora的出现并非技术上的突破,而在工程方面,国产大模型的差距其实并没有多远,“从本质上讲,场景或许是比工程突破更值得思考的一件事”。

北京商报

AI数字化身,正在取代时尚、医疗圈的打工人

面向汹涌而来的AI技术革命,越来越多企业开始探索用AI降本增效的新方式,许多行业的打工人也开始产生被端掉饭碗的危机感。

目前AI距离替代专业人员还很遥远,但它已经在解决一些行业的棘手实际问题上起到积极的影响。这在前文提及的三个案例中可见一斑,AI技术正逐渐渗透到时尚、商家、医疗健康等行业,通过打造AI数字孪生,在模特试装、焦点小组、临床试验等具体任务上起到辅助人类工作的作用。

- 智东西

 

观澜亭|开闭源之争,到底在争什么?

大模型的开闭源之争实质上是对于技术进步与安全保障、社会价值与经济效益之间平衡点的探索与博弈。

- 大众日报

用户观点

别人的17岁:自创开源编程语言作为成人礼;你的17岁:看封面图

  • 观点 1:一个被现实抹去棱角的成年人去指责一个锋芒毕露的未成年人,并没有什么值得骄傲的。尽管最终都会变成一个圆滑世故的人,但他的17岁确实比很多同龄人精彩
  • 观点 2:领导面前唯唯诺诺像条狗, 后生面前咋咋呼呼装大爷。 横批:既无能又无德
  • 观点 3:我17岁的时候就已经开始尝试粘合一个破碎的家了,年纪轻轻就开始做家庭顶梁柱,虽然有些累但是很自豪。但这样也不及同龄人能独自创作出一门语言的能力
  • 观点 4:华为抓紧签合同招进去啊,年轻的时候写写底层,写不动了加入营销团队,遥遥领先啊
  • 观点 5:有些人只是不想承认别人在自己这个年纪做到了自己做不到的事情罢了,要我现在优化一门语言的一些语言特性也无从下手
  • 观点 6:b站那个怼人的还只有15岁,年轻人开始崭露锋芒了
  • 观点 7:这个key语言我在b站刷到过,评论区有官网链接,但好像官网蹦掉了,看见up主是个高中生,备站高考,就没去打扰[捂脸]。这会在公众号里刷到,果然世界是一个很小的圈
  • 观点 8:这代码质量,让我想起了我高中时期用opengl和cpp写的图形库,也是just run,segment fault那是家常便饭。然后,我现在连这种质量的代码也写不出来了。
  • 观点 9:无论如何,对小白也好,对哪些小有成绩急着分享的新人也好,老油条应该保持耐心,做不到最起码可以闭嘴。去攻击他们,并不会显得老油条多么高明,反而让人觉得油腻
  • 观点 10:17 岁能做到这个已经很不错了,代码稚嫩很正常,一帮学了一堆框架,按部就班在搭好的架子里填空的看不起年轻人也是思路清奇。
  • 观点 11:赋值皆复制开销会不会有点大啊

RustDesk 由于诈骗猖獗,暂停国内服务

  • 观点 1:两个字,无奈
  • 观点 2:老人挺聪明的,还会自己安装rustdesk,就是有点笨,上当受骗了。
    • 观点 3:对方冒充*,一步步指挥老人操作的,和笨无关啊,只能说护家人心切
    • 观点 4:对,冒充公检法,而且以孩子牢狱之灾作威胁,一般老人很难抵挡。而且对方掌握家庭所有信息,隐私问题才是根源
  • 观点 5:我觉得老年模式限制安装app才是解决办法。年轻人也应该积极把老年人的手机切换成老年模式。
  • 观点 6:希望被诈骗的人能越来越少吧

Java 17 是最常用的 Java LTS 版本

  • 观点 1:国内老项目还是万年Java8
  • 观点 2:Eclipse Adoptium可不是“后起之秀”,前身是AdoptOpenJDK,2017年就开始运营了。Eclipse Adoptium是OpenJDK阵营的首选,Amazon Corretto毕竟还是商业公司运营。
  • 观点 3:越过17直接21,虚拟线程太香了
  • 观点 4:我司项目还是Java 6 和 Java 7的呢
  • 观点 5:我们已经升了一些java8项目到java17了,还有一些存量项目没升。

Mybatis 系列替代者,融合 JPA 和直观 sql 的 sqltoy-orm 5.6.5 发版

  • 观点 1:越来越强大了,非常好用,完全从mybatis转换到sqltoy了
  • 观点 2:要不试试jimmer,写法更直观
    • 观点 3:哈哈,跟jooq和fluent、easyquery一个性质的,复杂查询,个人推荐直接sql
  • 观点 4:强,复杂查询 还是sqltoy这种模式更直观舒服,作者多推广推广,让更多人了解使用起来
  • 观点 5:搞替代品的就没见几个成功了的!更何况是对着开源项目搞替代品
    • 观点 6:哈哈,sqltoy可不是对着mybatis搞替代,起始于2008年,想表达的是用创新思维让大家在orm领域有更好的体验,而非总是mybatis、mybatis,多了解真正好的框架是什么样的!

AlmaLinux 9.4 发布,CentOS 最佳替代方案之一

  • 观点 1:发布的比rockylinux快
  • 观点 2:可以把“之一“去掉

---END---

最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!

展开阅读全文
点击加入讨论🔥(1) 发布并加入讨论🔥
1 评论
4 收藏
分享
返回顶部
顶部