开源日报 | 马斯克给英伟达打工;扎克伯格因为AI开源又火了;横向对比各家LLM的长上下文;将.NET移植到任天堂NES;“腾讯元宝”

来源: OSCHINA
编辑:
2024-05-30 19:34:00

欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。

# 2024.5.30

今日要点

最强开源编程大模型一夜易主 —— Mistral AI 发布 Codestral

Mistral 发布了新的编程大模型  Codestral,并开源模型参数权重。据称 Codestral 在代码基准测试中显著优于 Llama3 70B 等大模型。

Codestral 在 80 多种编程语言的不同数据集上进行了训练,其中包括最流行的语言,如 Python、Java、C、C++、JavaScript 和 Bash。对于不那么主流的语言比如 Swift 和 Fortran 同样表现出色。这种广泛的语言基础确保 Codestral 可以在各种编码环境和项目中为开发者提供帮助。

谷歌搜索 API 文档被意外发布到 GitHub:2500 多页、揭开搜索排名内幕

谷歌今年 3 月 27 日不小心将其部分内部 API 文档发布到 GitHub 上,直到 5 月 7 日才被删除。这些内部文件披露了 Google 搜索引擎相关的敏感信息。

俄罗斯考虑向使用外国软件的公司收费

俄罗斯政府考虑对使用外国软件的本土企业收取费用,因为莫斯科正寻求减少对外国技术的依赖并加强本国技术。

腾讯混元推出大模型应用:“腾讯元宝”

腾讯混元全面升级,推出大模型APP「腾讯元宝」。其核心竞争力是腾讯的生态。在 AI 搜索方面,腾讯元宝接入了微信搜一搜、搜狗搜索等搜索引擎,并通过 AI 搜索增强,提升时新类和知识类问题效果。内容覆盖微信公众号等腾讯生态内容及互联网权威信源。

微软工程师将 .NET 移植到任天堂 NES

Jonathan Peppers 是微软 .NET for Android /.NET MAUI 团队的首席软件工程师。近日他在微软 Build 2024 开发者大会上分享了一个有趣的主题 —— 在任天堂 NES 游戏机上运行 .NET,演示了 C# 程序在 1985 年的游戏机上运行的效果(游戏机采用 6502 微处理器)。


今日观察

社交观察

日本尖端半导体技术中心

仔细研究了一下这个Japan's Leading-edge Semiconductor Technology Center (LSTC):日本尖端半导体技术中心,这就是日本国家半导体研究院(等同中科院的地位), 这是代表国家选择了RISC-V(也选择了Tenstorrent)。

- 微博 WinnieS的微博

2024.5横向对比各家LLM的Long Context(128k篇)

本文构造了一个比大海捞针稍难的长上下文测试方案,并对比了目前支持128k以上的上下文的闭源API LLM模型。

仅从这个很狭隘的测试来看,海外头部三家厂商在长上下文上还是领先于国内的。

本文的测试代码框架已经开源,方便大家测试其他数据。

本文没有得到任何厂商赞助,累计花了2700 RMB充值各家平台。我也是有点测不起了。

- 微信 孔某人的低维认知

从GPT4o谈谈接下来多模态推理小高潮对AI基础设施的需求

随着GPT4o for iPhone 以及Google Project Astra for Android, 大模型推理业务将逐渐进入一个小高潮,再伴随着国内各个大模型厂商逐渐开启的价格战,有些厂商开始谈模型不能看价格要看疗效,又有些厂商没融到几个钱的忽悠说大家不要补贴, 还有给大模型刷火箭的, 但是又有多少人想到免费背后实际上获得的数据价值呢?为了应对九月出现的推理需求激增, 模型和基础设施要做些什么应对? 

- 微信 zartbot

“大模价格战” 胜利者将花落谁家?

想“玩”大模型,除了需要有技术实力做支撑,另一方面,高昂的算力成本和服务器养护成本,也不是一家公司轻易能承担的,而诸如百度、阿里等巨头企业,则具有先天优势。不过,做出ChatGPT的不是谷歌,也不是亚马逊,掀起短视频“龙卷风”的不是阿里,也不是腾讯,这场大模型之战的胜利将花落谁家,现在还言之尚早。

- 微信 GPLP

Ren'Py:从入门到入坟

Ren'Py视觉小说引擎是一款开放源代码的自由软件引擎,用来创作通过电脑叙述故事的视觉小说/游戏。

身为Python的忠坚用户兼开发者之一,Ren'Py于我而言毫无疑问是极具魅力的。在初识Ren'Py时我就被其易于上手、跨平台性强等特点深深吸引,它无疑是我心目中最适合用以制作视觉小说或是Galgame的一个强大实用的开源游戏引擎。

- 微博 蚁工厂

媒体观察

AI开源让扎克伯格再次成为硅谷红人

扎克伯格因为AI开源在硅谷又火了——扎克伯格让AI模型开源,这与谷歌、OpenAI等公司的做法大相径庭。

1.扎克伯格让AI模型开源,这与谷歌、OpenAI等公司的做法大相径庭。

2.尽管扎克伯格仍在应对许多Meta问题,但工程师、程序员、技术专家都支持他的开源立场。

3.Stripe CEO对扎克伯格说,开源LLaMA是脸书在科技界做过的最受欢迎的事。

4.杨立昆等Meta专家推动了扎克伯格开源,认为这么做对公司有利。

- 凤凰科技

南开大学这门课程作业,为啥能冲上B站最热榜单

日前,“南开大学C++作业有多强”这一话题冲上B站最热榜单第三名。这是南开大学工科试验班(信息科学与技术)学生的一门大类基础课程——《高级程序语言设计》作业。课程负责人、南开大学计算机和网络空间安全学院教授刘晓光觉得,这项应时代之变而设计的作业达到了预期的效果。

刘晓光告诉记者,这门课程,从大一就开始培养学生开源合作的精神,要求作业的源码、资料以及开发说明都需上传至Gitee或者GitHub上。

- 中国青年报

马斯克也给英伟达打工了

5月27日,马斯克宣布:其创办的大模型公司“xAI”完成了60亿美元的B轮融资,市场估值达到240亿美元——这已是目前OpenAI约800亿美元估值的三分之一。

能一夜之间为xAI拉满血条,除了马斯克身上的创业光环,还有他自信能稳定地获取英伟达的芯片。

5月,在社交媒体“X”(此前名为Twitter)的路演活动上,马斯克对投资者宣布:xAI目前正在约2万颗英伟达H100芯片上,训练自家大模型Grok 2.0。未来,他要建造一座“计算超级工厂”,用10万颗英伟达H100 GPU芯片,训练Grok 3.0。

在这位全世界最任性,创业也最不计成本的老板支持下,成立虽不满一年,xAI一夜便挺进到了巨头行列,变身为全球AI第二大独角兽。

- 市界

武汉加速建设中国软件名城

记者从武汉市政府新闻办30日举办的新闻发布会上获悉,武汉正做大做强软件产业,加速建设“中国软件名城”。据武汉市经信局数据,2023年,武汉市软件业实现平稳较快增长,实现软件业务收入3023.8亿元,同比增长20.1%。利润总额保持较快增长,全市各类软件园展现集聚效应。

- 中国新闻网

天工大模型:中国AI搜索巨头如何一骑绝尘?

早在2023年8月,昆仑万维推出了国内第一个AI搜索引擎——天工AI搜索,成为国内AI搜索领域的领跑者。

随后百度、360、搜狗、秘塔等纷纷入局。此外,谷歌在2024年I/O开发者大会上展现的很多技术,诸如AI搜索、多模态搜索、图文并茂等功能,天工也早已具备。

一个月之前,在「天工」大模型发布一周年之际,昆仑万维果断推出「天工3.0」和「天工SkyMusic」公测,展现出其独特的战略眼光和坚定的决心。

那么,天工大模型在这一年里究竟经历了哪些蜕变?随着AI技术的飞速发展和市场的不断扩张,其战略布局又是如何谋划?更重要的是,其在大模型时代所秉持的先进理念和独特洞察,又将如何引领行业风向?这一切,都值得深入探究。

- 创业最前线


今日推荐

开源项目

opengoofy/hippo4j

https://gitee.com/opengoofy/hippo4j

hippo4j 通过对 JDK ThreadPoolExecutor 线程池增强,以及扩展三方框架底层线程池等功能,为业务系统提高线上运行保障能力。

每日一博

分布式任务调度内的 MySQL 分页查询优化

本文主要通过图示介绍了用主键进行分片查询的过程,介绍了主键分页查询存在 SQL 性能问题,如何去创建高效的索引去优化主键分页查询的 SQL 性能问题

对于数据分布不均如何发现,提供了一些 SQL 查询案例来进行参考,对 MySQL Index Condition Pushdown 优化算法做了一些简单介绍。


事件点评

为了不被卡脖子——俄罗斯政府考虑对使用外国软件的本土企业收取费用

塔斯社周二援引俄罗斯数字发展部部长马克苏特 - 沙达耶夫(Maksut Shadaev)的话称,政府考虑对使用外国软件的本土企业收取费用,因为莫斯科正寻求减少对外国技术的依赖并加强本国技术。

点评

俄罗斯政府的这一政策是一个复杂的决策,它涉及到国家的技术自主性、经济发展、国际贸易关系以及创新生态等多个方面。这一政策的实施和效果值得业界和观察家们持续关注。

  1. 技术自主性的推动:俄罗斯政府此举显示出其推动技术自主性和减少对外国技术依赖的决心。这是在全球政治经济紧张局势下,各国政府越来越重视本土技术发展和自主创新的一个例证。

  2. 政策导向的影响:对使用外国软件的企业收费,可以视为一种政策工具,旨在激励本土企业转向使用或开发本国软件,增强国内软件产业的竞争力。

  3. 经济激励与市场反应:虽然经济激励可能会促使一些企业考虑本土软件,但市场反应和企业的实际需求也是决定这一政策效果的关键因素。企业可能会权衡成本、效益和软件性能来做出选择。

  4. 本土软件产业的机遇与挑战:这一政策为俄罗斯本土软件产业提供了发展机遇,但同时也面临挑战,如需要提升产品质量、功能和用户体验,以满足企业用户的需求。

  5. 国际贸易关系的考量:此举可能会加剧国际贸易紧张关系,尤其是在软件和技术领域。其他国家和软件供应商可能会对此政策作出反应,影响国际贸易和合作。

  6. 对企业运营的影响:对使用外国软件的收费政策将直接影响企业的运营成本和决策。企业可能需要重新评估其软件采购策略,并探索更多元化的解决方案。

  7. 对创新的影响:政策的实施可能会对创新产生双重影响。一方面,它可能激励本土创新和技术开发;另一方面,如果过度依赖本土技术而忽视国际合作,可能会限制技术的交流与融合。

  8. 政策实施的细节:目前政策的具体细节尚未明确,如收费标准、实施方式和预期效果等,这些细节将对政策的最终效果产生重要影响。

  9. 国际制裁背景下的应对策略:俄罗斯政府此举在一定程度上是对西方国家制裁的一种应对策略,旨在通过减少对外部技术的依赖来增强国家的韧性。

  10. 全球技术格局的变化:这一事件也反映了全球技术格局正在发生变化,各国政府和企业都在寻求在不断变化的国际环境中保持竞争力和安全性。

微软工程师将 .NET 移植到任天堂 NES

Jonathan Peppers 表示这次尝试将 .NET 移植到 NES 学习到了逆向工程、操作码、MSIL(如何将 MSIL 转换为 6502 程序集)、API 设计、二进制格式和 .NET 开发经验等知识。他表示虽然成功移植不能玩任何游戏,主要是运行 Hello World 和其他简单的演示程序,但该项目依然很酷 —— —— 以及最重要的 “Nerd Flex”。

点评

Jonathan Peppers将.NET移植到NES的项目不仅是一次技术展示,也是对技术可能性的探索和对极客精神的庆祝。这种尝试超越了常规思维,体现了工程师对技术的热爱和对挑战的追求。

将现代的.NET框架与1985年的NES游戏机结合,是一次跨时代技术的有趣融合。这不仅是一种技术成就,也是对过去与现代技术的致敬。NES的硬件资源非常有限,而.NET是一个现代的、功能丰富的框架。成功在NES上运行.NET需要克服极大的技术限制,这本身就是一项技术壮举。

虽然目前该项目主要运行“Hello World”和其他简单演示程序,但它证明了在NES上运行现代编程语言的可行性,为未来可能的技术演示和教育工具奠定了基础。这一项目可能会激发对复古游戏机和游戏文化的兴趣,促进复古游戏社区的复兴和创新。

此类项目可能会启发未来的技术开发,例如在资源受限的环境下运行复杂软件的解决方案,或者在教育和娱乐领域创造新的应用。

谷歌搜索 API 文档被意外发布到 GitHub:2500 多页、揭开搜索排名内幕

本次泄露文档中的部分内容与谷歌公开表态的信息以及 2023 年的美国司法部起诉谷歌的反垄断案件中的证词相矛盾。比如,谷歌曾一再否认使用点击导向的排名机制,否认子域名在排名中被单独考虑,否认收集或考虑域名的年限等等。但泄露文档证实,这些因素都是谷歌搜索引擎排名机制中的一环。

点评

此次事件凸显了保护内部敏感信息安全的重要性。即使是像谷歌这样的科技巨头,也可能面临信息泄露的风险。尽管谷歌一直对搜索算法的具体工作原理保密,但公众和行业分析师经常要求更高的透明度。这次泄露可能会增加对谷歌透明度的压力。

文档的泄露可能会损害谷歌的声誉,尤其是如果它们与谷歌过去对外公开的信息相矛盾。谷歌需要妥善处理这一事件,以维护公众信任。如果泄露的信息被证明包含敏感或受保护的数据,谷歌可能面临法律和合规方面的挑战。

其他搜索引擎提供商可能会利用这次泄露的信息,来改进自己的搜索算法和市场策略。如果泄露的信息被广泛利用,可能会影响谷歌搜索结果的质量和相关性,进而影响其广告业务和收入。

这次事件可能会促使谷歌对其内部信息管理和发布流程进行审查和加强,也可能激发行业对如何更安全地处理和共享敏感技术信息的讨论。


开源之声

媒体观点

降价潮背后:中国产业大模型落地的卡点到底在哪?

在降价潮把大模型拉回C位的如今,我们更应该审视的是在大模型进入中国一年后的当下,在技术、参数不再是唯一标准的如今,中国产业大模型的卡点如今到底在哪?

- 产业家

黑客已经盯上了大模型!面对AI带来的安全风险,需要“用AI对抗AI

国内的相关数据显示,80%以上的网络安全公司都在将大模型技术集成到网络安全产品中,30%的公司已经开始做大模型安全的研究,也出现了一些安全创业的浪潮。

针对AI技术发展带来的安全风险,中国工程院院士、清华大学智能产业研究院院长张亚勤则建议,从事前沿大模型的企业或机构,要把10-30%的投资投到相关研究或产品的开发。

科创板日报

AI训练数据荒下,合成数据成为“开源”新解法?

在生成式人工智能时代,大模型表现与训练数据质量息息相关。高质量数据模型训练和应用过程中有着不可替代的重要性。高质量数据并非用之不竭的资源。一项来自EpochAlResearch团队的研究就表明,高质量的语言数据存量将在2026年耗尽。

21世纪经济报道

大模型的 5 月:热闹的 30 天和鸿沟边缘

这个 5 月,可能是 ChatGPT 发布至今大模型行业最热闹的时候:OpenAI、Google、微软、字节跳动、阿里巴巴等中美两国公司至少举办了 13 场与大模型相关的发布会,介绍了 10 多款新模型,拿出了一堆新产品。

热闹中的风险与失望是:不少从业者认为技术没有重大进步。

- 晚点LatePost

用户观点

为了不被卡脖子——俄罗斯政府考虑对使用外国软件的本土企业收取费用

  • 观点 1:信创(Russia version)
    • 观点 2:信创可能不好用,可总比没得用,有漏洞可能被恶意利用强
  • 观点 3:也是没办法了,现在不加压力促使这群企业主动做出改变,等到真出事可有好看的。
  • 观点 4:欧美都把软件的售后给断了,这些软件往下用确实问题也很大
  • 观点 5:Linux芬兰产,无国界
    • 观点 6:俄 自己会写,况且他们本身代码都不错
  • 观点 7:不是很懂哈,从商品的角度说,比如我购买了微软的office,实际上是已经收税了吧?如果说是以后购买office比购买WPS多收税的话,我觉得国内也可以推广一下这种规则
  • 观点 8:一堆可笑言论,这不就相当于软件的进口关税吗?上面这些评论,是不是害怕一个从几千米的空中掉下来的水滴砸死?

微软工程师真会整活,将.NET移植到40年前的任天堂NES

  • 观点 1:吃的太饱了
  • 观点 2:果然人类的进步始于无聊
  • 观点 3:这是编程最纯粹的快乐!
  • 观点 4:日系法务部有没有发出最强的通知?
  • 观点 5:其实我现在很难想象当年的程序员是如何在NES上开发游戏的,一个大概的流程可能都失传了吧……
  • 观点 6:你们.net 可真会玩

腾讯牌安卓模拟器,微软都说好!

  • 观点:1:赠品是内奸
  • 观点 2:以后玩模拟器也要付费了,不充个SVIP,好多功能还没法用
  • 观点 3:什么时候在Linux也可以集成? 这样Linux也可以运行Andorid应用,软件生态可以大幅度提升
    • 观点 4:Deepin Linux 有 Android 运行时
  • 观点 5:能不能和HyperV共存呢
    • 观点 6:可以的至少之前的wsl和wsa都可以腾讯应该不至于那么菜
  • 观点 7:其实安卓生态的优势是主要因素,也可以移植到桌面鸿蒙和Linux, Mac 上去,没有任何难度
  • 观点 8:我安卓系统何时可以用windows11模拟器呢?
    • 观点 9:这个目前就别想了,硬件上就不行

---END---

最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!

展开阅读全文
点击引领话题📣 发布并加入讨论🔥
0 评论
0 收藏
分享
返回顶部
顶部