开源日报 | 开源模型击败GPT-4 Turbo;Python考虑更改版本编号;开源大模型食用指南;你喜欢计算机/编程吗?

来源: OSCHINA
编辑:
2024-06-19 20:05:00

欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。

# 2024.6.19

今日要闻

彭博社:华为与腾讯接近达成协议,不向微信“抽成”

彭博社今日报道称:华为与腾讯即将达成协议,将免除微信的收入分成 (Revenue Sharing)。

via https://www.bloomberg.com

据知情人士透露,经过为期数月的谈判,双方接近达成协议。华为将同意不对微信中的应用内交易收取任何费用。知情人士还表示,作为交换,腾讯将持续维护和更新微信应用。

DeepSeek Coder V2 发布,首个击败 GPT-4 Turbo 的开源模型

DeepSeek-Coder-V2 已正式上线和开源,沿用 DeepSeek-V2 的模型结构,总参数 236B,激活 21B,在代码、数学的多个榜单上位居全球第二,介于最强闭源模型 GPT-4o 和 GPT-4-Turbo 之间。在 API 服务方面,DeepSeek-Coder-V2 API 支持 32K 上下文,价格和 DeepSeek-V2 一致:

 

Python 考虑更改版本编号,使用“日历”方式

一位 Python 核心维护者正在游说更改 Python 编程语言的版本发布编号方式。

Hugo van Kemenade 将担任即将发布的 Python 3.14 和 3.15 版本的发布经理,他撰写了提案 PEP 2026,即 “Python 的日历版本控制”,以确定所有未来版本的编号方式。

简而言之,此提案建议 Python 版本将编号为 3.YY.micro,其中:

  • 3 是主版本号 - 始终为 3。
  • YY 是次要版本号 - 是短年份号:{年份} - 2000。
  • micro 是微版本号 - 每次进行错误修复或安全版本发布时都会递增。

他指出,永远不会有 Python 4。“Python 3” 将成为未来的品牌。因此,Python 3.15 实际上将是 3.26,“26” 代表发布年份(“2026”)。

首个跨平台的通用 Linux 端间互联组件 Klink 在 openKylin 开源

Klink 是由 openKylin 社区 Connectivity SIG 星光麒麟团队于 2021 年开始打造的端间互联组件,解耦了软总线模块对多系统平台的应用,实现了对跨平台软总线协议的兼容,包括鸿蒙软总线 4.x 协议等,使包括 openKylin 开源操作系统、银河麒麟桌面操作系统等在内的各种主流 Linux 发行版皆可跨平台互联互通,大幅扩展了生态边界。其基本架构如下图所示:


今日观察

社交观察

中国已成为科学超级大国了吗?《经济学人》说:是的

尽管“中国科学的崛起是把双刃剑”的提法在西方不绝于耳,但中西方科学家的普遍共识是:科学合作必须继续,最好还能进一步加强。尽管中国的科学产出大幅增长,但与国际合作者合作的比例一直稳定在20%左右——相比之下,西方科学家往往有更多的国际合作。

- 微信 知识分子

《开源大模型食用指南》

《开源大模型食用指南》基于Linux环境快速部署开源大模型,更适合中国宝宝的部署教程。
 
本项目是一个围绕开源大模型、针对国内初学者、基于 AutoDL 平台的中国宝宝专属大模型教程,针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全流程指导,简化开源大模型的部署、使用和应用流程,让更多的普通学生、研究者更好地使用开源大模型,帮助开源、自由的大模型更快融入到普通学习者的生活中。

- 微博 蚁工厂

OpenAI 新董事会成员——退役的美军将军

OpenAI 新董事会成员——退役的美军将军,也是美国前国家安全局局长保罗·中曾根。

OpenAI 近期有安全研究员离职,并解散了部分安全团队,此前 OpenAI 一直因为训练模型的数据的不透明而受到广泛的批评。他曾经领导过美国军方的网络安全部门。这一任命受到了爱德华·斯诺登(棱镜计划揭露人)的强烈反对,他警告不要信任 OpenAI 及其产品,称这是"蓄意背叛全人类权利"。

- 微博 林亦LYi

从爱好角度谈一下。“你喜欢计算机/编程吗?”

怎么才算喜欢呢?
喜欢计算机,那么一般你可以在计算机相关的内容上投入大量时间而又不觉得痛苦
你喜欢动手折腾而不是照着简单的照着书本敲代码,你会想深入的了解每一个参数是什么意思,改了会有什么结果
你在解决计算机相关的问题上可能会以"用钱弥补技术不足"为耻
遇到计算机相关的问题,你不是搜个回答解决就完了,你还会兴奋的去找为什么这样就可以解决,顺便就学了很多新知识
如果你是这样的,那报计算机专业简直太合适了。

- 微博 蚁工厂

Open-Sora:GitHub 上全面开源的首个类 Sora 架构生成模型

最近,AI 生成视频的热度极其火爆,作为 GitHub 上全面开源的首个类 Sora 架构生成模型,「Open-Sora」取得了重大突破!

潞晨 Open-Sora 团队在 720p 高清文生视频的质量和生成时长上实现了突破性的改进。现在支持无缝生成任意风格的高质量短片。无论是自然风景、人物肖像,生动动画还是电影大片,皆能胜任。

GitHub:github.com/hpcaitech/Open-Sora

- 微博 GitHubDaily

解决大模型数学运算问题的方法

今天和商汤的朋友吃饭,聊到了解决大模型数学运算问题的方法,在可约计算的结构中,如何计算不可约问题?包括插件、知识图谱&这下面这个类似做法的构想。巧合的是人家已经Paper发布出来了,最卷的行业,一日千里。

https://arxiv.org/abs/2406.07394

- 微博 coolc-有趣的灵魂

媒体观察

市值狂飙,3.34万亿美元!英伟达一举超越微软、苹果,登顶“世界股王” !分析师看好上攻5万亿美元

美股周二,全球资本市场迎来了关键里程碑事件:在过去十年股价上涨300倍后,AI龙头英伟达(NVDA.O)终于登上“全球股王”的宝座。另据第一财经报道,英伟达股价过去一年飙升超过200%,但最乐观的一位分析师认为这家半导体巨头的行情还没有走到头,预计其市值来年将攀向近5万亿美元。

- 每日经济新闻

对话李开复:大模型公司的灵魂考验是什么?

在李开复看来,“让通用人工智能普惠各地,人人受益”,一直是他的初心。“我不认为我的利益或名声有多重要,我的股票10年内也不会卖。我不是为了出名而做这件事情,我的初心是纯粹的。(除了AI)没有什么更能让我把生活跟工作、快乐跟成就结合在一起。”李开复总结道。

- 中国企业家

成立不到一年,估值超10亿美元!日本大模型独角兽SakanaAI到底长什么样?

日本生成式AI初创公司SakanaAI即将获得一笔新的重大投资,本月底之前筹集约200亿日元资金(约1.27亿美元),这将使该公司估值达到1800亿日元(约11.42亿美元)。

这是日本独角兽中增长最快的,至此它成立还不到一年。

- 乌鸦智能说

前百度高管景鲲在美国创立的AI搜索公司获4.35亿首轮融资,最新估值近19亿

百度集团副总裁,原小度科技CEO景鲲(Eric Jing)联合创立的 AI 创新产品公司MainFunc宣布完成首个6000万美元(约合4.35亿元人民币)种子轮融资,由新加坡基金Lanchi Ventures领投,公司估值为2.6亿美元(约合18.87亿元)。

- 钛媒体App

中汽协付炳锋:建设智能网联汽车自主可控的开源操作系统

他坦言当前中国智能网联汽车发展一片繁荣,但目前中国汽车基础软件的开发,都是建立在国外的现成的开发系统上,这些软件的诞生场景和应用领域不同于当今的汽车产业的要求,对于应用领域的创新空间有一定的制约;在产业链、供应链安全和信息安全方面存在不确定性,尤其是与硬件芯片协同融合的风险更大。

- 贝壳财经

下一个十年,我们需要怎样的科技公司?

然而,随着人工智能时代的到来,我们对科技公司的需求也在发生着深刻的变化。AI时代的科技公司,需要更加深入地理解人类,更加全面地服务于人类。它们需要通过人工智能技术,全面打破和重塑人类的生活方式。科技公司成为人类智慧的放大器,通过AI技术提升人类的决策能力、创造力和生活质量。它们需要成为社会进步的推动者,通过技术创新解决复杂的社会问题,推动可持续发展。

- 硅星人Pro

重庆市经信委傅晓:加快培育开源软件生态,推动集群发展

当前,开源已覆盖软件开发的全域场景,重塑软件发展新生态,开源软件已成为软件产业创新源泉和“标准件库”;开源将生产模式从个体、集中、封闭转向众研、众创、众用,加速软件迭代升级,促进产用协同创新,推动产业生态完善,成为全球软件技术和产业创新的主导模式。

- 新京报

10万月薪招人,百亿大佬进军大模型

仅用一年时间,梁文锋另起的这座山头,已有AI小巨头之势。单论算力,有市场分析指出,国内手握1万枚GPU的企业,仅6家,除了BAT、商汤、字节,就是幻方。

- 21世纪商业评论

今日推荐

开源项目

srwi/EverythingToolbar

https://github.com/srwi/EverythingToolbar

EverythingToolbar 是由 Everything 提供支持的 Windows 任务栏的即时文件搜索集成,可以替换操作系统任务栏上的 Windows 搜索,使 Windows 上的文件搜索更快、更可靠。

每日一博

大众点评内容搜索算法优化的探索与实践

本文整理自美团技术沙龙第 80 期《美团内容智能分发的算法实践》,分享内容主要包括三部分。第一部分介绍了大众点评内容搜索的场景特点以及面临的挑战;第二部分介绍了为应对这些困难和挑战,技术团队在链路各环节上做的实践优化,包括内容消费和搜索满意度的优化等等;第三部分是总结和对未来的展望。


开源之声

用户观点

华为高管:昇腾AI算力性能已超美国英伟达A100

  • 观点:1:首先,CUDA才是英伟达的护城河,其次英伟达是卖显卡的,它恨不得显卡库供不应求,谁会囤那么多自家的显卡跟竞争对手比算力?华为算力遥遥领先的原因是不是卖不出,只能左手倒右手内部消化,表面上销量很高,其实大头卖给华为云
    • 观点 2:你那来的数据?你强调英伟达是卖显卡,是想表达什么?是觉得专业人士不知道你来科普吗?说内消耗你更搞笑,美国科技封锁,英伟达只能提供性能阉割了再阉割的版本,但价格跟完整版一样,华为这个跟英伟达性能差不多,价格更是只有英伟达的几分之一,你觉得国内厂商是人傻钱多吗?
    • 观点 3:卖不出去,那为什么我们的910和300订单排到9月
    • 观点 4:那又怎样?赶不上,嘲笑,赶上了,还是嘲笑?!
  • 观点 5:说的也没毛病,昇腾大集群(可能百卡/千卡)才能超过一张A100。
  • 观点 6:说了算力,唯独没说能耗
  • 观点 7:CUDA确实是个很重要的因素,其次还有价格。
  • 观点 8:你这集群超过别人单张卡 有啥可吹的哦 集群堆料没啥技术含量的
  • 观点 9:910b的fp16峰值320tflops,int8峰值640tops,功耗310w。a100的fp16峰值312tflops,int8峰值624tops,功耗400w。真正的正面强敌是nv的h和b系列,任重道远,一步步来

首个 AI 高考全卷评测结果发布

  • 观点 1:语文怎么阅卷?
  • 观点 2:现在大模型哪个数学最强?
  • 观点 3:达到了大专水准
  • 观点 4:这分数,再加个理综,能上二本线吗?

合格程序员不会写出诸如「摧毁地球」这样的程序......

  • 观点 1:Javaer 就不一样了,要先创建一个摧毁工厂,然后拿到一个摧毁星体工厂,拿到一个摧毁行星工厂,然后把地球传进去
    • 观点 2:Java是这样的,面向过程只需要把逻辑写清楚就行了,Java要考虑的事情就多了
  • 观点 3:设计代码要考虑后续运维监控,摧毁地球执行后,有回滚和备份方案吗?
    • 观点 4:有没有做过安全扫描?有没有未授权访问漏洞?会不会越权访问?有没有SQL注入?
  • 观点 5:这是在说类吗?没没,不累,还可以再干
  • 观点 6:一个经典的面向对象编程的冷笑话
  • 观点 7:难道不是应该是底层一个摧毁函数,然后封装出摧毁行星?
  • 观点 8:import star_wars as sw sw.death_star.evaporate(target_planet_name)
  • 观点 9:其他行星:那你这测试样例数据量挺大啊
  • 观点 10:一群测试把一坨屎当参数传过去,看地球有没有被摧毁
  • 观点 11:科幻迷程序员:把 death star 对准了地球
  • 观点 12:某个姓罗的普通程序员写出“向宇宙广播三体坐标”函数,也有同样的效果
  • 观点 13:单线程摧毁还是多线程? 有没有可能多个线程同时争夺某个摧毁任务? 摧毁超时该如何处理?

---END---

最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!

展开阅读全文
点击引领话题📣 发布并加入讨论🔥
0 评论
1 收藏
分享
返回顶部
顶部