开源日报 | Angular v18;大模型价格战下的推理优化;Mistral AI以开源模型瞄准美国市场;硅谷有自己的鲁迅

来源: OSCHINA
编辑:
2024-05-29 20:03:00

欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。

# 2024.5.29

今日要点

Angular v18 正式发布

《OpenHarmony设备统一互联技术标准》发布

据悉,除了统一物模型,该标准还定义了一系列其他标准,主要包括接入与控制接口、投屏、文件分享、符合性测试规范等标准。接入与控制接口规范从系统架构视角详细定义了设备发现配网、注册登录、安全认证,管理控制等环节的具体流程及接口。投屏和文件分享定义了多媒体设备间文件、视频等数据传输、加密、共享等接口。符合性测试规范对各个规范中技术要求和指标测试方法和步骤进行严格定义,确保标准规范的遵从和一致性。

Greenplum 的 GitHub 仓库"404"

TiDB 8.1 LTS 发版

TiDB 8.1 LTS 通过一系列创新功能,增强了大型集群的稳定性和运维能力,尤其针对应用多租户功能和 SaaS 类型用户场景做了稳定性和性能的多方面增强。

开源Llama3v全新发布:对打GPT4-V,成本500美元

与 GPT-4V 相当的 Llama 3-V 来了。它是一个只用 500 美元成本构建的基于 Llama3 的多模态模型。

在几乎所有指标上,Llama 3-V 的性能与GPT-4V、Gemini Ultra和Claude Opus等规模大100倍的闭源模型相当。唯一的例外是MMMU(多模态记忆任务),Llama 3-V略逊一筹。

Llama3-V 的架构结合了视觉模型和语言模型,由 Llama3 8B 和 siglip-so400m 驱动。

YC投资的开源代码版ChatGPT

Bloop 被视为专注代码的 ChatGPT,在2021年夏季获得了 YC 投资。它是一个基于 Rust 编写的、支持 MacOS/Linux/Windows 三端的 AI 代码搜索引擎,目前在 GitHub 上获得了 8.6K Star。

Bloop 的功能包括:

1. 解释代码
2. 基于上下文写代码
3. 自然语言进行代码搜索定位
4. 修复问题
5. 多语言
6. 对代码进行重复度检测和去重

Bloop 目前支持 10+ 编程语言,支持同步本地和 GitHub 存储库。

GitHub 地址:https://github.com/BloopAI/bloop


今日观察

社交观察

突破开源语音 TTS 天花板

这个 ChatTTS 是专门为对话场景设计的语音生成模型,主要用于 LLM 助手对话任务、对话语音以及视频介绍等。不但支持中英文混合文本合成语音,更重要音色表现非常强,能达到真假难辨程度!

GitHub:github.com/2noise/ChatTTS

- 微博 GitHubDaily

2024年,AI 男/女友将迎来爆炸性增长

CB Insights列出了6个趋势:
1. AI 伴侣初创公司 Character AI 在移动端的使用量紧随 ChatGPT 之后。
—— AI 伴侣可能是第二重要的消费者 AI 应用场景。
2. Character AI的400万用户中有一半以上年龄在24岁以下。
—— Z世代对AI伴侣的接受度非常高,随着大语言模型 (LLM) 能力的提升,这种接受度将会更强。
3. 在智能手机时代,Z世代与朋友面对面相处的时间大幅减少
4. 越来越多的人会觉得孤独
5. 越来越多的美国成年人没有配偶或伴侣
6. 年轻人的性生活越来越少

-微博 宝玉xp

杨立昆的卷积神经网络就是强化信念的一盏明灯

论AI方面的贡献,如果没有杨等三巨头长达20年以来的坚持的话,哪来后来的AI革命?而在那段「漫漫长夜」时期,杨的卷积神经网络就是强化信念的一盏明灯。再后来,FB的Llama系列模型及其开源理念也造福了很多有志于投身这股AI浪潮的人。马一龙要在这方面跟杨立昆比贡献吗?

-微博 陈晓鸣在湾区

大模型降价背后,国产大模型的竞争逻辑变了

大模型API降价给行业内卷敲响了警钟,单纯的堆参数、拼算力、价格,并不是行业健康发展的最优解,未来只有差异化才有出路。与所有的行业一样,从混沌初开到进入大混战,多是以惨烈的价格战作为标志。如今大模型经过狂热的“百模大战”之后,价格战初步显现,同质化竞争的恶果逐步出现。

- 自媒体刘旷

大模型价格战下的推理优化

在大模型架构层面去从系统的角度考虑推理的算力优化, 无论是MLA的工作还是Dense-MoE或者是Google MoD, Medusa, SplitWise这样的工作,再来反推寻找出一个合适的大模型架构, 只可惜大多数的草台班子大概只知道有什么抄什么, 或者利用泄漏的数据打个榜,天天自嗨超越GPT-N, 摊手

- 微信 zartbot

媒体观察

人工智能现在有多“像人”?

美国斯坦福大学计算机科学系教授李飞飞日前也在美国《时代》周刊刊文称,在通往通用智能的道路上,“感觉”是至关重要的一步,即拥有主观体验的能力。目前大模型并没有像人类一样的“感觉”,它可以说“自己脚趾痛”,尽管它根本就没有脚趾,它只是一个编码在硅芯片上的数学模型。

“我们还没有实现有感觉的人工智能,而更大的语言模型也无法实现这一目标。如果想在人工智能系统中重现这一现象,就需要更好理解感觉是如何在拥有实体的生物系统中产生的。”她说。

- 新华社

Mistral AI以开源模型瞄准美国市场

欧洲生成人工智能工具开发商法国Mistral AI已将目光投向美国市场。据彭博社周二(5 月 28 日)报道,这家初创公司本月聘请了Foursquare前首席营收官Marjorie Janiewicz担任其首位美国总经理。

Janiewicz 在报告中表示,Mistral AI 的目标是利用企业日益增长的需求,这些企业寻求替代人工智能模型以及OpenAI和谷歌等大型科技公司提供的服务的方案。

据报道,该公司进军美国市场的势头正在增强。这家初创公司计划招聘更多员工,并且已经在那些希望在 AI 解决方案中拥有更多选择和灵活性的企业中获得了关注。

Mistral的开源方法(底层代码是公开共享和可定制的)被视为比竞争对手提供的封闭系统更安全、更通用的替代方案。

- 鞭牛士Bianews

更高效的Scaling技术:MoE架构为何获得大模型厂商青睐?

2023年,大模型狂奔一年后,很快就遇到了瓶颈。Scaling law(指随着参数量的增加,模型性能也将提高)的存在,让大模型的能力似乎没有了上限,但是,用于训练大模型的数据和算力却十分有限。在此背景,业界也不得不去探索效率更高的模型架构,而MoE(Mixture of Experts,混合专家模型)架构的出现,让业界看到了希望。

- 21世纪经济报道

硅谷有了自己的鲁迅!AI大佬LeCun连续暴走,从马斯克到OpenAI,全被怼了个遍

尽管Llama最初是由LeCun领导的FAIR开发的,但现在已经转交给了专注于技术和产品开发的GenAI部门,FAIR则专注于更长远的目标:开发能够达到人类智能水平的新AI架构和方法。

许多人认为Yann LeCun喜欢发表一些争议言论,但更重要的背景是目前AI未来发展中产生的问题。作为人工智能领域最知名的人士之一,Yann LeCun在某种程度上有义务站出来,为这个充满争议的领域提供一些清晰的见解。

LeCun说,实现AGI不是一个产品设计问题,甚至不是一个技术开发问题,在很大程度上是一个科学问题。

如果这个说法是成立的,那么在通往探索AGI的道路上,显然我们需要更多他这样的“鲁迅”。

- 品玩

默认“成功人士”为男性 大模型存在性别偏差?

邱锡鹏教授通过数据看到了大模型这两年的进步。对于大模型的训练,价值对齐是重要一项,目标是人类赋予它的价值观。其中,也包括性别问题。但通过对词语分析形成的词云,也显示了AIGC(生成式人工智能)的固有印象,比如,形容男性的词汇集中于世界、发现、生命、简单等;而围绕女性则集中于乡村、丈夫、挑战、母亲等词语。

邱锡鹏说:“在实际研究中,要进行语料的性别校正需要非常大的投入。需要进行模型对齐,通过人类偏好建模、价值观对齐等方法,调整模型输出更积极的内容。”

- 济宁新闻网


今日推荐

开源项目

vuejs/language-tools

https://github.com/vuejs/language-tools

Volar 是 Vue 的 VS Code 插件,也是 Vue 的官方 IDE/TS 支持工具,除了集成 Vetur 的相关功能,如高亮、语法提示等之外,还包含一些独有功能。 

每日一博

百亿大规模图在广告场景的应用

本文通过搜索推荐项目进行外卖搜索广告弱供给填充,提高流量变现效率。我们提出外卖多场景异构大图、异构大图在线建模技术演进路线,解决外卖搜索推荐业务多渠道、即时化的挑战。相关成果发表 CIKM2023 会议一篇。联合机器学习平台搭建大规模图训练、在线推理引擎 GraphET,满足近百亿边规模、复杂图结构的多个业务落地。


事件点评

世界上第一个开源的大规模并行数据库——Greenplum的GitHub repo突然“404”,博通要将其闭源收费?

知名开源 MPP 数据库 Greenplum 已将源代码仓库访问权限修改为仅支持「只读」,并将原有的 branch、tag、pr、issue 等信息全部清空。横幅通知显示仓库于 5.25 进入存档状态。

点评

Greenplum作为一个知名的开源MPP数据库,其源代码仓库变为只读并清空相关信息,对依赖该数据库的开源社区可能是一个重大打击。社区成员和贡献者可能会对项目的未来发展感到不确定,引发了关于Greenplum未来发展方向和维护的疑问。

对于使用Greenplum数据库的用户和企业来说,这一变化可能会影响他们的业务连续性和技术选型。Greenplum的变化可能会对其他开源项目产生连锁反应,特别是那些依赖于Greenplum或由相同公司维护的项目。

如果真是受博通收购VMware的影响,这将是开源项目转向商业化的又一例证,可能会引起开源社区的不满和抵触。这一事件也凸显了开源项目和商业利益之间的紧张关系。如果Greenplum确实转为闭源,这可能会对开源文化产生负面影响,减少社区对开源项目的信任和参与度。

研究表明,AI 工程师薪酬远超其他同行

Levels.fyi 发布的 2024 年第一季度 AI 工程师薪酬调查数据指出,专门从事 AI 的软件工程师与非 AI 软件工程师的薪资存在明显差异。

点评

AI工程师薪酬的高企反映了市场对AI专业技能的强烈需求。随着AI技术的不断发展和应用,企业愿意为拥有这些技能的人才支付溢价。随着越来越多的公司涉足AI领域,对AI工程师的竞争也在加剧。为了吸引和保留顶尖人才,公司不得不提供更具竞争力的薪酬。

从入门级到资深级别,AI工程师的薪酬都高于非AI工程师,这表明在职业发展的各个阶段,AI技能都被高度重视。随着AI人才市场的成熟,公司可能会调整招聘和薪酬策略,使薪酬更贴近市场标准,缩小AI和非AI职位之间的薪酬差距。

高薪酬可能会激励更多的学生和专业人士投身AI领域的学习和职业发展,从而影响教育和职业规划的方向。企业需要认识到AI人才的重要性,并在战略规划中考虑如何吸引、培养和保留这些人才,以保持竞争力。

OpenAI 前安全主管加入竞争对手 Anthropic

本月早些时候,OpenAI 原安全主管、超级对齐(Superalignment)团队负责人 Jan Leike 宣布从 OpenAI 离职,并公开发文抨击了该公司的安全性问题。现如今,Leike 发帖称已加入了 OpenAI 的竞争对手 Anthropic 公司,并将领导一个新的 “超级对齐” 团队。

点评

作为OpenAI的安全主管和超级对齐团队负责人,Leike的加入可能会加强Anthropic在AI安全方面的研究和开发,从而加剧AI安全领域的竞争。与此同时,Leike公开批评OpenAI的安全性问题后选择加入竞争对手,这种动态可能会影响其他员工的士气和忠诚度。

此举可能会对OpenAI的声誉造成一定的影响。同时,OpenAI需要考虑如何在人才流失后继续保持其在AI领域的领导地位。

此外,Leike的行动和言论可能会提高公众对AI伦理和治理问题的关注。随着AI技术的发展,确保其安全性和伦理性变得越来越重要。Leike在Anthropic的新角色可能会推动公司在AI安全和伦理方面的创新,这对于整个行业来说是一个积极的信号。

这一事件可能指示了AI行业内部人才争夺战的激烈程度,以及公司之间为了获得竞争优势而进行的策略调整。


开源之声

媒体观点

AI 倒贴钱也不好用,是因为没有「操作系统」

别看现在技术和价格卷得如火如荼,目前能用好 AI 能力的公司十分有限。当前阶段稍显「有价无市」的大模型落地,是一个显而易见的痛点。

极客公园

马斯克最新专访:担忧人工智能的价值观;AI时代不用工作,人人高收入?

过度追求政治正确的倾向让我对人工智能的未来感到担忧。我认为这种趋势非常危险。

对于xAI,我们的目标就是追求绝对的真相,哪怕这真相不受欢迎。

财经ThinkTank

为什么 AI 艺术看上去总是有点糟糕?

但是,随着时间的推移,越来越多的人开始发现 AI 艺术作品的背后是一片空洞。我们无法从 AI 的画作中看到维梅尔对宁静生活的细腻刻画,也无法看到毕加索从写实到抽象的提纯流转。

- 爱范儿

用户观点

世界上第一个开源的大规模并行数据库——Greenplum的GitHub repo突然“404”,博通要将其闭源收费?

  • 观点 1:博通是真的行业百草枯啊,要是当年操作资本真把高通吃了完全不敢想现在移动市场会是啥样
  • 观点 2:博通的陈老板,金融资本式收并购。vmware 都开源了,何必捏着这个开源的数据库产品再去做商业化付费呢?
    • 观点 3:VMware 没有开源,只是对个人用户免费了
  • 观点 4:哪天搞不好Spring框架都整成对企业收费就乐子大了
  • 观点 5:呵呵,从来都不敢用这数据库
  • 观点 6:换了房东,立马拆房子

腾讯应用宝与 Microsoft Store 达成合作,Windows 可直接运行移动应用

  • 观点 1:Amazon: 想换人你直说
  • 观点 2:wsa使用体验太差差差了
  • 观点 3:腾讯牌安卓模拟器

JavaScript、Python 和 Java 为何一直是开发者的首选

  • 观点:1:生态是决定性作用
  • 观点 2:语言不好用生态也不会有。
  • 观点 3:“此外,Java 之所以能名列前茅,不仅仅是因为它的历史实力。Java 每六个月就会进行一次重要的功能和性能更新,每季度还会发布一些小的改进、错误修复和安全更新。”然而很多人不是特别在意他提供的新特新,甚至很多企业都在千年Java8。

【Java orm 框架对比】十三,新增 qdbc 框架对比

  • 观点:1:mybatis-mp挺好用的,值得使用的新ORM框架
    • 观点 2:各有利弊吧,基于mybatis的二次开发确实能节省很多适配比如优先适配Solon
  • 观点 3:Mybatis那个xml真的又臭又长,都2024了,居然还要手动设置result mapping
    • 观点 4:其实你可以不设置的
    • 观点 5:mybatis-mp 这个可以ORM 可xml,连表小case
  • 观点 6:建议加个jooq
    • 观点 7:研究过感觉太重了,要生成很多东西

---END---

最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!

展开阅读全文
点击引领话题📣 发布并加入讨论🔥
0 评论
2 收藏
分享
返回顶部
顶部