欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。
# 2024.8.30
今日要闻
Elastic被三年前飞出的“回旋镖”打到了
Elastic 公司创始人兼首席技术官 Shay Banon 今日发表官方博客《Elasticsearch is open source, again》,宣布为旗下两大核心产品 —— Elasticsearch 搜索引擎和 Kibana 可视化平台添加 AGPL 作为另一个许可证选项,与 ELv2 和 SSPL 并列。
米哈游蔡浩宇新AI公司曝光,挖Llama 3科学家坐镇大模型
米哈游创始人蔡浩宇,“退休”后新AI创业项目曝光,起因竟是他在网上发的一条“暴论”。AIGC已经彻底改变了游戏开发……大部分从业者可以考虑转行了。
新公司名为Anuttacon,要用AI为游戏玩家创造前所未有的体验,突破互动娱乐的界限。
FreeBSD 社区大讨论:基础系统中使用 Rust
FreeBSD 社区正在讨论是否将 Rust 语言纳入基础系统(base system),以改善系统的安全性和可维护性。
与 Linux 不同,FreeBSD 操作系统内核和用户空间是作为基础系统一起开发的,并在 FreeBSD 源代码树(通常称为 “src”)中维护。这意味着,为了讨论使用 Rust 作为 FreeBSD 内核或基础系统中其他程序 / 实用程序的语言,Rust 工具链也需要存在于基础中。
目前,FreeBSD 基础系统支持的语言包括汇编、C、C++、Lua 和为 sh 编写的 shell 脚本。在遥远的过去,Perl 也是基础系统的一部分,但在 2002 年 FreeBSD 5.0 之前被删除。
FreeBSD 还拥有一个 第三方软件的 ports 集合,这些软件并非由 FreeBSD 本身维护。包括 Apache HTTP Server、Xwayland 等等。Rust 已经存在于 ports 系统中,许多用 Rust 语言编写的应用程序也是如此。在 FreshPorts 上搜索,会列出 ports 集合中的新软件包,结果显示 ports 系统中有 500 多个用 Rust 编写的软件包。
今日观察
社交观察
Telegram创始人杜罗夫:一位科技自由意志主义者的陨落
- 未尽研究
全球3.5亿下载量破纪录! Llama家族暴涨10倍,开源帝国掀AI革命
截至目前,Llama模型在开源平台HuggingFace下载量近3.5亿。
Groq的创始人表示,这也太疯狂了,想想Linux花了多长时间才达到这个数字?官博介绍,这一数字,是去年同期的10倍。而且,仅在上个月,模型的下载量超2000万次。2023年2月,Llama 1首次亮相,经过多次迭代,到现在已经过去了整整18个月。
而在这仅有的一年半里,Llama已经从一个最先进的单体基础模型,发展成为,一个面向开发者的强大生态系统。
- 新智元
科技巨头狂卷“智能体”,大模型上终于长出了“大家伙”?
这两天,备受瞩目的 OpenAI 新项目又有了新消息。
The Information 援引内部消息报道称,OpenAI 计划最快将在今年秋天推出代号「草莓(Strawberry)」的全新 AI,其拥有前所未有的「推理」能力,可以处理复杂的数学和编程任务,甚至还能体现在日常生活中的非技术问题上。
此外,报道还指出这项技术对未来 AI 产品,特别是旨在解决多步骤任务的「智能体(Agent)」具有重要意义。
- 雷科技
深度伪造(#deepfake# )一词源于2017年
深度伪造(#deepfake# )一词源于2017年,一名Reddit用户deepfakes利用名人的图像、视频与色情内容中的原始演员合成色情视频,在网络上引起了疯狂传播,也引发了全球民众对人工智能技术发展的担忧。
数据和算法的互惠合作可以释放无限的价值和技术潜力,但对欠缺数据收集和算法处理技能的主体而言,数据和算法的紧密依存将会导致未知的“黑箱效应”,进而衍生出难以预估的安全风险。
- 微博 禾几日月
国产RISC-V芯崛起:中科院7nm芯片,比肩ARM Neoverse N2
近日,中科院推出第三代“香山”系列开源高性能RISC-V处理器核“昆明湖”,这次对标的是Arm Neoverse N2内核,而“昆明湖”这个项目,其实是2022年开始启动的。
Neoverse是ARM最早于2019年发布的服务器CPU核,也是ARM最强的CPU核。而Neoverse N2是ARM于2021年发布,也是Arm第一个基于Armv9指令集架构的平台“Arm Neoverse N2”。
Neoverse N2相比N1有40%的IPC提升,是ARM的所有IP核中,性能最强的。
而这次中科院第三代“昆明湖”开源高性能RISC-V处理器核,采用7nm工艺,主频是3GHz,SPECINT2006评分为15分/GHz,SPEC CPU 2006得分已经达到了44分,通过编译器优化甚至可以达到47.63分,这已经能够PK英特尔的12代酷睿了,也不输给Arm Neoverse N2内核。
- 今日头条 互联网乱侃秀
媒体观察
机器“人”走入家庭,还有多远
业界普遍认为,以大模型为代表的AI技术融合机器人的硬件技术,将产生更多“连带效应”,一条完整的产业链正在加速形成,机器人的成长之路将越走越宽。
- 新华网
ToB Or ToC,大模型不做“选择题”
从“百模大战”走到“应用之战”,大模型已经到了商业化的关键时期,不仅要考虑产品是否突出,更要综合考虑成本、应用、变现等问题,每个公司都在寻找属于自己的答案,对它们来说,“ToB or ToC” 或许并不是选择题,而是必选题。
- 伯虎财经
谷歌大手笔挖走创始人后 Character.AI上演裁员风波
在科技行业的瞬息万变中,初创公司的命运往往充满了不确定性。据The Information报道,与谷歌达成重大交易不久后,美国人工智能创业公司Character.AI在当地时间8月29日进行了至少5%的裁员,主要涉及营销和招聘岗位。在裁员前,Character.AI拥有约120名员工。
- 科创板日报
蔡崇信预言成真?微软AI扩张版图背后的故事
如果没有“11月政变”,微软的“海王策略”也不会出现。这给微软及其投资者敲了一次警钟。随后,微软悄然启动了一项“OpenAI戒断策略”:通过多元投资、广泛合作布局AI版图;推出自家“小而美”Phi系列模型;招兵买马,推动C端AI研发。
- 大力财经
生成式人工智能飞速发展,安全问题需重点关注
孙蔚敏在论坛上表示,未来将优化大模型备案的流程,加强生成、合成内容的标识管理,在分级分类、安全测试、应急响应等方面丰富完善安全标准体系,引导推动大模型提升安全能力,确保人工智能始终朝着安全可靠的方向发展。
- 每日经济新闻
蒋国飞:数据将成为AI发展的最大驱动力
谈到人工智能与数据要素的关系,蒋国飞认为,所有产业基本都在数字化,这是不可逆的,在此过程中会大规模的产生数据。数据的流通,数据要素市场,才能让数据的价值得以体现,很多数据的生产方、运输方、消费方并非同一家企业,需要打通各个环节。同时,大规模的数据使用基本上是通过AI算法来充分跟行业知识结合,挖掘其中的数据价值,包括了决策式AI和生成式AI。因此,数据和AI是相辅相成的。
- 中国经济网
今日推荐
开源项目
google-deepmind/mujoco
https://github.com/google-deepmind/mujoco
MuJoCo 全称 Multi-Joint dynamics with Contact (接触型多关节动力学),它是一个模拟接触周围环境的多关节运动的物理引擎,可用于机器人动作、生物力学、图形和动画、机器学习等领域。
每日一博
如何让大模型输出 10k+ 字长文?
如何才能让模型拥有更强的长文本输出能力呢?我们发现,模型输出长度受限的主要原因在于,监督微调(SFT)数据集缺乏足够长的输出样例。
针对这一问题,我们构建了一个 6000 多条 2k-20k words 不等的长输出数据集 LongWriter-6k,并在此基础上,对 GLM-4-9B 进行 SFT 微调和 DPO 对齐。新的模型拥有了能够生成超过 10,000 字 / 词连贯文本的能力。
开源之声
用户观点
Elastic被三年前飞出的“回旋镖”打到了
- 观点 1:感觉白嫖和赚钱都是人的本性,与本性做斗争不容易
- 观点 2:下一篇,Elasticsearch changes license, again
- 观点 3:再开源估计也不香了,Apache License 2的OpenSearch不香吗?翻来覆去的修改许可,谁还会相信,哪天再修改了呢
- 观点 4:这是份额少了,扛不住了吧
- 观点 5:不开源又不受行业支持,开源了各大厂商又都是白嫖怪,还动不动在原来的版本上整个新分支,进退两难
微软推出“Cascadia Next”开源字体
- 观点 1:要替换掉 微软雅黑了吗
- 观点 2:我最喜欢的编程字体,把字体大小设成 14,Font Family 设置成【Cascadia Code PL,CaskaydiaCove Nerd Font,'SauceCodePro Nerd Font', Menlo, Monaco, 'Courier New', monospace】,Font Ligatures 设置成【'ss01', 'ss02', 'ss03', 'ss04', 'ss05', 'ss06', 'zero', 'onum'】,最重要的 Font Weight 设置成 300,再配合着 Gruvbox Dark Hard 主题,效果非常赞
- 观点 3:这个字体的字母很窄,不太喜欢
- 观点 4:整体效果很差,不如 intel one mono
OpenAI 洽谈新一轮融资,估值超 1000 亿美元
- 观点 1:烧钱
- 观点 2:这东西现在真的小公司玩不起
---END---
最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!