开源日报 | Vim项目现状;MiniMax-01开源;PG获年度数据库“五冠王”;给AI喂料的小技巧;USB全新标识公布;AI公司是真饿了

来源: OSCHINA
编辑:
2025-01-15 18:33:41

欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。

# 2025.1.15

今日要闻

“苹果 AI”有望在 2025 年亮相中国,已成立新公司

苹果智能(Apple Intelligence)有望在 2025 年正式亮相中国市场。据企查查官方消息,1 月 10 日,苹果技术开发(上海)有限公司成立,法定代表人为 Tejas Kirit Gala,注册资本 3500 万美元。

公开数据显示,该公司行业属于软件开发,主要经营范围涵盖软件开发、大数据服务、数据处理服务以及存储支持服务等。股权穿透显示,该公司由 APPLE SOUTH ASIA PTE. LTD. 全资持股。 ​

苹果 CEO 库克在 2024 年三次访华期间,曾提到关于中国市场推出 AI 手机的计划,并强调了公司正在努力推进这一计划。因此有理由推测,苹果公司通过这家新公司,在中国加速推进 Apple Intelligence 服务落地。

Vim 项目现状

Vim 创始人及终身仁慈独裁者(BDFL)Bram Moolenaar 于 2023 年的离世让社区感到震惊,同时也引发了对项目未来的担忧。

在 2024 年 11 月举行的 VimConf 大会上,现任 Vim 维护者 Christian Brabandt 发表主题演讲 “Vim 项目的新生”(the new Vim project"),介绍了社区如何重组以继续维护 Vim,以及未来的发展方向。

来源:https://youtu.be/bopbmRyHQog?si=BHzt6g_yK0Xlc5PU

MiniMax 开源新一代 01 系列模型

MiniMax 发布并开源了 MiniMax-01 全新系列模型,其中包含:基础语言大模型 MiniMax-Text-01 和视觉多模态大模型 MiniMax-VL-01。

根据介绍,MiniMax-01 系列模型首次大规模实现线性注意力机制,传统 Transformer 架构不再是唯一的选择。这个模型的参数量高达 4560 亿,其中单次激活 459 亿。模型综合性能比肩海外顶尖模型,同时能够高效处理全球最长 400 万 token 的上下文,是 GPT-4o 的 32 倍,Claude-3.5-Sonnet 的 20 倍。

目前,官方给出的标准定价是输入 token 1 元 / 百万 token,输出 token 8 元 / 百万 token。

DB-Engines 公布 2024 年度数据库:PostgreSQL

DB-Engines 宣布 PostgreSQL 获得 “2024 年度数据库” 称号,这是它连续第二年赢得此殊荣,也是在 2017、2018、2019 和 2023 年称霸之后,第五次荣登榜首 —— 名副其实的 “五冠王”。

DB-Engines 是全球知名的数据库流行度排行榜网站,其评选年度数据库的标准为:计算数据库当前最新流行度分数的同比增长量,分数增长最多的即为年度数据库。

Angular 团队公布 2025 年战略

谷歌 Angular 产品和开发者关系负责人 Minko Gechev 日前发表了一篇关于 Angular 2025 战略的博客文章表示,团队的年度战略重点是投资于有助于 Angular 开发人员取得成功的关键领域。目前正在针对以下几个目标进行优化:

  • 通过增强开发者体验来提高开发者满意度。以及将通过继续为生态系统带来创新,来突破性能和开发者体验的界限。
  • 支持采用最新的改进。包括使用 schematics 简化新功能的采用、提高 Angular 社区内外功能的可见性等等。

具体而言,为了进一步改善开发者体验,Gechev 提出计划在 2025 年将 zoneless 推广到开发者预览版,使 Angular 具有更高效的变化检测能力、提高互操作性(例如,在 MFE 中)、并提高初始加载性能,以及推出 Signal forms 功能——目前正在处于设计阶段,“我们将继续支持现有的表单模块,使其与 signal forms 可互操作,同时逐步推荐 signal forms 作为最佳实践。”

USB 全新标识将直接标注传输速度、功率

全新的 USB 标识相较于旧版更加直观,舍弃了旧版的「USB 3.2 Gen1」、「USB 3.2 Gen2」等类似后缀,改为了由传输速度和充电功率作为后缀。其中设备与数据线的传输速度以 Gbps 为单位,而充电功率统一使用「W(瓦)」为单位。

新的 USB 标识采用速度优先的原则,用清晰易懂的数字直接标明数据传输速度,例如 USB 80Gbps、USB 40Gbps 等,取代以往 USB4 v2 等复杂表述。

新的 USB 标识也适用于线缆标识,会在线缆上同时标明数据传输速度和供电能力。

USB-IF 强调此次更新旨在解决长期以来消费者对 USB 标识的困惑,尤其是在 2017 年 USB 3.2 推出时,诸如 Gen 2x2 和 SuperSpeed USB 20Gbps 等让消费者难以理解实际规格的复杂命名。

微软 CEO 纳德拉宣布组建新 AI 团队「CoreAI」

近日,微软 CEO Satya Nadella 在官方博客宣布,微软将组建新的 AI 团队「CoreAI」。

据介绍,CoreAI 将专注于开发端到端的 AI 应用平台与工具,为微软自己与其第三方客户打造端到端的 Copilot 和 AI 堆栈,以构建和运行 AI App 及 AI Agents(人工智能代理)。同时 CoreAI 还将打造 GitHub Copilot,从而在领先的 AI 产品与 AI 平台之间建立紧密的反馈循环,以推动堆栈及其路线图的发展。

据了解,CoreAI 将汇集开发部、AI 平台以及 CTO 办公室的一些关键团队(包含 AI 超级计算机、AI Agentic Runtime 和 Engineering Thrive

“TikTok 难民”突然涌入——小红书内部观点尚未达成一致,国内互联网公司纷纷发英文贴揽客

近日,TikTok “禁令” 进入倒计时,而许多美国网友并没有选择使用 Instagram Reels 和 YouTube Shorts 等 TikTok 在美国竞争对手的平台,而是决定加入另一个中国社交媒体平台:小红书。

小红书也登上了 App Store 美区的下载榜榜首。小红书或许也因此成为有史以来第一款登顶美区下载榜的名字全是汉字的 App。

从多位小红书内部人士处了解到,“内部对此次事件的观点尚不能达成一致”。核心的争议在于全球化的挑战大于流量承接的喜悦,“这个事情是偶发的、突然的”。

据悉,这并非小红书首次承接来自 TikTok 的流量,小红书上一次有大规模外国人出现还是 “外国人听劝” 系列,事后内部也曾拉数据查看,对 DAU 的带动并不明显。目前尚不清楚有多少海外用户涌入,以及其所对应的笔记量。

但截至发稿,TikTokRefugee 词条下显示有 7 万 + 笔记。有部分人士认为,此举无法等同于小红书的全球化。

值得注意的是,很多国内互联网公司也借机以玩梗名义试图吸引这波流量。


今日观察

社交观察

10 位 CEO 复盘:我们眼中的 2024 中国 To B 市场

To B市场在2025将有什么新焦点?AI,AI,还是AI。场景,场景,还是场景。市场会理性回归,价值向真实需求靠拢。

除了AI和场景落地,这些关键词同样值得关注:大模型产业化落地、场景化AI应用、传统软件AI转型、轻量级应用崛起、多技术协同创新、算力升级、安全合规建设、“通算+智算”演进、敏捷迭代开发、流程与场景变革。

- 微信 雷峰网

从聊天室 icq msnspace 直接快进到了此刻

在小红书看了驻韩美军说自己累死了,交猫税的笔记下面讨论为什么全世界都养狸花。中国人帮美国人做数学卷子,美国人帮中国人做英语完形填空,美国人说我们教育不好所以可能做的是错的,美国南方人说我们的英语被考试看不起中国南方人说中国也是。亚利桑那州红脖晒自己钓的大鱼评论区完全是小红书风格一堆人晒自己钓的更大的鱼。极乐迪斯科粉丝找同好评论区晒中国同城聚会的照片他说这是天堂吧。黑人音乐家吹拉弹唱讲解。中国人问美国人是不是要打两个工才能生活,一千多条回复讲自己怎么辛勤工作。洋女给欧美同人圈带来新粮。还有原住民发科普视频,评论区最热门的话题是你们吃啥呀好吃吗游客去吃贵吗。印度北部人跟中国语言研究者讨论他那儿是不是藏缅语族交换语音对照表。还看到了离我开车15分钟的地方的农场里的牛,以及各个州的牛马驴在荒凉的农场上。农民晒自己刚拔的巨大的芜菁。美国女矿工下井,女科学家做实验。中国观鸟者想看外国稀罕鸟,评论区有上千张稀罕鸟的照片。
 
好像从聊天室icq msnspace直接快进到了此刻,中间发生的一切是一场梦。
- 微博  库特纳霍拉的骨头

搜索引擎&爬虫工程师的工具链面临洗牌

搜索引擎&爬虫工程师的工具链感觉现在全面面临洗牌了。以前靠SVM来分类,靠 TF-IDF 来抽关键词,trie-tree 来过滤敏感词,基于文本密度算法来抽正文,靠余弦相似度等相似度算法来消重。
现在,大模型能全面取代这些传统NLP做法了。

我现在抽正文就在用 reader-lm-1.5b,这个模型能把 html 转 markdown,然后再消息队列塞给下游模型用定义好的Agent来分类,提取关键词和摘要。最后入库之前RAG检索做消重。尤其是文本内容的对抗进化没那么快,现在打不过LLM(比如写点抽象的东西来规避过滤,LLM能轻松认出来,但是基于敏感词的 trie-tree 效果就很差)。所以LLM除了耗资源几乎无缺点了。

reader-lm-1.5b 地址:huggingface.co/jinaai/reader-lm-1.5b
这个模型小到不用量化,纯CPU都能跑得飞起。

- 微博 karminski-牙医

日常给 AI 喂料的小技巧

如果你想丢给它的网页没有图表,那直接用 MarkDownload 插件剥离图片和链接直接把纯 Md 文件给它就行。
如果你想对给它的网页有图表,并且希望它读图表,那最简单的路径是用 Safari 打开网页,点击阅读器模式然后另存为 PDF。

第二点能大幅减少网页中非文章干扰项对 AI 的影响。

- 微博 评论尸

媒体观察

日本人工智能应用潜力仍存

近年来,日本在人工智能应用方面积极探索,在制造业、农业、教育等诸多领域都涌现出一些创新案例。但整体而言,日本社会对AI科技的接受程度并不高。在全面拥抱AI时代之前,日本社会的当务之急是更加大胆地踏进信息化时代。

- 经济日报

中国科技企业宜以AI为桨高质量“出海”

在数字化智能化浪潮下,中国科技企业新一轮“走出去”如何突破、扎根、攀升?笔者认为,中国科技企业“出海”宜以人工智能等新技术为桨,布局未来、跨界融合、铸就自主品牌力,加速从“走出去”到“融进去”,迈向更深层次的全球化。

- 证券日报

AI 公司是真「饿了」,开始砸钱买你拍的「废片」

Open AI、Google、Moonvalley 等公司正在购买视频创作者们拍摄但未使用的「废片」。高质量 4K、无人机、3D 动画素材,1 - 4 美元(约合 7.3 - 30 元)一分钟,为了 YouTube、TikTok、Instagram 等网络视频制作的素材 1 - 2 美元(约 7.3 - 15 元)一分钟。

- 极客公园

英伟达带火的世界基础模型,会给工业企业带来哪些变革?

在真正的全系统数字孪生技术可行之前,还需要五年甚至更长的时间,但是在此期间,涉及日益复杂的系统的数字孪生的中间步骤仍然是可行的。

- 中欧商业评论

赢下芯片竞赛,美国最新计划

SIA 总裁兼首席执行官 John Neuffer 在给美国即将上任总统特朗普的一封信中表示,未来四年对美国和世界都非常重要。而美国半导体行业随时准备与他合作,加强美国的经济实力、国家安全、创新基础和技术领导地位。

- 半导体行业观察

美国管控新规会否终止AI行情?

如果特朗普政府放松对人工智能基础设施建设的限制、放宽有关核反应堆开发的规定,英伟达的业务可能会因此获得提振,核反应堆对于未来10年为人工智能项目提供足够的能源至关重要。

-巴伦周刊


今日推荐

开源项目

LuxCoreRender/LuxCore

https://github.com/LuxCoreRender/LuxCore

LuxCoreRender 是一个物理上正确的、无偏差的渲染引擎。它建立在以物理学为基础的方程上,对光的传输进行建模。这使得它能够准确地捕捉到其他大多数渲染程序根本无法再现的广泛现象。

每日一博

《Apache Shiro 源码解析》- 8. 缓存

有很多数据实际上并不需要在每次请求中都重新计算,我们可以将计算结果缓存起来,至少在一个特定的时间段以内,都可以直接从缓存中捞出数据,从而显著降低系统资源的消耗。


开源之声

用户观点

Linus祖师爷沉迷“焊接”,将亲自打造一套吉他效果器踏板赠送给内核开发者

  • 观点 1:Pedal翻译成踏板意义不准确,应该是叫单块效果器。
  • 观点 2:师傅请问你是做什么工作的.jpg
    • 观点 3:作为一名软件工程师,随身携带电烙铁也很合理吧。
  • 观点 4:他温和了好多
    • 观点 5:他又没有狂躁症, 就是生气的时候骂人而已
    • 观点 6:祖师爷性情中人罢了,而且也是对事不对人,本身性格和人品应该很nice的那种吧
      • 观点 7:对事也对人,比如俄国人
  • 观点 8:圣皇手作
  • 观点 9:非常有名的潜水日志管理软件subsurface也是Linus开发的
  • 观点10:现在就去义乌下单开模,让Linus大吃一惊而且卖不出去
  • 观点 11:臥槽,我也是,吉他彈不好,一天就知道折騰

小红书用户迷惑行为大赏

  • 观点 1:我的首页已经被两美元起中文名的帖子霸占了
  • 观点 2:讲个都市传说,我有个硕士学历的前同事根本不会用M$ Word,她甚至用空格来居中文本(而且还没对齐)
    • 观点 3:我的妈呀,那是怎么硕士毕业的,用LaTex?
  • 观点 4:好厉害,第一天就提了 mr,那第二天不得提个新版本
  • 观点 5:我人都麻了,这个语气,学习k8s,好像学习如何用打火石在野外点火一样轻松
  • 观点 6:手抄代码可以的,可以快速加入图解理解逻辑原理,但抄代码记忆的话就不懂了……
  • 观点 7:k8s提pr?就相当于第一次当兵,给航母提功能,,

---END---

 

展开阅读全文
点击加入讨论🔥(1) 发布并加入讨论🔥
1 评论
0 收藏
分享
返回顶部
顶部