欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。
# 2024.9.24
今日要闻
腾讯发布第五代机器人 The Five
腾讯 Robotics X 实验室公布最新机器人研究进展,推出人居环境机器人 “5 号”(The Five,小五),目标是成为可以与人居环境和谐相处的通用机器人。
该机器人拥有四腿轮足复合设计、大面积触觉皮肤、多指灵巧手以及安全人机物理交互等多项能力。可在真实人居环境中完成行走、搬运物体等动作,处理复杂任务,与人进行交互。
字节跳动发布豆包视频生成大模型
字节跳动今天在深圳举办 2024 火山引擎 AI 创新巡展,并发布豆包・视频生成模型以及豆包・音乐模型、豆包・同声传译模型等产品。
据悉,豆包・视频生成模型能遵从复杂 prompt,解锁时序性多拍动作指令与多个主体间的交互能力。
据火山引擎介绍,豆包视频生成模型基于 DiT 架构,通过高效的 DiT 融合计算单元,让视频在大动态与运镜中自由切换,拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力,灵活控制视角,带来真实世界的体验。支持包括黑白、3D 动画、2D 动画、国画等多种风格,包含 1:1、3:4、4:3、16:9、9:16、21:9 六个比例,适配于各种终端,以及电影、手机竖屏等不同画幅。
开源剪贴板管理器“Maccy”发布2.0
Maccy 最近正式发布了 2.0 版本,开发者称这是 7 年来最大的更新。虽然从外观来看变化不大,但在代码层面,新版本采用现代化的苹果官方技术栈进行完全重写,解决了许多问题,并为未来的版本解锁了新的机会。
Maccy 2.0 主要变化
-
UI 采用 SwiftUI + NSPanel 进行重写,此前为 AppKit + NSMenu
-
重写存储实现:数据持久化框架从 Core Data 迁移到 SwiftData
-
与 Maccy 1.x 向后兼容。如果不喜欢新版本或遇到错误,可以降级到 1.0
-
搜索高亮显示匹配结果:在剪贴板历史中搜索时,Maccy 2.0 现在可以高亮显示与你的输入内容相匹配的部分,方便快速识别出目标内容
-
可调整大小的窗口:Maccy 现在支持像 macOS 中其他原生窗口一样自由调整窗口大小,让用户能够根据需要调整显示历史记录的面积,适应不同的工作场景
-
滚动历史记录列表:2.0 版本中,剪贴板历史记录列表支持滚动操作,即便你有成百上千条历史记录,也可以轻松滚动查找,不用担心内容被遗漏。
-
优化内存使用:Maccy 2.0 提升了复制大体积图片时的性能
-
不支持与 Maccy0.x 的向后兼容性
-
系统最低要求 macOS 14 Sonoma 及更高版本
Sam Altman:我们将在几千天内实现超级智能
OpenAI 首席执行官 Sam Altman 今天在其个人网站上发表了一篇名为 “The Intelligence Age” 的文章,详细阐述了他对 AI 未来的愿景。他认为,人类将很快达成与 AI 的合作,从而完成许多非 AI 时代所不能完成的事。
“最终,我们每个人都可以拥有一个个人 AI 团队,由不同领域的虚拟专家组成,共同创造几乎任何我们能想象到的东西。我们的孩子将拥有虚拟导师,他们可以在任何科目、任何语言和任何他们需要的速度下提供个性化指导。我们可以想象类似的想法,比如更好的医疗保健、创建任何人能想到的任何类型软件的能力等等。
有了这些新能力,我们就能实现今天看来难以想象的共同繁荣;在未来,每个人的生活都会比现在更好。繁荣本身并不一定会让人幸福 -- 有很多悲惨的富人 -- 但它会切实改善全世界人民的生活。”
并预测称,人类可能在几千天内实现超级智能(superintelligence)。“这可能需要更长的时间,但我相信我们会实现这一目标。”
今日观察
社交观察
RSS其实是一种迎合用户利益远远大于迎合生产利益的产品
如果说Google Reader的落幕,预示着原教旨主义RSS的结束,那么在后面这十多年来,其实又有很多很明显建立在RSS文化的基座之上、同时又增加了些许创新的产品,说是续命也好,重造也好,在接受了阅读注定不会是大众市场的设定之后,反而有了一种高度自知的宁静感。
比如Feedly和Reeder这种靠着接济Google Reader难民活到今天的,都实现了小富即安的财务平衡,推特的创始人Evan Williams在出局后也建了长阅读平台Medium,还买了一家RSS源服务商,要做订阅接口的多样化,更不用说Flipboard这样甚至能在中国落户运营的产品。
其中还有一个证明「天下文章一大抄」的故事,Substack作为后RSS时代可能是最成功的产品,其创始人说过启发自己的灵感来源之一就是中国的微信公众号,而Substack的早期框架也非常像一个拆分出来的美国版公众号体系,同时这老哥的上一个创业产品是手机聊天应用Kik,而张小龙开发微信时的参照对象,就包括Kik⋯⋯
- 微博 阑夕
微软开源了一个 C++ 库 Proxy 3
微软开源了一个 c++ 库 proxy 3,不是给你上网开代理的,是不通过虚函数,不要侵入修改代码,编译期高效实现现代编程语言的多态的,并且顺便实现了类似于 Java 以及脚本语言那种内存管理,让 c++ 程序员不用再考虑内存回收。这个库本来是微软工程师开发 Windows 的,微软正在努力,希望其成为未来 c++ 标准。文档很少,代码就一个头文件,把 template 玩出花了,需要至少 c++20 的编译器才能使用,微软承诺,运行效率不会低于虚函数,大多数时候,编译器在编译时就绑定了函数调用,比虚函数高效。
- 微博 薛凯-又重名了
Moshi:实时语音到语音生成 Transformer 开源模型
Moshi主要由三部分组成:Helium,一个使用2.1万亿个token训练的 7B Transformer语言模型;Mimi,一个建模语义和声学信息的神经音频编解码器;以及一个新的多流架构,该架构分别建模用户和Moshi的音频。
- 微博 互联网的那点事
批评华为真的要看时候
我只想问一个很简单的问题——“如果你觉得华为这个模式赢不了,那么你是否能给出一个更加可行的道路?”反正从我自己对于各种行业的观察来看,好像并没有。
就简单的从芯片制造这个角度来说,如果不是华为发力松山湖打捞技术,中国可能都没有大规模商业化可用的等效7nm制造能力。中芯国际很早就研发出来了N+1,但是没人大规模使用。
再从AI训练卡的这个角度来说,除了昇腾还有谁?摩尔线程、寒武纪这些全都是小打小闹……这些所有加在一起的部署算力,有1E Flops吗?……
适用于苹果手机的开源备份工具
因为不太相信苹果换机的速度。
还是决定先备份再恢复,这回用的工具是我朋友写的,叫 Bbackupp,特色如下:
1、可以备份到外置硬盘。
2、开源的,安全的。
3、备份的时候会把 App 保存在本地。
4、基于上条,恢复的时候不需要再下载软件。
获取链接:github.com/Lakr233/BBackupp
媒体观察
融资、投流、造血,大模型“新星”开启变现竞速
被称为“AI大模型应用元年”的2024年已过半,行业变化太快,充斥着各种声音。
原本漫长的技术发展周期,在大模型身上被装上了加速键。从卷参数、到卷应用,短短两年时间,玩家“百模大战”、资本烈火烹油,都在探索,又备受质疑。
步入下半年,整个行业的风向更加微妙。
- 连线Insight
华为“纯血”鸿蒙拉开万亿市场 产业链个股或有望受益
展望未来,华为“纯血”鸿蒙HarmonyOS NEXT的正式推出,无疑将进一步加速鸿蒙生态的成熟与扩张,鸿蒙生态的繁荣也将为华为及其生态合作伙伴如润和软件、中软国际、九联科技等公司带来强劲的商业机遇和增长动力。
- 证券时报
AI赋能可持续,大模型创造“无法计算的价值”
中国可持续发展研究会理事长李萌认为,人工智能赋能可持续发展,将成为推进经济社会绿色转型的关键支撑。作为新兴技术力量,人工智能在中国助力资源优化、提升效率,推动产业转型、环境保护、消除贫困、教育公平,以及加速实现可持续发展的目标中将发挥不可替代的作用。
- 经济观察报
多家国外巨头制定“AIGC成分表”,能给国内打什么样?
但AI内容标识还面对不少争议和挑战,问题一方面来自技术本身——对于显形标识,稍加截图和裁剪便可以隐去。隐形标识虽然使用哈希函数加密,有一定篡改难度,但也并非完全可靠。
更大的问题来自AI内容标识跨平台、跨地域的推广。从C2PA的发展背景中不难发现,需要足够多的内容生产者和平台使用协议,建立一条完整的使用链,这类协议才能发挥效果。
- 21世纪经济报道
纯血鸿蒙应用适配,仍需更多耐心
1500多个应用,看起来数量不少。据余承东介绍,这已经能够满足用户使用时长99.9%。但是,从目前的应用类型和功能上来看,适配进程并没有想象中快,对于开发者来说,适配的工作量大、周期长,而对于华为和其拥趸者来说,需要给予开发者更多耐心。
- 虎嗅网
每天消失30家,为何这5家国产GPU公司活得很好?
回看全球芯片产业发展的历程,芯片都不是单纯的“技术”或“产业”门类,而是始终与各国地缘政治、经济博弈等因素纠葛难分。但如果把视角聚焦在具体的企业身上,所有芯片公司都要回归一家企业的“本能”——赚钱。
对于此时处在风口浪尖的国产GPU厂商而言,如何活下去,似乎比远方的星辰大海更加重要。
- 创业邦
今日推荐
开源项目
pydata/xarray
https://github.com/pydata/xarray
xarray 是一个开源 Python 包,它可以使处理多维数组更加简单、高效并有趣。xarray 在原始类 NumPy 多维数组中引入了标签化的变量名称和坐标索引,实现了更直观、更简洁和更加不容易出错的能力。该软件包包括一个庞大且不断增长的域无关功能库,用于使用这些数据结构进行高级分析和可视化。xarray 灵感来自同为解决数据分析任务而诞生的 pandas。
每日一博
10 种数据库技术的发展历程与现状
本文将深入探讨应运而生的多种数据库类型,从传统的层次、网状、关系型数据库到现代的列存、文档、键值、图以及时序数据库,乃至新兴的 HTAP 数据库,揭示了它们各自的设计理念、技术特点、应用场景及局限性。
开源之声
用户观点
Node.js之父ry“摇人”——要求Oracle放弃JavaScript商标:一众“前端老炮”纷纷力挺,已有一万多人签名支持!
- 观点 1:Java尝到甜头,你想让他放弃是不可能的,更何况,众所周是他是一家法务驱动型公司,不是技术驱动型公司。
- 观点 2:javax -> jakarta 简直是个灾难
- 观点 3:Oracle的公司发展最起源于IBM的一个技术员的论文-论关系性数据库的发展,后来这篇论文被Oracle公司的老总:Larry Ellision所发现,从而创办了今天的Oracle。
- 观点 4:JavaScript还是幸运的,只是一个名称被Oracle把持,反观Java就没那么幸运了,跟Oracle绑定得太深了。
- 观点 5:这不是道德绑架吗
- 观点 6:不算道德绑架。占用商标但是不用,超过三年,任何人都可以提出申请,废除商标。
- 观点 7:这次我支持龟壳
程序员如何选择适合自己的编程语言?
- 观点 1:省流:选 Java(
- 观点 2:dumb AF 什么意思?
- 观点 3:dumb as fuck
- 观点 4:感觉不如编程原神rust
- 观点 5:do you like snakes
- 观点 6:还差一个选择自己的编程语言
- 观点 7:竟然还能看到delphi,还很真实
- 观点 8:i am not dumb,not engineer,not love myself......
- 观点 9:Do you like crabs?
- 观点 10:你想多了,项目需要啥语言,你就得上啥!
- 观点 11:还是自己造语言好
- 观点 12:超C压J力比P的rust呢?赶快加上不然你就是老古董,不专业了
- 观点 13:我们julia呢
- 观点 14:matlab那里再问一下,are you lechrous? Y→Julia; N→Matlab
- 观点 15:每一句都是灵魂发问
- 观点 16:Are you short-lived? Yes→Python
- 观点 17:面向工资编程不好吗?
- 观点 18:省流:dumb想赚钱选js
- 观点 19:没有什么合不合适,只要钱合适
---END---