欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。
# 2024.8.23
今日要闻
Linus Torvalds 首次亮相香港
2024 年 8 月 21 日,由云原生计算基金会(CNCF)和 Linux 基金会联合主办的 KubeCon + CloudNativeCon + Open Source Summit + AI_dev China 2024 在香港开幕。
Linus Torvalds 今天出席了大会,并与早期 Linux 内核贡献者 Dirk Hohndel(现任 Verizon 开源项目办公室负责人)进行了现场交谈。
Linus 表示这是他第一次来香港,虽然 Linux 基金会在这里举办过各种会议和活动,但在他自己参与的在亚洲举办的所有活动中,从未去过香港。
BTW,Linus 称自己非常讨厌公开演讲,他喜欢不知道问题的问答环节。
可远程操控机器人的新系统,软硬件均开源
来自加州大学圣地亚哥分校的团队近日发布了一个跨平台的视觉外骨骼系统(ACE),只需 0.5 万美元左右的预算,就可以实现远程精准操作机器人。
使用者需要用大概30秒的时间佩戴好相应的设备,然后就可以用普通模式直接观察和操作手臂,或者以镜像模式控制屏幕上显示的机器人,复合误差在毫秒级!团队已开源了ACE 的软件和硬件,还有长达30分钟的硬件组装教程,网页中有更多详细内容:https://ace-teleop.github.io/
谷歌搜索引擎全面揭秘:近百份文档泄露,博主爆肝数周逆向工程
DeepMind高级研究科学家Xingyou (Richard) Song等人最近发表的论文中,解释了谷歌Vizier服务背后的算法秘密。
作为一个运行过数百万次的黑盒优化器,Vizier帮助谷歌内部优化了很多研究和系统;同时,谷歌云和Vertex也上线了Vizier服务,帮助研究者和开发人员进行超参数调整或黑盒优化。
Song表示,与Ax/BoTorch、HEBO、Optuna、HyperOpt、SkOpt等其他行业基线相比,Vizier在很多用户场景中都有更稳健的表现,比如高维度、批查询、多目标问题等。
趁着论文发布,谷歌元老Jeff Dean也发推赞扬Vizier系统。他提到的开源版Vizier已经托管在GitHub仓库上,有非常详细的文档说明,并且最近仍在持续维护更新。
仓库地址:https://github.com/google/vizierOSS
今日观察
社交观察
用多模态LLM提取发票上的文字为结构化数据
最近有个朋友跟我讨论技术问题,他在用个第三方的OCR的服务,用来提取发票上的文字为结构化数据。但收费较高,想自己实现一套,试了开源的PaddleOCR,识别可以,但是无法转成结构化的数据。
我建议他试试多模态的LLM,比如Gemini 1.5 Flash,用来做 OCR 效果非常好,可以在 Prompt 里面定制要输出的格式,并且成本极低。
参考提示词:
***
Extract text from the provided image and organize it into a structured JSON format.
***
如果要自定义JSON格式,给一个样例应该就可以了。
无人能敌的芬兰小子的故事
Nils Torvalds,上世纪70年代的芬兰贡产档档圆,在茉斯科学习经济;是芬兰和欧洲政坛的风云人物,不久前曾作为瑞典人民党候选人竞选总统。
他的儿子Linus Torvalds,在11岁那年从Commodore VIC-20上开启了BASIC编程之旅。
仅仅10年之后,Torvalds发布了Linux的第一个版本。再30年后,世界上全部的大型机,互联网的绝大部分,智能手机中的绝大部分,和工业嵌入式设备的相当比例,都基于这个操作系统运行。
- 微博 有个梨GPT
开源的科学研究助手:OpenResearcher
一款开源的科学研究助手:OpenResearcher
基于RAG技术,通过访问arXiv数据集,其可以理解用户问题并从科学文献中找到最相关的答案,总结最新研究成果
准确性、丰富性和相关性方面性能出色,媲美Perplexity
特点:
1、查找并总结论文内容,比较不同论文观点,提供相关研究领域的其他资源
2、支持多种LLM,提供Web界面
github:https://github.com/GAIR-NLP/OpenResearcher
悟空在菩提祖师里学了什么(程序员版)
很多人不懂悟空在菩提祖师里学了什么,这么说吧……
老师:我教你 HTML 、CSS3、 JavaScript ,各种流行框架,以后做个优秀前端。
你:不学,不学。
老师:我教你 Java , C #,各种数据库和底层协议,以后做个后端大拿。
你:不学,不学。
老师:我教你 Python , C ++,神经网路,机器学习,数据分析和统计,以后做个 AI 专家。
你:不学,不学。
老师砸了三下键盘,转身而去。
半夜,你跑到老师办公室,老师小声说:我教你黑客技术、木马投放,病毒设计、解密秘诀,外带赠送各大银行的安全漏洞,保你一毕业就能黑进中央银行。
你:对对对,我就想学这个。老师,我以后发大财怎么谢你?
老师:说什么谢不谢的,你以后出了事,别把老师供出来就行。
- 微博 黄鱼Veda
媒体观察
精准学将公布中国首个语音端到端大模型
教育科技公司精准学宣布,公司已在AI语音交互技术上取得领先性的突破,成功训练了中国首个语音端到端大模型“心流知镜-s(V02)”,可直接实现语音输入-语音输出的交互,使其更适配辅学场景,使大模型达到“真人老师”级别的自然对话交流体验。
- 数智前线
电商之外,阿里巴巴将目光对准了它?
阿里巴巴管理层表示,对大部分数字化的企业而言,对AI的投入是必须的,目前也没有看到市场对AI的需求有下降的迹象。接下来几个季度,阿里巴巴对AI的投入仍然会维持目前水平。
- 投资时报
AI智能体箭在弦上,字节跳动的“扣子”能否抢先一步?
从形势看,科技巨头主要是想通过AI智能体及开发平台来打造自身的AI生态系统,让这一系统变得更为多元化、潜力更大。至于其他初创企业和聚焦细分领域的企业,则主要是聚焦让AI智能体在垂直类场景落地。
- 科技说说
对话猎豹移动傅盛:大模型不是通往AGI的唯一路径
傅盛表示,自己在AI 1.0时代便看到了机器人将从传统的工业场景走到服务业场景,乃至千家万户的机会,因此于七年前投资创办了猎户星空。
而在进阶程度更高的AI 2.0时代,他用“人类科技史上的奇迹年”来形容人工智能的这波崛起,认为可与牛顿的“万有引力”或是爱因斯坦“相对论”的出现相提并论。在他看来,大语言模型带来的端到端创新范式的影响,对全行业、全社会都会产生巨大改变。
- 界面新闻
瞄准新摇钱树,思科“放弃”网络业务?
除了今年之内两次宣布裁员之外,思科最新的“重组举措”还包括将其原本独立的网络部门(Networking)与安全(Security)和协作(Collaboration)部门进行整合,以期打造更加统一和精简的产品与服务。对于依靠网络设备起家并实现安身立命的思科来说,这无疑是一个非常重要的转变。
- C114通信网
快手转向AI,程一笑边降本边借钱
快手不断减少行政开支、研发开支下降,雇员福利支出降低,但依然大手笔投入营销,对于后续AI板块的研发或有一定影响。
快手亟需补充资金,2024年6月,其与若干商业银行订立无抵押信贷融资协议,融资项下总额为90亿元。
- 预审IPO
今日推荐
开源项目
remix-run/remix
https://github.com/remix-run/remix
Remix 是一个新的全栈式 JavaScript 框架,它摆脱了静态网站的生成,并且在其他方面做了一些与我们常用的其他框架不同的事情。它依靠 React 来渲染用户界面,如果你熟悉 Next.js,你肯定能发现很多相似之处。但它也有自己的特点,比如嵌套路由、数据获取和数据保存的处理以及错误处理等。
每日一博
MySQL 5.7 DDL 与 GH-OST 对比分析
本文首先介绍 MySQL 5.7 DDL 以及 GH-OST 的原理,然后从效率、空间占用、锁阻塞、binlog 日志产生量、主备延时等方面,对比 GH-OST 和 MySQL5.7 DDL 的差异。
开源之声
用户观点
微软“砍刀部”出手——将近40岁的「Windows控制面板」被淘汰
- 观点 1:改的好,要多改,大改,linux就有更好条件发展了
- 观点 2:利好linux mac
- 观点 3:感觉挺好用的啊
- 观点 4:说实话,设置的功能就是答辩,虽然好看了,但是真的很难用。
- 观点 5:《几乎用不到控制面板了》
- 观点 6:如果真能把控制面板所有的功能都迁移过来,我倒是没什么意见
- 观点 7:设置不就是另一个控制面板?改头换面有什么意义?kpi
- 观点 8:控制面板更直观,使用更简单。哪个设置应用,用着别扭,功能藏得很深。
- 观点 9:坐等未来某个时刻缅怀吧 微软砍掉的放弃的都是好东西
- 观点 10:我也觉得,本来windows就已经形成这种习惯,又没有特别的坏处,不知道为什么要放弃,包括一些已经固化的习惯,除非改进的确实特别好,否则,不知道改动意义是什么
- 观点 11:我就喜欢控制面板,WINDOWS内又不是所有系统和底层相关设置都是在一个统一的系统“设置”里面完成的
小米将对外公开超1000万行开源代码
- 观点 1:ESP32能用吗?
- 观点 2:应该可以,eps32在智能家居方面还是优先的
- 观点 3:一千万行,是加上各种库一共吗
- 观点 4:树莓派可以用吗
- 观点 5:支持 js 语言就行了
- 观点 6:这种为了工作而产生代码,漏洞肯定不少。等开源后找漏电,米家可卖了不少设备,黑产狂欢。大概率不会全部开源。
Windows、Mac和Linux用户终究是殊途同归
- 观点 1:“用闲置的硅材料制造自己的微处理器”——你们家光刻机借我用用?
- 观点 2:只有光刻机好像还不行,要完整的fab流程设备,还得买化学,金属材料
- 观点 3:linux折腾半天,结果输入法崩溃,还是重装win系统
- 观点 4:真实...到现在没搞明白wayland fcitx5 electron这仨玩意怎么就不能默认情况同时存在。非要每个electron应用都配置传一遍参数....
- 观点 5:linux:出问题,发现依赖破坏,重装系统。
- 观点 6:现在国产linux像deepin openkylin很容易上手了,不必那么折腾,win+linux双系统才是完美大结局!
- 观点 7:现在wsl基本都够用
- 观点 8:所以我在一台电脑上装了Windows、macos、Ubuntu三个系统
- 观点 9:没有什么操作系统比 Linux distro 更好用易用、更人性化、更简单。
- 观点 10:硬盘没坏的话,重装系统前可以从PE启动去备份文件
- 观点 11:未必,学习曲线过于陡峭罢了
- 观点 12:win+linux子系统最终解决方案
- 观点 13:可以搞linux to go啊
- 观点 14:linux对于程序员来说非常好用,对其他用户来说宛如天书,各种命令
- 观点 15:linux用户表示迁移用rsync不明白为什么丢失文件,虽然双系统,但是每次打开win都很恶心
---END---
最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!