开源日报 | 李彦宏称开源模型是智商税;Windows下的GUI开发;有趣的人形机器人;边学AI边赚钱

来源: OSCHINA
编辑:
2024-07-05 18:16:15

 欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。

# 2024.7.5

今日要闻

李彦宏:开源模型是智商税,智能体正在爆发

李彦宏认为,开源其实是一种智商税。“当你理性地去想,大模型能够带来什么价值,以什么样的成本带来价值的时候,就会发现,你永远应该选择闭源模型。今天无论是ChatGPT、还是文心一言等闭源模型,一定比开源模型更强大,推理成本更低。”

谈及“AI超级应用什么时候出现”时,李彦宏表示,“不是说一定在等待一个超级应用的出现”。他认为,在基础模型之上,应该能够诞生数以百万计的各种各样的应用。“如果仅仅是从0到1,你可能会希望出现某几个Super APP,也就是几个公司从中受益。但是今天,几乎各行各业所有的公司,被大模型加持之后,它都能受益。这种影响力,对于整个社会、对于人类来说,无疑是更大的。”

李彦宏称,智能体代表着AI时代的未来趋势。“智能体正在爆发,只是现在基数还比较小,大家的体感没有那么强烈。”基础模型需要靠应用才能显现出价值,智能体是一个几乎“放之四海而皆准”的基于大模型的应用,由于它门槛足够低,可能你连编程都不用,就可以做出一个效果不错的智能体。“让更多人进来,他们发挥聪明才智,指不定哪条路跑通了,它就是一个Super APP。”

MySQL 9.0“创新版”已支持向量,为何甲骨文却“偷偷摸摸”地宣布?

对于 MySQL 9.0“创新版”,最值得关注的新特性莫过于支持向量数据类型字段类型名称为 VECTOR,可以使 to_vector/string_to_vector/from_vector/vector_dim 等函数操作向量数据。MySQL 9.0 的 Release Notes 写道

此版本中添加了对 VECTOR 列类型的支持。向量 (Vector) 是一种数据结构,由条目列表(4 字节浮点值)组成,可以表示为二进制字符串值或列表格式的字符串。

VECTOR 列声明有最大长度或条目数(在括号中);默认为 2048,最大为 16383。

下面示例是使用 CREATE TABLE 创建包含 VECTOR 列的 InnoDB 表:

mysql> CREATE TABLE v1 (c1 VECTOR(5000));
Query OK, 0 rows affected (0.03 sec)

操作向量的相关函数介绍:

  • VECTOR_DIM() 函数用于获取向量的长度
  • STRING_TO_VECTOR()(别名TO_VECTOR())函数采用向量的列表格式表示形式,并返回二进制字符串表示形式
  • VECTOR_TO_STRING()(别名FROM_VECTOR())函数执行和上面相反的操作
mysql> SELECT STRING_TO_VECTOR('[2, 3, 5, 7]');
+------------------------------------------------------+
| TO_VECTOR('[2, 3, 5, 7]')                            |
+------------------------------------------------------+
| 0x00000040000040400000A0400000E040                   |
+------------------------------------------------------+
1 row in set (0.00 sec)

mysql> SELECT VECTOR_TO_STRING(0x00000040000040400000A0400000E040);
+------------------------------------------------------+
| VECTOR_TO_STRING(0x00000040000040400000A0400000E040) |
+------------------------------------------------------+
| [2.00000e+00,3.00000e+00,5.00000e+00,7.00000e+00]    |
+------------------------------------------------------+
1 row in set (0.00 sec)

更多信息和示例查阅:VECTOR TypeVector Functions (WL #16081)

通义真正实现全尺寸、全模态开源,下载量已破2000万

在今日的 2024 上海世界人工智能大会上,阿里云 CTO 周靖人公布近期通义大模型和阿里云百炼平台的最新进展:近 2 个月,通义千问开源模型下载量增长 2 倍,突破 2000 万次;阿里云百炼服务客户数从 9 万增长至 23 万,涨幅超 150%。

周靖人重申了阿里云拥抱开源开放的坚定立场,“两年前,我们在世界人工智能大会上发布通义大模型系列,当时我们公布,通义核心模型将开源开放。到今天,通义千问已经实现真正意义上的全尺寸、全模态开源,拉平了开源、闭源模型之间的差距。”

腾讯混元DiT开源6G小显存版本,支持Kohya训练

腾讯混元文生图大模型(混元DiT)宣布开源小显存版本,仅需6G显存即可运行,对使用个人电脑本地部署的开发者十分友好,该版本与LoRA、ControlNet等插件,都已适配至Diffusers库;并新增对Kohya图形化界面的支持,让开发者可以低门槛地训练个性化LoRA模型;同时,混元DiT模型升级至1.2版本,在图片质感与构图方面均有所提升。

此外,腾讯宣布混元文生图打标模型”混元Captioner“正式对外开源。该模型支持中英文双语,针对文生图场景进行专门优化,可帮助开发者快速制作高质量的文生图数据集。


今日观察

社交观察

《JavaScript 工程师的 Python 指南》

作者是一名前端工程师,受人工智能的影响,决定系统性地学习 Ptyhon,并将其学习过程整理成这本书。涵盖了从 Python 环境安装到项目开发的方方面面,同时会通过案例对比 JavaScript 和 Python 语言的异同,帮助 JavaScript 工程师快速掌握 Python 语言。

GitHub:github.com/luckrnx09/python-guide-for-javascript-engineers

- 微博  GitHubDaily

用150行C代码超越NumPy的矩阵乘法性能

“这篇博文是我尝试在CPU上实现高性能矩阵乘法的结果,同时保持代码简单、可移植和可扩展。该实现遵循BLIS设计,适用于任意矩阵大小,并且在针对AMD Ryzen 7700(8核)进行微调后,性能超过了NumPy(=OpenBLAS),在各种矩阵大小上实现超过 1 TFLOPS 的峰值性能”。
 
文章地址:salykova.github.io/matmul-cpu

- 微博 蚁工厂

Windows下的GUI开发

开发Windows GUI应用真是让人头疼,先梳理一下需求:

- 仅支持Windows
- 允许商业用途
- 易于样式化,包括暗模式
- 结果是一个无依赖或最小依赖的单一.exe文件,大小不超过40MB
- 编写GUI部分不应比实际功能花费更多时间

然而目前市面上的常见库体验并不好:

1. WinUI 3:支持现代Windows组件和样式化,但分发时依赖繁多,难以实现单一可执行文件。
2. Win32 / MFC:高可移植性,但样式化困难,需要大量自定义绘制代码。
3. Qt:功能强大,易于样式化,但动态链接依赖大,静态链接需开源或购买商业许可证。
4. wxWidgets:学习曲线平缓,可静态链接成小文件,但样式化受限。
5. hikogui:新兴库,使用Vulkan后台,样式化方便,但编译复杂且稳定性差。
6. Sciter:类似Electron,支持HTML/CSS写GUI,但渲染效果一般,某些元素无法自定义。
7. WinForms / WPF:建议使用其他前端技术并加载C++功能模块,理论上可实现单一可执行文件,但依然有些复杂。

经过多方尝试,发现Dear ImGui最适合简单的应用。虽然设计复杂UI时有些局限,但符合大部分需求。ImGui是即时模式UI,需要使用DirectX进行渲染,但其结果只有500KB大小,不需要额外安装任何依赖。

- 微博 量子位

上海AI lab开源多模态LLM:InternLM-XComposer-2.5

详细的模型特点:

  • 长上下文处理:IXC-2.5原生支持24K标记的输入,可扩展到96K,能处理超长文本和图像输入。
  • 多样化视觉能力:支持超高分辨率图像理解、细粒度视频理解和多轮多图对话。
  • 其他功能:可以生成网页和高质量文章,结合了文本和图像。
  • 模型架构:包括轻量级视觉编码器、大语言模型和部分LoRA对齐。
  • 测试结果:在28个基准测试中,16项超过开源模型,16项接近或超过GPT-4V和Gemini Pro。

模型下载:https://huggingface.co/internlm/internlm-xcomposer2d5-7b

- 微博 歸藏的AI工具箱

边学 AI 边赚钱的 GitHub 项目

从 2023/3 月开始用 chatgpt 和 mj 等 ai 开始,我们已经陆续开发了几个 ai 项目。最近,帮助公司内部文档查询的基于 llama3 的 RAG 项目也开始部署了。而在这个过程中,我们才慢慢明白 LLM 是什么,能力的边界在哪里。哪些人是靠谱的,又有哪些人在胡说。

而今天 ai device 的热潮慢慢升温,ai 开始结合硬件。学习的最佳方式,仍然是参与项目。前一段时间介绍的 friend 这个硬件项目就非常有意思。他不但开源了,而且会在 GitHub issues 里面用悬赏。

比如这个 issues 390 ,你解决了就拿走 100 美金。
https://github.com/BasedHardware/Friend/issues/390

- 微博 李楠或kkk

媒体观察

这些有趣的人形机器人争相登场,它们离实际应用有多远?

多位业内人士表示,倘若机器人未来大规模应用,从制造业到服务业,真正走进公众生活、走近百姓身边,陪护老人、陪教儿童等,还有许多“软硬件”待升级,包括看得见的零部件灵敏度、安全性等,看不见的数据隐私、算法偏见、伦理道德等,都需要有更全面、更优化的解决方案,保障新技术、新产品的安全和可持续发展。

- 新华社

国内首款人形机器人公版机发布,百亿人形机器人产业基金正在弦上

为何发布公版机?很大程度上是由于目前人形机器人产业面临的一系列共性问题。比如硬件层面同质化重发研发,中小企业创新难;软件层面动力学研发周期长,容易摔倒,稳定性不够。

国地共建中心首席科学家江磊对21世纪经济报道记者表示,“手机行业曾经经历了从公版机,到目前手机大厂的发展模式。公版机,也是促进人形机器人快速标准化,通用化最好的方式。等下半年,共创验证没有问题,会择机完全开源。”

- 21世纪经济报道

硅基流动完成近亿元天使+轮融资 国产大模型“补足弹药”混战升级

今年以来,大模型赛道热闹非凡:一方面国内大模型创业公司打响“价格战”;另一方面,OpenAI宣布终止对中国开发者提供API(应用程序接口)服务也引发了国内大模型争相推出“迁移计划”。与此同时,资本也正在向头部企业进一步聚集。

- 每日经济新闻

【西街观察】开放是AI风险的唯一解

AI的风险底层是技术问题,由于其决策过程常因技术黑箱而显得神秘莫测,这种不透明性不仅削弱了公众的信任,还为技术主导者的滥用和误判提供温床。推动AI技术的开放势在必行,让更多人能够深入了解AI运作机制。

- 北京商报

大模型落地考,难点在哪里?

所以,大模型的能力在多模态方面的突破,会带来AI的普惠,为AI开启更多的可能性。原来的投入产出是一个金字塔型结构,即投入很大,但是收益很小;只有将它变成一个倒金字塔结构,这样才能真正放大它的价值。

新技术在催生新的产业变迁的同时,也会构建一个新的价值链,AI产业也是如此,从单点爆发到各行业的全方位突破,AI所创造的价值也将是指数级的。

- 光锥智能

大模型想赚钱,先过这七道难关

中关村科金CTO李智伟博士最近发现,大模型商业闭环,正在被提到很重要的位置。

不同于过去20年间中国IT行业的发展,可以通过烧钱来快速积累用户,靠估值和广告实现商业变现;大模型时代,投资市场愈加理性,正在倒逼业界加快实现商业闭环。

- 数智前线

工信部赵志国:开放鸿蒙、开源欧拉等优质开源项目正在走向国际舞台

工业和信息化部新闻发言人、总工程师赵志国在“推动高质量发展”系列主题新闻发布会上表示,生态的打造与构建对信息通信业发展极其重要。目前,我国成立了开放原子开源基金会,开放鸿蒙、开源欧拉等优质开源项目正在走向国际舞台。

- 通信世界网


今日推荐

开源项目

wa-lang/wa

https://gitee.com/wa-lang/wa

凹语言(凹读音“Wā”)是 针对 WASM 平台设计的通用编程语言,同时支持 Linux、macOS 和 Windows 等主流操作系统和 Chrome 等浏览器环境,同时也支持作为独立 Shell 脚本和被嵌入脚本模式执行。

每日一博

VLMs 多模态大模型当下进展与思考

在过去的一年中,VLMs 技术取得了飞速发展。本文旨在对这些技术进步进行梳理与思考,但将避免深入具体的论文细节,而是用简明扼要的方式介绍每篇研究的核心思想。


开源之声

用户观点

Visual Studio Code 1.91 发布

  • 观点 1:graph终于出现了,希望搞的更牛批点,比webstorm的git图形化还好。大家都去点个赞,加快点速度,让vscode的git更好用!!!github----com/microsoft/vscode/issues/179053
  • 观点 2:mac更新完,VSC起不来了
  • 观点 3:目前我用Git Graph插件,不过几年没更新了
  • 观点 4:没有独立的git提交界面

李彦宏:没有应用,基础模型不值一提

  • 观点 1:比没有应用更可怕的是没有下限,你的文心一言会不会骗大家去莆田系医院呢?
  • 观点 2:现在有什么问题还是要ChatGPT google。某些搜索引擎搜索出来的东西不能看啊。
  • 观点 3:为了吃入,从一个极端到另一个极端?
  • 观点 4:可以预测的未来,百度越是缺钱,百度搜索体验越差,这简直是一个恶性循环,百度搜索结果前两页全是广告,名副其实的广告搜索。
  • 观点 5:说的也没错,现阶段AI就是适合专向专干。
  • 观点 6:起个大早,赶个晚集。
  • 观点 7:陆奇哭晕在厕所里

Elasticsearch 8.14.2 发布

  • 观点 1:一般用来干嘛?
    • 观点 2:百度搜索
  • 观点 3:前段时间在服务器启动了一个es,结果内存8g被吃掉了,直接选择放弃
    • 观点 4:修改jvm参数,修改内存大小。

美团面了大概四十分钟,全程细节拷打

  • 观点 1:要是没什么干货,大可不必水文章。
    • 观点 2:兄弟,程序员终极归宿是送外卖啊。难道还想登月球?
    • 观点 3:我偏不,我开网约车
  • 观点 4:这送外卖的是程序员出身的可以理解了。但你这面试官怎么还是程序员出身呢?也晋升管理层了是吧?哦,我悟了。[旺柴]前期写代码,如果顺利,可以晋升管理层,如果不顺利,35岁去送外卖了。然后再顺利,也还是能进管理层的啊!
    • 观点 5:外卖面试官还懂out of box呢
  • 观点 6:没问电动车的原理是什么?
  • 观点 7:看完了!小编现在真的改过自新了!或是已经良心发现了!要不然,这种标题,内容百分百是广告。
  • 观点 8:开水团前端感到被冒犯
  • 观点 9:读个大学去做程序员,不做程序员去送外卖,结果发现老大居然是初中毕业就去打工的同学了。会不会很尴尬
  • 观点 10:赶快开班培训一下吧,这个真的很有用
  • 观点 11:互联网的尽头是送外卖
  • 观点 12:兄弟,你这里的“餐”,不会是暗指“数据包”吧,送餐=发包,电话联系=TCP连接,你面的还是程序员对不?

---END---

最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!

展开阅读全文
点击加入讨论🔥(4) 发布并加入讨论🔥
本篇精彩评论
闭源的优势是我不行你还也不知道我不行
2024-07-06 09:37
1
举报
闭源的优势就是:我可以抄开源的,但是开源不能抄我的。
2024-07-06 08:13
1
举报
4 评论
1 收藏
分享
返回顶部
顶部