开源日报 | 微软开源GraphRAG;AI不仅仅是大模型;开源语音模型接近人类水平;中国寻求人类“开源”新方式

来源: OSCHINA
编辑:
2024-07-03 19:54:45

欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。

# 2024.7.3

今日要闻

Fedora 41 要和 Python 2.7 说再见

红帽工程师 Miro Hrončok 提交了一份变更提案,建议在 Fedora 41 中退役 Python 2.7,并放弃仍然依赖 Python 2 的软件包。

Python 2 已于 2020 年 1 月 1 日退出生命周期,CentOS 7 也已退出生命周期,RHEL 8 的 Python 2.7 应用程序支持也将退出,红帽开发人员认为现在是时候从 Fedora 中移除 Python 2.7 软件包了。除了 PyPy 之外,Fedora 将不再支持 Python 2。

微软 WSL2 过渡至 Linux 6.6 LTS 内核

一直以来,微软 Windows Subsystem for Linux 2(WSL2)的内核使用的都是 Linux 5.15 LTS 内核。现如今,它终于从那个已经老化了的 LTS 版本升级到了当前的 Linux 6.6 LTS 系列。

日前发布的 linux-msft-wsl-6.6.36.3 内核是第一个使用 Linux 6.6.36 作为基础的 WSL2 内核。除了升级内核版本外,还对 x86_64/ARM64 内核配置进行了修改,包括支持可加载模块。

科技巨头的开源 AI 模型是“假开源”

《Nature》的一篇报道指出,很多科技巨头宣称他们的 AI 模型是开源的,但实际上并不完全透明。这些模型的数据和训练方法往往没有公开,这种做法被称为 “开源洗白”,严重妨碍了科学研究的可复现性和创新。

研究发现,在资源有限的情况下,小公司和研究团队往往能做到更加透明和开放。真正的开源应该包括代码、数据和训练方法的全面公开

微软基于图的检索增强型生成(RAG)系统,GraphRAG,开源了!

GraphRAG通过创建知识图谱来增强模型的推理和生成性能,使用 LLM GPT-4 对 GraphRAG 和传统 RAG 进行评估, GraphRAG 在全面性和多样性方面优于传统 RAG。

与使用纯文本片段的简单语义搜索不同,GraphRAG 从原始文本中提取知识图谱、构建知识模块结构、生成摘要,帮助大模型更好地捕捉文本中的复杂联系和交互,来增强其生成、检索等能力。


今日观察

社交观察

开源语音模型接近人类水平

Fish Speech是一款已经开源的文本到语音(TTS)模型。

这个模型使用了三语数据进行训练,经过约15万小时语音数据的锤炼,Fish Speech的语音处理能力已接近人类水平,并且可以完美支持中英日文三种语言,目前它在Github上的标星数已达2.9k!

- 微博  量子位

腾讯的多智能体翻译工具免费在线试用

腾讯的多智能体翻译工具已经可以免费在线试用了,而且是使用的 GPT-4 的 API,你可以上传txt或者pdf文件,然后会自动帮你翻译,并且整个过程都可以从右边的 Chatbox 看到。

注意上传后要手动选一下目标语言。使用地址:transagents.ai 

- 微博 宝玉xp

对话腾讯汤道生:AI不仅仅是大模型

过去1年,腾讯集团高层间,新增了一个重要的企业微信群聊。腾讯公司董事会主席兼CEO马化腾、总裁刘炽平、高级执行副总裁卢山和汤道生等,悉数进入该群。这个群专门针对大模型技术变革,用于分享和讨论最新前沿并跟进业务进展。

很多人说,对大模型,腾讯“不着急”。对此,汤道生表达了不同看法:“着急啊。我们在群里经常讨论,不能说不着急。”

在汤道生看来,对于腾讯这样体量的公司,资源上必须确保投入和跟进,做“类OpenAI”的研究与研发;但同时也要保持清醒,“不要把AI等同于大模型,要看得更全面”。

“不是只有做大模型的玩家才是做AI。这就等于认为,只有做手机的企业才在移动时代重要,是很狭隘的。”他说。

腾讯新闻《潜望》

结合开源图片与相关视频,天龙三这事大概能明晰了

火箭箭体及试车从设计到最后试车方案签字,中间理应经过多个部门间的协同与数次复查相关结构件的强度与设计的合理性,但离谱的是在此过程中竟无一人能发现这个如此低级又如此致命的错误,实在是令人汗颜。

- 微博 归零工作室RTZT

媒体观察

中国脑机接口发展提速:“机智”上新,从实验室走向市场

7月1日,工业和信息化部就《脑机接口标准化技术委员会筹建方案》(下称《方案》)公示征求公众意见,以推动脑机接口技术发展。此举说明我国脑机接口技术标准的制定有望提速。

- 一财网

爱奇艺限制投屏案落槌,算计用户不能“层层叠buff”

事实一再证明,吃相难看,势必难堪;积极解“套”,才有未来。会员花式加价并非解决长视频平台营收可持续增长的长久之道,靠不断降低用户体验感来增加营收与利润,只能是竭泽而渔。靠修改规则来收割老用户,终究是搬起石头砸自己的脚。只有以用户为中心,提高内容质量、提升服务体验,视频平台才能走得更远。

- 上游新闻

大模型吞了谁?程序员彷徨,产品经理消失

大模型呼啸而至,互联网已经很久没有经历这样的技术冲击了。互联网时代的技术岗打工人,和前线大模型公司,这两块拼图要完全吻合,难度超乎想象。

- 36氪

太空探索,中国寻求人类“开源”新方式

中国正在西方式现代化道路外另辟蹊径,走中国特色的和平、绿色、可持续发展的现代化道路,并积极寻求另一种“开源”方式——外太空探索,来突破地球资源上限,与各国共享发展红利。

- 环球时报新媒体

码农们的AI焦虑:交15万元上班,不卷就被“毕业”

但现阶段,社会普遍对AI产生了深刻焦虑,大学报志愿时,大家都会思考一个问题:什么专业以后不会被AI替代。有人说,正是职业焦虑让张雪峰们动辄上万元的高考志愿填报咨询火了。

程序员抢到了互联网爆发的红利,毕业几年就能拿到50万甚至上百万的年薪,一度触发了“文转码”的职业潮流,但如今,最怕被AI抢了“金饭碗”的人群也正是码农们,他们因此而“卷”。

- IT时报

成为巨头的“烦恼”,英伟达将在法国面临反垄断指控

除CUDA外,英伟达的其他护城河也面临对手挑战。此前据多家媒体报道,AMD、英特尔、谷歌、微软、博通、思科、Meta等企业已组建了UALink(Ultra Accelerator Link)联盟,旨在对抗英伟达另一项硬件互联技术NVLink。

- 界面新闻

谁卡了OpenAI的脖子?

当前OpenAI遭遇了“卡脖子”风波:一方面谷歌、亚马逊、Meta以及其合作伙伴英伟达等总市值超过8.7万亿美元(约合人民币63.3万亿元)的科技巨头对 AI 大模型领先地位“虎视眈眈”,借助自身流量和资本等优势强势加入赛道,促使美国 AI 市场竞争愈加激烈;另一面,OpenAI自身也遭遇“滑铁卢”,推出的GPT-4o语音助手功能测试时间不断推迟。

- 钛媒体AGI


今日推荐

开源项目

zombodb/zombodb

https://github.com/zombodb/zombodb

ZomboDB 通过使用 Elasticsearch 作为索引类型,为 Postgres 带来了强大的文本搜索和分析功能。其全面的查询语言和 SQL 函数支持以新颖和创造性的方式来查询你的关系数据。

每日一博

把飞书云文档变成 HTML 邮件:问题挑战与解决历程

要被邮件客户端识别,飞书云文档内容需要转译成 HtmlEmail 格式,该格式为了兼容各种版本的邮箱客户端(特别是 Windows Outlook),对于现代 HTML5 和 CSS3 的很多特性是不支持的,飞书云文档的多种富文本块格式都需要转译,且部分格式完全不支持,造成编辑和预览发送不一致的情况。

1.jpg


开源之声

用户观点

完全开源的现代化IDE正式发布:支持云端和桌面、兼容VS Code扩展、全球最大开源基金会打造

  • 观点 1:所以他比VS Code好在哪里?
    • 观点 2:号称完全开源
  • 观点 3:eclipse,曾经多么辉煌的呀
  • 观点 4:我先来,套壳 vsc
  • 观点 5:ide换来换去有毛用,代码写的垃圾依旧垃圾
  • 观点 6:这玩意不会又是个 Electron吧?
    • 观点 7:完全兼容vsc扩展,你说呢
  • 观点 8:很好,vscode有竞争对手了
  • 观点 9:现在是Debian下eclipse+vscode+kate,后面是不是可以eclipse全家桶了
  • 观点 10:有idea 要它干嘛?支持AI编程助手
  • 观点 11:所以为什么不用codium呢
  • 观点 12:已经在用了
  • 观点 13:很好!但是我放不下自己DIY后的vim,吹上天都没用
  • 观点 14:之前看vitis新ide风格像vscode,以为xilinx也转向vscode,结果是eclipse的新玩意
  • 观点 15:vscode的浏览器版本,除了微软自己用的以外,功能基本都是残血的,托管过的都知道。 所以有个新的挺好的。
  • 观点 16:完全兼容vsc,目前好像并不是,连jdp的实现Java debugger都没兼容上。Java Debugger的github仓库上有相关issue 最扯的是你标假快捷键是啥意思,样子产品。
  • 观点 17:所有云端的web IDE,纯粹是前端卷得没地卷了,强行把CICD绑到了一起搞出来的kpi项目。始终理解不了用它们图啥。如果一定要个牵强的理由:我们能ai自动补全,但我想用个高端一点的好理由来收你的钱。
  • 观点 18:它能开发java微服务大型项目吗?曾经是了vs跑java微服务,根本跑不起来

科技巨头的开源AI模型是“假开源”

  • 观点 1:早就对此感到奇怪了... 作为一个开源软件,至少能让用户自己编译(ai这里应该是训练)一个相同的软件(模型)吧,但是很多所谓的开源模型只是给出了一个可商用的预训练模型而没有给训练集以及相关的代码 这和闭源的免费软件好像也没什么区别...
  • 观点 2:OpenAI啥时候改名叫ClosedAI
  • 观点 3:其它好说,数据基本上就别想了,除了护城河,还可能有版权问题
  • 观点 4:这是哪个无耻之徒说出来的?人家都请你吃饭,把锅打开,递给你饭碗,难道还要给你喂饭?算法、算力、数据,人家不可能把三样全部都给你的,尤其是数据,要是连数据都给你,你岂不是第二天就立马选择自研?要点B脸不?
    • 观点 5:在 Google 之后,社媒平台 Reddit 与 OpenAI 达成了内容协议,这一消息推动其股价上涨逾十分之一。根据该协议,OpenAI 将获得 Reddit 内容的访问权限,同时它将为 Reddit 提供 AI 驱动功能。和 Stack Overflow 类似,Reddit 的内容都是用户创造和管理的,它的高质量内容应该早就被 OpenAI 抓取并被用于训练大模型。OpenAI 等 AI 公司正面临来自众多版权所有者的诉讼,通过与 Reddit 等公司达成协议,AI 公司正试图合法化其训练数据。

---END---

最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!

展开阅读全文
点击引领话题📣 发布并加入讨论🔥
0 评论
2 收藏
分享
返回顶部
顶部