本文翻译自 Apache Cloudberry (Incubating) 官方英文博客,译文较原文有个别微调。
原文地址:https://cloudberry.apache.org/blog/cloudberry-database-enters-the-apache-incubator
2024 年 10 月 12 日,Cloudberry Database 项目通过投票获准加入 Apache 软件基金会孵化器[1],这标志着 Cloudberry 项目及其社区的一个重要里程碑。2024 年 11 月 5 日,Cloudberry 项目的关联代码仓库迁移至 Apache 软件基金会。随着此次转变,Cloudberry 正式加入 Apache 孵化器,并在其旗下启动孵化开发。此外,Cloudberry Database 正式更名为 Apache Cloudberry™ (Incubating)。
什么是 Cloudberry
Cloudberry 由 Greenplum Database 原始开发者创建,是一款领先且成熟的开源大规模并行处理(Massively Parallel Processing,MPP)数据库。它基于开源版的 Pivotal Greenplum Database® 衍生而来,但采用了更新的 PostgreSQL 内核,并具备更先进的企业级功能。Cloudberry 可以作为数据仓库使用,也可用于大规模分析和 AI/ML 工作负载。
Greenplum Database 已被众多不同行业的小型、中型和大型团队广泛采用,并长期位居 DB-Engines 网站[2] 最受欢迎的 Top50 数据库。然而,随着开源版本 Greenplum Database 走向归档以及其社区彻底关闭,原开源用户将无法免费获取安全或功能更新,这对他们的业务造成了潜在挑战。
我们希望 Cloudberry 成为原 Greenplum 开源版本的主要开源替代方案。我们也期望所有 Greenplum 的开源开发者和用户能够迁移到 Cloudberry 上来。
Cloudberry 的来龙去脉
在展开后续内容之前,我们希望回顾一下 Greenplum Database 从闭源到开源(2015 年 10 月),再到重新闭源(2024 年 5 月)的历史:
-
Greenplum Database 最早发起于 2003 年,基于 MPP 架构和 PostgreSQL 技术,由 Greenplum 公司创建。
-
2010 年,Greenplum 公司被 EMC 收购。
-
2012 年,EMC 和 VMware(EMC 的子公司)将包括 Greenplum Database 在内的若干软件资产合并为一家新公司 Pivotal Software。
-
2015 年,Pivotal 开源了 Greenplum 的核心引擎,并将其重新命名为 Pivotal Greenplum Database®,成为行业第一个开源的 MPP 数据仓库。Pivotal Greenplum Database® 的开源核心还促成了 Apache HAWQ 和 Apache MADlib 项目,但 Greenplum 本身仍是单一厂商所有的开源项目。
-
2019 年,VMware 收购 Pivotal Software。本次收购使得 Pivotal Greenplum Database® 重回 VMware。此后,VMware 继续支持 Greenplum Database 的开发及其开源社区,并在后续几年提供 VMware Tanzu Greenplum 作为其商业产品。
-
2023 年 11 月,Broadcom 完成对 VMware 的收购,Greenplum 归属于 Broadcom[3]。
-
2024 年 5 月,几乎所有的 Greenplum GitHub 仓库被归档并设置为只读,其 Slack 工作区(https://greenplum.slack.com)被删除,原有的
user
[4] 和dev
[5] 邮件列表停止活动,此类操作均未在提前发布相关声明的情况下进行。
可以看到,Greenplum Database 多年来频繁更换所有权,引发了社区用户、开发者和生态伙伴的担忧。由于受单一厂商控制,Greenplum 缺乏允许社区参与决策的开放治理模式。
Cloudberry 的构建者认识到 Greenplum Database 已长期缺乏创新动力和主要功能更新,与新一代开源数据仓库和分析项目相比竞争力不断下降。
Cloudberry 项目始于 2022 年,由原 Greenplum 开发者打造,并在 2023 年开放源码。当 Greenplum 突然转为闭源时,这一变化令人吃惊。从那时起,我们坚定了继续使命的决心,致力于团结原 Greenplum 的开源开发者和用户,并以社区方式打造我们的项目。
Cloudberry 不是简单换名。它拥有宏伟的愿景,并提供许多先进功能与解决方案(备注:部分功能已在路线图上并等待开源进而贡献到主分支),包括更新的 PostgreSQL 内核、增强的安全性、端到端性能优化、支持 AI/ML 工作负载及流处理、湖仓集成等。我们致力于让 Cloudberry 与 Greenplum 保持兼容,让用户可以像使用 Greenplum 一样使用 Cloudberry。
为什么选择 Apache 孵化器?
加入 Apache 孵化器是 Cloudberry 的一大进步,打开了与开源世界协作、社区增长和创新的大门。Apache 孵化器为开源项目提供了治理、指导和项目管理的框架,确保项目的成长符合“Apache 之道”(Apache Way),实现以社区驱动的开发模式,保持透明和开放协作。
随着 Cloudberry 加入孵化器,我们比以往任何时候都更加致力于培养充满活力、多样化的开发者社区,并鼓励来自全球的贡献者参与。Cloudberry 也可从经验丰富的 Apache 孵化器导师们的指导中受益。我们希望通过践行“Apache 之道”(Apache Way),推动 Cloudberry 顺利从 ASF 孵化器毕业,并成为一个成熟且成功的顶级 Apache 项目。
致谢
感谢来自 Cloudberry 社区的所有贡献者,以及我们上游项目贡献者的辛勤努力!感谢 Roman Shaposhnik 作为我们的 Champion,感谢 Willem Jiang 和 Kent Yao 担任我们的导师!
加入我们
随着 Cloudberry 开始在 Apache 孵化器中的激动人心的旅程,我们邀请开发者、数据科学家和数据库爱好者一起参与进来,共同塑造 Cloudberry 的未来。无论是贡献代码、分享使用案例,还是参与讨论,我们欢迎每个人加入 Cloudberry 不断壮大的社区。
关注我们
您可以通过以下方式找到我们:
-
网站:https://cloudberry.apache.org
-
GitHub:https://github.com/apache/cloudberry
-
Slack:https://apache-cloudberry.slack.com
-
开发者邮件列表:
-
订阅开发者邮件列表:发送邮件至 dev-subscribe@cloudberry.apache.org[6]
-
浏览过去的邮件列表讨论:https://lists.apache.org/list.html?dev@cloudberry.apache.org
-
引用链接
[1]
2024 年 10 月 12 日,Cloudberry Database 项目通过投票获准加入 Apache 软件基金会孵化器: https://lists.apache.org/thread/qzfb38dzb1x3cg29snq4doy95gd6pzy8
[2]
DB-Engines 网站: https://db-engines.com/en/ranking
[3]
Broadcom 完成对 VMware 的收购,Greenplum 归属于 Broadcom: https://investors.broadcom.com/news-releases/news-release-details/broadcom-completes-acquisition-vmware
[4]
`user`: https://groups.google.com/a/greenplum.org/g/gpdb-users
[5]
`dev`: https://groups.google.com/a/greenplum.org/g/gpdb-dev
[6]
dev-subscribe@cloudberry.apache.org: mailto:dev-subscribe@cloudberry.apache.org