GitHub.com 跑了 1200 多台 MySQL 主机,如何无缝升级到 8.0?

来源: OSCHINA
编辑:
2023-12-11 13:59:00

GitHub 团队近日分享了他们将 GitHub.com 的底层数据库无缝升级到 MySQL 8.0 的经验。

据介绍,GitHub 使用 MySQL 来存储大量关系数据,因此在不影响网站服务级别目标 (SLO) 的情况下升级主机集群(1200 多台 MySQL 主机)绝非易事。其团队表示,为了升级到 MySQL 8.0,他们规划、测试和升级本身总共花费了一年多的时间,并且需要 GitHub 内部多个团队的协作。

GitHub 的 MySQL 基础设施概览:

  • 由 1200 多台主机组成,包括数据中心中的 Azure 虚拟机和裸机主机
  • 存储超过 300 TB 的数据,并在 50 多个数据库集群中每秒处理 550 万次查询
  • 每个集群都配置为具有主副设置的高可用性
  • 分区存储数据——利用水平和垂直分片来扩展 MySQL 集群,以及使用 MySQL 集群来存储特定产品领域的数据。此外还为大结构域 (large-domain) 提供了水平分片的 Vitess 集群,这些区域的增长超出了单主 MySQL 集群的规模
  • 庞大的工具生态,包括 Percona Toolkit、gh-ost、orchestrator、freno 和用于操作主机集群的内部自动化工具

由于需要操作两个版本的 MySQL,因此 GitHub 内部使用的工具和自动化设施需要能够兼容处理混合版本,并了解 5.7 和 8.0 之间新的、不同的或已弃用的语法

为了满足可用性标准,GitHub 团队采取了逐步升级策略,满足在整个过程中进行 checkpoint 和回滚的需求。下面是他们制定的升级计划:

  • 步骤 1:升级滚动副本 (rolling replica)

     

  • 步骤 2:升级备份拓扑 (replication topology)

     

  • 步骤 3:将 MySQL 8.0 主机提升为主集群

     

  • 步骤 4:升级面向内部的实例类型
  • 步骤 5:清理,确认集群不需要回滚并成功升级到 MySQL 8.0 后,删除 5.7 服务器。验证工作会至少经历一个完整的 24 小时流量周期,以确保在高峰流量期间不会出现问题。

至于为什么要升级到 MySQL 8.0,GitHub 团队表示主要是因为 MySQL 5.7 的生命周期即将结束。此外升级后可以获得最新安全补丁、错误修复和性能增强的 MySQL 版本。他们还希望测试 8.0 中的新功能并从中受益,包括即时 DDL、隐形索引和压缩的 bin 日志等。

详细的技术细节查看:https://github.blog/2023-12-07-upgrading-github-com-to-mysql-8-0/


延伸阅读

展开阅读全文
点击加入讨论🔥(14) 发布并加入讨论🔥
本篇精彩评论
可以学习下滴滴原地升级
2023-12-11 14:58
12
举报
人家又不用996
2023-12-11 16:45
3
举报
之前还没被收购前用的mysql, 虽然现在被微软收购了, 但换数据库这种行为还是太冒险
2023-12-12 12:20
2
举报
马斯克:不用计划了,今晚就升级
2023-12-12 09:08
2
举报
升级的价值在哪里,在国内行不通
2023-12-12 10:03
1
举报
14 评论
19 收藏
分享
返回顶部
顶部