过去几周导致 GitHub 频繁宕机的最初主要原因是其 mysql1 集群负载增加,数据库代理达到最大连接数,导致服务中断。在中断期间,所有写入操作都无法运行,包括 git 操作、webhook、拉取请求、API 请求、issues、GitHub Packages、GitHub 代码空间、GitHub 操作和 GitHub 页面服务。
为了防止将来发生此类事件,GitHub 已开始在高峰时段对该特定数据库的负载模式进行审计,并根据这些审计进行一系列性能修复。作为其中的一部分,他们正在将流量转移到其他数据库,以减少负载并加快故障转移时间,并审查其变更管理程序,特别是与生产中高负载期间相关的监控和变更。
世界大厂都只能换数据库,这还能出个啥建议?