首页
开源软件
问答
博客
翻译
资讯
Gitee
众包
活动
专区
源创会
高手问答
开源访谈
周刊
公司开源导航页
登录
注册
资讯
软件
博客
动弹
专区
问答
活动
工具
培训
APP
Gitee
新媒体
OSC 公众号
硬核 + 嬉笑怒骂
OSC 微博
技术圈大 V 出没
OSC 视频号
AI 百科
OSC 今日头条
微头条显行业百态
LFOSSA 公众号
LF 开源软件学园
Gitee AI 公众号
大模型托管平台
Gitee 服务号
研发管理解决方案
登录
注册
OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施
作者:王建伟(正己) 12 月 11 日,OpenAI 旗下 AI 聊天机器人平台 ChatGPT、视频生成工具 Sora 及其面向开发人员的 API 自太平洋时间下午 3 点左右起发生严重中断,耗费约三个小时才顺利恢复所有服务。 OpenAI...
作者:
阿里云云原生
OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施
分享
复制链接
README badge(
)
社交分享
微信
QQ
微博
深蓝苹果
昨天 09:38
夹带私货有些太明显了。
这个事故本质原因是,遥测占用了过多业务的容量,并非 K8S 下辖组件自身问题。
按lz思路做物理隔离,当然OK,但应选用 etcd 做,而不是又引入私货的nacos
回复
举报
深蓝苹果
昨天 09:38
夹带私货有些太明显了。
这个事故本质原因是,遥测占用了过多业务的容量,并非 K8S 下辖组件自身问题。
按lz思路做物理隔离,当然OK,但应选用 etcd 做,而不是又引入私货的nacos
回复
举报
天
天1天1天
01/17 21:33
所以搞ai的吹了这么多牛,居然连最基本的预警都实现不了智能化,很讽刺啊
回复
举报
深蓝苹果
昨天 09:40
这个没啥,飞机飞得快,不说明飞机场维护的好
回复
举报
回复 @
{{ emoji.type }}
{{emojiItem.symbol}}
评论用户
天
推荐博客
推理中心化:构建未来AI基础设施的关键
肖滢
·
昨天 18:39
0 评论
AI大模型如何影响基础软件行业中的开发工具与环境?
肖滢
·
昨天 18:32
0 评论
大模型生成代码的安全与质量
肖滢
·
昨天 17:30
0 评论
人工智能与处理器芯片架构
肖滢
·
昨天 17:26
0 评论
2024: 大模型背景下知识图谱的理性回归
肖滢
·
昨天 16:50
0 评论
谈开源大模型的技术主权问题
肖滢
·
昨天 15:52
0 评论
机房迁移,不同 Pod 副本请求耗时会相差数倍?
阿里云云原生
·
昨天 15:42
0 评论
AI Agent逐渐成为AI应用的核心架构
肖滢
·
昨天 15:33
0 评论
AI 开发者中间件工具生态 2024 年总结
肖滢
·
昨天 15:28
0 评论
海外泼天流量丨浅谈全球化技术架构
阿里云云原生
·
昨天 15:17
0 评论
删除一条评论
评论删除后,数据将无法恢复
取消
确定
©OSCHINA(OSChina.NET)
工信部
开源软件推进联盟
指定官方社区
社区规范
深圳市奥思网络科技有限公司版权所有
粤ICP备12009483号
顶部
这个事故本质原因是,遥测占用了过多业务的容量,并非 K8S 下辖组件自身问题。
按lz思路做物理隔离,当然OK,但应选用 etcd 做,而不是又引入私货的nacos
这个事故本质原因是,遥测占用了过多业务的容量,并非 K8S 下辖组件自身问题。
按lz思路做物理隔离,当然OK,但应选用 etcd 做,而不是又引入私货的nacos