云计算(cloud computing)是分布式计算的一种,指的是通过网络“云”将巨大的数据计算处理程序分解成无数个小程序,然后,通过多部服务器组成的系统进行处理和分析这些小程序得到结果并返回给用户。

加载中
置顶
程序员
发表了博客
03/18 18:20

一通百通,一文实现灵活的K8S基础架构!

> 作者简介 > > VIGNESH T.V.,Timecampus CEO、CTO及创始人。 Kubernetes是当前最为流行的开源容器编排平台,成为众多企业构建基础架构的首选。在本文中,我们将探讨针对你的用例构建基础设施的最佳方式,以及你可能要根据各种限制条件做出的各种决定。 ## 架构设计 你的架构应该在很大程度上围绕你的用例来设计,因此在设计过程中你需要非常仔细以确保该基础架构能够支撑你的用例,在必要的时候也可以寻求外部专业团队的帮助。... 展开更多

收藏 39
0
置顶
发表了博客
03/11 14:37

有道 Kubernetes 容器API监控系统设计和实践

本期文章,我们将给大家分享有道容器服务API监控方案,这个方案同时具有轻量级和灵活性的特点,很好地体现了k8s集群化管理的优势,解决了静态配置的监控不满足容器服务监控的需求。并做了易用性和误报消减、可视化面板等一系列优化,目前已经超过80%的容器服务已经接入了该监控系统。 来源/ 有道技术团队微信公众号 作者/ 郭超容 王伟静 编辑/ hjy 1.背景 Kubernetes 已经成为事实上的编排平台的领导者、下一代分布式架构的代表... 展开更多

收藏 2
0
置顶
发表了博客
03/03 15:26

基于 KubeVela 与 Kubernetes 打造“无限能力”的开放 PaaS

![头图.png](https://ucc.alicdn.com/pic/developer-ecology/53035c23a1104a77ba1fd66c781451d5.png) 作者 | 孙健波(天元) 来源 | 阿里巴巴云原生公众号 如今,围绕 Kubernetes 构建应用交付平台已经逐渐成为共识。 Kubernetes 生态本身的能力池固然是丰富的,但社区里并没有一个可扩展的、方便快捷的方式,能够帮助平台团队把这些能力快速“组装”成面向最终用户的功能(Feature)。因此,尽管大家都在基于 Kubernetes 构建上... 展开更多

收藏 2
0
置顶
发表了博客
03/02 18:18

Kubernetes 稳定性保障手册 -- 日志专题

![头图.png](https://ucc.alicdn.com/pic/developer-ecology/59ffe27f4c614fb989f5afd49ac77f32.png) 作者 | 悟鹏、沉醉 来源 | [阿里巴巴云原生公众号](https://mp.weixin.qq.com/s/5ezU9Z6f1-Q8YyRU7O5ZXA) 《Kubernetes 稳定性保障手册》系列文章: - [Kubernetes 稳定性保障手册 -- 极简版](http://mp.weixin.qq.com/s?__biz=MzUzNzYxNjAzMg==&mid=2247501775&idx=1&sn=8b3b27934e7bced10b2a7f81483e3256&chksm=fae6cc00cd9... 展开更多

收藏 2
0
置顶
发表了博客
03/01 14:56

Kubernetes 稳定性保障手册 -- 极简版

![头图.png](https://ucc.alicdn.com/pic/developer-ecology/789059362e5a4c15bad6d55d92cf7d10.png) 作者 | 悟鹏 来源 | [阿里巴巴云原生公众号](https://mp.weixin.qq.com/s/kZmi2gK16qe2yMYMRS3Etg) Kubernetes 在生产环境中的采用率越来越高,复杂度越来越高,由此带来的稳定性保障的挑战越来越大。 对于基于 Kubernetes 的云产品,稳定性保障已成为基本诉求,稳定性缺陷会给产品带来巨大的损失,如用户流失、用户信心下降、... 展开更多

收藏 7
1
置顶
发表了博客
02/26 10:58

K8S线上集群排查,实测排查Node节点NotReady异常状态

#### 一,文章简述 大家好,本篇是个人的第 2 篇文章。是关于在之前项目中,k8s 线上集群中 Node 节点状态变成 NotReady 状态,导致整个 Node 节点中容器停止服务后的问题排查。 文章中所描述的是本人在项目中线上环境实际解决的,那除了如何解决该问题,更重要的是如何去排查这个问题的起因。 关于 Node 节点不可用的 NotReady 状态,当时也是花了挺久的时间去排查的。 #### 二,Pod 状态 在分析 NotReady 状态之前,我们首先需... 展开更多

收藏 2
1
置顶
发表了博客
02/19 15:03

在 Kubernetes 上弹性深度学习训练利器 -- Elastic Training Operator

![头图.png](https://ucc.alicdn.com/pic/developer-ecology/a6e2e19e5348456eafd6336c22c8fe78.png) 作者 | 徐晓舟(萧元) 来源|阿[里巴巴云原生公众号](https://mp.weixin.qq.com/s/LQfa0R9JruXxqDEKDWBBZQ) # 背景 由于云计算在资源成本和弹性扩容方面的天然优势,越来越多客户愿意在云上构建 AI 系统,而以容器、Kubernetes 为代表的云原生技术,已经成为释放云价值的最短路径, 在云上基于 Kubernetes 构建 AI 平台已经成... 展开更多

收藏 0
0
置顶
发表了博客
02/08 10:59

从架构设计理念到集群部署,全面认识KubeEdge

摘要:本篇文章将从KubeEdge架构设计理念、KubeEdge代码目录概览、KubeEdge集群部署三方面带大家认识KubeEdge。 KubeEdge即Kube+Edge,顾名思义就是依托K8s的容器编排能力和调度能力,实现云边协同、计算下沉、海量设备的平滑接入。本篇文章将从KubeEdge架构设计理念、KubeEdge代码目录概览、KubeEdge集群部署三方面带大家认识KubeEdge。 KubeEdge架构设计理念 1、Kubernetes的架构 这里是一个经典的K8s架构,K8s相信大家已经了... 展开更多

收藏 1
0
置顶
发表了博客
02/07 16:39

在本地如何玩转kubernetes? - kind

## 导读 > kubernetes 现在已经走进了大众的视野,很多同学都对此比较好奇,从其他渠道或多或少都了解了一些,但是苦于kubernetes环境,不能身临其境的感受, > 毕竟如果完整搭建一套kubernetes环境是需要资源的。 今天介绍一款工具(**kind**),让大家可以本地也可以构建起 kubernetes 环境,愉快的在本地玩转 kubernetes。 > > kind 全称 是 kubernetes in docker ,把 kubernetes 控制面的组件全部运行在一个docker 容器中,... 展开更多

收藏 0
0
置顶
发表了博客
02/02 11:13

托管节点池助力用户构建稳定自愈的 Kubernetes 集群

![头图.png](https://ucc.alicdn.com/pic/developer-ecology/d6354530a4434ad6bf2eec65cebcc58a.png) 作者 | 谢瑶瑶(初扬) 来源|[阿里巴巴云原生公众号](https://mp.weixin.qq.com/s/CLoALO6r9bb3cE7CLTvZUQ) 随着容器技术的不断发展迭代,Kubernetes 已成为云原生时代的标准操作系统,那么如何构建一个稳定自愈的云原生操作系统事关重大。尤其是分布式环境下,各类硬件和软件故障已成为常态,直接导致 Kubernetes 集群工作节... 展开更多

收藏 0
0
置顶
高级程序员
发表了博客
01/23 17:26

《Kubernetes设计与实现》内置准入控制器插件--MutatingAdmissionWebhook

`MutatingAdmissionWebhook`是一款系统内置且默认启用的准入控制器插件,它在`kube-apiserver`审查请求(Mutating admission)阶段被调用,用于审查请求。 与其他准备控制器插件不同的是,`MutatingAdmissionWebhook`本身并不直接审查请求,而是将任务转发给相应的`webhook`(多个`webhook`串行调用),如果任何一个`webhook`返回失败,`MutatingAdmissionWebhook`将会立即拒绝请求。`MutatingAdmissionWebhook` 与`webhook`的关... 展开更多

收藏 0
0
置顶
发表了博客
01/22 17:47

被集群节点负载不均所困扰?TKE 重磅推出全链路调度解决方案

# 引言 在 K8s 集群运营过程中,常常会被节点 CPU 和内存的高使用率所困扰,既影响了节点上 Pod 的稳定运行,也会增加节点故障的几率。为了应对集群节点高负载的问题,平衡各个节点之间的资源使用率,应该基于节点的实际资源利用率监控信息,从以下两个策略入手: - 在 Pod 调度阶段,应当优先将 Pod 调度到资源利用率低的节点上运行,不调度到资源利用率已经很高的节点上 - 在监控到节点资源率较高时,可以自动干预,迁移节点上... 展开更多

收藏 3
0
置顶
发表了博客
01/21 09:33

【Kubernetes 增强】勿让 Docker Volume 引发 Terminating Pod

Terminating Pod 是业务容器化后遇到的一个典型问题,诱因不一。本文记录了网易数帆-轻舟 Kubernetes 增强技术团队如何一步步排查,发现 Docker Volume 目录过多导致 Terminating Pod 问题的经历,并给出了解决方案。希望本文的分享对读者排查及规避同类问题有所帮助。 问题背景 最近用户的集群中又出现了某个节点上的 Pod 长时间处于 Terminating 状态的问题。起初我们以为是 18.06.3 版本的几个经典的 Docker 和 Containerd 问... 展开更多

收藏 4
1
置顶
发表了博客
01/20 09:46

一文读懂 Kubernetes APIServer 原理

## 前言 整个Kubernetes技术体系由声明式API以及Controller构成,而kube-apiserver是Kubernetes的声明式api server,并为其它组件交互提供了桥梁。因此加深对kube-apiserver的理解就显得至关重要了。 ![](https://oscimg.oschina.net/oscnet/up-d1a7b8ad264910753a1c2cbba65c742db8f.png) ## 整体组件功能 kube-apiserver作为整个Kubernetes集群操作etcd的唯一入口,负责Kubernetes各资源的认证&鉴权,校验以及CRUD等操作,提供... 展开更多

收藏 4
0
置顶
发表了博客
01/19 10:15

K8s 平台可以如何处理 Pod 预授权问题

# 前言 **TKEx-CSIG 是基于腾讯公有云 TKE 和 EKS 容器服务开发的内部上云容器服务平台,为解决公司内部容器上云提供云原生平台,以兼容云原生、适配自研业务、开源协同为最大特点。** 业务容器上云过程中,会遇到一些问题,有的需要业务进行容器化改造,有的需要平台赋能。平台赋能的部分,有一类问题是 CVM 场景下已经有解决方案的,而因运维方式不同在 Kubernetes 平台上不兼容的,比如 Pod 预授权的问题。我们希望用云原生的... 展开更多

收藏 0
0
置顶
发表了博客
01/15 14:06

上车了!一文尽览Scheduling Framework 应用实践

Kubernetes 是目前最受欢迎的⾃动化容器管理平台,它提供了灵活的声明式容器编排、自动部署、资源调度等功能。Kube-Scheduler 作为 Kubernetes 的核心组件之一,主要负责整个集群资源的调度功能,根据特定的调度算法和策略,将 Pod 调度到最优的工作节点上面去,从而更加合理、充分地利用集群资源。 但是随着 Kubernetes 部署的任务类型越来越多,原生 Kube-Scheduler 已经不能应对多样的调度需求:比如机器学习、深度学习训练任... 展开更多

收藏 8
0
置顶
运营/编辑
发表了博客
01/06 10:48

Kubernetes安全专家预约优惠计划

Kubernetes安全专家认证 (CKS)在Linux基金会开源软件大学上线以来,受到了开发者们的广泛关注,但苦于没有配套在线课程,很多开发者难以深入学习,精准触达知识点。 终于,CKS认证对应课程——Kubernetes安全基础课程(LFS260)即将上线! Kubernetes安全基础课程(LFS260)讲什么? 本课程提供在构建、部署和运行时确保基于容器的应用程序和 Kubernetes 平台的安全和广泛最佳实践的技能和知识。本课程重点针对云生产环境的安全... 展开更多

收藏 0
0
置顶
发表了博客
01/04 10:42

Kubernetes 探针详解!

:你填了吗?10人将获赠CNCF商店$100美元礼券! 来参与2020年CNCF中国云原生调查 问卷链接(https://www.wjx.cn/jq/97146486.aspx) 配置 readiness、liveness 和 startup 探针可以处理不健康的 Pod,本文介绍了三种类型的探针、最佳实践和有关工具,以检测可能存在的配置问题。 作者:Yitaek Hwang 翻译:Bach(才云) 校对:木子(才云) 分布式系统和微服务体系结构的挑战之一是自动检测不正常的应用程序,并将请求(request... 展开更多

收藏 4
0
置顶
程序员
发表了博客
2020/12/30 12:58

Kubernetes生产环境最佳实践

众所周知,Kubernetes很难! 以下是在生产中使用它应遵循的一些最佳实践。遵循这些步骤能够确保更高的安全性和生产效率。 毫无疑问,DevOps已经走过了一段很长的路! 借助于Kubernetes编排平台使得公司比以往更快地发布软件。随着容器用于构建和发布软件的使用量不断增加,Kubernetes已经成为事实上的容器编排工具标准,在软件企业中非常受欢迎。 Kubernetes具有优秀的特性,比如:支持可扩展、零停机部署、服务发现、自动重启和回... 展开更多

收藏 10
1
置顶
发表了博客
2020/12/30 08:13

搭一个K8s集群

在公司一直用的现成的kubernetes环境,封装的组件很多,这次尝试自己搭一个轻量级的环境,踩了好多坑,下面经验奉上。 前置要求: 两台主机,可以是云服务器、虚拟机,网络要互通,内存最好大于2GB,主机上都要提前安装Docker。 下面我使用的两台主机。 主机名(centos) ip 角色 guozhao-50 192.168.9.50 Master guozhao-51 192.168.9.51 slave 搭建过程 1、首先在两台主机配置阿里云镜像源地址 #进入root用户 sudo su #配置镜... 展开更多

收藏 8
1
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
返回顶部
顶部