45
回答
OSC 第 132 期高手问答 -- Linux 运维最佳实践
华为云实践训练营,热门技术免费实践!>>>   

OSCHINA 本期高手问答(11 月 1 日 - 11 月 7 日) 我们请来了@xufengnju(胥峰)为大家解答关于 Linux 运维方面的问题。

@xufengnju(胥峰),资深运维专家,有 10 年运维经验,在业界颇具威望和影响力。也是盛大游戏高级研究员,2006 年毕业于南京大学,2011 年加入盛大游戏,工作至今,曾参与盛大游戏多款大型端游和手游的上线运维,主导运维自动化平台的功能设计和实施。拥有工信部认证高级信息系统项目管理师资格。

也是图书《Linux 运维最佳实践》的主要作者,《Devops: A Software Architect's Perspective》第一译者(中译本,即将出版)。

我们面对的是一个不断变化的世界,业务需求在变,技术架构在变,开源工具与商业系统异构部署,新工具和技术概念层出不穷,唯有一套科学的技术方法论才能应对这些变化。很多时候,我们在面对新的问题时,会束手无措。带着问题和困惑,相信大家会在此次答疑活动以及《Linux 运维最佳实践》一书中找到想要的答案。

本书是运维领域的璀璨明珠,是一本有思想的运维技术干货集!

技术层面,作者从高性能网站架构、服务器安全和监控、网络分析、自动化运维和游戏运维 4 个方向,梳理和总结了 105 个棘手的运维难题,结合自己 10 余年的工作经验,对这些问题给出了经过实践检验的解决方案,可直接应用到生产环境中。除解决方案外,还详细讲解了每个问题背后涉及的技术原理(共涉及 21 种技术)。

思想层面,本书不仅有作者对运维服务体系的深度思考,而且还有作者的主动运维思维和宏观的运维格局,更有作者解决具体运维问题的思维方法。

通过本书,不仅能解决具体的技术难题,提高工作效率,而且还能增强技术功底,提升工作能力。更重要的是,它能让我们明白,技术不是运维的终极追求,思想才是运维人员应该毕生修炼的目标!

为了鼓励踊跃提问,@华章图书会在问答结束后从提问者中抽取 5 名幸运会员赠予《Linux 运维最佳实践》一书。

购买链接:http://item.jd.com/12025874.html

OSChina 高手问答一贯的风格,不欢迎任何与主题无关的讨论和喷子。

下面欢迎大家就Linux 运维方面的问题向@xufengnju(胥峰)提问,请直接回帖提问。

举报
局长
发帖于1年前 45回/5K+阅
共有45个答案 最后回答: 1年前
@xufengnju :请问您写书,是怎么坚持写下来的?是把平时工作重点的问题,记录下来,每天写一点,再总结吗?写书有什么工具软件吗?还是只是用word来写?能分享下写运维书籍的方法吗?
--- 共有 1 条评论 ---
xufengnju@萝卜K 你好,这个问题非常好,也是我想分享的。写书的素材依赖于平时的积累,建议大家平时多写写标准的文档,word格式可以参考咱们这本书的编排。比较重要的3点是:1,visio图要保留下来,不能只存图片,因为可能还要调整排版;2,有些故障现场,尽量记录详细,现象和分析过程、辅助的日志和抓包文件等,建议都保留下来。3,脚本按照分类保存下来,以便查找。 1年前 回复
@xufengnju :最近在研究运维方面的知识,一方面是觉得自己工作5年,数学天赋又不怎么好,在大数据算法上面不能有所突破,常用的业务场景依然烂熟,大型网站业务又接触不到。那干些什么呢?突然想拓宽自己的宽度,于是乎擦开落满灰尘的linux命令,在它黑乎乎的面板上,jekins,docker,各种基础环境安装,mysql的简单集群,redis哨兵,主从,再到遥不可及的codis,简单的安卓应用开发,前端样式。这些东西又容易遗忘,我就开始记录笔记。而最好的笔记,莫过于前人的武功秘笈了,比如书。翻一翻,遇到问题的时候查一查,前些年还追求什么都自己摸索,总结出和别人一样的观点,多么幼稚的想法。今天我选择站在巨人的肩膀,既然他们已经这么慷慨的献出,便不能辜负,传承推动,进步是对他们最大的尊重!
--- 共有 3 条评论 ---
iamcoder回复 @萝卜Robert : O(∩_∩)O谢谢 1年前 回复
厦门萝卜遥不可及的codis?codis不难啊,挺简单的,熟悉的话,搭建还不要10分钟就可以搞定!可以看下这个https://github.com/ppabc/codis_quick 1年前 回复
xufengnju@iamcoder 为你的评论点赞,写的很好,希望你多多支持。技术书籍也是非常丰富,择其优者而常实习之。 1年前 回复
@xufengnju :有详细讲解,如何分析服务器瓶颈吗?比如  CPU 内存 磁盘IO 瓶颈?
--- 共有 1 条评论 ---
xufengnju@淡定歌 你的问题非常好。目前确实也没有看到这方面系统讲解的书籍,我正在考虑是不是可以作为下一个专门的主题,系统讲解分析系统性能瓶颈和优化。 1年前 回复

@xufengnju :作为工作4年多的测试工作者,在运维方便也是有一定的涉猎,在公司维护自己的测试环境,有时候也需要一定运维功底,从windowserver到linux,学习很多,也总结了很多。上家公司着手docker部署的时候刚好离开公司了。真是有点遗憾,后续工作也没时间去实践,目前使用的是ng负载,采用tomcat部署方案,工作实在比较忙,很想在运维方面也有一定的提升哇!不知道从何入手后好,求大神指教。

--- 共有 1 条评论 ---
xufengnju@丸子吃不饱 你好。从你的描述来看,目前是兼职运维。我建议是否可以考虑,在搭建环境之外,多多研究下其中的原理,同时用自动化脚本维护这些环境呢。相信你也有一些编程经验,这些对于你后续实践运维也是有帮助的。另外,就是可以多看看别人总结的运维案例,少走一些弯路。 1年前 回复
@xufengnju :可以说下什么是自动化运维?怎么定义?如何才算服务器做了自动化运维?包括哪些?自动化发布,有问题可以回滚?
--- 共有 1 条评论 ---
xufengnju@淡定歌 你好。运维自动化是一个仁者见仁智者见智的概念。我的理解是,运维自动化要打通从代码开发完到正式上线的所有环节,包括版本构建、打通自动测试、自动化上线以及自动化监控。在这个大命题下,可以根据自己工作环境和自动化水平的不同,选择一两个痛点开始进行自动化实践。最后形成完整体系。 1年前 回复

@xufengnju :做自动化发布,除了Jenkins持续集成工具,还有那些好用的工具呢?能说说么?


--- 共有 1 条评论 ---
xufengnju@追爱科技CEO 你好。目前我所知道的,一般都是Hudson或者Jenkins,后者是前者分支出来的。这些工具都有丰富的插件,灵活使用这些插件是关键所在。 1年前 回复
@xufengnju :您觉得游戏服务器运维和网站服务器运维以及APP服务器运维,有哪些不同点和相同点?
--- 共有 1 条评论 ---
xufengnju@大哈ha 你好。这个问题很有代表性。不同点是,网站和APP运维接触的通用开源软件比较多,游戏运维接触的大部分都是自研的程序。共同点是,都需要掌握操作系统知识、软件硬件以及网络知识,还有排查问题的思路和容量规划等。两者都需要引入运维自动化的思维和体系。《Linux运维最佳实践》最后2章描述了游戏运维的相关体系和技术。欢迎加入QQ群 434242482 进一步交流。 1年前 回复
@xufengnju :书里有开源出一些工具和脚本吗?哪里可以下载到呀?分享下?
--- 共有 3 条评论 ---
xufengnju回复 @OSC_LYabsV : 你好,建议尝试使用相关加速和代理软件。 1年前 回复
OSC_LYabsV回复 @xufengnju : 我手机怎么始终打不开你发的这个连接而开别的网址都正常。 1年前 回复
xufengnju@小黄鸭的思想 你好,书上的脚本我正在整理,其中一部分通过git可以下载https://github.com/xufengnju/books.git。 1年前 回复
顶部