OSCHINA第47期高手问答--网站运维技术与实践

丫头潘潘 发布于 2014/04/28 11:13
阅读 9K+
收藏 37

OSCHINA 本期高手问答(428-505)我们请来了 @饶琛琳 为大家解答关于网站运维方面的问题。

@饶琛琳   简介

先后在世纪互联云快线和中华网负责运维工作,热爱CDN并乐于尝试一切可以给互联网用户带来便利和优质体验的技术。现任人人公司网络运营部高级研发工程师。专注自动化运维平台的构建,活跃于PuppetLogstash开源社区。比特币大潮中依然坚持要写程序实践证券投资分析原理和时间序列数据预警原理。教徒推崇“懒惰、急躁和傲慢”三大程序员美德,并时时运用于运维工作中。同时热衷于推广以perltidyMooAnyEventPlack为代表的新一代Perl编程,参与组织了Perl中国用户2013年度大会。

为了鼓励踊跃提问,@博文视点 会在问答结束后从提问者中抽取 5 名幸运会员赠予《网站运维技术与实践》一书。试读请点击这里。  


OSChina 高手问答一贯的风格,不欢迎任何与主题无关的讨论和喷子。

下面欢迎大家就网站运维方面问题向 @饶琛琳  提问,请直接回帖提问。
加载中
0
HuiGe_sd
HuiGe_sd

@饶琛琳 :您好,菜鸟入门网站运营,有什么推荐资料去学习呢?最好要懂得什么技术呢?还有什么工具可以推荐一下?有遇到过运营由LINUX和WIN共同组成的网站情况吗?需要注意什么?

饶琛琳
饶琛琳
刚入门的同学还是要做好基础,系统管理的书一定要看的,然后要有大局观,也就是怎么从服务器管理提高到网站运维。既然你提到是linux和win混合环境,那你可以尝试学习一些支持跨平台的工具,比如puppet就有很多在win上运行的案例。我书里提到的logstash日志系统我也有帮朋友在win上跑起来
fei
fei
多看文档。多多实践。有人指路最好
0
滔哥
滔哥

@饶琛琳 : 您好!我现在在一家单位做一些项目运营,主要负责全市的电子政务系统的运营,大概有100台左右的服务器,单台的负载并不是特别的高,但是几百个部门外加内网及一些业务系统的融入,高可用性这块并不是特别的理想,系统也是windows和linux混杂。程序也是ASP、PHP、JSP的都有!现在在运维过程中发现几点让我头疼的,一个是容灾,还有就是这些服务器的批量管理。请问您有好点的建议或者是意见吗? 我目前都是每台机器根据不同的配置写上一些备份脚本之类的,但数量增多,维护起来的确头疼。。。。

枫爱若雪
枫爱若雪
同病相怜啊
饶琛琳
饶琛琳
回复 @滔哥 : 然后每台还得再开监控来保证备份正确吧......赶紧改造吧
饶琛琳
饶琛琳
回复 @皮总 : nagios是好东西,我就很推荐。有mod_gearmand后,大规模分布式也很ok啦。
滔哥
滔哥
@皮总 向皮总靠齐
下一页
0
amonxu
amonxu

@饶琛琳 :云对网站运维带来了什么变化或者革命呢。

饶琛琳
饶琛琳
部署什么的工作会慢慢减少,但是运维人员如何从数据里抽象出来有价值的点,来驱动优化和云之间的联动性,会更重要了--不要奢望有一个云能提供一起,那叫天计算好啦。
fei
fei
虚拟化和云确实让运维有很大变化。可以多多学习。但根据实际情况运用
0
mickelfeng
mickelfeng

@饶琛琳 :网站经常被木马攻击,linux上面的网站执行用户www,我们是要生成静态页面的,有次目录被生成了20多G的html代码。怎么破? 另外。公司还有windows服务器,iis提供http服务,都设置了回收池了的,访问量比较大,到一定时间后,访问很卡,重启iis也不行,要重新启动服务器才行,

fei
fei
Windows的不太熟悉。Linux的做好安全防范和代码级系统级的安全。
0
Finlay
Finlay

@饶琛琳 : 阿里云等众多云服务器,会不会抢运维人员的饭碗?

饶琛琳
饶琛琳
要是只会部署,饭碗被抢也是迟早的;否则应该开心的迎接云,云意味着运维从花钱的变成赚钱的一部分了,对提高我们待遇很有作用的
fei
fei
是补充。但是我见过的很多公司还是自己托管IDC和硬件服务器交换机防火墙的。云不会完全替代物理机等传统模式
0
5th_days
5th_days

@饶琛琳 :我公司目前面对最大的困难时当研发项目增多,如何规划开发环境、集成测试环境、线上环境之间设计、部署,包括权限等等,希望能给与您工作的经验指导。

饶琛琳
饶琛琳
要想办法给开发和测试提供跟生产线一致的环境,通过虚拟机或者容器技术来快速供应他们的环境需求
fei
fei
可考虑使用物理机和虚拟机混合环境。开发,测试,预发布,线上环境隔离,开发,测试配置可以较低。权限可以放得较松一些。
0
梦朝思夕
梦朝思夕

@饶琛琳 :Liunx内核的编译,系统参数的调优。不知道您有什么好的建议

饶琛琳
饶琛琳
回复 @fei : 最小安装这个持保留意见,很多时候这是给未来运维和排障挖坑呢
fei
fei
回复 @fei : 还有一些ulimit方面的调优。关闭不必要的服务和端口。尽量最小化安装。
饶琛琳
饶琛琳
楼上兄弟说的不错,我在书里也提到uek了,从人人经验看还是比较靠谱的。更高版本内核提高很多新特性,如果能有精力关注到,经过测试上线还是很不错的,比如lvs的conn tab bits在后来就可以直接通过modprobe.conf修改,不用重编译内核
fei
fei
回复 @fei : 另外系统参数的调优主要是TCP级的。在/etc/sysctl.conf里。可根据实际情况具体更改。
fei
fei
内核我们之前都是自己编译定制。对一些参数调优。关闭不需要的硬件驱动选项。有利有弊。缺点是不标准一些商业应用支持不好。但在大规模服务器环境下建议使用标准化的内核。如CentOS 6的2.6.32.如果觉得低可以考虑Oracle 的UEK 2.6.39/3.8内核 完全兼容RHEL 6.
0
oscuser
oscuser

@饶琛琳 : 你们的运维自动化主要用什么技术?你觉得自动化运维中最麻烦的地方是什么?如何解决的?人人的服务器有几w台吧?是如何管理的呢?

oscuser
oscuser
能具体谈一下你遇到的案例吗?分享一个,谢谢。
饶琛琳
饶琛琳
人人运维自动化是由很多系统联动构建组合到一起的,有puppet,rex,pantheon等等,工具技术都是最后一步的事情了,你怎么通过业务,区域平衡出来一个可行的,其他部门都能接受的方案,这才是难点。我同事曾经在看完刘宇的puppet实战后跟我开玩笑说,你要写一本,内容用法能跟他完全不一样。所以说,还是要因地制宜
fei
fei
人人应该主要是Puppet.应该几千台服务器,(虽然我没去过人人,,拿到过人人运维经理的Offer但是没去)其实Puppet.SaltStack,Cfengine哪怕是Func或自己写的都可以。个人觉得运维更多的还是灵活运用各种技术,不能一概而论,也不必别人用什么我们就用什么。如果机器多了可以逻辑划分来分类管理。
0
rgone
rgone

@饶琛琳 :我也姓饶,也是做运维的。

0
LeoXu
LeoXu

@饶琛琳 :我是外行,请教个问题,数据库查询的优化算不算运维的工作?

饶琛琳
饶琛琳
严格上,这是DBA的工作。不过考虑很多中小公司分不太开,应该大多数运维也多少懂些
fei
fei
可以算也可以不算。运维体系很大,大公司有专门DBA。小公司没有,数据库相关的由运维和研发来做。但是运维如果对 数据库了解很深也可以做。
返回顶部
顶部