Skill List

vi
查找,复制,粘帖,定位行,字符串替换.

Remote Tool RDP/VNC/Jumpmydesktop …

Shell

ipTable

fdisk / parted Dish partation.

System - Load CPU / IO

Log

管理用户 查看主机配置 lvm 管理 文件系统管理. 网络配置, 多网卡配置. 软件安装 / 源码包安装. 软件包依赖关系解决

Linux

Linux 整体理解 / 使用基本命令

  • 了解 FHS
  • Linux 系统架构与目录解析
  • 入门 Linux : 鸟哥的Linux私房菜.基础学习篇(第三版)

至少熟悉一个发行版 Centos debian Ubuntu 了解多个版本

运维相关工具命令

基础服务

(鸟哥 服务器架设篇) LAMP / LNMP: Apache MySQL PHP/Python/perl FTP DNS

SAMBA Email NTP DHCP

运维平台工具

Nagios Puppet Zabbix Cacti SaltStack

脚本

额外: Python Perl

网络

  • <<TCP/IP 协议详解>> 多看几遍.理解.
  • 熟练使用 Wireshark / tcpdump 等抓包工具

硬件

接口信息 查看硬件信息 知道各类型的服务器:塔式,机架式,刀片式

其他

Google “Linux 运维工程师招聘” 看需求

推荐书本

Unix/Linux系统管理技术手册 UNIX/Linux 系统管理技术手册

安全

加密工具储存密码:
ipassword truecrypt

本地存储,不用网盘. SSH 私钥添加密码.

遇到报警 第一时间处理 不要等别人. 无法处理 找同事帮忙.不能拖….

细心

任何操作 都要再三确认.

Learn

遇到问题 要记录.还可以内部分享


熟悉 HA 集群 / 负载均衡(lvs)集群的配置. 多路径的配置和管理 二进制包的制作过程 和 安装原理.

分析系统性能瓶颈 (IO Memory CPU 常用工具 top 中 Shift 的特殊用法 sar / vmstat / iostat /ipcs)

xwindows 大致原理 用 ssh 做 x server 的任意跳转

PXE+kickstat 做无人值守 批量部署

用源代码方式安装硬件驱动.


分析程序 不能运行 或者 不正常运行的原因. strace 对运行程序跟踪 查看系统调用的过程.


安全

  • 任何操作 最好先搞明白原理.

复杂操作: 先写详细计划文档. 细致到每个命令.请人审核

记录分析意识

监控意识

监控室非常重要的

业务意识:

了解主机上的 业务类型. 各主机间的 关联性.

网络/系统/开发 复合型人才

基础运维 应用运维 系统运维 虚拟化运维 存储运维 网络运维/IDC 运维

职业发展: 桌面运维 系统运维 开发运维 系统架构师

路由交换 ccna → ccnp → ccie

系统平台 Win :MCTS → MCSE/MCITP → Linux:RHCE RHCA

脚本开发 bashshell /powershell/vb python,ruby,c,c++,GO ,lisp

系统架构 信息安全 逛乌云

不要过于在意商业产品的部署和企业方面的技术认证,这玩意变化太快。 关键是通过前期的广泛吸收打好基础,进而找到今后要走的路,从而抓住一个方向深入。最终要成为一个方面的专家而不是什么都会什么都不精通的普工! 虽然操不着系统架构师的心,但也要有尽量靠齐的大局观和视角。以项目来促进成长,以压力为动力继续前行做一个有价值,有成就,有原则,有妹子的四有运维工程师!!

相关书籍: 路由交换: 《TCP/IP协议》 第三卷 | cisco教材 linux: (鸟哥 全套) | Linuxshell脚本攻略 | 深入理解linux内核 | linux内核完全注释 win: 教材/白皮书/google 服务部署: 构建高性能WEB站点 |高性能网站建设指南 -steve souders | puppet实战 | 大话存储 2 |Mysql 性能调优与架构设计 - 简朝阳 信息安全: Web前端黑客技术揭秘 | 白帽子讲web安全 | 脚本开发: 深入理解计算机系统 | 编写可读代码的艺术 | Python核心编程 | 笨办法学Python 启发思路: 淘宝十年 | 海量运维 |大数据时代 | 思科九年 |我这一代京东人

依次为: 《鸟哥的linux私房菜》 《脚本从入门到精通》 《脚本编程指南》 《计算机网络基础》 《nginx\apache\IIS调优指南》 《Linux内核入门》 《Linux内核调优指南》 《西藏自由行手册》 《论佛经与故障处理》 《抑郁症的自我康复》

负载均衡 冷备 热备 高可用 异地容灾 故障监控 确保备份可用 避免单点

限定在linux运维 1:第一名的列的那张图上的命令基本过一遍,能知晓用处,基本上对着系统就不会发怵了。 2:无论如何,要有一个你自己的测试机器(建议装centos,更贴近企业现状),从头到脚的折腾。 3:英语要好,如果man一下都看不懂的话,我觉得接下来很多解决方案你会找不到。 4:要有一颗平常心,面试的时候和你谈架构,谈大数据,最后发现90%的时间是在做一些基础的东西,而这恰恰是最重要的。我见过很多基础做着做着就烦了,就迷失然后日复一日做无用功。 5:一个健壮的身体,来应付7*24可能出现的报警。 6:一颗偷懒的心,能用脚本坚决就用脚本,能自动化跑的就设法实现自动化。

2.网络服务 服务有很多种,每间公司都会用到不同的,但基础的服务肯定要掌握,如FTP, DNS,SAMBA, 邮件, 这几个大概学一下就行,LAMP和LNMP是必须要熟练,我所指的不是光光会搭建,而是要很熟悉里面的相当配置才行,因为公司最关键的绝对是Web服务器,所以nginx和apache要熟悉,特别是nginx一定要很熟悉才行,至少有些公司还会用tomcat,这个也最好学一下。其实网络服务方面不用太担心,一般公司的环境都已经搭建好,就算有新服务器或让你整改,公司会有相应的文档让你参照来弄,不会让你乱来的,但至少相关的配置一定要学熟,而且肯定是编译安装多,那些模块要熟悉一下他的作用,特别是PHP那些模块。

3.shell脚本和另一个脚本语言 shell是运维人员必须具备的,不懂这个连入职都不行,至少也要写出一些系统管理脚本,最简单也得写个监控CPU,内存比率的脚本吧!这是最最最基本了,别以为会写那些猜数字和计算什么数的,这些没什么作用,只作学习意义,写系统脚本才是最有意义,而另一个脚本语言是可选的,一般是3P,即python, perl和php,php就不需要考虑了,除非你要做开发,建议学python会比较好,难实现自动化运维,perl是文本处理很强大,反正这两个学一个就行了。

4.sed和awk工具 还要掌握正则表达式,正则是最难学的表达式,但结合到sed和awk中会很强大,在处理文本内容和过滤Web内容时十分有用,不过在学shell的同时一般会经常结合用到的,所以学第3点就会顺便学第4点。

5.文本处理命令 sort , tr , cut, paste, uniq, tee等必学:Linux运维工程师视频课程(系统命令)

6.数据库 首选MySQL,因为linux用得最多绝对是MySQL,增删改查必学,特别要学熟查,运维人员 7.防火墙 不学不行,防火墙也算是个难点,最重要弄懂规则,如果学过CCNA的朋友可能会比较好学,因为iptables也有NAT表,原理是一样的,而FILTER表用得最多,反正不学就肯定不合格。 8.监控工具 最好学这3个:cacti,nagios,zibbix,企业用得最多应该是nagios和 zibbix。 9.集群和热备 集群工具有很多,最好学是LVS,这是必学,最好也学学nginx集群,反向代理,还有热备,这个就更多工具能实现了。 10.数据备份 至少要把RAID的原理弄懂,特别是企业最常用的1+0或0+1,自己做实验也要弄出来,备份工具有很多,如tar, dump, rsync等,最好多了解一下。建议先学熟shell,等工作后再学另一门脚本语言,这样会比较好。

IT行业变更迭代真的太快了,每隔 年甚至几年都有可能出现新的引爆点; 运维领域,基于开源思潮的引领,类似zabbix,puppet,cacti,kafka等等,大量优秀的开源系统/平台不断涌现,解决原来低效的运维工作,降低运维成本,因此,作为一名运维工程师,对开源软件的学习应该成为基本的技能之一; 现在云计算正在大行其道,比如cloudfoundry,openshift等等开源的PaaS平台,以及当下最火的容器管理技术,docker,kubernetes等等,它们通过对基础架构的抽象与优化,不仅可以解决服务的运维问题,比如监控,部署,配置等,还可以通混部,资源调度优化等手段,大幅服务成本,因此,作为一名运维工程师,对云计算领域的了解与掌握,也将逐步成为运维工程师的基本技能之一; 由于现代基础架构的不断演进,很多繁杂/琐碎的运维工作都交给了基础架构解决,运维工程师也就需要更加关注他们的原理,了解一些常用的调度机制与算法,甚至一些基础的经济学原理,如何让资源分配与利用更加高效,一方面提高自己的逼格,一方面也可以从更高的维度来考虑运维的问题,比如成本/效率/稳定性等,这些技术就是运维工程师的杠杆;

也许基于运维工程师对CDN这个杠杆的应用,就可以帮公司省掉几千万的带宽成本; 也许基于云计算架构这个杠杆的运用,通过混和部署,可以帮公司省掉几千万的服务器成本; (吹吹NB,数字都是变量哈,基于你的平台有多大呢! ^_^)