UNIX 系统性能优化
在您继续探索 Unix® 广袤领域的过程中,请将注意力转向有关多任务的问题。现代计算机,就像您的敏捷而高效的雇员,拥有非常高速的内存,这使得它们可以在内存中同时容纳成百上千个单独的程序。
内存中的程序通常有许多不同的名称,包括线程、进程、守护进程、内核、库、共享对象等等。如果您想了解这种看似杂乱的现象中的基础规则,那么拿起您的弯刀,劈开挡住去路的荆棘。您会发现内存中的程序都是具有共同特征的简单二进制模式:它们拥有各自的运行上下文。为了简单起见,在本文中将它们都称为任务。
操作系统的任务切换程序,也称为调度程序,用来完成下列工作:
将任务的上下文加载到中央处理器 (CPU) 寄存器。
让任务运行一小段时间。
在加载下一个任务的上下文之前,保存该任务的上下文。
调度程序维护了大量的内部表以管理系统中每个运行任务的上下文。它还使用称为运行队列 和睡眠队列 的一对队列来对资源进行管理。运行队列中的任务已经获得它们所需的所有资源。睡眠队列中的任务则等待获得一个或多个资源。通常,调度程序确保系统以有序的并能作出快速响应的方式运行。
所有的信息都保存在上下文中
运行任务的上下文由许多内容组成。当任务运行时,有一个称为指令指针 (IP) 的 CPU 寄存器,它包含了当前正在执行的机器代码指令的内存地址。当任务被换出时,任务切换程序必须保存这个 IP 寄存器的值,以便在该任务以后被再次换入时可以重新加载它。因此,当前 IP 值是任务上下文中的一部分。
组成任务上下文的另一个重要的值是堆栈指针 (SP)。堆栈是一个后进先出 (LIFO) 队列,它保存了子例程的返回地址、数据项、指针等等。根据程序员的详细设计,由操作这些数据项的指令来确定堆栈中每一项的具体含义。
IP 和 SP,加上组成运行任务上下文的所有其他重要 CPU 寄存器,这些都是任务切换程序用来切换上下文并运行不同任务的底层细节信息。任务切换程序还可以利用更高层次的细节信息。任务的优先级是这些更高层次细节信息之一。
优先级
程序在创建时并不是平等的。有些对计算机本身的操作至关重要的程序必须比其他次要的程序具有更高的优先级。在 Unix 系统方案中,使用从 -20 到 +19 的一个可变数值来表示优先级,这个数值又称为任务的 nice 数值。具有最高优先级的程序,其 nice 值最低,所以在 UNIX 系统方案中,值 -20 使得一项任务变得非常重要。与之相反,如果任务的 nice 为 +19,则表示它是一个高尚的、无私的任务,允许所有其他任务比自己享有宝贵的 CPU 时间的更大使用份额。
UNIX 提供了许多强大的工具,可以在任何时候查看计算机中正在运行的任务的细节,ps 命令可用来提供这些细节信息。启动一个 xterm 并输入下面的命令以查看程序的 nice:
$ ps -eo pid,state,nice,args | less -S
该命令所生成的输出,如下面的清单 1 所示。
清单 1. 输出
PID S NI COMMAND1 S 0 init [5]2 S 19 [ksoftirqd/0]3 S -10 [events/0]4 S -10 [khelper]5 S -10 [kblockd/0] 28 S 0 [kapmd] 30 S 0 [pdflush] 31 S 0 [pdflush] 33 S -10 [aio/0] 32 S 0 [kswapd0] 138 S 0 [kseriod] 176 S 0 [kjournald]1080 S 0 [kjournald]1081 S 0 [kjournald]1082 S 0 [kjournald]1564 S 0 /sbin/dhclIEnt -1 -q -lf /var/lib/dhcp/dhclient-eth0...1610 S 0 syslogd -m 01614 S 0 klogd -x1632 S 0 portmap1651 S 0 rpc.statd1729 S 0 /usr/sbin/sshd1744 S 0 xinetd -stayalive -reuse -pidfile /var/run/xinetd.pid1760 S 0 ntpd -U ntp . . .2364 S 0 konsole2373 S 0 /bin/bash2563 R 0 ps -eo pid,state,nice,args
在我的工作站上,共生成了 84 行输出。这表示当时 ps 任务正在运行,它仅仅是那些争用 CPU 上的运行时间的 84 个不同任务的其中之一。现在来研究一下该命令中的部分内容,以便更好地理解系统输出的含义。-eo pid、state 和 nice args 开关告诉 ps 任务列出系统中每项运行任务的下列信息:
进程 ID (pid)
任务处于运行还是睡眠状态 (state)
Nice 数值 (nice)
调用任务时的参数 (args)
带 -S 开关的 less 命令通过将列表中的每行限制为 xterm 的宽度,从而创建了一个整洁、漂亮的列表。
其中大部分任务的 nice 值为“0,这使得它们处于优先级范围的正中间。有少数运行任务的 nice 数值为 -10 或 19,这使得它们分别具有高的或低的优先级。同时,大多数任务处于睡眠状态,这表明它们正等待着获得某种资源。事实上,在我生成该列表时,只有 ps 命令在运行。大多数任务都是用来快速地完成它们所需执行的操作,然后退出或睡眠。
Nice 和 renice
nice 命令根据给定的 nice 数值来执行其参数中指定的命令。而 renice 命令则用来更改任务的 nice 数值。关于这些命令开关的详细信息,请参阅每个命令的 man 页面。
Unix 计算机主要分为两大类:工作站和服务器。需要对它们所运行的进程加以关注,以确保有限的资源不会被重复执行且对预定目标并不重要的任务浪费。
工作站
因为工作站可以用来完成各种各样的任务,所以对于每个工作站的优化,没有固定的规则。有些工作站用来进行编程、艺术图形设计、繁重的数值计算和数据挖掘。在所有情况下,如果您能够在完成所需活动的同时查看正在运行的进程,并对工作站进行相应的优化,那么这将是很有帮助的。
例如,在程序员的工作站上,编译和连接某些程序可能花费数小时。如果程序员想不惜一切代价地加速其执行过程,那么可以使用超级用户登录,并按照如下命令启动编译任务:
$ suPassWord:# nice -n -15 make
参数 -n -15 将 make 任务的 nice 数值降低了 15,这就大大提高了它的优先级,以至于您在屏幕上移动鼠标时能够确切地感受到这一点。在大多数系统中,只有超级用户帐户才能够对任务进行这种优先级的更改。尽管如此,对于运行长进程的工作站来说,这是值得的。
另一种进行工作站性能优化的重要方法是标识出您并不使用但却有可能在工作站上运行的特性和功能。例如,许多 Linux® 系统都有一个称为 /etc/cron.daily/slocate.cron 的文件,它每天都会运行磁盘密集型的 dbupdate 程序。这个程序允许您使用 locate 命令来代替 find 命令,以执行查找文件的工作。如果您从来都不使用 locate 命令,那么您可以对 /etc/cron.daily/slocate.cron 文件进行编辑,以使 dbupdate 程序不以超级用户的身份运行,启动您最喜欢的编辑器,并且注释其中的指令,如下面的清单 2 所示。
清单 2. /etc/cron.daily/slocate.cron 文件
$ suPassword:# cd /etc/cron.daily# vi slocate.cron
清单 3 显示了在您完成注释工作后该文件中的内容。每行开始处的英镑标记阻止了该命令的运行。
清单 3. 文件结果
#!/bin/sh# renice +19 -p $$ >/dev/null 2>&1# /usr/bin/updatedb -f "nfs,proc,devpts" -e "/tmp,/var/tmp,/usr/tmp,/afs,/net"
请记住,这也是关于个人首选参数设置的问题。如果您的计算机属于雇主,那么我并不建议在没有管理许可的情况下进行这样的更改。毕竟,当您不在的时候,系统管理员可能打算使用 locate 命令。
服务器
与工作站不同,服务器通常具有明确定义的用途,因此更容易进行优化。例如,Web 服务器的主要职责是接收和响应来自 Internet 上的浏览器请求。与之类似,文件服务器则必须迅速而准确地分发所请求的文件。在这两种情况下,服务器不应该执行通常分配给工作站的那些任务。
如果服务器专门用于某个主要功能,如 Web 服务器,那么请对配置文件进行编辑以去掉任何其他的服务。通常,Web 服务器会运行 ftp、nfs、dhcp、dns 和其他非必需的守护进程。计算机所需共享的资源越少,那么它对其主要任务的响应能力越高。作为回报,安全性也更高,因为可供攻击的漏洞更少。
本文为服务器性能优化提供了一些通用规则。有关详细信息,请查阅参考资料部分中的链接。
结束语
如果您对工作站和服务器上所运行的进程进行仔细地优化,包括设置适当的任务优先级以及移除浪费资源的任务,那么您的计算机将继续作为您称职的和忠实的雇员。