Zombies y <defunct>

Rodrigo Fuentealba darkprox en gmail.com
Dom Jul 15 11:45:12 CLT 2007


> On 7/14/07, Horst H. von Brand <vonbrand en inf.utfsm.cl> wrote:
> > Larry Letelier N. <barbudone en gmail.com> wrote:
> > > Vengo a acusar a dovecot-auth, nos esta dando demaziados proceso Zombies
> > > [root en maquina ~]# ps -el |grep Z
> > > F S   UID   PID  PPID  C PRI  NI ADDR SZ WCHAN  TTY          TIME CMD
> > > 4 Z    97 32414 12911  0  75   0 -     0 exit   ?        00:00:00 imap-login
> > > <defunct>
> > > 5 Z     0 32426 12914  0  77   0 -     0 exit   ?        00:00:00
> > > dovecot-auth <defunct>

> > > top - 15:31:25 up 1 day,  2:48,  3 users,  load average: 7.90, 7.72, 6.73

Es una cantidad de carga bastante alta para una máquina que tiene
correo electrónico solamente... ¿qué otras cosas corres ahí?

> > > Tasks: 1423 total,   7 running, 1412 sleeping,   0 stopped,   4 zombie
> > > Cpu(s): 40.1% us,  9.1% sy,  0.0% ni,  0.0% id, 50.5% wa,  0.3% hi,  0.0% si
> > > Mem:   2043572k total,  1388116k used,   655456k free,    56080k buffers

Veamos, tienes 2 Gb de memoria RAM de las cuales estás usando algo así
como 1.4 Gb... ¿los procesos que te consumen memoria son los famosos
difuntos?

> > > Swap:  4610644k total,      160k used,  4610484k free,   550024k cached

La SWAP ni la toca... estás perdiendo 4 preciosos Gb de swap (y si te
faltase alguna vez, podrías crear una swap temporal en disco más
mejol)

> > > alguna sugerencia?

Varias:

1.- Revisa los discos duros de tu equipo; debe haber algún problema ahí.
2.- Pregúntale a los usuarios si han tenido problemas para leer su mail.
3.- Mira si hay alguna clase de error, core dumped, segfault o algo
así, el /var/log/messages, dmesg | more y toda la cantidad de
información que tengas.
4.- ¿Dovecot está en inetd o corre como daemon solito? Si está como
inetd/xinetd cámbialo a daemon solito; de otra manera, chequea la
configuración.
5.- Trata de correr a Dovecot con un strace o similar... es lento pero
te da alguna pista sobre si el problema es del binario.

> Larry, el origen de tu consulta es que tienes algun problema con la máquina?

Eso creo, parece que es con los discos, o bien le está fallando alguna
pastilla de la memoria RAM (Inclusive alguna puede estar mal puesta).

En un tarrito viejo que tenía (mi Sparc Classic, snif) se me caía el
Apache a punta de procesos difuntos y otros varios, al punto de que no
había diferencia entre ejecutar top y ver el videoclip "Thriller" de
Michael Jackson. Cuento corto, lo apagué, lo abrí y la memoria estaba
calentita... La di por QEPD, la saqué y funcionó mucho mejor, aún
teniendo la mitad de la RAM (que era poquísima).

> Con el encabezado del top se ve que está bastante cargadita y al
> parecer las cpus estan esperando datos de los discos. Lo que me
> extraña es por qué tiene ~ 600MB libres de RAM y no estan en el buffer
> o cache, siendo que el uso parece ser mayoritariamente de correo.

No tiene por qué comerse toda la RAM si tiene diez cuentas de correo
electrónico en esa máquina; aparte no ha dicho si tiene algún método
antispam, por ejemplo, que a mi parecer son los que más consumen.

-- 
Rodrigo Fuentealba Cartes
Desarrollador de Sistemas Web
Registered User 387639 - http://counter.li.org



Más información sobre la lista de distribución Linux