Utilitario para buscar, eventualmente encontrar y opcionalmente purgar archivos de igual contenido.

Horst H. von Brand vonbrand en inf.utfsm.cl
Jue Ago 3 17:11:35 CLT 2006


Guillermo O. Burastero <linux.gb en gmail.com> wrote:
> Hola, estoy buscando algún utilitario para buscar, eventualmente
> encontrar y opcionalmente purgar archivos de igual contenido.

No se de nada de ese corte... aunque lo de "purgar" es un tanto fuerte,
puedes usar links duros para buen efecto.

> Si no existe supongo que podría hacer algún shell script que primero
> saque los md5 de cada fichero, los ordene y saque aquellos que
> comparten el mismo hash (por ej. md5) (se suponge que deberían ser
> iguales en contenido -salvo una despreciable probabilidad no ?-).
> Luego de marcar los iguales permita individualizar cual dejar y
> posteriormente purgar (borrar) los demás.

Suena bastante razonable. Podrias incluso usar algun hash mas liviano que
MD5 (un chancho XOR de a 4/8 bytes debiera bastar), y confirmar via cmp(1).
antes de tomar medidas irreversibles.

Algo como lo adjunto debiera servir...




-- 
Dr. Horst H. von Brand                   User #22616 counter.li.org
Departamento de Informatica                     Fono: +56 32 654431
Universidad Tecnica Federico Santa Maria              +56 32 654239
Casilla 110-V, Valparaiso, Chile                Fax:  +56 32 797513


Más información sobre la lista de distribución Linux