¿utilidad para limpiar/corregir código HTML?

Enrique Place masterplace en gmail.com
Mar Nov 1 13:26:26 CLST 2005


Tengo "heredado" código html muy "chancho" (muchos generados a partir
de Word) y me están haciendo perder mucho tiempo porque quiero borrar
todas las marcas de estilos, fonts y varios indeseables.

Quiero tener como resultado un código limpio html, lo más básico posible.
Qué scripts/utilidades pueden recomendar?

Uso Quanta y Eclipse/PHPEclipse, pero no encontré este tipo de funcionalidad.
Estuve buscando en Freshmeat.net, y encontré muchos interesantes:

Microsoft Word 2002 Unmunger
http://freshmeat.net/projects/wordunmunger/

html_scrub
http://freshmeat.net/projects/htmlscrub/

Html To Xhtml Convertor - Default branch
http://freshmeat.net/projects/htx/

Sugerencias, experiencias? En lo posible para consola, y siempre, GPL
(aunque toleraría algún BSD ;-)

--
Saludos, Enrique.



Más información sobre la lista de distribución Linux