Solucionar poblemas con tildes en html/php + utf8?

Alvaro Herrera alvherre en alvh.no-ip.org
Dom Oct 30 23:49:29 CLST 2005


Horst von Brand escribió:

> Unicode (el actual standard internacional, codigo de 32 bits) es una
> codificacion unificada de todos los caracteres existentes. Para simplificar
> su manejo, se usa una codificacion de largo variable, UTF-8; "casualmente"
> Unicode coincide con ASCII en los 128 primeros caracteres, y UTF-8 codifica
> caracteres Unicode < 128 como ese byte unicamente.

En realidad Unicode es la especificacion de los "glifos" (los dibujos de
los caracteres), la secuencia de ordenamiento entre ellos, las
relaciones de mayuscula/minuscula, y otras propiedades de ese estilo.

Como se codifica cada caracter Unicode en secuencias de bits es un
problema aparte.  UTF-8 es la codificacion mas comun (sobre todo para
lenguajes occidentales, me parece), pero hay otras como UTF-16 y UTF-32,
que no comparten las mismas propiedades.

-- 
Alvaro Herrera                                http://www.PlanetPostgreSQL.org
"El sudor es la mejor cura para un pensamiento enfermo" (Bardia)


Más información sobre la lista de distribución Linux