Base de datos MySQL... u otra?

Rodrigo Fuentealba darkprox en gmail.com
Dom Feb 17 15:39:14 CLST 2008


El 17/02/08, Leonardo Soto M. <leonardosoto en tutopia.com> escribió:
> 2008/2/16 Rodrigo Fuentealba <darkprox en gmail.com>:
> > El 16/02/08, Leonardo Soto M. <leonardosoto en tutopia.com> escribió:
> > > 2008/2/15 Rodrigo Fuentealba <darkprox en gmail.com>:
> > > > El 15/02/08, Leonardo Soto M. <leonardosoto en tutopia.com> escribió:
> > > > > Dudo *mucho* que el índice del buscador de google esté almacenado en un RDBMS.
> >
> > MySQL /no/ es un RDBMS.
>
> No seas odioso. Ya leimos eso un montón de veces.

Fue un lapsus nada más...

> Pero (a) yo puse RDBMS para ahorrarme la lata de escribir "Base de
> datos SQL o algo por el estilo"

DBMS podría funcionar; o SGBD, SABD, SMBD si quieres.

> De donde se desprende que el 99% del tiempo, la gente usa
> el término RDBMS en un sentido no demasiado estricto.

No me extraña; pero bueno; por cierto, pues no le cojo la gracia.

> > Y no hablo del buscador (que siempre fue
> > BigTable + GFS) sino del índice de servicios de Google.
>
> Ah. De ahí la confusión entonces.

Suele pasar.

> En cualquier caso, volviendo al tema original, ni Google, ni
> Wikipedia, ni todos esos sitios con necesidades absurdas de
> rendimiento usan un "Base de datos SQL o algo por el estilo"

Ninguno ha dado la talla en rapidez a tal punto; los DBMS de la clase
PostgreSQL, SQL Server, MySQL y otros son para sistemas no tan
grandes, en los que importa mucho la integridad.

Si se quiere mejorar la performance en sitios que son grandes pero que
no son masivamente utilizados (como Yahoo! Bookmarks), es mejor no
usar claves foráneas y planificar muy bien las consultas. Y ojalá
mandar al autoincrement y similares a la punta del cerro, pues causan
problemas.

Germán Poó dio un buen par de detalles de esto.

    http://listas.inf.utfsm.cl/pipermail/linux/2007-July/038322.html

Los sistemas del tipo redes sociales utilizan demasiado la caché, sin
utilizar mucho las bases de datos, pues les interesa justamente que
sea rápido y no preciso (algo fundamental en un DBMS donde se hacen
varios cientos de miles de transacciones bancarias).

Por ejemplo, los Google Groups dan cuenta de varios errores. Si ven la
lista de threads, en los detalles dice "9 mensajes"; pero cuando van a
leer el thread, se dan cuenta de que sólo existen 8. Last.fm tampoco
está exento de estos fallos: la primera semana que estuve suscrito
salió en mi lista que yo había escuchado un disco de Sin Bandera,
cuando yo lo único que escucho es metal y música clásica (y no hay
otros MP3 en mi disco duro que los que yo escucho, y me niego a que
haya).

> Como referencia, acá un tipo colleccionó links
> a un montón de material "on topics related to designing of high
> throughput, scalable, highly available websites":
> <http://www.royans.net/arch/library/>

Excelente! tendré harta lectura para el fin de semana.

-- 
Rodrigo Fuentealba



Más información sobre la lista de distribución Linux