Posgresql y MySQL: búsqueda de texto dentro de un documento guardado en la base

Juan Carlos Muñoz Ilabaca jcmunoz en dcc.uchile.cl
Mar Dic 6 12:57:37 CLST 2005


Disque el Lunes, 5 de Diciembre de 2005 17:32, Juan Martínez escribiosese:
> El lun, 05-12-2005 a las 09:19 -0300, Juan Carlos Muñoz Ilabaca
>
> escribió:
> > IMHO esto es incorrecto estimado, las bases de datos son para guardar
> > datos tal y como dices... y los archivos qué tienen adentro??? CHACHAN!!!
>
> Las bases de datos se guardan en archivos también. Incluso una tabla
> puede estar en más de un archivo (de hecho esa es la gracia que los DBMS
> son más rápidos). El concepto de base de datos es de nivel superior a
> los archivos. Los FileSystem son el soporte de cualquier estructura
> básica de organización de información. Las BD son estructuras avanzadas
> o de alto nivel, superior a los archivos.

No creo que sea el tema ahondar sobre que es qué, porque en una base de datos 
se guardan archivos y claro, las tablas "pueden ser archivos" (MySQL) o estar 
dentro de otros archivos (tablspaces) y ser distribuidos... y una pila de 
cosas más... pero eso no tiene nada que ver... 

>
> Evidentemente que los archivos contienen datos, pero cada uno de ellos
> puede tener una organización distinta.
>

La organización no tiene nada que ver... no estamos hablando de hacer una 
busqueda sobre un XML, ni botton-up ni nada parecido... solo de indexar 
contenido.

> > datos... :P esa es la gracia de los sistemas de busqueda no??? el tema
> > ahora es como buscarlos... tu solución puede ser plausible pero creo que
> > lo que se pregunta es si hay un sistema de indexación ya hecho para
> > ahorrarse la pega... como el sistema de busqueda del Oracle Collaboration
> > Suite...
>
> Oracle, lo que debe hacer es extraer el ascii de cualquier archivo y lo
> almacena en una tabla como fila, que luego indexa. Sino, los tiempos de
> búsqueda serían muy deficientes.
>

No es eso lo que hace... de hecho hace tiempo atrás Oracle podía indexar 
imágenes, los tiempos de busqueda depende de la forma en que se indexe y de 
lo que se busque con esos índices... lo que puede ser lento es la indexación 
misma...


> >  que es
> > como lo mismo, te permite buscar contenido en los archivos que guardas en
> > la base de datos... o el buscador personal de google... yo no conozco
> > ninguno salvo el de OCS así que no es mucho lo que puedo opinar, pero
> > creo que por ahí va la pregunta...
> >
> > Atte. JCMI
> >
> > Disque el Domingo, 4 de Diciembre de 2005 22:51, Juan Martínez 
escribiosese:
> > > > Estoy buscando esta funcionalidad que viene de SQL Server (no
> > > > encontré aún información al respecto): almacenar un documento en la
> > > > base, por ejemplo, de word y luego hacer una búsqueda de texto dentro
> > > > del documento a través de un SQL.
> > >
> > > Las bases de datos son para guardar datos.
> > > Los sistemas de archivos, son para guardar archivos.
> > >
> > > > Ideas? Alguna de las bases libre lo permite?
> > >
> > > podria servirte hacer un catdoc sobre los archivos de MS word que
> > > necesitas, y el resultado en ascii que te entregará guardarlo en la bd.
> > > Tambén seria útil tener un campo en la bd que tenga el nombre del
> > > archivo (con la ruta si es necesario).
> > >
> > > --
> > > Juan Martínez G.
> > > Jefe del DIC
> > > Universidad Miguel de Cervantes

-- 
To calculate the capacity of any floppy disk, simply add up the number of 
bytes of data you wish to copy to it and multiply by .9, so that 
Capacity=(Data*.9). Then look for a second floppy disk. 
	-- Murphy's Law of Floppy-Disk Capacity



Más información sobre la lista de distribución Linux