Topicos Avanzados de Bases de Datos

Sistemas de Recuperación de Información – SRI

El proceso de recuperación se lleva a cabo mediante consultas a la base de datos donde se almacena la información estructurada, mediante un lenguaje de interrogación adecuado. Es necesario tener en cuenta los elementos clave que permiten hacer la búsqueda, determinando un mayor grado de pertinencia y precisión, como son: los índices, palabras clave, tesauros y los fenómenos que se pueden dar en el proceso como son el ruido y silencio documental. Uno de los problemas que surgen en la búsqueda de información es si lo que recuperamos es “mucho o poco” es decir, dependiendo del tipo de búsqueda se pueden recuperar multitud de documentos o simplemente un número muy reducido. A este fenómeno se denomina Silencio o Ruido documental.

esquema

En la figura se como es el proceso de Recuperación de información , todo nace de una necesidad del usuario o de una consulta, el mismo mediante un procesamiento, búsqueda y evaluación busca lo solicitado entre un grupo de documentos o consultas, esto se hace mediante un lenguaje y al encontrar la información devuelve un resultado.

Los sistemas de recuperación de información SRI se componen de tres componentes transcendentales: La base de datos documental, el subsistema de consultas y el componente de igualación o evaluación.

proceso de informacion

Modelos de recuperacion de informacion

El modelo probabilístico necesita una hipótesis inicial para establecer los documentos relevantes y el peso de sus descriptores. Además, no tiene en cuenta la frecuencia de los términos índice y supone que estos son independientes entre sí

El modelo booleano se basa en obtener aquellos documentos que cumplan la función lógica expresada en la consulta realizada por el usuario. Para ello utiliza los operadores propios del álgebra de Boole (AND, OR y NOT) y ficheros de índices invertidos que contienen en sus entradas los documentos que contienen dicho término.

En el modelo vectorial La resolución de la consulta consiste en un proceso de establecer el grado de semejanza entre el vector consulta y el vector de cada uno de los documentos. El grado de similitud de cada documento dependerá de la consulta realizada. El sistema de recuperación considerará que los documentos con grado de similitud más elevado se ajustan más a las necesidades expresadas en la consulta

Lenguajes de consulta

Cada sistema de recuperación tiene su propio lenguaje de interrogación, que es el que le permite “hablar” en el mismo lenguaje que la base de datos. Este lenguaje como cualquier otro tiene sus propia sintaxis que especifica las características especiales de la búsqueda determinando en cada momento la relación que tienen los elementos de búsqueda. Las reglas gramaticales en el lenguaje de interrogación son los operadores.

Proceso de recuperacion de informacion.

Indexado y busqueda

Los índices guardan una estrecha relación con la forma de representación elegida para los documentos. La construcción de índices puede hacerse por palabras, frases u oraciones enteras. Si los documentos se representan como una bolsa de palabras, considerando como keywords la totalidad de sus palabras, entonces los índices estarán construidos para buscar palabras. Dado que el reconocimiento de frases no mejora apreciablemente el proceso de recuperación y es un proceso no trivial, el método más común de construcción de índices es por palabras. Una búsqueda de frases puede resolverse usando índices construidos por palabras, si bien la operación resulta más costosa.

http://www.mariapinto.es/e-coms/busqueda-y-recuperacion-de-informacion/

http://sisinfo-sri.blogspot.com/2011/09/componentes-de-los-sistemas-de.html

http://recuperacioninf.orgfree.com/modelo_probabilistico.html

http://www.elprofesionaldelainformacion.com/contenidos/1999/noviembre/evaluacion_de_sistemas_de_recuperacion_de_informacion_aproximaciones_y_nuevas_tendencias.html

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s