Rendimiento de los sistemas de recuperación de información en la web: evalución de servicios de búsqueda (search engines)

Rendimiento de los sistemas de recuperación de información en la web: evalución de servicios de búsqueda (search engines).

Se han evaluado diez servicios de búsqueda: Altavista, Excite, Hotbot, Infoseek, Lycos, Magellan, OpenText, WebCrawler, WWWWorm, Yahoo. Se formularon 20 preguntas a cada uno de los 10 sistemas evaluados por lo que se realizaron 200 consultas. Además, se examinó la relevancia de los primeros 20 resul...

Guardado en:
Título traducido: Performance evaluation of ten Internet search engines. Second Part.
Título de la revista: Revista Española de Documentación Científica
Autor: María Dolores Olvera Lobo
Palabras clave:
Palabras clave traducidas:
Idioma: Español
Enlace del documento: http://redc.revistas.csic.es/index.php/redc/article/view/326
Tipo de recurso: Documento de revista
Fuente: Revista Española de Documentación Científica; Vol 23, No 3 (Año 2000).
DOI: http://dx.doi.org/10.3989/redc.2000.v23.i3.326
Entidad editora: Consejo Superior de Investigaciones Científicas CSIC
Derechos de uso: Reconocimiento (by)
Materias: Ciencias Sociales y Humanidades --> Biblioteconomía y Documentación
Resumen: Se han evaluado diez servicios de búsqueda: Altavista, Excite, Hotbot, Infoseek, Lycos, Magellan, OpenText, WebCrawler, WWWWorm, Yahoo. Se formularon 20 preguntas a cada uno de los 10 sistemas evaluados por lo que se realizaron 200 consultas. Además, se examinó la relevancia de los primeros 20 resultados de cada consulta lo que significa que, en total, se revisaron aproximadamente 4.000 referencias, para cada una de las cuales se calcularon los valores de precisión y exhaustividad. Los análisis muestran que Excite, Infoseek y Altavista son los tres servicios que, de forma genérica, muestran mejor rendimiento. Se analizan también los resultados en función del tipo de pregunta (booleanas o de frase) y del tema (ocio o especializada). Se concluye que el método empleado permite analizar el rendimiento de los SRI de la W3 y que los resultados ponen de manifiesto que los buscadores no son sistemas de recuperación de información muy precisos aunque sí muy exhaustivos.
Resumen traducido: Ten search engines, Altavista, Excite, Hotbot, Infoseek, Lycos. Magellan, OpenText, WebCrawler, WWWWorm, Yahoo, were evaluated, by means of a questionnaire with 20 items (adding up to a total of 200 questions). The 20 first results for each question were analysed in terms of relevance, and values of precision and recall were computed for the resulting 4000 references. The results are also analyzed in terms of the type of question (boolean or natural language) and topic (specialized vs. general interest). The results showed that Excite, Infoseek and AltaVista performed generally better. The conclusion of this methodological trial was that the method used allows the evaluation of the performance of Information Retrieval Systems in the Web. As for the results, web search engines are not very precise but extremely exhaustive.