ciencia de Datos aplicada al arca: desarrollo y disponibilización de herramientas para recuperación de la información en el Repositorio Institucional de la Fundação Oswaldo cruz
DOI:
https://doi.org/10.29397/reciis.v11i0.1417Palabras clave:
Ciencia de Datos, Almacenamiento y Recuperación de la Información, Minería de Datos, Aprendizaje Automático, Repositorios Institucionales.Resumen
El repositorio institucional Arca es el principal instrumento de realización del acceso abierto en la Fundación Oswaldo Cruz, teniendo como misión reunir, hospedar, preservar, poner a disposición y dar visibilidad a la producción intelectual de la Institución. La diversidad temática y la complejidad institucional de la Fundación fomentan un desafío metodológico relacionado con la clasificación y recuperación de los objetos digitales depositados y la gobernanza de los metadatos registrados por las comunidades que integran el repositorio. En 2016 el mecanismo de búsqueda del Arca contabilizó más de 400 mil consultas. Es necesario un sistema de Recuperación de la Información que atienda las especificidades de indexación del repositorio y la creciente demanda por información por parte de los usuarios internos y externos a Fiocruz. En este trabajo proponemos la utilización de herramientas de Ciencia de Datos, especialmente técnicas de Minería de Datos y Aprendizaje Automático con el objetivo de mejorar la Recuperación de la Información, a través de la clasificación automática de objetos digitales depositados en el Arca y el desarrollo y puesta a disposición del sistema de RI basado en métricas de calidad relacionadas con los conceptos de precisión y revocación.Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor: El autor retiene los derechos sobre su obra sin restricciones.
Derechos de reutilización: La Reciis adopta la Licencia Creative Commons, CC BY-NC atribución no comercial conforme la Política de Acceso Abierto al Conocimiento de la Fundación Oswaldo Cruz. Con esa licencia es permitido acceder, bajar (download), copiar, imprimir, compartir, reutilizar y distribuir los artículos, desde que para uso no comercial y con la citación de la fuente, confiriendo los debidos créditos de autoría y mención a la Reciis. En esos casos, ningún permiso es necesario por parte de los autores o de los editores.
Derechos de depósito de los autores/auto-archivado: Los autores son estimulados a realizar el depósito en repositorios institucionales de la versión publicada con el link de su artículo en la Reciis.