ciencia de Datos aplicada al arca: desarrollo y disponibilización de herramientas para recuperación de la información en el Repositorio Institucional de la Fundação Oswaldo cruz

Autores/as

  • Marcel de Moraes Pedroso Fundação Oswaldo Cruz (FIOCRUZ), Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (ICICT), Rio de Janeiro, RJ, Brasil
  • Jefferson da Costa Lima Fundação Oswaldo Cruz (FIOCRUZ), Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (ICICT), Rio de Janeiro, RJ, Brasil
  • Vinicius Belchior Assef Neto Fundação Oswaldo Cruz (FIOCRUZ), Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (ICICT), Rio de Janeiro, RJ, Brasil

DOI:

https://doi.org/10.29397/reciis.v11i0.1417

Palabras clave:

Ciencia de Datos, Almacenamiento y Recuperación de la Información, Minería de Datos, Aprendizaje Automático, Repositorios Institucionales.

Resumen

El repositorio institucional Arca es el principal instrumento de realización del acceso abierto en la Fundación Oswaldo Cruz, teniendo como misión reunir, hospedar, preservar, poner a disposición y dar visibilidad a la producción intelectual de la Institución. La diversidad temática y la complejidad institucional de la Fundación fomentan un desafío metodológico relacionado con la clasificación y recuperación de los objetos digitales depositados y la gobernanza de los metadatos registrados por las comunidades que integran el repositorio. En 2016 el mecanismo de búsqueda del Arca contabilizó más de 400 mil consultas. Es necesario un sistema de Recuperación de la Información que atienda las especificidades de indexación del repositorio y la creciente demanda por información por parte de los usuarios internos y externos a Fiocruz. En este trabajo proponemos la utilización de herramientas de Ciencia de Datos, especialmente técnicas de Minería de Datos y Aprendizaje Automático con el objetivo de mejorar la Recuperación de la Información, a través de la clasificación automática de objetos digitales depositados en el Arca y el desarrollo y puesta a disposición del sistema de RI basado en métricas de calidad relacionadas con los conceptos de precisión y revocación.

Publicado

2017-11-30

Cómo citar

Pedroso, M. de M., Lima, J. da C., & Assef Neto, V. B. (2017). ciencia de Datos aplicada al arca: desarrollo y disponibilización de herramientas para recuperación de la información en el Repositorio Institucional de la Fundação Oswaldo cruz. Revista Eletrônica De Comunicação, Informação E Inovação Em Saúde, 11. https://doi.org/10.29397/reciis.v11i0.1417

Número

Sección

Pecha Kucha