Ciência de Dados aplicada ao Arca: desenvolvimento e disponibilização de ferramentas para recuperação da informação no Repositório Institucional da Fundação Oswaldo Cruz
DOI:
https://doi.org/10.29397/reciis.v11i0.1417Palavras-chave:
Ciência de Dados, Armazenamento e Recuperação da Informação, Mineração de Dados, Aprendizagem de Máquina, Repositórios Institucionais.Resumo
O repositório institucional Arca é o principal instrumento de realização do acesso aberto na Fundação Oswaldo Cruz, tendo como missão reunir, hospedar, preservar, disponibilizar e dar visibilidade à produção intelectual da Instituição. A diversidade temática e a complexidade institucional da Fundação fomentam um desafio metodológico relacionado a classificação e recuperação dos objetos digitais depositados e a governança dos metadados registrados pelas comunidades que integram o repositório. Em 2016 o mecanismo de busca do Arca contabilizou mais de 400 mil consultas. É necessário um sistema de Recuperação da Informação que atenda as especificidades de indexação do repositório e a crescente demanda por informação por parte dos usuários internos e externos a Fiocruz. Neste trabalho propomos a utilização de ferramentas de Ciência de Dados, especialmente técnicas de Mineração de Dados e Aprendizagem de Máquina com o objetivo de aprimorar a Recuperação da Informação, por meio da classificação automática de objetos digitais depositados no Arca e o desenvolvimento e disponibilização de sistema de RI baseado em métricas de qualidade relacionadas aos conceitos de precisão e revocação.Downloads
Publicado
Como Citar
Edição
Seção
Licença
Direitos de autor: O autor retém, sem restrições dos direitos sobre sua obra.
Direitos de reutilização: A Reciis adota a Licença Creative Commons, CC BY-NC atribuição não comercial conforme a Política de Acesso Aberto ao Conhecimento da Fundação Oswaldo Cruz. Com essa licença é permitido acessar, baixar (download), copiar, imprimir, compartilhar, reutilizar e distribuir os artigos, desde que para uso não comercial e com a citação da fonte, conferindo os devidos créditos de autoria e menção à Reciis. Nesses casos, nenhuma permissão é necessária por parte dos autores ou dos editores.
Direitos de depósito dos autores/autoarquivamento: Os autores são estimulados a realizarem o depósito em repositórios institucionais da versão publicada com o link do seu artigo na Reciis.