Uma Estratégia de Apoio à Gerência de Dados de Proveniência em Experimentos Científicos
Autores
5081 |
Sérgio Manuel Serra da Cruz
|
1781,51,493
|
5082 |
1781,51,493
|
|
5083 |
1781,51,493
|
Informações:
Publicações do PESC
Título
Uma Estratégia de Apoio à Gerência de Dados de Proveniência em Experimentos Científicos
Linha de pesquisa
Engenharia de Dados e Conhecimento
Tipo de publicação
Tese de Doutorado
Número de registro
Data da defesa
8/8/2011
Resumo
A busca pelo conhecimento faz com que empresas e instituições de pesquisa procurem não só novas formas de melhorar a qualidade dos experimentos científicos, como também reduzir o tempo e os custos necessários para a sua execução usando ambientes distribuídos. A gerência dos descritores de proveniência coletados ao longo do ciclo de vida de experimentos científicos representa uma faceta preponderante neste novo cenário. Esta tese apresenta uma estratégia de apoio à gerência dos descritores de proveniência, baseada no desenvolvimento de uma solução computacional que envolve a integração de uma ontologia de proveniência, bem fundamentada, intitulada OvO (Open proVenance Ontology), e de um sistema de coleta de descritores de proveniência intitulado Matriohska. Este sistema é capaz de ser acoplado aos workflows científicos executados em ambientes distribuídos e heterogêneos do tipo nuvens de computadores. A estratégia também possibilita a execução de consultas sobre os descritores de proveniência de variadas granulosidades obtidos a partir de experimentos executados nesses ambientes.
Abstract
The continuous quest for knowledge stimulates companies and research institutions not only to investigate new ways to improve the quality of scientific experiments, but also to reduce the time and costs needed for its implementation in distributed environments. The management of provenance descriptors collected during the life cycle of scientific experiments may represent an important goal to be achieved. This thesis presents a new strategy which was focused to aid scientists to manage different kinds of provenance descriptors. It describes a computational approach that uses a well founded ontology named OvO (Open proVenance Ontology) and a provenance infrastructure entitled Matriohska that can be attached to scientific workflows executed on distributed and heterogeneous environments like the cloud of computers. The approach also allows scientists to further perform semantic queries on provenance descriptors with distinct types of granularity.
Arquivo