Informações:

Publicações do PESC

Título
Classificação de Linfomas Utilizando Uma Abordagem Baseada em Árvores de Decisão
Linha de pesquisa
Inteligência Artificial
Tipo de publicação
Dissertação de Mestrado
Número de registro
Data da defesa
23/2/2016
Resumo
Esta dissertação apresenta uma metodologia de apoio ao diagnóstico de pacientes com linfomas. É proposta uma solução através de árvores de decisão para o diagnóstico diferencial de linfomas a partir de dados de citometria de fluxo. Por diagnóstico diferencial, entende-se escolher ou eliminar linfomas dentre alguns tipos pré-definidos. Os citômetros de fluxos são aparelhos usados, entre outras funções, no diagnóstico de linfomas. Permitem medir diversos parâmetros de milhares de células simultaneamente, gerando informações individualizadas de cada uma destas células a partir de uma amostra de sangue periférico ou de medula óssea colhida de um paciente. Com o método proposto se constrói uma árvore utilizando um modelo de regressão logística regularizada com o algoritmo do Lasso em cada nó. Analisa-se a combinação de múltiplas variáveis em cada passo a fim de escolher ou eliminar classes, implementando o diagnóstico diferencial. O modelo em árvore foi escolhido por sua interpretabilidade, deixando a decisão do diagnóstico a um especialista humano. Um requisito essencial desse projeto é evitar falsos negativos. Para atingir esse objetivo, dois métodos foram acoplados à árvore para verificar o resultado antes de informá-lo ao tomador de decisão. Esses métodos agregam ao resultado dado pela árvore, classes extras que devem ser consideradas para o diagnóstico. Os atributos do modelo são medidas feitas a partir de anticorpos monoclonais que tem custo elevado. Dessa forma, torna-se importante pela motivação de custo e também pela qualidade do resultado de classificação de padrões, que os atributos possam ser usados de forma parcial. Para analisar os resultados fora da amostra foram utilizadas técnicas de validação cruzada, leave-one-out e um conjunto de teste com observações não vistas no treinamento. Os experimentos indicaram que essa abordagem produz os resultados compatíveis com os esperados pelos especialistas.
Abstract
This work presents a methodology to support lymphoma diagnosis. A decision tree approach is proposed to perform a lymphoma di erential diagnosis using ow cytometry data. Di erential diagnosis is to select or eliminate lymphomas among some possible prede ned categories. Flow cytometers are equipments used to diagnose lymphoma among other diseases. It is possible to monitor thousands of cells and their parameters simultaneously. It generates individualized information about each cell using patient's peripheral blood or bone marrow sample. The proposed method builds the tree using in each node a regularized logistic regression algorithm called Lasso. It analyzes multiple combinations of attributes in each decision step in order to choose or eliminate classes for the di erential diagnosis. The tree approach was chosen because the nal decision is made by a human specialist and its representation is easy to understand. A key project requirement is to avoid false negatives. To accomplish this goal, two procedures were added while constructing the tree. Their objective is to double check the outcome and add extra possible outcomes to the diagnosis given to the decision maker. The parameters monitored in the cytometer and used as attributes in the predictor model are actually monoclonal antibodies with an associated high cost. Therefore, motivated by the antibodies cost and also the result quality, another research in this dissertation is to analyze if these antibodies can be used in a partial way. Cross-validation and leave-one-out techniques and a test dataset containing observations not used in training were used to validate the model. The results given by this approach are compatible with those expected by the specialists.
Arquivo
Topo