Classificação de Séries Temporais Via Divergente entre Densidades de Probabilidade no Espaço de Fases
Autores
6320 |
1749,2489,2867
|
|
6321 |
1749,2489,2867
|
|
6322 |
1749,2489,2867
|
Informações:
Publicações do PESC
Séries temporais estão presentes nas mais diversas áreas de pesquisa, como eletrocardiogramas, reconhecimento de voz e escrita. A classificação de séries temporais é uma tarefa que tem atraído a atenção de pesquisadores de diversas áreas do conhecimento e tem como objetivo a detecção de padrões que discriminem as séries em um conjunto predefinido de classes. Diversas técnicas para classificação de séries temporais estão disponíveis na literatura. Muitas dessas abordagens definem métricas de distância entre as séries e as utilizam em classificadores clássicos, como o k-vizinhos mais próximos, enquanto que outras constroem modelos estatísticos a partir dos dados.
Nesta dissertação, é apresentado um novo método de classificação de séries temporais. A proposta utiliza a técnica time delay embedding para reconstruir o espaço de estados das séries temporais e supõe que estes são amostras de populações com distribuições desconhecidas. Essas distribuições são estimadas através de um método não paramétrico e uma medida de divergente entre funções de densidade de probabilidade é utilizada para calcular a distância entre as mesmas e as classifica de acordo com seus vizinhos.
Para avaliar a efetividade do método, dois experimentos foram conduzidos. O primeiro analisa o impacto dos parâmetros do método no resultado da classificação e na métrica de distância entre dois conjuntos de dados diferentes. O segundo avalia os resultados obtidos em diversos conjuntos de dados e os compara com outros métodos da literatura. Os resultados indicam que a proposta se apresenta como uma alternativa promissora, obtendo resultados comparáveis aos melhores métodos da literatura.
Time series are present in several areas of research, such as electrocardiograms, voice and handwritting recognition. Time series classification has been attracting the attention of researchers from dierent areas of knowledge. It aims at detecting patterns that discriminate against these time series in a pre-defined set of classes. Several techniques for time series classification are available in the literature. Many of these approaches are based on metrics between time series to apply them on classic classifiers such as the k-nearest neightboors, whereas others build statistical models on the data.
In this work, we propose a new method for time series classification. The proposal employs the technique of time delay embedding to reconstruct the time series state space assuming these are samples iid from the unknown population corresponding distributions. These distributions are then estimated by nonparametric methods and a divergence measure between them is taken as the distance between the correspondng time series to classify them according to their neightbors.
To evaluate the eectiveness of the proposal, two experiments were conducted. The first analyzes the impact of the method parameters on the classification and on the metric in two dierent data sets. The second evaluates the results obtained in several data sets and compares them to other literature methods. The results indicate that the proposed method seems to be a promising alternative, achieving results comparable to the current state of the art.