Autores

5963
2744,299
5964
2744,299

Informações:

Publicações do PESC

Título
Agrupamentos Múltiplos Não-Redundantes em Grafos com Atributos
Linha de pesquisa
Engenharia de Dados e Conhecimento
Tipo de publicação
Tese de Doutorado
Número de registro
Data da defesa
30/9/2015
Resumo
Muitos algoritmos de agrupamento em grafo destinam-se a gerar uma única partição (agrupamento) dos dados. No entanto, um mesmo conjunto de dados pode produzir diferentes agrupamentos. De uma perspectiva exploratória, dado um conjunto de dados, a possibilidade de se gerar agrupamentos alternativos e não-redundantes é importante para a compreensão dos dados. Cada um desses agrupamentos poderia proporcionar um ponto de vista diferente sobre esses dados. Muitas áreas demandam a exploração de diversas soluções de agrupamento, como a área de marketing em redes sociais. É nesse contexto que esse trabalho se insere, apresentando um novo algoritmo para gerar agrupamentos múltiplos a partir de um grafo com atributos. Nesse tipo de grafo, cada vértice está associado a uma n-tupla de atributos (por exemplo, em uma rede social, os usuários têm interesses, sexo, idade, etc.). A abordagem concebida adiciona arestas artificiais entre vértices semelhantes do grafo utilizando a similaridade entre os atributos, o que resulta em um grafo com atributos aumentado. Em seguida, é aplicado um algoritmo de agrupamento nesse novo grafo. Dessa maneira, diversos agrupamentos são gerados utilizando diferentes combinações de atributos. Os resultados experimentais indicam que a abordagem é eficaz na tarefa de produzir agrupamentos múltiplos em grafos com atributos. No entanto, o problema não é apenas produzir os agrupamentos múltiplos, mas produzi-los de maneira que não sejam redundantes. Nesse cenário, esse trabalho também contribui com um novo algoritmo para selecionar os top-k agrupamentos não-redundantes. Resultados experimentais utilizando uma rede social online real e uma rede de co-autoria mostram a eficácia dos algoritmos propostos.
Abstract
Many graph clustering algorithms aim at generating a single partitioning (clustering) of the data. However, the same set of data may produce different clusterings. From a exploratory perspective, given a dataset, the availability of many different and non-redundant clusterings is important for data understanding. Each one of these clusterings could provide a different insight about the data. Many areas demands exploring multiple clustering solutions, such as marketing in social networks. This work is immersed in this context, presenting a novel algorithm that generates multiple clusterings from an attributed graph. In this type of graph, each vertex is associated to a n-tuple of attributes (e.g., in a social network, users have interests, gender, age, etc.). The approach adds artificial edges between similar vertices of the graph using similarity between attributes, which results in an augmented attributed graph. Then a clustering algorithm is applied in this new graph. Thus, multiple clusterings are produced by using different combinations of attributes. Experimental results indicate the algorithms are effective in providing multiple clusterings in attributed graphs. Indeed, the problem is not only to provide multiple solutions, but multiple non-redundant solutions. In this scenario, this work also contributes with a novel algorithm that discovers the top-k non-redundant clusterings. Experimental results using a real online social network and a co-authorship network show the effectiveness of proposed algorithm.
Arquivo
Topo