Reconhecimento Visual Atencional
Autores
1824 |
749,190,200
|
|
1825 |
749,190,200
|
|
1826 |
749,190,200
|
Informações:
Publicações do PESC
Título
Reconhecimento Visual Atencional
Linha de pesquisa
Inteligência Artificial
Tipo de publicação
Tese de Doutorado
Número de registro
Data da defesa
30/3/1999
Resumo
A visão é um processo ativo, onde as informações importantes para o comportamento são seletivamente adquiridas. Nesta tese propomos um modelo de reconhecimento visual atencional no qual uma fóvea simulada com alta resolução é dirigida para regiões de maior interesse por um processo de atenção seletiva. A região de interesse da imagem bruta é inicialmente representada por um mapa space-variant de respostas das células complexas, ou de contornos orientados. Esta representação é processada por um Sistema de Decisão que tenta reconhecer a imagem com as informações parciais adquiridas. Caso a informação disponível seja insuficiente para garantir o reconhecimento, um Módulo Atencional entra em ação para determinar a próxima região de interesse de onde extrair informações. A próxima foveação é baseada em informações da imagem (bottom-up) e do conjunto de modelos armazenados no sistema (top-down) combinadas de acordo com uma estratégia atencional adotada pelo sistema. O processo de foveação continua até que a imagem seja reconhecida ou seja atingido um número limite de foveações. Diversas estratégias atencionais foram investigadas, aplicando-se o modelo ao reconhecimento de faces e outros objetos em extensas simulações, que permitem avaliar qualitativamente e quantitativamente os resultados de cada estratégia atencional. Os resultados mostram ser factível reconhecer faces e outros objetos com margens de erros comparáveis ou menores que outros modelos tradicionais, porém a um custo computacional bem mais baixo, utilizando a representação space-variant associada a uma estratégia atencional adequada.
Abstract
Vision is an active process where behaviorally important information is selectively gathered. We present a model of visual recognition in wich the high- resolution fovea is deployed to interesting regions by selective attention processes. The raw image is initially represented by a space-variant complex-cell, or oriented edge, map. This transformed input is processed by a decision system which attempts to recognize the image given partial information. In the more typical case where the available information is insufficient to support recognition, an attentive foveation system is engaged which is responsible for determining the subsequent image region of interest. The next foveation is based on both bottom-up information from the image and top-down information from the set of stored models, combined according to the attentional strategy in execution. The foveation process continues until the object is recognized or a maximum number of foveations is reached. Several attentional strategies were investigated as the model is applied to the task of recognition of faces and other objects. Both qualitative and quantitative evaluations of the attentional strategies are provided. Results show the feasibility of recognition of faces and objects with a error rate comparable or lower to other traditional models, but with much reduced computational costs, a consequence of the space-variant representation used associated with efficient attentional strategy.
Arquivo