Publicações do PESC Distribuição de Pedidos de Patente em Português

Autores

id		url
7181	Rafael de Sant'Anna Corrêa Nunes	3071,299
7182	Geraldo Bonorino Xexéo (Orientador)	3071,299

Informações:

Publicações do PESC

3063

Título

Distribuição de Pedidos de Patente em Português

Número de registro

Data da defesa

31/8/2022

tituloi

Resumo

Este trabalho propôs uma solução para a distribuição automática de pedidos de patente em português baseada em técnicas de Aprendizado de Máquina e Classificação de Textos, que obteve como melhor resultado uma acurácia média de 62,32%. Divulga um conjunto de dados de pedidos de patente construído a partir de dados públicos do Instituto Nacional da Propriedade Industrial (INPI), e do European Patent Office (EPO), estuda formas de limpar e preparar os dados, extrair features e reduzir dimensionalidade; além de avaliar o desempenho de diversos algoritmos de classificação baseados em aprendizado de máquina utilizando a técnica de validação cruzada.

Abstract

This work proposes a Machine Learning and Text Classification-based solution to automate the distribution of Brazilian Portuguese patent applications that achieves a mean accuracy of 62.32%. It discloses a new dataset based on public data from the Instituto Nacional da Propriedade Industrial (INPI) and the European Patent Office (EPO); studies different ways to clean, sanitize, and prepare data, extract features, and reduce dimensionality; and uses cross-validation to evaluate various estimator’s performance.

Arquivo

3063.pdf

url

Distribuição de Pedidos de Patente em Português

Autores

Informações:

Publicações do PESC

Menu principal