PATENT CLASSIFICATION MODEL BASED ON DENSE VECTOR REPRESENTATION, SORTING TECHNIQUES, AND KNOWLEDGE EXPLICATION

Autores

DOI:

https://doi.org/10.18624/e-tech.v19i1.1447

Palavras-chave:

patent analysis; deep learning; patent classification; embedding; knowledge graph

Resumo

This study addresses the automatic classification of patents, aiming to assist examiners in efficiently categorizing documents. The objective is to propose a model that utilizes unstructured text data, taking into account the ordering of subclasses and the explication of knowledge. An integrative literature review was conducted to identify appropriate methods. The model is evaluated in two scenarios using data from the USPTO. In the general scenario, employing transformer-based neural network architectures, an accuracy of approximately 80% is achieved in recommending the top 5 subclasses, considering 50 retrieved documents. In the specific scenario, compared to traditional neural networks, an accuracy of 90% is obtained. Additionally, the feasibility of a knowledge graph is explored to support the ordering of patent subclasses, with the aim of facilitating the explication and visualization of results. The findings indicate that the proposed model can optimize the patent classification process, making it easier for examiners to select appropriate subclasses.

Downloads

Não há dados estatísticos.

Biografia do Autor

Luciano Zamperetti Wolski, Universidade do Estado de Mato Grosso - UNEMAT/Professor

Possui graduação em Tecnólogo em Processamento de Dados pela Universidade do Vale do Rio dos Sinos (1996) e mestrado em Ciência da Computação pela Pontifícia Universidade Católica do Rio Grande do Sul (2009) e doutorado pelo Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento (PPGEGC ) da Universidade Federal de Santa Catarina (UFSC). Atua na área de concentração da Engenharia de Conhecimento (EC) com linha de pesquisa em Teoria e Prática em Engenharia do Conhecimento. Professor efetivo da Universidade do Estado de Mato Grosso. Tem experiência na área de Ciência da Computação, com ênfase em Engenharia de Software, atuando principalmente nos seguintes temas: Sistemas de Informação, Sistemas Multiagentes, Aprendizado de Máquina, Aprendizado Profundo e Ciência de Dados.

Alexandre Leopoldo Gonçalves, Universidade Federal de Santa Catarina - UFSC/Professor

Possui graduação em Ciência da Computação pela Fundação Universidade Regional de Blumenau (1997), mestrado e doutorado em Engenharia de Produção pela Universidade Federal de Santa Catarina em 2000 e 2006. Atualmente é Professor Associado lotado no Departamento de Computação/Centro de Ciências, Tecnologias e Saúde/UFSC e Professor Permanente do Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento/UFSC. Tem experiência nas áreas de Ciência da Computação e Engenharia do Conhecimento atuando principalmente nos seguintes temas: Extração e Recuperação de Informação, Descoberta de Conhecimento, Engenharia de Ontologia, Sistemas de Recomendação, Internet das Coisas, Aprendizado de Máquina e Ciência de Dados.

Downloads

Publicado

2026-02-13

Como Citar

Zamperetti Wolski, L., & Leopoldo Gonçalves, A. (2026). PATENT CLASSIFICATION MODEL BASED ON DENSE VECTOR REPRESENTATION, SORTING TECHNIQUES, AND KNOWLEDGE EXPLICATION. Revista E-TECH: Tecnologias Para Competitividade Industrial - ISSN - 1983-1838, 19(1). https://doi.org/10.18624/e-tech.v19i1.1447