@MASTERSTHESIS{ 2021:748840114, title = {Extra??o de rela??o entre entidades nomeadas no contexto econ?mico-financeiro}, year = {2021}, url = "http://tede2.pucrs.br/tede2/handle/tede/9970", abstract = "Intelig?ncia Competitiva (IC) ? uma ?rea relevante de uma corpora??o e pode apoiar a ?rea estrat?gica de neg?cios, auxiliando os respons?veis pela tomada de decis?es e como posicionar sua organiza??o no mercado. No dom?nio financeiro, a identifica??o das organiza??es contidas em uma not?cia pode se tornar insuficiente, sendo necess?rio extrair rela??es (ER) entre as entidades. Assim sendo, o objetivo deste trabalho ? propor uma abordagem para a extra??o de qualquer rela??o sem?ntica entre Entidades Nomeadas (ENs) no dom?nio do Mercado Financeiro para a l?ngua portuguesa. Para atingir este objetivo, inicialmente foi feita uma revis?o do estado da arte que levou ? an?lise de 76 artigos para identificar as t?cnicas e conjuntos de dados usados para avali?-las. Este estudo demonstrou que existem poucas abordagens para a tarefa de ER na l?ngua portuguesa. Portanto, seguindo a metodologia de Knowledge Discovery in Databases (KDD) criada por Fayyad, propusemos uma abordagem em cinco etapas, que vai desde a coleta de dados at? a avalia??o dos resultados. Esta abordagem usa dois modelos baseados em Bidirectional Transformer Encoding Representations (BERT) para processar uma frase e suas entidades nomeadas. Primeiro classificamos se um determinado par de entidades tem ou n?o uma rela??o sem?ntica e, em seguida, extra?mos as partes da frase que representam ou descrevem a rela??o sem?ntica entre essas entidades nomeadas. A abordagem foi desenvolvida para a l?ngua portuguesa, considerando o dom?nio financeiro e explorando representa??es lingu?sticas profundas sem utilizar outros recursos l?xico-sem?nticos. Os resultados dos experimentos mostram uma precis?o de 76,3% usando a m?trica de Jaccard, que mede a similaridade entre as rela??es extra?das pelo modelo extrator, al?m de alcan?ar pontua??es de 87%, 84,5% e 85,8%, respectivamente para as m?tricas de Recall, Precis?o e F-Measure quando mensuramos a abordagem completa. Outra contribui??o importante ? o corpus constru?do manualmente com mais de 9.114 tuplas (frase, entidade, entidade) anotadas em tweets e not?cias disponibilizadas por analistas de IC para apoiar a decis?o.", publisher = {Pontif?cia Universidade Cat?lica do Rio Grande do Sul}, scholl = {Programa de P?s-Gradua??o em Ci?ncia da Computa??o}, note = {Escola Polit?cnica} }