Exportar este item: EndNote BibTex

Use este identificador para citar ou linkar para este item: https://tede2.pucrs.br/tede2/handle/tede/9970
Registro completo de metadados
Campo DCValorIdioma
dc.creatorReyes, Daniel Alessandro Guimarães de los-
dc.contributor.advisor1Manssour, Isabel Harb-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/4904489502853690por
dc.date.accessioned2021-11-24T11:25:17Z-
dc.date.issued2021-08-30-
dc.identifier.urihttp://tede2.pucrs.br/tede2/handle/tede/9970-
dc.description.resumoInteligência Competitiva (IC) é uma área relevante de uma corporação e pode apoiar a área estratégica de negócios, auxiliando os responsáveis pela tomada de decisões e como posicionar sua organização no mercado. No domínio financeiro, a identificação das organizações contidas em uma notícia pode se tornar insuficiente, sendo necessário extrair relações (ER) entre as entidades. Assim sendo, o objetivo deste trabalho é propor uma abordagem para a extração de qualquer relação semântica entre Entidades Nomeadas (ENs) no domínio do Mercado Financeiro para a língua portuguesa. Para atingir este objetivo, inicialmente foi feita uma revisão do estado da arte que levou à análise de 76 artigos para identificar as técnicas e conjuntos de dados usados para avaliá-las. Este estudo demonstrou que existem poucas abordagens para a tarefa de ER na língua portuguesa. Portanto, seguindo a metodologia de Knowledge Discovery in Databases (KDD) criada por Fayyad, propusemos uma abordagem em cinco etapas, que vai desde a coleta de dados até a avaliação dos resultados. Esta abordagem usa dois modelos baseados em Bidirectional Transformer Encoding Representations (BERT) para processar uma frase e suas entidades nomeadas. Primeiro classificamos se um determinado par de entidades tem ou não uma relação semântica e, em seguida, extraímos as partes da frase que representam ou descrevem a relação semântica entre essas entidades nomeadas. A abordagem foi desenvolvida para a língua portuguesa, considerando o domínio financeiro e explorando representações linguísticas profundas sem utilizar outros recursos léxico-semânticos. Os resultados dos experimentos mostram uma precisão de 76,3% usando a métrica de Jaccard, que mede a similaridade entre as relações extraídas pelo modelo extrator, além de alcançar pontuações de 87%, 84,5% e 85,8%, respectivamente para as métricas de Recall, Precisão e F-Measure quando mensuramos a abordagem completa. Outra contribuição importante é o corpus construído manualmente com mais de 9.114 tuplas (frase, entidade, entidade) anotadas em tweets e notícias disponibilizadas por analistas de IC para apoiar a decisão.por
dc.description.abstractCompetitive Intelligence (CI) is a relevant area of a corporation and can support the strategic business area, helping those responsible for decision making and how to position your organization in the market. In the financial domain, identifying the organizations contained in a news story can become insufficient, and it is also necessary to extract relations (ER) between entities. Therefore, the main goal of this work is to propose an approach for the extraction of any semantic relation between Named Entities (NEs) in the Financial Market domain for the Portuguese language. To achieve this goal, a state-of-the-art review was initially carried out, which led to the analysis of 76 articles to identify techniques and datasets used to assess them. This study shows that there are readings for the RE task in Portuguese language. Therefore, following the methodology of Knowledge Discovery in Databases (KDD) created by Fayyad, we proposed a five-step approach, which goes from collecting data to evaluating the results. This approach uses two models based on Bidirectional Transformer Encoding Representations (BERT) to process a sentence and its named entities. We first classify whether or not a given pair of entities has a semantic relation and then extract the sentence parts representing or describing the semantic relation between these named entities. The approach was developed for the Portuguese language, considering the financial domain and exploring deep linguistic representations without using other lexical-semantic resources. The results of the experiments show an accuracy of 76.3% using the Jaccard metric, which measures the similarity between the relations extracted by the extractor model, in addition to achieving scores of 87%, 84.5% and 85.8%, respectively for the Recall, Precision and F-Measure metrics when assessing the complete approach. Another important contribution is the manually built corpus with more than 9,114 tuples (phrase, entity, entity) annotated from tweets and news provided by CI analysts to support the decision.eng
dc.description.provenanceSubmitted by PPG Ciência da Computação ([email protected]) on 2021-11-23T17:54:32Z No. of bitstreams: 1 DANIEL ALESSANDRO GUIMARÃES DE LOS REYES_DIS.pdf: 2384395 bytes, checksum: 761da9e6e646f285a0d58da6103f97ca (MD5)eng
dc.description.provenanceApproved for entry into archive by Sheila Dias ([email protected]) on 2021-11-24T11:17:42Z (GMT) No. of bitstreams: 1 DANIEL ALESSANDRO GUIMARÃES DE LOS REYES_DIS.pdf: 2384395 bytes, checksum: 761da9e6e646f285a0d58da6103f97ca (MD5)eng
dc.description.provenanceMade available in DSpace on 2021-11-24T11:25:17Z (GMT). No. of bitstreams: 1 DANIEL ALESSANDRO GUIMARÃES DE LOS REYES_DIS.pdf: 2384395 bytes, checksum: 761da9e6e646f285a0d58da6103f97ca (MD5) Previous issue date: 2021-08-30eng
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESpor
dc.formatapplication/pdf*
dc.thumbnail.urlhttp://tede2.pucrs.br:80/tede2/retrieve/182625/DANIEL%20ALESSANDRO%20GUIMAR%c3%83ES%20DE%20LOS%20REYES_DIS.pdf.jpg*
dc.languageporpor
dc.publisherPontifícia Universidade Católica do Rio Grande do Sulpor
dc.publisher.departmentEscola Politécnicapor
dc.publisher.countryBrasilpor
dc.publisher.initialsPUCRSpor
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computaçãopor
dc.rightsAcesso Abertopor
dc.subjectExtração de Relaçãopor
dc.subjectExtração de Relação Financeira de Entidade Nomeadapor
dc.subjectExtração de Relação Semânticapor
dc.subjectProcessamento de Linguagem Naturalpor
dc.subjectRelation Extractioneng
dc.subjectFinancial Named-Entity Relation Extractioneng
dc.subjectSemantic Eelation Extractioneng
dc.subjectNatural Language Processingeng
dc.subject.cnpqCIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOpor
dc.titleExtração de relação entre entidades nomeadas no contexto econômico-financeiropor
dc.typeDissertaçãopor
dc.restricao.situacaoTrabalho não apresenta restrição para publicaçãopor
Aparece nas coleções:Programa de Pós-Graduação em Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
DANIEL ALESSANDRO GUIMARÃES DE LOS REYES_DIS.pdfDANIEL_ALESSANDRO_GUIMARÃES_DE_LOS_REYES_DIS2,33 MBAdobe PDFThumbnail

Baixar/Abrir Pré-Visualizar


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.