Analysing semantic resources for coreference resolution

Export this record:

Please use this identifier to cite or link to this item: https://tede2.pucrs.br/tede2/handle/tede/9079

Full metadata record

DC Field	Value	Language
dc.creator	Lima, Thiago Machado	-
dc.creator.Lattes	http://lattes.cnpq.br/8291310436197653	por
dc.contributor.advisor1	Vieira, Renata	-
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/6218967777630412	por
dc.contributor.advisor-co1	Collovini, Sandra	-
dc.contributor.advisor-co1Lattes	http://lattes.cnpq.br/0943477449872196	por
dc.date.accessioned	2020-01-27T20:28:16Z	-
dc.date.issued	2019-03-15	-
dc.identifier.uri	http://tede2.pucrs.br/tede2/handle/tede/9079	-
dc.description.resumo	Coreference Resolution is the task that consists of identifying mentions in a discourse that refer to the same entity. The task has the potential to improve other Natural Language Processing tasks such as sentiment analysis, information extraction, question answering, and others. Some coreferent relationships can be identified using lexical and syntactical rules, while others require semantic knowledge. However, few works focus on the possible improvements of using semantic knowledge. This work’s objective is to improve the coreference resolution task by using semantic knowledge. For that, we reviewed the semantic resources available for the Portuguese language, and selected ContoPT, Concept-Net and a word embedding model for our experiments. Experiments were performed using CORP, a coreference tool for the Portuguese language which already uses OntoPT as a semantic resource. The evaluation was composed of metrics MUC, B3 and CEAFe, using Corref-PT and Summ-it++ as corpora. Compared to OntoPT, we obtained better results in terms of F-Measure using ContoPT and ConceptNet. The experiments using the semantic similarity rule based in word embeddings was not able to surpass the results obtained with the structured semantic bases. Texts with more semantic relationships were selected for error analysis, and we were able to observe some difficulties involved in the detection of semantic relationships. To overcome these difficulties improvements are proposed. Besides the analysis of available semantic basis, this work brings as contribution a new CORP version, integrated with three new semantic resources, which obtained a higher F-Measure using semantics than the version that uses OntoPT.	por
dc.description.abstract	Resolução de Correferência é uma tarefa que consiste em identificar menções em um discurso que se referem a uma mesma entidade. A tarefa tem o potencial de aprimorar outras tarefas de Processamento de Linguagem Natural como análise de sentimentos, extração de informação, sistemas de pergunta-resposta, entre outras. Algumas relações de correferência podem ser identificadas utilizando-se regras lexicais e sintáticas, enquanto para outras é necessário conhecimento semântico. No entanto, poucos trabalhos de resolução de correferência focaram em melhorias que possam ser realizadas com conhecimento semântico. O objetivo deste trabalho é aprimorar a tarefa de resolução de correferência utilizando semântica. Para isso, foram revisados os recursos semânticos disponíveis para o Português, dos quais foram selecionados para os experimentos o ContoPT, o Concept- Net e um modelo de word embeddings. Os experimentos foram realizados no CORP, uma ferramenta de correferência para o Português que já utiliza o OntoPT como recurso semântico. A avaliação foi composta pelas métricas MUC, B3 e CEAFe, utilizando-se os corpora Corref-PT e Summ-it++. Ao comparar com o OntoPT, obtivemos melhores resultados em termos de Medida-F utilizando o ContoPT e o ConceptNet. Nos experimentos com a regra de similaridade semântica que utiliza o modelo de word embeddings não foi posível atingirmos os resultados obtidos com as bases semânticas estruturadas. Textos com mais relações semânticas foram selecionados para análise de erros, na qual observamos algumasdificuldades envolvendo a detecção de relacionamentos semânticos. Para tratar essas dificuldades foram propostas melhorias. Como contribuição este trabalho traz, além da análise das bases, uma nova versão do CORP integrada com três novos recursos semânticos. A nova versão obteve uma maior Medida-F utilizando semântica em relação à versão anterior que utiliza o OntoPT.	por
dc.description.provenance	Submitted by PPG Ciência da Computação ([email protected]) on 2020-01-20T14:43:19Z No. of bitstreams: 1 THIAGO MACHADO LIMA_DIS.pdf: 1007664 bytes, checksum: 133ead2776491ddcb6a67c86456ec12e (MD5)	eng
dc.description.provenance	Approved for entry into archive by Sheila Dias ([email protected]) on 2020-01-27T20:20:47Z (GMT) No. of bitstreams: 1 THIAGO MACHADO LIMA_DIS.pdf: 1007664 bytes, checksum: 133ead2776491ddcb6a67c86456ec12e (MD5)	eng
dc.description.provenance	Made available in DSpace on 2020-01-27T20:28:16Z (GMT). No. of bitstreams: 1 THIAGO MACHADO LIMA_DIS.pdf: 1007664 bytes, checksum: 133ead2776491ddcb6a67c86456ec12e (MD5) Previous issue date: 2019-03-15	eng
dc.format	application/pdf	*
dc.thumbnail.url	http://tede2.pucrs.br:80/tede2/retrieve/177524/THIAGO%20MACHADO%20LIMA_DIS.pdf.jpg	*
dc.language	eng	por
dc.publisher	Pontifícia Universidade Católica do Rio Grande do Sul	por
dc.publisher.department	Escola Politécnica	por
dc.publisher.country	Brasil	por
dc.publisher.initials	PUCRS	por
dc.publisher.program	Programa de Pós-Graduação em Ciência da Computação	por
dc.rights	Acesso Aberto	por
dc.subject	Coreference Resolution	eng
dc.subject	Semantic Knowledge	eng
dc.subject	Corpus Analysis	eng
dc.subject	Resolução de Correferência	por
dc.subject	Conhecimento Semântico	por
dc.subject	Análise de Corpus	por
dc.subject.cnpq	CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO	por
dc.title	Analysing semantic resources for coreference resolution	por
dc.type	Dissertação	por
dc.restricao.situacao	Trabalho não apresenta restrição para publicação	por
Appears in Collections:	Programa de Pós-Graduação em Ciência da Computação

Files in This Item:

File	Description	Size	Format
THIAGO MACHADO LIMA_DIS.pdf	THIAGO_MACHADO_LIMA_DIS	984.05 kB	Adobe PDF	Download/Open Preview ×

Show simple item record Recommend this item

PUCRS

Digital Library of Theses and Dissertations