Extração de relações hiponímicas em corpora de língua portuguesa

Exportar este item:

Use este identificador para citar ou linkar para este item: https://tede2.pucrs.br/tede2/handle/tede/6108

Registro completo de metadados

Campo DC	Valor	Idioma
dc.creator	Machado, Pablo Neves	-
dc.creator.Lattes	http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4294042A5	por
dc.contributor.advisor1	Lima, Vera Lúcia Strube de	-
dc.contributor.advisor1Lattes	http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4781127A8	por
dc.date.accessioned	2015-06-08T11:20:00Z	-
dc.date.issued	2015-03-26	-
dc.identifier.uri	http://tede2.pucrs.br/tede2/handle/tede/6108	-
dc.description.resumo	O Processamento da Linguagem Natural (PLN) é uma área da Ciência da Computação destacada por sua relevância para o desenvolvimento de aplicações em processamento de grandes quantidades de documentos textuais ou orais. Neste trabalho focamos nos textos em língua portuguesa, deles extraindo relações hiponímicas entre entidades, usando uma abordagem baseada em regras adaptadas dos trabalhos de Hearst para o inglês, Freitas e Quental e Taba e Caseli para o português, aqui complementadas. Para validar a proposta foi desenvolvido um protótipo que extrai relações hiponímicas de corpora em língua portuguesa. O protótipo foi executado sobre corpus de textos e os resultados obtidos foram analisados tanto por fonte de referência como por grupos de regras. O processo avaliativo seguiu o proposto por Freitas e Quental com avaliação humana, e as medidas obtidas são comparadas com as relatadas nas principais fontes de referência. A dissertação ainda estuda em detalhe os erros mais frequentes identificados.	por
dc.description.abstract	Natural Language Processing (NLP) is a Computer Science area featured by its relevance to the development of applications that process large amounts of text or speech. In this paper we focus on texts in Portuguese, extracting from them hyponymic relations between entities, using a rules-based approach adapted from Hearst to English, and Freitas and Quental and Taba and Caseli to Portuguese. The prototype was executed over a corpus of Portuguese texts and the output was analyzed according to the reference author and rule sets. The evaluation process followed the one proposed by Freitas and Quental with human judgment, and the results are compared to those reported in the main references. The dissertation also studies in detail the most common errors identified.	eng
dc.description.provenance	Submitted by Setor de Tratamento da Informação - BC/PUCRS ([email protected]) on 2015-06-08T11:20:00Z No. of bitstreams: 1 470106 - Texto Completo.pdf: 1241867 bytes, checksum: fb5ae9bcc63565dabf9bfb2f5c3ed3ad (MD5)	eng
dc.description.provenance	Made available in DSpace on 2015-06-08T11:20:00Z (GMT). No. of bitstreams: 1 470106 - Texto Completo.pdf: 1241867 bytes, checksum: fb5ae9bcc63565dabf9bfb2f5c3ed3ad (MD5) Previous issue date: 2015-03-26	eng
dc.format	application/pdf	*
dc.thumbnail.url	http://tede2.pucrs.br:80/tede2/retrieve/162954/470106%20-%20Texto%20Completo.pdf.jpg	*
dc.language	por	por
dc.publisher	Pontifícia Universidade Católica do Rio Grande do Sul	por
dc.publisher.department	Faculdade de Informática	por
dc.publisher.country	Brasil	por
dc.publisher.initials	PUCRS	por
dc.publisher.program	Programa de Pós-Graduação em Ciência da Computação	por
dc.rights	Acesso Aberto	por
dc.subject	INFORMÁTICA	por
dc.subject	PROCESSAMENTO DA LINGUAGEM NATURAL	por
dc.subject	ANÁLISE SEMÂNTICA (PROGRAMAÇÃO)	por
dc.subject.cnpq	CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO	por
dc.title	Extração de relações hiponímicas em corpora de língua portuguesa	por
dc.type	Dissertação	por
Aparece nas coleções:	Programa de Pós-Graduação em Ciência da Computação

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
470106 - Texto Completo.pdf	Texto Completo	1,21 MB	Adobe PDF	Baixar/Abrir Pré-Visualizar ×

Mostrar registro simples do item Recomendar este item Visualizar estatísticas

PUCRS

Biblioteca Digital de Teses e Dissertações