Compartilhe o registro |
|
Use este identificador para citar ou linkar para este item:
https://tede2.pucrs.br/tede2/handle/tede/5038
Tipo do documento: | Dissertação |
Título: | Combinação de classificadores na categorização de textos |
Autor: | Linden, Gustavo Sandini |
Primeiro orientador: | Lima, Vera Lúcia Strube de |
Resumo: | Este trabalho apresenta e avalia uma proposta para Categorização Hierárquica de Textos com uso combinado dos classificadores k-Nearest Neighbors (k-NN) e Support Vector Machines (SVM). O estudo foi embasado numa série de experimentos os quais fizeram uso da coleção Folha-RIcol de textos em língua portuguesa, que se encontram hierarquicamente organizados em categorias. Nos experimentos realizados, os classificadores k-NN e SVM tiveram seu desempenho analisado, primeiro individualmente, com uma variante da metodologia de avaliação hold-out, e após, de modo combinado. A combinação proposta, denominada k-NN+SVM, teve seu desempenho comparado com aquele dos classificadores individuais e com o da combinação por voto. Em síntese, a combinação k-NN+SVM não apresentou desempenho superior às demais alternativas, todavia o estudo permitiu a observação do comportamento dos classificadores e seu uso combinado, a identificação de problemas e possíveis soluções, bem como algumas considerações sobre a coleção de documentos utilizada |
Palavras-chave: | INFORMÁTICA CATEGORIZAÇÃO (LINGÜíSTICA) LINGÜÍSTICA COMPUTACIONAL PROCESSAMENTO DE TEXTOS (COMPUTAÇÃO) APRENDIZAGEM DE MÁQUINA |
Área(s) do CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Idioma: | por |
País: | BR |
Instituição: | Pontifícia Universidade Católica do Rio Grande do Sul |
Sigla da instituição: | PUCRS |
Departamento: | Faculdade de Informáca |
Programa: | Programa de Pós-Graduação em Ciência da Computação |
Citação: | LINDEN, Gustavo Sandini. Combinação de classificadores na categorização de textos. 2007. 94 f. Dissertação (Mestrado em Ciência da Computação) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2007. |
Tipo de acesso: | Acesso Aberto |
URI: | http://tede2.pucrs.br/tede2/handle/tede/5038 |
Data de defesa: | 6-Dez-2007 |
Aparece nas coleções: | Programa de Pós-Graduação em Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
409150.pdf | Texto Completo | 902,26 kB | Adobe PDF | Baixar/Abrir Pré-Visualizar |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.