Export this record: EndNote BibTex

Please use this identifier to cite or link to this item: http://tede2.pucrs.br/tede2/handle/tede/7854
Full metadata record
DC FieldValueLanguage
dc.creatorLeães Neto, Antônio do Nascimento-
dc.creator.Latteshttp://lattes.cnpq.br/2307805233301986por
dc.contributor.advisor1Bordini, Rafael Heitor-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/4589262718627942por
dc.date.accessioned2018-02-22T16:40:19Z-
dc.date.issued2017-11-20-
dc.identifier.urihttp://tede2.pucrs.br/tede2/handle/tede/7854-
dc.description.resumoO crescimento acelerado dos repositórios de dados, nas diversas áreas de atuação, abre espaço para pesquisas na área da mineração de dados, em específico, com os métodos de classificação e de combinação de classificadores. O Boosting é um desses métodos, e combina os resultados de diversos classificadores com intuito de obter melhores resultados. O propósito central desta dissertação é responder a questão de pesquisa com a experimentação de alternativas para aumentar a eficácia e o desempenho do algoritmo AdaBoost.M1 que é a implementação frequentemente empregada pelo Boosting. Foi feito um estudo empírico levando em consideração aspectos estocásticos tentando lançar alguma luz sobre um parâmetro interno obscuro em que criadores do algoritmo e outros pesquisadores assumiram que o limiar de erro de treinamento deve ser correlacionado com o número de classes no conjunto de dados de destino e, logicamente, a maioria dos conjuntos de dados deve usar um valor de 0.5. Neste trabalho, apresentamos evidências empíricas de que isso não é um fato, mas provavelmente um mito originado pela aplicação da primeira definição do algoritmo. Para alcançar esse objetivo, foram propostas adaptações para o algoritmo, focando em encontrar uma sugestão melhor para definir esse limiar em um caso geral.por
dc.description.abstractThe accelerated growth of data repositories, in the different areas of activity, opens space for research in the area of data mining, in particular, with the methods of classification and combination of classifiers. The Boosting method is one of them, which combines the results of several classifiers in order to obtain better results. The main purpose of this dissertation is the experimentation of alternatives to increase the effectiveness and performance of the algorithm AdaBoost.M1, which is the implementation often employed by the Boosting method. An empirical study was perfered taking into account stochastic aspects trying to shed some light on an obscure internal parameter, in which algorithm creators and other researchers assumed that the training error threshold should be correlated with the number of classes in the target data set and logically, most data sets should use a value of 0.5. In this paper, we present an empirical evidence that this is not a fact, but probably a myth originated by the mistaken application of the theoretical assumption of the joint effect. To achieve this goal, adaptations were proposed for the algorithm, focusing on finding a better suggestion to define this threshold in a general case.eng
dc.description.provenanceSubmitted by PPG Ciência da Computação (ppgcc@pucrs.br) on 2018-02-16T13:18:07Z No. of bitstreams: 1 Antônio_do_Nascimento_Leães_ Neto_Dis.pdf: 1049012 bytes, checksum: 293046d3be865048cd37706b38494e1a (MD5)eng
dc.description.provenanceApproved for entry into archive by Caroline Xavier (caroline.xavier@pucrs.br) on 2018-02-22T16:34:51Z (GMT) No. of bitstreams: 1 Antônio_do_Nascimento_Leães_ Neto_Dis.pdf: 1049012 bytes, checksum: 293046d3be865048cd37706b38494e1a (MD5)eng
dc.description.provenanceMade available in DSpace on 2018-02-22T16:40:19Z (GMT). No. of bitstreams: 1 Antônio_do_Nascimento_Leães_ Neto_Dis.pdf: 1049012 bytes, checksum: 293046d3be865048cd37706b38494e1a (MD5) Previous issue date: 2017-11-20eng
dc.formatapplication/pdf*
dc.thumbnail.urlhttp://tede2.pucrs.br:80/tede2/retrieve/170944/Ant%c3%b4nio_do_Nascimento_Le%c3%a3es_%20Neto_Dis.pdf.jpg*
dc.languageporpor
dc.publisherPontifícia Universidade Católica do Rio Grande do Sulpor
dc.publisher.departmentEscola Politécnicapor
dc.publisher.countryBrasilpor
dc.publisher.initialsPUCRSpor
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computaçãopor
dc.rightsAcesso Abertopor
dc.subjectMineração de dadospor
dc.subjectClassificaçãopor
dc.subjectCombinação de classificadorespor
dc.subjectBoostingeng
dc.subjectAdaBoost.M1eng
dc.subjectData Miningeng
dc.subjectEnsemble Methodseng
dc.subjectClassificationpor
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpor
dc.titleClassificação com algoritmo AdaBoost.M1 : o mito do limiar de erro de treinamentopor
dc.typeDissertaçãopor
dc.restricao.situacaoTrabalho não apresenta restrição para publicaçãopor
Appears in Collections:Programa de Pós-Graduação em Ciência da Computação

Files in This Item:
File Description SizeFormat 
Antônio_do_Nascimento_Leães_ Neto_Dis.pdfANTONIO_DO_NASCIMENTO_LEAES_NETO_DIS1.02 MBAdobe PDFThumbnail

Download/Open Preview


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.