@PHDTHESIS{ 2015:1782454847, title = {Descoberta de conjuntos de itens frequentes com o modelo de programa??o MapReduce sobre contextos de incerteza}, year = {2015}, url = "http://tede2.pucrs.br/tede2/handle/tede/6254", abstract = "Frequent Itemsets Mining (FIM) ? uma tarefa de minera??o de dados utilizada para encontrar rela??es entre os itens de um dataset. O Apriori ? um tradicional algoritmo da classe Generateand- Test para descobrir tais rela??es. Estudos recentes mostram que este e outros algoritmos desta tarefa n?o est?o aptos para executar em contextos onde haja incerteza associada, pois eles n?o est?o preparados para lidar com as probabilidades existentes nos itens do dataset. A incerteza nos dados ocorre em diversas aplica??es como, por exemplo, dados coletados de sensores, informa??es sobre a presen?a de objetos em imagens de sat?lite e dados provenientes da aplica??o de m?todos estat?sticos. Dada a grande quantidade de dados com incertezas associadas, novos algoritmos t?m sido desenvolvidos para trabalharem neste contexto: UApriori, UF-Growth e UH-Mine. O UApriori, em especial, ? um algoritmo baseado em suporte esperado, abordado frequentemente pela comunidade acad?mica. Quando este algoritmo ? aplicado sobre grandes datasets, em um contexto com probabilidades associadas aos itens do dataset, ele n?o apresenta boa escalabilidade. Por outro lado, alguns trabalhos t?m adaptado o algoritmo Apriori para trabalhar com o modelo de programa??o MapReduce, a fim de prover uma melhor escalabilidade. Utilizando este modelo, ? poss?vel descobrir itens frequentes de modo paralelo e distribu?do. No entanto, tais trabalhos focam seus esfor?os na descoberta de itens frequentes sobre datasets determin?sticos. Esta tese apresenta o desenvolvimento, implementa??o e os experimentos realizados, a partir da aplica??o e discuss?o de tr?s algoritmos: UAprioriMR, UAprioriMRByT e UAprioriMRJoin. Os tr?s algoritmos citados evoluem o algoritmo tradicional Apriori para que possam executar com o modelo de programa??o MapReduce sobre contextos com incerteza associada. O algoritmo UAprioriMRJoin ? um algoritmo h?brido com base nos algoritmos UAprioriMR e UAprioriMRByT. Os experimentos revelam o bom desempenho do algoritmo UAprioriMRJoin quando aplicado sobre grandes datasets, com muitos atributos e um n?mero m?dio pequeno de itens por transa??o, em um cluster de nodos.", publisher = {Pontif?cia Universidade Cat?lica do Rio Grande do Sul}, scholl = {Programa de P?s-Gradua??o em Ci?ncia da Computa??o}, note = {Faculdade de Inform?tica} }