Export this record: EndNote BibTex

Please use this identifier to cite or link to this item: https://tede2.pucrs.br/tede2/handle/tede/9007
Document type: Dissertação
Title: Preprocessing profiling model for visual analytics
Author: Milani, Alessandra Maciel Paz 
Advisor: Manssour, Isabel Harb
First advisor-co: Paulovich, Fernando Vieira
Abstract (native): Na era da informação, desenvolvemos a capacidade de coletar e armazenar dados, criar métodos sofisticados de mineração de dados e gerar visualizações ricas para compartilhar as informações resultantes do processo de análise de dados. No entanto, analisar e gerenciar dados brutos ainda é uma parte desafiadora desse processo, principalmente no que diz respeito ao pré-processamento de dados, que visa transformar esses dados brutos em um formato apropriado para análises subsequentes. Embora possamos encontrar estudos propondo implicações ou recomendações para futuras soluções de visualização no escopo da análise de dados, eles não se concentram nos desafios da fase de pré-processamento, nem em como a visualização pode suportá-la. Da mesma forma, os modelos atuais de análise visual não consideram o pré-processamento como uma fase igualmente importante em seus processos. Assim, com este estudo, pretendemos contribuir para a discussão de como podemos usar e combinar métodos de visualização e mineração de dados para auxiliar os analistas de dados durante as atividades de pré-processamento. Para isso, apresentamos um modelo de pré-processamento com análise visual, que contempla um conjunto de recursos para inspirar a implementação de novas soluções. Por sua vez, esses recursos foram projetados considerando uma lista de ideias(Insights) que obtivemos durante um estudo de entrevista com treze analistas de dados. As principais contribuições de nosso estudo são três: (a) O modelo de análise visual para auxiliar durante a fase de pré-processamento. (b) A lista de dez Insights, como um conjunto consolidado de requisitos para futuros estudos de pesquisa de visualização aplicados ao pré-processamento e à mineração de dados. (c) Os detalhes sobre o perfil dos analistas de dados, os principais desafios que eles enfrentam e as oportunidades que surgem enquanto eles estão envolvidos em projetos de mineração de dados em diversas áreas da organização
Abstract (english): In the information age, we have evolved the ability to collect and store data, create sophisticated data mining methods, and generate rich visualizations to share the information resulting from the data analysis process. However, analyzing and managing raw data is still a challenging part of this process, mainly with regards to data preprocessing, which aims to transform this raw data into an appropriate format for subsequent analysis. Although we can find studies proposing design implications or recommendations for future visualiza- tion solutions in the data analysis scope, they do not focus on the challenges during the Preprocessing phase and on how visualization can support it. Likewise, the current Visual Analytics Models are not considering preprocessing an equally important phase in their process, such as Data, Models, Visualization, and Knowledge. Thus, with this study, we aim to contribute to the discussion of how we can use and combine methods of visualization and data mining to assist data analysts during the preprocessing activities. To achieve that, we are introducing the Preprocessing Profiling Model for Visual Analytics, which contemplates a set of features to inspire the implementation of new solutions. In turn, these features were designed considering a list of insights we obtained during an interview study with thirteen data analysts. The main contributions in our study are three: (a) the Preprocessing Profiling Model for Visual Analytics as a solution to assist during Preprocessing phase. (b) The list of ten insights, as a consolidated set of requirements for future visualization research studies applied to preprocessing and data mining. (c) The details on the profile of the data analysts, the main challenges they face, and the opportunities that arise while they are engaged in data mining projects in diverse organizational areas
Keywords: Visual Analytics
Visualization Techniques
Data Mining
Preprocessing
Análise Visual
Técnicas de Visualização
Mineração de Dados
Pré- Processamento
CNPQ Knowledge Areas: CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
Language: eng
Country: Brasil
Publisher: Pontifícia Universidade Católica do Rio Grande do Sul
Institution Acronym: PUCRS
Department: Escola Politécnica
Program: Programa de Pós-Graduação em Ciência da Computação
Access type: Acesso Aberto
Fulltext access restriction: Trabalho não apresenta restrição para publicação
URI: http://tede2.pucrs.br/tede2/handle/tede/9007
Issue Date: 29-Aug-2019
Appears in Collections:Programa de Pós-Graduação em Ciência da Computação

Files in This Item:
File Description SizeFormat 
DIS_ALESSANDRA_MACIEL_PAZ_MILANI_COMPLETO.pdfALESSANDRA_MACIEL_PAZ_MILANI_DIS4.75 MBAdobe PDFThumbnail

Download/Open Preview


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.