Exportar este item: EndNote BibTex

Use este identificador para citar ou linkar para este item: https://tede2.pucrs.br/tede2/handle/tede/9260
Tipo do documento: Dissertação
Título: Automated database indexing using model-free reinforcement learning
Autor: Licks, Gabriel Paludo 
Primeiro orientador: Meneguzzi, Felipe Rech
Resumo: A configuração de bancos de dados para uma execução eficiente de queries é uma tarefa complexa, ficando a cargo de um administrador de banco de dados. Para isso, são utilizados índices, estruturas que facilitam a busca de registros e reduzem o tempo de resposta das queries, especialmente ao processar queries complexas. Porém, resolver o problema de criar índices que realmente otimizam o acesso ao banco de dados requer uma quantidade substancial de conhecimento do banco de dados e do domínio, cuja falta geralmente resulta em espaço e memória desperdiçados com índices irrelevantes, comprometendo o desempenho do banco de dados para queries e, certamente, degrada o desempenho da atualização de registros no banco. Nesta pesquisa, desenvolvemos a arquitetura SmartIX para resolver o problema de indexar automaticamente um banco de dados utilizando aprendizado por reforço para otimizar queries indexando dados ao longo da utilização de um banco de dados. Para avaliar seu desempenho, utilizamos o banco de dados TPC-H, referência na literatura para benchmarking de bancos de dados. Nossa avaliação experimental mostra que nossa arquitetura converge para configurações de índices com desempenho superior em comparação à trabalhos relacionados que utilizam aprendizado por reforço e algoritmos genéticos, constantemente mantendo configurações de índices próximas do ótimo e eficientemente escalando para bancos de dados maiores.
Abstract: Configuring databases for efficient querying is a complex task, often carried out by a database administrator. To reduce the response time of queries, especially complex ones, index structures are created to facilitate the search for data. However, solving the problem of building indexes that truly optimize database access requires a substantial amount of database and domain knowledge, the lack of which often results in wasted space and memory for irrelevant indexes, possibly jeopardizing database performance for querying and certainly degrading performance for updating. In this research, we develop the an architecture to solve the problem of automatically indexing a database by using reinforcement learning to optimize queries by indexing data throughout the lifetime of a database. We train our reinforcement learning agent and evaluate its performance in experiments using TPC-H, a standard, and scalable database benchmark. In our experimental evaluation, our architecture shows superior performance compared to related work on reinforcement learning and genetic algorithms, maintaining near-optimal index configurations and efficiently scaling to large databases.
Palavras-chave: Artificial intelligence
Reinforcement learning
Databases
Automated indexing
Inteligência artificial
Aprendizado por reforço
Bancos de dados
Indexação automática
Área(s) do CNPq: CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
Idioma: eng
País: Brasil
Instituição: Pontifícia Universidade Católica do Rio Grande do Sul
Sigla da instituição: PUCRS
Departamento: Escola Politécnica
Programa: Programa de Pós-Graduação em Ciência da Computação
Tipo de acesso: Acesso Aberto
Restrição de acesso: Trabalho não apresenta restrição para publicação
URI: http://tede2.pucrs.br/tede2/handle/tede/9260
Data de defesa: 4-Ago-2020
Aparece nas coleções:Programa de Pós-Graduação em Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
GABRIEL PALUDO LICKS_DIS.pdfGABRIEL_PALUDO_LICKS_DIS988,1 kBAdobe PDFThumbnail

Baixar/Abrir Pré-Visualizar


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.