@MASTERSTHESIS{ 2020:1373751123, title = {Evaluating the performance and improving the usability of parallel and distributed word embedding tools}, year = {2020}, url = "http://tede2.pucrs.br/tede2/handle/tede/9245", abstract = "A representa??o de palavras por meio de vetores chamada de Word Embeddings (WE) vem recebendo grande aten??o do campo de Processamento de Linguagem natural (NLP). Modelos WE s?o capazes de expressar similaridades sint?ticas e sem?nticas, bem como relacionamentos e contextos de palavras em um determinado corpus. Apesar de as implementa??es mais populares de algoritmos de WE apresentarem baixa escalabilidade, existem novas abordagens que aplicam t?cnicas de High-Performance Computing (HPC). Nesta disserta??o ? apresentado um estudo interdisciplinar direcionado a utiliza??o de recursos e aspectos de desempenho dos algoritmos de WE encontrados na literatura. Para melhorar a escalabilidade e usabilidade, o presente trabalho prop?e uma integra??o para ambientes de execu??o locais e remotos, que cont?m um conjunto das vers?es mais otimizadas. Usando estas otimiza??es ? poss?vel alcan?ar um ganho de desempenho m?dio de 15x para multicores e 105x para multinodes comparado ? vers?o original. H? tamb?m uma grande redu??o no consumo de mem?ria comparado ?s vers?es mais populares em Python. Uma vez que o uso apropriado de ambientes de alta performance pode requerer conhecimento especializado de seus usu?rios, neste trabalho tamb?m ? proposto um modelo de otimiza??o de par?metros que utiliza uma rede neural Multilayer Perceptron (MLP) e o algoritmo Simulated Annealing (SA) para sugerir conjuntos de par?metros que considerem os recursos computacionais, o que pode ser um aux?lio para usu?rios n?o especialistas no uso de ambientes computacionais de alto desempenho.", publisher = {Pontif?cia Universidade Cat?lica do Rio Grande do Sul}, scholl = {Programa de P?s-Gradua??o em Ci?ncia da Computa??o}, note = {Escola Polit?cnica} }