Export this record: EndNote BibTex

Please use this identifier to cite or link to this item: http://tede2.pucrs.br/tede2/handle/tede/8336
Document type: Tese
Title: Gerenciamento térmico e energético em MPSoCs
Author: Castilhos, Guilherme Machado de 
Advisor: Moraes, Fernando Gehm
Abstract (native): As altas variações térmicas e de temperatura de operação podem ter um impacto significativo no desempenho do sistema, consumo de energia e na confiabilidade, uma métrica cada vez mais crítica em sistema multiprocessados. As técnicas de gerenciamento térmico existentes dependem de sensores físicos para fornecer os valores de temperatura para regular a temperatura de operação e a variação térmica do sistema em tempo de execução. No entanto, os sensores térmicos em um chip apresentam limitações (por exemplo, custo extra de potência e de área), o que pode restringir seu uso em sistemas com uma grande quantidade de processadores. Neste contexto, esta Tese propõe um modelo de temperatura baseado em software, realizado em tempo de execução, permitindo capturar informações detalhadas da distribuição de temperatura de sistemas multiprocessados com custo mínimo no desempenho das aplicações. Para validar a proposta, o modelo foi incluído em uma plataforma MPSoC com memória distribuída, descrita no nível RTL. Além disso, os resultados mostram que o erro absoluto médio da estimativa de temperatura, em comparação com a ferramenta HotSpot, é menor do que 4% em sistemas com até 36 elementos de processamento. O mapeamento de tarefas foi o processo escolhido para atuar no sistema, utilizando as informações de temperatura geradas pelo modelo proposto. O mapeamento de tarefas é o processo de selecionar um elemento de processamento para executar uma determinada tarefa. O número de núcleos em sistemas multiprocessados, aumenta a complexidade do mapeamento de tarefas. As principais preocupações no mapeamento de tarefas em sistemas de grande porte incluem: (i) escalabilidade; (Ii) carga de trabalho dinâmica; e (iii) confiabilidade. É necessário distribuir a decisão de mapeamento em todo o sistema para assegurar a escalabilidade. A carga de trabalho de sistemas multiprocessados pode ser dinâmica, ou seja, novas aplicações podem começar a qualquer momento, levando a diferentes cenários de mapeamento. Portanto, é necessário executar o processo de mapeamento em tempo de execução para suportar carga dinâmica de trabalho. A atribuição de carga de trabalho desempenha um papel importante na confiabilidade do sistema. O desequilíbrio de carga pode gerar zonas de hotspot e consequentemente implicações térmicas. Recentemente, técnicas de mapeamento de tarefas com o objetivo de melhorar a confiabilidade do sistema foram propostas na literatura. No entanto, tais abordagens dependem de decisões de mapeamento centralizado, que não são escaláveis. Para enfrentar esses desafios, esta Tese propõe uma heurística de mapeamento hierárquico realizado em tempo de execução, que ofereça escalabilidade e uma melhor distribuição térmica. A melhor distribuição térmica dentro do sistema aumenta a confiabilidade do sistema a longo prazo, devido à redução das variações térmicas e redução de zonas de hotspot. A heurística de mapeamento proposta considera a temperatura do PE como uma função custo. A proposta adota um esquema hierárquico de monitoramento de temperatura, capaz de estimar em tempo de execução a temperatura instantânea de cada elemento de processamento. O mapeamento usa a temperatura estimada pelo método de monitoramento para orientar a decisão de mapeamento. Os resultados comparam a proposta com uma heurística de mapeamento cuja principal função de custo minimiza a energia de comunicação. Os resultados obtidos mostram diminuição da temperatura máxima (melhor caso, 8%) e melhora na distribuição térmica (melhor caso, valor 50% menor do desvio padrão das temperaturas dos processadores). Além disso, alcançou-se, no melhor caso, um aumento de 45% no tempo de vida do sistema utilizando o mapeamento proposto.
Abstract (english): Thermal cycles and high temperatures can have a significant impact on the systems performance, power consumption and reliability, which is a major and increasingly critical design metric in emerging multi-processor embedded systems. Existing thermal management techniques rely on physical sensors to provide them temperature values to regulate the system’s operating temperature and thermal variation at runtime. However, on-chip thermal sensors present limitations (e.g., extra power and area cost), which may restrict their use in large-scale systems. In this context, this Thesis proposes a lightweight software-based runtime temperature model, enabling to capture detailed temperature distribution information of multiprocessor systems with negligible overhead in the execution time. The temperature model is embedded in a distributedmemory MPSoC platform, described at the RTL level. Results show that the average absolute temperature error estimation, compared to the HotSpot tool is smaller than 4% in systems with up to 36 processing elements. Task mapping is the process selected to act in the system, using the temperature information generated by the proposed model. Task mapping is the process of assigning a processing element to execute a given task. The number of cores in many-core systems increases the complexity of the task mapping. The main concerns of task mapping for large systems include (i) scalability; (ii) dynamic workload; and (iii) reliability. It is necessary to distribute the mapping decisions across the system to ensure scalability. The workload of emerging many-core systems may be dynamic, i.e., new applications may start at any moment, leading to different mapping scenarios. Therefore, it is necessary to execute the mapping process at runtime to support dynamic workload. The workload assignment plays a major role in the many-core system reliability. Load imbalance may generate hotspots zones and consequently thermal implications. Recently, task mapping techniques aiming at improving system reliability have been proposed in the literature. However, such approaches rely on centralized mapping decisions, which are not scalable. To address these challenges, the main goal of this Thesis is to propose a hierarchical runtime mapping heuristic, which provides scalability and fair thermal distribution. Thermal distribution inside the system increases the system reliability in long-term, due to the reduction of hotspot regions. The proposed mapping heuristic considers the PE temperature as a cost function. The proposal adopts a hierarchical thermal monitoring scheme, able to estimate at runtime the instantaneous temperature at each processing element. The mapping uses the temperature estimated by the monitoring scheme to guide the mapping decision. Results compare the proposal against a mapping heuristic whose main cost function minimizes the communication energy. Results obtained in large systems, show a decrease in the maximum temperature (best case, 8%) and improvement in the thermal distribution (best case, 50% lower standard deviation of processor temperatures). Such results demonstrate the effectiveness of the proposal. Also, a 45% increase in the lifetime of the system was achieved in the best case, using the proposed mapping.
Keywords: MPSoC
Gerência Térmica
Gerência Energética
Confiabilidade
Thermal Management
Energy Management
Reliability
CNPQ Knowledge Areas: CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Language: por
Country: Brasil
Publisher: Pontifícia Universidade Católica do Rio Grande do Sul
Institution Acronym: PUCRS
Department: Escola Politécnica
Program: Programa de Pós-Graduação em Ciência da Computação
Access type: Acesso Aberto
Fulltext access restriction: Trabalho não apresenta restrição para publicação
URI: http://tede2.pucrs.br/tede2/handle/tede/8336
Issue Date: 10-Aug-2017
Appears in Collections:Programa de Pós-Graduação em Ciência da Computação

Files in This Item:
File Description SizeFormat 
TES_GUILHERME_MACHADO_DE_CASTILHOS_COMPLETO.pdfGUILHERME_MACHADO_DE_CASTILHOS_TES4.53 MBAdobe PDFThumbnail

Download/Open Preview


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.