Exportar este item: EndNote BibTex

Use este identificador para citar ou linkar para este item: http://tede2.pucrs.br/tede2/handle/tede/7563
Tipo do documento: Dissertação
Título: Contributions in face detection with deep neural networks
Autor: Paula, Thomas da Silva
Primeiro orientador: Barros, Rodrigo Coelho
Resumo: Face Detection is one of the most studied subjects in the Computer Vision field. Given an arbitrary image or video frame, the goal of face detection is to determine whether there are any faces in the image and, if present, return the image location and the extent of each face. Such a detection is easily done by humans, but it is still a challenge within Computer Vision. The high degree of variability and the dynamicity of the human face makes it an object very difficult to detect, mainly in complex environments. Recently, Deep Learning approaches started to be applied for Computer Vision tasks with great results. They opened new research possibilities in different applications, including Face Detection. Even though Deep Learning has been successfully applied for such a task, most of the state-of-the-art implementations make use of off-the-shelf face detectors and do not evaluate differences among them. In other cases, the face detectors are trained in a multitask manner that includes face landmark detection, age detection, and so on. Hence, our goal is threefold. First, we summarize and explain many advances of deep learning, detailing how each different architecture and implementation work. Second, we focus on the face detection problem itself, performing a rigorous analysis of some of the existing face detectors as well as implementations of our own. We experiment and evaluate variations of hyper-parameters for each of the detectors and their impact in different datasets. We explore both traditional and more recent approaches, as well as implementing our own face detectors. Finally, we implement, test, and compare a meta learning approach for face detection, which aims to learn the best face detector for a given image. Our experiments contribute in understanding the role of deep learning in face detection as well as the subtleties of changing hyper-parameters of the face detectors and their impact in face detection. We also show how well features obtained with deep neural networks trained on a general-purpose dataset perform on a meta learning approach for face detection. Our experiments and conclusions show that deep learning has indeed a notable role in face detection.
Abstract: Reconhecimento facial é um dos assuntos mais estudos no campo de Visão Computacional. Dada uma imagem arbitrária ou um frame arbitrário, o objetivo do reconhecimento facial é determinar se existem faces na imagem e, se existirem, obter a localização e a extensão de cada face encontrada. Tal detecção é facilmente feita por seres humanos, porém continua sendo um desafio em Visão Computacional. O alto grau de variabilidade e a dinamicidade da face humana tornam-a difícil de detectar, principalmente em ambientes complexos. Recentementemente, abordagens de Aprendizado Profundo começaram a ser utilizadas em tarefas de Visão Computacional com bons resultados. Tais resultados abriram novas possibilidades de pesquisa em diferentes aplicações, incluindo Reconhecimento Facial. Embora abordagens de Aprendizado Profundo tenham sido aplicadas com sucesso para tal tarefa, a maior parte das implementações estado da arte utilizam detectores faciais off-the-shelf e não avaliam as diferenças entre eles. Em outros casos, os detectores faciais são treinados para múltiplas tarefas, como detecção de pontos fiduciais, detecção de idade, entre outros. Portanto, nós temos três principais objetivos. Primeiramente, nós resumimos e explicamos alguns avanços do Aprendizado Profundo, detalhando como cada arquitetura e implementação funcionam. Depois, focamos no problema de detecção facial em si, realizando uma rigorosa análise de alguns dos detectores existentes assim como algumas implementações nossas. Nós experimentamos e avaliamos variações de alguns hiper-parâmetros para cada um dos detectores e seu impacto em diferentes bases de dados. Nós exploramos tanto implementações tradicionais quanto mais recentes, além de implementarmos nosso próprio detector facial. Por fim, nós implementamos, testamos e comparamos uma abordagem de meta-aprendizado para detecção facial, que visa aprender qual o melhor detector facial para uma determinada imagem. Nossos experimentos contribuem para o entendimento do papel do Aprendizado Profundo em detecção facial, assim como os detalhes relacionados a mudança de hiper-parâmetros dos detectores faciais e seu impacto no resultado da detecção facial. Nós também mostramos o quão bem features obtidas com redes neurais profundas — treinadas em bases de dados de propósito geral – combinadas com uma abordagem de meta-aprendizado, se aplicam a detecção facial. Nossos experimentos e conclusões mostram que o aprendizado profundo possui de fato um papel notável em detecção facial.
Palavras-chave: Deep Learning
Face Detection
Neural Networks
Machine Learning
Computer Vision
Aprendizado Profundo
Reconhecimento Facial
Redes Neurais
Aprendizado de Máquina
Visão Computacional
Área(s) do CNPq: CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Idioma: eng
País: Brasil
Instituição: Pontifícia Universidade Católica do Rio Grande do Sul
Sigla da instituição: PUCRS
Departamento: Faculdade de Informática
Programa: Programa de Pós-Graduação em Ciência da Computação
Tipo de acesso: Acesso Aberto
URI: http://tede2.pucrs.br/tede2/handle/tede/7563
Data de defesa: 28-Mar-2017
Aparece nas coleções:Programa de Pós-Graduação em Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
DIS_THOMAS_DA_SILVA_PAULA_COMPLETO.pdfTexto Completo10,35 MBAdobe PDFThumbnail

Baixar/Abrir Pré-Visualizar


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.