Share record |
![]() ![]() |
Please use this identifier to cite or link to this item:
https://tede2.pucrs.br/tede2/handle/tede/11735
Document type: | Tese |
Title: | Holistic patient representation learning and automatic annotation of electronic health records |
Other Titles: | Aprendizado de representações holísticas de pacientes e anotação automática de registros eletrônicos de saúde |
Author: | Consoli, Bernardo Scapini ![]() |
Advisor: | Manssour, Isabel Harb |
Abstract (native): | Patient representation learning is the use of artificial intelligence technologies to reinterpret known patient data, extracted from Electronic Health Records, in a way that allows machine learning models to predict data and outcomes that could help medical professionals in diagnosis and the administration of proper care. It is important to note that medical data is tied to its place of origin. To deal with such a vital aspect to the development of national computational medicine solutions, we developed BRATECA, a collection of Brazilian tertiary care hospital data. This collection is open for credentialed access and was the largest collection of Brazilian medical data at the time of its release. Utilizing this collection in patient flow tasks, we achieved results of up to 0.88 F1 in patient Admission Prediction and up to 0.84 F1 for patient Extended Stay Prediction. We also developed an architecture for automatic annotation of social determinants of health in Electronic Health Records, which was validated on the US intensive care data collection MIMIC-III, where we achieved correlations of more than 0.8 measured in Cohen’s kappa for all annotation categories between our automatic annotation and human annotations. |
Abstract (english): | Aprendizado de representações de pacientes é o uso de inteligência artificial para reinterpretar dados conhecidos de pacientes, extraídos de Registros Eletrônicos de Saúde, para que modelos de aprendizado de máquinas consigam fazer previsões sobre pacientes que possam ajudar profissionais médicos no diagnóstico e na administração de cuidados adequados. É importante observar que dados médicos estão vinculados ao seu local de origem. Para lidar com este aspecto vital para o desenvolvimento das tecnologias nacionais de medicina computacional, desenvolvemos o BRATECA, uma coleção de dados de hospitais terciários brasileiros. Esta coleção for aberta para acesso credenciado e era o maior banco de dados hospitalares Brasileiros quando foi lançada. Utilizando ela em tarefas de fluxo de pacientes, atingimos resultados de até 0,88 de F1 para a tarefa de Predição de Admissão de pacientes e de até 0,84 de F1 para Predição de Estadia Longa de pacientes. Desenvolvemos também a arquitetura de anotação automática SDoH-GPT, a qual validamos nos banco de dados de UTI estadunidenses MIMIC-III e atingimos correlação medida em mais de 0,8 pontos no kappa de Cohen para todas categorias entre nossas anotações automáticas e anotações humanas. |
Keywords: | Patient Representation Learning Electronic Health Records BRATECA Patient Flow Automate Annotation Deep Learning Predictive Models Length-of-Stay Internet of Things Medical Data Patient Clinical History Heterogeneous Data Aprendizado de Representações de Pacientes Registros Eletrônicos de Saúde BRATECA Fluxo de Pacientes Anotação Automática Aprendizado Profundo Modelos Preditivos Tempo de Estadia Internet das Coisas Dados Médicos Histórico Clínico de Pacientes Dados Heterogêneos |
CNPQ Knowledge Areas: | CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
Language: | eng |
Country: | Brasil |
Publisher: | Pontifícia Universidade Católica do Rio Grande do Sul |
Institution Acronym: | PUCRS |
Department: | Escola Politécnica |
Program: | Programa de Pós-Graduação em Ciência da Computação |
Access type: | Acesso Aberto |
Fulltext access restriction: | Trabalho não apresenta restrição para publicação |
URI: | https://tede2.pucrs.br/tede2/handle/tede/11735 |
Issue Date: | 26-Mar-2025 |
Appears in Collections: | Programa de Pós-Graduação em Ciência da Computação |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
BERNARDO_SCAPINI_CONSOLI_TES.pdf | BERNARDO_SCAPINI_CONSOLI_TES | 3.12 MB | Adobe PDF | ![]() Download/Open Preview |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.