A extração manual de informações de laudos de tomografia computadorizada (TC) cardíaca é um processo trabalhoso e sujeito a erros. Modelos baseados em inteligência artificial (IA) podem automatizar essa tarefa e padronizar os dados obtidos. Neste trabalho, desenvolvemos um modelo de processamento de linguagem natural (PLN) para reconhecimento de entidades nomeadas em laudos de TC cardíaca, visando a obtenção de dados estruturados para pesquisa e prática clínica.
Desenvolvemos um sistema de reconhecimento de entidades utilizando a biblioteca spaCy. O modelo foi treinado para identificar 14 entidades anatômicas e patológicas da aorta e grandes vasos, incluindo raiz aórtica, aorta ascendente, arco aórtico, aorta descendente, e condições como dissecção e aneurisma. Laudos de TC foram anotados manualmente e divididos em conjuntos de treinamento (80%) e validação (20%). Implementamos técnicas de aumento de dados para equilibrar classes sub-representadas. O treinamento utilizou aceleração por GPU, e a avaliação incluiu métricas de precisão, recall e F1-score.
O modelo alcançou desempenho consistente com F1-score médio de 0,92. "Transição Tóraco-Abdominal" (F1=0,98), "Origem do Tronco Celíaco" (F1=0,98) e "Origem das Artérias Renais" (F1=0,98) obtiveram os melhores resultados. "Raiz" aórtica (F1=0,94) e "Descendente" (F1=0,94) também apresentaram excelente desempenho. Entidades de maior complexidade como "Aneurisma" (F1=0,82) e "Região Sinotubular" (F1=0,82) apresentaram desempenho satisfatório, porém com métricas inferiores. O sistema mostrou-se eficaz na identificação precisa de segmentos anatômicos específicos, facilitando a extração de dados para análises comparativas.
O modelo desenvolvido demonstra capacidade robusta para extrair automaticamente informações de laudos de TC cardíaca, com foco na avaliação aórtica. A implementação possibilita a criação de bancos de dados estruturados para pesquisa epidemiológica, monitoramento de padrões anatômicos e avaliação de alterações patológicas. O modelo apresenta maior precisão em estruturas anatômicas bem definidas e menor desempenho em patologias complexas, indicando áreas para refinamento futuro. Esta tecnologia contribui para a padronização de registros radiológicos e suporte à análise clínica baseada em evidências.