Comportamentos de movimento nos modelos de machine learning para predição de quedas em 28.660 pessoas idosas: Evidências do UK Biobank
Por Raíssa de Melo (Autor), Irina Buionova (Autor), Chen Zheng, Narun Pat (Autor), Eduardo Caldas Costa (Autor).
Em XV Congresso Brasileiro de Atividade Física e Saúde - CBAFS
Resumo
As quedas em pessoas idosas são ocorrências multifatoriais complexas e representam uma grande preocupação em saúde pública. Avanços em machine learning (ML) oferecem novas possibilidades para predições de eventos em saúde com base em dados populacionais amplos e com alta complexidade. Neste contexto, pouco se sabe sobre o papel preditor da atividade física (AF), tempo sedentário e sono para quedas. Objetivo: Avaliar o desempenho preditivo de ML na classificação de quedas em pessoas idosas e analisar o papel preditor dos comportamentos de movimento. Métodos: A amostra incluiu 28.660 participantes entre 60 e 79 anos do UK Biobank (UKBB), um banco de dados amplo e multidimensional. O desfecho foi a ocorrência autorreferida de queda no último ano. Utilizou-se 417 preditores (features), incluindo dados sociodemográficos, álcool, tabagismo, composição corporal, comportamentos de movimento por acelerometria (AF, tempo sedentário e sono) e tipos de AF no último mês. Utilizou-se o classificador Random Forest, com divisão entre treino (n=22.928; 80%) e teste (n=5.732; 20%) (modelo 1) e amostragem balanceada 1:1 (modelo 2). As métricas incluíram acurácia, área sob a curva (AUC), F1-score e as 15 variáveis mais importantes na construção do modelo. Resultados: A prevalência de quedas foi 22,1%. O modelo 1 apresentou acurácia de 0,81, AUC de 0,59, F1-score de 0,89 (não caiu) e 0,00 (caiu). O modelo 2 teve F1-scores equilibrados entre "não caiu" e "caiu", 0,59 e 0,58, respectivamente, acurácia de 0,58 e AUC de 0,60. Entre as 15 variáveis mais relevantes, a AF (leve e moderada a vigorosa), tempo sedentário e sono representaram 42,6% da importância relativa no algoritmo gerado. Conclusão: Comportamentos de movimento estiveram entre os principais preditores de quedas. Entretanto, o desempenho dos algoritmos testados foi limitado, sugerindo dificuldades na aprendizagem de padrões para predição quedas, mesmo em um grande banco de dados e com alta dimensionalidade.