Desenvolvimento de um biomarcador vocal:

análise de áudio para a estimativa do nível de SpO2 usando Redes Neurais

Alunos
Natália Hitomi Koza Ricardo Mikio Morita
Supervisor
Prof. Dr. Marcelo Finger

Resumo

Insuficiência respiratória é um sintoma comum em casos de COVID-19 e pode ser diagnosticada quando a saturação de oxigênio do sangue (SpO2) de um paciente é inferior a 92%. Nosso trabalho analisa a eficiência de Redes Neurais Convolucionais para determinar o nível de SpO2 a partir de amostras de voz. Através de etapas de pré-processamento, estas amostras de áudio passam por um processo de janelamento para serem então convertidas em MFCCs, as quais foram usadas em diversos experimentos para tentar determinar uma configuração ótima da rede neural. A investigação incluiu a variação de hiper-parâmetros da rede, adição de ruído, comparação do desempenho de MFCCs e Mel espectrogramas, dentre outros. As técnicas aplicadas nos permitiram alcançar uma acurácia de 80% na predição de pacientes com insuficiência, apesar de que em certos intervalos nosso modelo é capaz de predizer corretamente com uma acurácia de ao redor de 90%, comparável ao trabalho do grupo SPIRA (classificação binária com 91,66% de acurácia). Acreditamos que é necessário obter mais amostras de pacientes com insuficiência respiratória para que possamos analisar com mais profundidade estes resultados e possivelmente melhorar as nossas métricas.

Biomarcador Insuficiência Respiratória Redes Neurais Convolucionais