Aluno
Luan Tavares de Andrade - 12542904
Orientador
Marcelo Finger
Motivação
O projeto SPIRA (Detecting respiratory insufficiency by voice analysis: the SPIRA project, 2021) demonstrou possível o estudo da voz humana para detecção de insuficiência respiratória, especialmente durante o período da pandemia de Covid-19. Durante a fase inicial do projeto, visando melhorar a qualidade dos dados, foi utilizada a inserção de ruídos hospitalares nos áudios coletados. Essa abordagem previa padronizar as condições (ambiente) de gravação dos grupos analisados (pacientes e grupo de controle) e reduzir o viés do modelo utilizado. Apesar dos resultados obtidos ao final do projeto serem satisfatórios, surgiu o questionamento sobre a eficiência dos métodos de tratamento inicial dos dados, principalmente quando comparado a outras abordagens.
Proposta de Trabalho
Esse trabalho propõe uma nova análise do estudo feito em 2021, agora com o uso de técnicas de filtragem de ruído na detecção de insuficiência respiratória, a fim de observar o impacto dessas mudanças nos resultados do modelo de detecção.
Objetivos
- Revisar a metodologia utilizada pelo projeto original (SPIRA);
- Aplicação de diferente tipos de filtros em diferentes etapas do projeto;
- Análise comparativa do desempenho dos modelos antes e depois da aplicação dos filtros;
- Analisar e interpretar os resultados obtidos, identificando os impactos das mudanças implementadas.
Metodologia
A metodologia do trabalho é proposta da seguinte forma:
1. Reprodução dos Resultados Anteriores
Para a fase inicial deste trabalho, serão consideradas duas abordagens distintas, que se diferenciam no ponto de partida da pesquisa: Ablação e Exploração.
- Ablação: Será feita a reprodução dos resultados obtidos pelo projeto original até o momento onde a inserção de ruídos não impactava negativamente a acurácia do modelo, e a partir desse ponto, seguir o estudo utilizando filtros de ruído;
- Exploração: Desta vez, a análise seguirá do ponto inicial do projeto anterior, onde a adição de ruídos ainda não representava uma melhora significativa na acurácia do modelo, e a partir desse ponto, realizar o estudo com filtros de ruído. (Iniciaremos com essa)
2. Filtragem de Ruídos
Sendo o diferencial deste trabalho, essa parte consiste no estudo e aplicação de diferentes tipos de filtros de áudio em distintos domínios de análise, como o domínio de frequência (FFT) e o domínio do tempo (espectrogramas), podendo assim ser feita uma análise mais vasta do impacto da remoção de certas partes do áudio no desempenho dos modelos estudados.
3. Análise e Interpretação dos Resultados
Para verificar a eficácia dos métodos aplicados, durante todo o projeto testes serão realizados analisando diferentes métricas como:
- Acurácia
- Matriz de Confusão
- F-Score
- Precisão
- Recall
- Outras métricas que se mostrarem relevantes durante a pesquisa
Referências
CASANOVA, Edresson et al. Deep learning against COVID-19: respiratory insufficiency detection in Brazilian Portuguese speech. In: Proceedings. 2021.
KONG, Qiuqiang et al. Panns: Large-scale pretrained audio neural networks for audio pattern recognition. IEEE/ACM Transactions on Audio, Speech, and Language Processing, v. 28, p. 2880-2894, 2020.