FenixEdu™

Dissertação

Real time audio system for SNR improvement with applications to distant speech recognition EVALUATED

Detalhes: Nesta tese estudou-se o método de separação de fontes DUET de forma a avaliar o seu potencial para vir a funcionar como interface de processamento de sinais de fala em tempo-real de forma a alimentar software de reconhecimento automático de fala e assim obter um sistema de reconhecimento de fala à distância em ambientes com pouco eco e mais que um locutor. A dispersão dos estimadores de localização no espaço binaural foi estudada e explicada pela primeira vez e a hipótese de estacionariedade local do DUET refutada para sons plosivos e sibilantes. O conhecimento adquirido sobre os factores de erro no espaço binaural permitem uma mais robusta localização dos picos, que é o ponto fulcral do DUET. Este conhecimento é extensível a outros métodos. Novas métricas de confiança e distância foram desenvolvidas para a identificação dos picos em tempo real que dispõe de pouca estatística. Um sistema de streaming em tempo real para processamento em paralelo de múltiplas fontes foi desenvolvido.
Keywords: Separação de fontes, DUET, Reconhecimento de Fala, Processamento de áudio, Processamento de Sinal

Discussão: novembro 10, 2014, 11:0