Dissertação
Real time audio system for SNR improvement with applications to distant speech recognition EVALUATED
Nesta tese estudou-se o método de separação de fontes DUET de forma a avaliar o seu potencial para vir a funcionar como interface de processamento de sinais de fala em tempo-real de forma a alimentar software de reconhecimento automático de fala e assim obter um sistema de reconhecimento de fala à distância em ambientes com pouco eco e mais que um locutor. A dispersão dos estimadores de localização no espaço binaural foi estudada e explicada pela primeira vez e a hipótese de estacionariedade local do DUET refutada para sons plosivos e sibilantes. O conhecimento adquirido sobre os factores de erro no espaço binaural permitem uma mais robusta localização dos picos, que é o ponto fulcral do DUET. Este conhecimento é extensível a outros métodos. Novas métricas de confiança e distância foram desenvolvidas para a identificação dos picos em tempo real que dispõe de pouca estatística. Um sistema de streaming em tempo real para processamento em paralelo de múltiplas fontes foi desenvolvido.
novembro 10, 2014, 11:0
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
Diogo Gonçalo Franco Falcão Osório de Alarcão
Departamento de Engenharia Electrotécnica e de Computadores (DEEC)
Prof Auxiliar Convidado