Biometria - Impressão vocal
Digitalização do sinal
Conhecidas as propriedades de um sinal de voz, que tem características únicas para cada ser humano, precisamos agora entender como o sinal acústico é digitalizado, ou seja, para um sistema biométrico processar o sinal de fala, como ocorre a conversão do sinal analógico de voz em sinal digital afim de que o computador compreenda esse sinal. Após isso, é necessária a extração de parâmetros do sinal relevantes para o processo de reconhecimento de locutor.
A digitalização pode ser feita com a amostragem do sinal de voz e quantização dos valores de tensão, que serão transformados em seqüências de bits. Esse método é utilizado por exemplo na voz PCM (pulse code modulation), em que 8 bits são necessários para tal quantização.
Porém existem métodos mais eficientes de digitalização, baseados na modulação do sinal de voz. Um dos mais rápidos, simples, precisos e efetivos é o LPC (Linear Predictive Coding), que é baseado na predição de uma amostra n do sinal levando-se em conta as n-1 amostras anteriores. Matematicamente falando, temos:
Adaptada de [6]
Onde: x(n) é a amostra do sinal no instante n
p é a ordem da predição
ak são os coeficientes de predição
x(n - k) são as amostras do sinal em instantes anteriores
e(n) é o erro de predição
Como podemos ver, o sinal observado no instante n pode ser previsto com combinações lineares das amostras do sinal em tempos anteriores. Isso se baseia no fato de que o sinal de voz não possui variações bruscas em seus níveis de tensão.
O problema consiste então em minimizar o erro de predição, afim de obter o método mais preciso, achando os coeficientes de predição ak. Isso pode ser feito por certos métodos como o método da covariância.