Biometria - Impressão vocal

Digitalização do sinal

Conhecidas as propriedades de um sinal de voz, que tem características únicas para cada ser humano, precisamos agora entender como o sinal acústico é digitalizado, ou seja, para um sistema biométrico processar o sinal de fala, como ocorre a conversão do sinal analógico de voz em sinal digital afim de que o computador compreenda esse sinal. Após isso, é necessária a extração de parâmetros do sinal relevantes para o processo de reconhecimento de locutor.

A digitalização pode ser feita com a amostragem do sinal de voz e quantização dos valores de tensão, que serão transformados em seqüências de bits. Esse método é utilizado por exemplo na voz PCM (pulse code modulation), em que 8 bits são necessários para tal quantização.

Porém existem métodos mais eficientes de digitalização, baseados na modulação do sinal de voz. Um dos mais rápidos, simples, precisos e efetivos é o LPC (Linear Predictive Coding), que é baseado na predição de uma amostra n do sinal levando-se em conta as n-1 amostras anteriores. Matematicamente falando, temos:

Adaptada de [6]

Onde: x(n) é a amostra do sinal no instante n

p é a ordem da predição

a_k são os coeficientes de predição

x(n - k) são as amostras do sinal em instantes anteriores

e(n) é o erro de predição

Como podemos ver, o sinal observado no instante n pode ser previsto com combinações lineares das amostras do sinal em tempos anteriores. Isso se baseia no fato de que o sinal de voz não possui variações bruscas em seus níveis de tensão.

O problema consiste então em minimizar o erro de predição, afim de obter o método mais preciso, achando os coeficientes de predição ak. Isso pode ser feito por certos métodos como o método da covariância.