Um sistema de verificação de locutor dependente de texto consiste em um sistema onde são usadas as mesmas elocuções tanto para o treino quanto para o teste, ou ainda pode corresponder a um sistema que usa um conjunto de modelos, baseados em palavras ou nas subunidades das palavras, de cada locutor, apenas para um vocabulário restrito.
No primeiro caso, também é usado, geralmente, um sistema de reconhecimento de voz para que a entrada fixa, que corresponde ao pedido de identidade feito pelo usuário ao sistema, seja feita também através de voz. Para isso, escolhe-se uma sequência de dígitos (que pode ser o número de uma conta, por exemplo) que será usada tanto na etapa do “pedido de identidade” quanto na etapa de verificação do locutor.
No segundo caso apresentado, o sistema faz uso de modelos para construir a elocução de entrada na fase de teste, sendo que a mesma pode ou não estar presente no conjunto de treinamento. No entanto, o sistema impõe a restrição de que a elocução de entrada deve corresponder a uma sequência de palavras que se encontram no vocabulário do sistema. Um exemplo de vocabulário restrito é um vocabulário composto apenas por dígitos.
O sistema apresentado no primeiro caso, então, deve apresentar desempenho superior ao sistema que usa modelos para construir a elocução de entrada, uma vez que esse último necessitará de um tempo maior para a fase de treino, de modo a gerar os modelos, além de não apresentar um resultado tão acurado quanto o do sistema que compara a elocução de entrada a uma elocução pré-existente na base de treino.
|