Tipos de Sistema
Sistemas de Verificação de Locutor Dependentes de Texto

Um sistema de verificação de locutor dependente de texto consiste em um sistema onde são usadas as mesmas elocuções tanto para o treino quanto para o teste, ou ainda pode corresponder a um sistema que usa um conjunto de modelos, baseados em palavras ou nas subunidades das palavras, de cada locutor, apenas para um vocabulário restrito.

No primeiro caso, também é usado, geralmente, um sistema de reconhecimento de voz para que a entrada fixa, que corresponde ao pedido de identidade feito pelo usuário ao sistema, seja feita também através de voz. Para isso, escolhe-se uma sequência de dígitos (que pode ser o número de uma conta, por exemplo) que será usada tanto  na etapa do “pedido de identidade” quanto na etapa de verificação do locutor.

No segundo caso apresentado, o sistema faz uso de modelos para construir a elocução de entrada na fase de teste, sendo que a mesma pode ou não estar presente no conjunto de treinamento. No entanto, o sistema impõe a restrição de que a elocução de entrada deve corresponder a uma sequência de palavras que se encontram no vocabulário do sistema. Um exemplo de vocabulário restrito é um vocabulário composto apenas por dígitos.

O sistema apresentado no primeiro caso, então, deve apresentar desempenho superior ao sistema que usa modelos para construir a elocução de entrada, uma vez que esse último necessitará de um tempo maior para a fase de treino, de modo a gerar os modelos, além de não apresentar um resultado tão acurado quanto o do sistema que compara a elocução de entrada a uma elocução pré-existente na base de treino.

Sistemas de Verificação de Locutor Independentes de Texto

Em um sistema de verificação de locutor independente de texto, um modelo dependente de locutor, como apresentado na Figura 3.1.1, da seção 3.1, é treinado baseado nas características gerais da voz de uma pessoa.

Para sistemas desse tipo, são necessárias grandes quantidades de dados para a fase de treino do sistema, além de serem usadas elocuções de tamanho maior na fase de teste do sistema, quando comparados aos sistemas dependentes de texto.

Um sistema independente de texto que não contenha as características aqui explicitadas apresentará desempenho inferior ao de um sistema dependente de texto.