Biometria - Impressão vocal

                                                                                                                                                                                  

  

    GMMs

Home

 

      

            O Modelo de Mistura de Gaussianas (Gaussian mixture model) é um modelo estocástico que se baseia na modelagem de classes acústicas através do uso das probabilidades geradas por conjuntos de funções de densidade de probabilidade, no caso, gaussianas. Cada uma dessas misturas pode representar uma ou mais classes fonéticas, caracterizando o som produzido pelo locutor.

 

            O modelo de um sistema GMM é dado pela seguinte equação:

 

[8]

 

          Isso mostra que a probabilidade condicional p(ot|Cj) é igual a p(ot|λj), já que λj é um modelo GMM para a classe Cj, e é igual ao somatório de gaussianas multivariadas, sendo ci o peso de cada gaussiana  N (ot , µi , Σi) , com médias e variâncias iguais a µi e Σi , respectivamente.

 

          

           A probabilidade de ocorrência de uma classe "Ci" dado que foi observado um vetor acústico "o", chamada de probabilidade a posteriori, é dada pelo teorema de Bayes:

 

[9]

 

            Sendo P(o) a probabilidade de observação do vetor acústico , P(Ci) a freqüência de ocorrência da classe no banco de dados.

 

            O reconhecimento do locutor se dará através de uma regra de decisão considerando-se uma sequência de vetores acústicos com probabilidades de ocorrência independentes. A regra de decisão será baseada na maximização da probabilidade a posteriori através do método da máxima verossimilhança, que é dado por um produtório de probabilidades a posteriori. Na prática, o cálculo geralmente se faz tomando o somatório de logaritmos de probabilidades a posteriori, segunda a seguinte fórmula:

 

[10]

 

           A fórmula diz que αk é o valor a ser tomado na regra de decisão e nota-se um somatório do logaritmo das probabilidades a posteriori. Percebe-se também a omissão do termo P(0), que torna-se dispensável ao cálculo já que é igual para todas as classes Ci.

                      

 

                                                                                             

                                                                                      Anterior             Próximo

 

 

 

Guilherme Pires Sales de Carvalho

Thiago Monte dos Santos


 


         

 

 

 

  Home

  1. Biometria

  2. O sinal de voz

  3. Sistemas de verificação de locutor

  4. Conclusões

  5. Perguntas

  6. Referências bibliográficas

  7. Índice de figuras