Pares espectrais de linha - Line spectral pairs
Pares espectrais de linha ( LSP ) ou frequências espectrais de linha ( LSF ) são usados para representar coeficientes de predição linear (LPC) para transmissão em um canal. Os LSPs têm várias propriedades (por exemplo, menor sensibilidade ao ruído de quantização) que os tornam superiores à quantização direta de LPCs. Por esse motivo, os LSPs são muito úteis na codificação de voz .
A representação LSP foi desenvolvida por Fumitada Itakura , na Nippon Telegraph and Telephone (NTT) em 1975. De 1975 a 1981, estudou problemas de análise e síntese de fala com base no método LSP. Em 1980, sua equipe desenvolveu um chip sintetizador de voz baseado em LSP . LSP é uma tecnologia importante para síntese e codificação de voz e, na década de 1990, foi adotada por quase todos os padrões internacionais de codificação de voz como um componente essencial, contribuindo para o aprimoramento da comunicação digital de voz em canais móveis e na Internet em todo o mundo. LSPs são usados no algoritmo de predição linear excitada por código (CELP), desenvolvido por Bishnu S. Atal e Manfred R. Schroeder em 1985.
Base matemática
O polinômio LP pode ser expresso como , onde:
Por construção, P é um polinômio palíndromo e Q um polinômio antipalindrômico ; fisicamente P ( z ) corresponde ao trato vocal com a glote fechada e Q ( z ) com a glote aberta. Pode ser demonstrado que:
- As raízes de P e Q estão no círculo unitário no plano complexo.
- As raízes de P alternam com as de Q conforme viajamos ao redor do círculo.
- Como os coeficientes de P e Q são reais, as raízes ocorrem em pares conjugados
A representação Line Spectral Pair do polinômio LP consiste simplesmente na localização das raízes de P e Q (ou seja, tal que ). Como ocorrem em pares, apenas metade das raízes reais (convencionalmente entre 0 e ) precisam ser transmitidas. O número total de coeficientes para P e Q é, portanto, igual ap , o número de coeficientes LP originais (sem contar ).
Um algoritmo comum para encontrá-los é avaliar o polinômio em uma sequência de pontos próximos espaçados ao redor do círculo unitário, observando quando o resultado muda de sinal; quando isso acontecer, uma raiz deve estar entre os pontos testados. Como as raízes de P estão intercaladas com as de Q, uma única passagem é suficiente para encontrar as raízes de ambos os polinômios.
Para converter de volta para LPCs, precisamos avaliar "cronometrando" um impulso através dele N vezes (ordem do filtro), gerando o filtro original, A ( z ).
Propriedades
Os pares espectrais de linha têm várias propriedades interessantes e úteis. Quando as raízes de P ( z ) e Q ( z ) são intercaladas, a estabilidade do filtro é garantida se e somente se as raízes estiverem aumentando monotonicamente. Além disso, quanto mais próximas duas raízes estão, mais ressonante é o filtro na frequência correspondente. Como os LSPs não são excessivamente sensíveis ao ruído de quantização e a estabilidade é facilmente garantida, os LSP são amplamente usados para quantizar filtros LPC. As frequências espectrais de linha podem ser interpoladas.
Veja também
Fontes
- Manual Speex e código-fonte (lsp.c)
- "The Computation of Line Spectral Frequencies using Chebyshev Polynomials" / P. Kabal e RP Ramachandran. IEEE Trans. Acoustics, Speech, Signal Processing, vol. 34, nº 6, pp. 1419-1426, dezembro de 1986.
Inclui uma visão geral em relação ao LPC.
- Capítulo "Line Spectral Pairs" como um excerto online (pdf) / "Digital Signal Processing - A Computer Science Perspective" ( ISBN 0-471-29546-9 ) Jonathan Stein .