Perguntas Propostas ao Leitor
Introdução
Como
VoIP Reconhece uma Chamada Telefônica
Numeração
das Chamadas
CODEC
Qualidade
do Som
Atraso
de Ponta a Ponta
Protocolos
"Gateways"
Efeito Eco
Sinalização
Considerações
Finais
Glossário
Fontes
Links
Respostas às Perguntas
PERGUNTAS PROPOSTAS
Primeira: Resumidamente, o que é voz sobre IP?
Segunda: Qual é a grande vantagem da telefonia IP sobre a tradicional?
Terceira: Qual o principal protocolo usado em VoIP? Para que serve?
Quarta: Quais são as causas principais de atraso na rede? Como se classificam estas causas?
Quinta: Qual é a grande dificuldade a curto prazo para a implantação da tecnologia VoIP?
Voice-over-IP (VoIP) habilita o roteador (router) a transportar voz (telefonemas por exemplo) sobre a rede Internet. Na VoIP um DSP segmenta a voz em "frames" e os armazena em pacotes de voz. Estes pacotes são transportados pela rede IP de acordo com a especificação H.323 da ITU-T para transmissão multimídia (voz, vídeo e dados) através da rede IP. Por ser uma aplicação sensível ao atrazo, será necessário ter um sistema de transmissão de ponta a ponta com eficiência sufuciente para operar VoIP com sucesso. Para isso deve-se ter um conjunto de protocolos e características para fornecer seviço de qualidade (QoS). Considerações de tráfego também devem ser vistas para manter a cadência do discurso. É utilizado para conectar uma rede de soluções de telefonia IP aos troncos de telefone normais ou aos dispositivos analógicos. Estes troncos de telefone podem ser conectados à rede telefônica pública comutada PSTN ou aos sistemas das centrais privadas de comutação PBX existentes. Os dispositivos analógicos incluem os telefones existentes, aparelhos de fax e unidades de conferência de voz. Quanto à rede de dados, o cisco vg200 oferece uma porta ethernet 10/100 com detecção automática. Internamente, cisco vg200 tem processadores digitais de sinais DSP que convertem voz analógica e digital em pacotes IP para serem transportados através da rede IP utilizando os codificadores/decodificadores (CODEC - coders/decoders) padrão, incluindo g.711, g.723.1, g.729(a), etc.
1.
O usuário liga o "handset". Este sinal ativa
a parte de aplicação de VoIP no roteador.
2. A parte de aplicação de VoIP habilita a
chamada telefônica por tom e espera o usuário fornecer o
número de telefone.
3. O usuário digita o número. Este número é
acumulado na seção aplicação.
4. Quando os dígitos suficientes para completar
a ligaço são acumulados, o número de telefone é mapeado em um
endereço IP usando DPM. O "Host" IP tem a
conexão, e também a destinação, do número de telefone ou PBX
responsável por completar a chamada do destino configurado em
"host".
5. A sessão aplicação então roda o protocolo
H.323 para estabelecer um canal de transmissão e recepção em
cada direção da rede IP. Se o canal está sendo compartilhado
com um PBX, o PBX envia a chamada para o telefone de
destinação. Se o protocolo RSVP estiver sendo
configurado, as reservas de RSVP são colocadas em um arquivo
para atingir o QoS desejado na rede IP.
6. O CODEC é habilitado para ambos os
endereços do processo de conversação e conecsão usando RTTP/UDP/IP como protocolo.
7. Todas as indicações de chamada em andamento
são encerradas assim que um canal de audio é estabelecido. Esta
sinalização pode ser detectada por portas de voz (pode ser
feito com DTMF depois de ter completado a ligação). E é
feito na sessão aplicação com o portocolo RTCP.
8. Assim que termina a ligação, as reservas
feitas pelo RSVP são encerradas (desde que o
RSVP tenha sido usado, é claro!). os endereços se tornam
osiosos e ficam esperando a próxima conexão de estabelecimento
de uma nova chamada.
O padão PSTN usa um esquema
de numeração específico, este esquema segue a recomendação
da NANP para a América do Norte. A codificação é feita da
seguinte maneira: Existem códigos específicos para área,
escritório e estação. As áreas são isoladas geograficamente,
os códigos de escritório são específicos para um grupo de
"switches" e os códigos de estação
especificam um "switch" qualquer. Na América
do Norte o formato é 1Nxx-Nxx-xxxx, com N
de 2 a 9 e x de 0 a 9. cada país
estabelece um código de três dígitos.
ANALÓGICO
x DIGITAL
A transmissão
analógica não é eficiente por ter problema com ruído de
linha. Assim os sinais analógicos são degradados com a
distância, precisam ser amplificados periodicamente. O que
ocorre é que o ruído de linha também amplificado resultando na
perda de qualidade do som transmitido. Em resposta, é usada a
transmissão digital com modulação PCM ou ADPCM. Em ambos os casos, o som analógico
é convertido em digital a uma taxa de 8000 amostras por segundo.
PCM e ADPCM
são exemplos de forma sde onda de CODEC. O CODEC fornece formas
de onda comprimidas explorando a redundância da onda original.
Em geral, o CODEC inclui um sistema de predicção linear LPC, CELP e uma quntização MP-MLQ Técnicas de codificação para
telefonia e pacotes de voz são padronizadas pelo ITU-T na série
G.
G.711:
Descreve a técnica de codificação para voz em PCM 64
Kbps. É feito através de PBX ou PSTN.
G.729: Usado para voz com compressã de taxa de 8 Kbps. Há duas variações deste padrão: G.729 e G.729.A. A principal diferença é a complixidade computacional, ambos fornecem fornecem qualidade similar a 32 Kbps em ADPCM.
Outro problema que pode irritar o ouvinte durante a conversação telefônica é o eco. Assim, também deve-se empregar algoritmos de cancelamento de eco de forma a evitar tais incômodos. Os algoritmos mais modernos modelam padrões matemáticos da conversação humana e o subtraem no caminho de transmissão. Para funcionar de forma eficiente, esta técnica deve ser empregada no mesmo roteador que faz a codificação da voz.
Cada CODEC fornece som com
uma determinada qualidade. E esta qualidade é algo subjetivo,
pois depende das preferências de cada pessoa. Um parâmetro
usado é o nível de opinião médio MOS. Assim, um grande número de
ouvintes julgam a qualidade do som em uma escala de 1 (ruím)
até 5 (excelente). A tabela 1 abaixo mostra os escores de MOS
para cada CODEC. Uma das mais importantes considerações em
transmissão de voz é minimizar o atraso. para isso deve-se
considerar o trafego de voz em tempo real. Se ocorrer um atraso
muito grande no pacote, o som será ireconhecível, o atraso
aceitável é da ordem de 200 ms. Há basicamente dosi tipos de
atraso: Propagação e processamento. O atraso de propagação é
causado pela característica da luz em uma fibra optica e atrasos
de processamento ou serialização são causados pelos aparelhos.
A figura 2 mostra os atrasos introduzidos por diferentes
aparelhos de CODEC. Outro atraso de processamento é o tempo para
gerar o pacote de voz. Em VoIP o DSP forma um "frame" a
cada 10 ms. Outra forma de atraso é mover o pacote para a saída
da fila. "Jitter" também interfere no tempo de
transmissão. Ocorre quando há uma variação entre o tempo em
que o pacote é esperado e o tempo de recebimento; isto é, o
pacote foi recebido antes ou depois do esperado. Assim ocorre
descontinuidade no fluxo de voz em tempo real.
TABELA 1: Métodos de compressão e coeficiente MOS.
Método de compressão |
Taxa de bits (Kbps) |
Tamanho do Frame (ms) |
MOS |
G.711 PCM |
64 |
0,125 |
4,1 |
G.729 CS-ACELP |
8 |
10 |
3,92 |
G.729 x 2 encoding |
8 |
10 |
3,27 |
G.729 x 3 encoding |
8 |
10 |
2,68 |
G.729a CS-ACELP |
8 |
10 |
3,7 |
TABELA 2: Atrasos induzidos pelo CODEC.
CODEC |
Taxa de bits (Kbps) |
Tamanho do Frame (ms) |
Atraso de compressão (ms) |
G.711 PCM |
64 |
0,125 |
5 |
G.729 CS ACELP |
8 |
10 |
15 |
G.729a CS ACELP |
8 |
10 |
15 |
Considerando o endereçamento, CODEC e tarifação dos pacotes pelo tamanho é inevitável o atraso. Este atraso tem valores de 5 ms com G.711 e 10 ms com G.729.
Os atrasos fixos são ocasionados por diversos fatores, que podem ser citados abaixo:
ATRASO em cada etapa da transmissão.
O congestionamento da rede é o principal responsável pelo atrazo. Estes atrazos são causados pela acumulação dos pacotes nos roteadores. Atrasos da ordem de 150ms ou mesmo 250ms são considerados intoleráveis por alterar a qualidade e diminuir a iteratividade. Para outras aplicações da Internet, este tempo pode ser maior sem apresentar problemas de desempenho.
Como se os atrasos em si não fossem um problema grave, ainda há mais um problema: A perda na rede. Esta perda é um problema grave quando se trata de emviar dados. Para voz, dois casos devem ser considerados: Pacote de voz com e sem compressão. Para pacotes sem compressão, uma perda pode não causar problema de compreenssão do som. Em pacotes comprimidos sempre haverá uma perda maior que é dada pelo fator de compressão. Assim, o som terá o que patece uma pausa. Para garantir uma baixa probabilidade de perda, é necessário uma taxa de transmissão maior possível, apesar do protocolo TCP tentar garantir uma perda pequena. Isso sem falar em mais velocidade de processamento.
O IP é um protocolo de camada de rede encarregado em encapsular os dados em pacotes para roteamento. O que está sendo encapsulado não faz a menor diferença para ele. Poder ser o TCP ou UDP. Em telefonia sobre IP, estes protocolos chamados de transporte seriam RTTP. O RTTP é responsável pela ordem de chegada dos pacotes. Há a questão das aplicações em tempo real onde pacotes atrasados ou extraviados não podem mais ser amostrados na saída. Estes pacotes devem ser descartados. Neste caso, a camada de aplicação deve interpolar dados adjacentes para compensar o pacote que falta, caso contrário o resultado será desagradável, um efeito semelhante à voz picada dos telefones que suspendem a portadora quando não há mais sinal transmitido acima de um determinado nível. O RTTP não precisa se preocupar com a confiabilidade dos dados pois não há como retransmitir em tempo razoável para não alterar a qualdade do som.
Os protocolos RTTP precisam manter-se constantemente informados do tempo de chegada dos pacotes. Atrasos maiores que 300msec de ida e volta tornam a conversa muito difícil. Para manter a harmonia emtre qualidade e latência, os RTTP contam com um segundo protocolo chamado RTCP. Esta qualidade em redes é comumente chamada QoS.
A conexão para VoIP é estabelecida, sinalizada e terminada por outro protocolo. Os mais usados são H.323, SIP e MGCP. O H.323 deve destacar-se por ter sido o padão criado pelo ITU-T por ser o orgão mais influente em telecomunicações no mundo. Seja qual for o protocolo, este fica encapsulado no IP, o que é interessante. O SIP é muito parecido com o famoso HTTP por ser baseado em texto e ter mensagensmuito simplificadas. Finalmente, o MGCP é mais voltado para estabelecer o controle dos "gateways" Os "gateways" são codificadores e decodificadores que passam o sinal de um protocolo para outro. São responsáveis pelo encapsulamento dos sinais de voz digitalizados para o prootocolo RTP e vice-versa. Os "gateways" são os primeiros produtos disponíveis para VoIP.
TABELA 3: Protocolos principais.
Protocolo | descrição |
SGCP | Baseado no UDP para manejar pontos de endereçamento e suas conexões |
SAP | Usado na seção de envio múltiplo. Controla a distribuição para um grupo de receptores |
SIP | Convida um usuário a entrar em um ponto a ponto ou seçào de envio simples |
RTSP | Usado em interface, é em tempo real |
SDP | Descreve a seção para SAP, SIP e RTSP |
Já é possível encontrar "gateways" para ligação em equipamentos de PBX, são conectados às redes locais e a outros "gateways" em escritórios remotos fazem o trabalho de recuperação. No meio do caminho pode haver comutadores, embora não haja suporte técnico para uso na internet; isto é, nada de roteadores. A Cisco é uma das empresas que oferece "gateways" de VoIP que podem ser empregados em redes comutadas. Já a Nortel está desenvolvendo "gateways" que suportam roteadores, mas isso ainda está em pesquisa. Principalmente no que se refere à tradução do endereço de IP.
O modelo VG200 da Cisco
permite conexão à telefonia com PSTN ou PBX. Telefone
analógicos ou aparelhos de FAX também podem ser conectados.
Este "gateway" consiste em um módulo de rede (NM -
Network Module) que fornece processamento e recursos DSP e placas
de interface de voz VCI oferecendo as
interfaces de voz física. Uma configuração típica inclui duas
placas VCI (FXS e FXO) para um
total de quatro portas analógicas de voz.
Este efeito, no telefone, é ouvir sua própria voz no receptor enquanto você está falando. Se o eco superar cerca de 25 milisegundos pode ocorrer problemas na comunicação como interrupções. Na rede telefônica tradicional o eco é causado pela impedância não casada entre os terminais. Em pacotes de voz, são construidos canceladores de eco em CODEC de baixa taxa de bits e operam em cada DSP. Estes canceladores são limitados pelo tempo total de espera para pacotes refletidos serem recebidos, este efeito é conhecido como "echo trail" e é normalmente da ordem de 32 milisegundos. Atualmente as implementações de cancelamento de eco levam em consideração este "echo trail" por configuração pelo comando "echo-cancel-coverange". VoIP tem "echo trail" configurável em 8, 16, 24 e 32 milisegundos.
Há atualmente várias formas de sinalização usadas em telecomunicações. Uma das que se referem a transmissão de voz é a sinalização de acesso. determinando se uma linha está "off-hook" ou "on-hook". FXS e FXO são tipos de sinalização de acesso, há dois métodos de fornecer este sinal:
Apesar de ser de um
interesse alto por fornecedores de tecnologias, Os produtos
disponíveis são basicamente voltados às redes locais WAN's,
ainda sem tráfego na internet. Este é o maior objetivo da
tecnologia VoIP, pelo menos no ponto de vista dos usuários que
se preocupam com ligações interurbanas e internacionais.
Resposta1) Que tal telefonar para a China e pagar tarifa de ligação local? Com Voz sobre IP (Voice over IP [VoIP]) isto é possível. A diferença básica com a telefonia tradicional é a não ocupação integral do canal, isto é, quando ninguém está falando a ligação está efetiva e é tarifada. Em VoIP a voz é dividida em pacotes e enviada pela internet com endereçamento e todas as características da internet. A grande dificuldade, e problema a ser resolvido futuramente, é manter a cadência de mídias contínuas. Um atraso considerável (da ordem de 3000ms) torna a conversa difícil.
Resposta2) A grande vantagem é a flexibilidade. Ao invés de ter um sistema só para voz, outro só para dados, usa-se um sistema único com custo reduzido para o usuário. Um sistema de comunicação miltimídia. Outra grande vantagem é a reduçào da ociosidade da rede. na telefinia tradicional a ligação está ativa mesmo sem conversação e em VoIP os pacotes de voz são roteados. Isso reduz o custo.
Resposta3) IP é o protocolo da camada rede que faz o encapsulamento dos pacotes, sejam de dados ou mídias contínuas. mas no caso da voz são necessários protocolos de transporte chamados RTP [real time protocol]. RTP cuida da ordem de chegada dos pacotes. Os pacotes que chegam atrasados não podem mais ser amostrados na saída, em seu lugar é feita uma interpolação na camada de aplicação. Uma característica importante destes procolos: Os RTP's não precisam se preocupar com erros; já que, pelo menos por enquanto, não há tempo para retransmitir pacotes errados! Um outro protocolo é o RTCP [real time control protocol] que é usado para manter a cadência do discurso de forma a manter um mínimo de qualidade determinada.
Resposta4) Estes atrasos são classificados de
acordo com as causas possíveis: Fixos ou variáveis. Os atrasos
fixos são responsáveis por alterações na qualidade do som
não alterando a continuidade. Já os variáveis tiram a
cadência do som.
Os atrasos fixos são causados por: Compressão, descompressão,
"buffer" e limitação de velocidade nos enlaces.
Atrasos variáveis são causados por congestionamento na rede
devido a lotação de pacotes nos roteadores.
Resposta5) Os "gateways" são um
grande problema. Em geral não suportam roteadores e também não
há suporte técnico adequado para o uso em IP. Na verdade os
fabricantes ainda estão precionados pelas grandes empresas
limitando soluções na internet.
Quanto ao problema dos atrasos, parece qua a solução é usar
equipamentos mais rápidos dentro das subredes da internet, isso
pode levar muito tempo. Faça um teste: Use um modem de 56Kbps e
acesse um endereço qualquer fazendo um "ping" (ida e
volta). O tempo de resposta deve ficar entre 300 milisegundos
dependendo do endereço escolhido.
ADPCM: adaptive
differential PCM
DPM: Dial Plan Mapper
CELP: Code-Excited Linear
Prediction
CODEC: COder-DEcoder
Compression
DSP: Digital Signal
Processors
DTMF: Dual-Tone
MultiFrequency
GS: Ground Start
HTTP:Hiper
Text Transfer Protocol
ITU-T: International Telecommunications
Union-Telecommunications
LPC: Linear Predictive Coding
MOS: Mean Opinion Score
MP-MLQ: MultiPulse-MultiLevel Quantization
NANP: North American
Numbering Plan
PBX: Private Branch
Exchange
PCM: Pulse Code Modulation
PSTN: Public Switched
Telephone Network
QoS: Quality of Service
RTCP: Real Time
Control Protocol
RTTP/UDP/IP: Real-Time
Transport Protocol/User Datagram Protocol/Internet Protocol
VCI: Voice Cards Interface
http://www.radiolink.com
http://www.audiocodes.com
http://www.cisco.com/univercd/cc/td/doc/product/acess
http://www.micom.com/product/vip.html
http://www.micom.com/product/manuals/index.html
http://www.micom.com/product/manuals
| Minha Página | GTA | DEL | UFRJ |