Latência, Jitter e Perda de Pacotes - VoIP

A variação no atraso do pacote às vezes é chamada de "jitter". Esse termo, no entanto, causa confusão porque é usado de maneiras diferentes por diferentes grupos de pessoas.

"Jitter" geralmente tem dois significados: O primeiro significado é o variação de um sinal em relação a algum sinal de clock, onde o espera-se que a hora de chegada do sinal coincida com a chegada do sinal do relógio. Este significado é usado com referência a sinais síncronos e pode ser usado para medir a qualidade de emulação de circuito, por exemplo. Existe também uma métrica chamada "wander" usado neste contexto.

O segundo significado tem a ver com a variação de uma métrica (por exemplo, atraso) em relação a alguma métrica de referência (por exemplo, atraso médio ou atraso mínimo). Este significado é frequentemente usado por computadores cientistas e frequentemente (mas nem sempre) refere-se à variação atraso.

Neste documento, evitaremos o termo "jitter" sempre que possível e mantenha a variação de atraso que é mais precisa.

Definição
Uma definição da variação do atraso do pacote IP (ipdv) pode ser dada para pacotes dentro de um fluxo de pacotes.


O ipdv de um par de pacotes dentro de um fluxo de pacotes é definido para um par selecionado de pacotes no fluxo que vai da medição ponto MP1 ao ponto de medição MP2.
O ipdv é a diferença entre o atraso unidirecional do pacotes.

Um uso importante da variação de delay é o dimensionamento do play-out buffers para aplicativos que exigem a entrega regular de pacotes (por exemplo, reprodução de voz ou vídeo). O que normalmente é importante neste caso é a variação máxima de atraso, que é usada para dimensionar buffers de play-out para tais aplicações [ 7 ]. Outros usos de um atraso métrica de variação são, por exemplo, para determinar a dinâmica de filas dentro de uma rede (ou roteador) onde as mudanças no atraso variação pode ser vinculada a mudanças no processo de comprimento da fila em um determinado link ou uma combinação de links.

Além disso, este tipo de métrica é particularmente robusto no que diz respeito às diferenças e variações dos relógios dos dois hosts. Esse permite o uso da métrica mesmo que os dois hosts que suportam a os pontos de medição não estão sincronizados. No último caso indicações de inclinação recíproca dos relógios podem ser derivadas da medição e correções são possíveis. A precisão relacionada é muitas vezes comparável com o que pode ser alcançado com sincronização relógios, sendo da mesma ordem de grandeza de sincronização erros. Isso será discutido a seguir.

O escopo deste documento é fornecer uma maneira de medir o ipdv entregue em um caminho. Nosso objetivo é fornecer uma métrica que possa ser parametrizado para que possa ser utilizado para diversos fins. Algum relatório da métrica DEVE incluir todos os parâmetros associados para que as condições e o significado da métrica possam ser determinados exatamente. Como a métrica não representa um julgamento de valor (ou seja, definir "bom" e "ruim"), não especificamos especificamente valores das métricas que as redes IP devem atender.


A flexibilidade da métrica pode ser vista como uma desvantagem, mas existem alguns argumentos para torná-lo flexível. Primeiro, embora haja são alguns usos do ipdv mencionados acima, até certo ponto os usos do ipdv ainda são um tópico de pesquisa e algum espaço deve ser deixado para experimentação. Em segundo lugar, existem diferentes pontos de vista no comunidade do que exatamente a definição deve ser (por exemplo. 

A ideia aqui é parametrizar a definição, em vez de escrever um documento diferente para cada definição proposta


Desde que todos os parâmetros sejam informados, ficará claro o que é significa um uso particular de ipdv. Todas as observações no documento mantenha, não importa quais parâmetros são escolhidos.

E agora podemos falar sobre o assunto.

A tecnologia VoIP permite aplicações de tempo real, como uma ligação telefônica por meio de uma rede IP, podendo ser utilizada a Internet. É importante salientar que uma rede IP não garante Qualidade de Serviço (QoS), ou seja, não garante que os pacotes chegarão no destino e tampouco na ordem correta, mas são implementadas soluções para essa necessidade. E para que a voz seja enviada e recebida pela rede IP com bom desempenho, são necessários estes mecanismos para oferecer QoS, a fim de eliminar ou minimizar problemas críticos da rede, e consequentemente da comunicação em VoIP.

 Fatores consideráveis para a qualidade de serviço VoIP

 Um dos problemas críticos de uma comunicação VoIP é o atraso fim a fim ou latência, que consiste na diferença de tempo em que é transmitido o primeiro bit do pacote de voz, do tempo que esse mesmo bit é recebido, a diferença não pode ultrapassar 150 milissegundos (ms), de acordo com a recomendação G.114 da ITU-T. Caso existam atrasos acima desse patamar, haverá sobreposição das falas nas chamadas, ou seja, a perda de sincronização. A ocorrência de eco nas chamadas telefônicas também acontece devido ao atraso fim a fim. Esse tipo de atraso pode decorrer devido ao atraso de propagação do sinal no meio de transmissão (cabos, fibras ópticas, wireless), e também o tempo gasto com o processamento da digitalização e compressão de voz, feito pelo codec implementado.

 No gráfico apresentado a seguir (figura 1), são ilustradas as consequências na qualidade de voz provenientes do atraso fim a fim:

 

Figura 1: Consequências do atraso fim a fim numa comunicação VoIP. (ROSS, 2007)

 Outro atraso a ser considerado é o de empacotamento, que é o tempo necessário de geração de um número suficiente dos pacotes de voz para preencher o payload (carga útil) do pacote IP.

 O atraso de fila já consiste no tempo em que os pacotes são enfileirados entre os nós da rede.

 Também é inevitável a perda de pacotes, que nem sequer chegam ao destino, ou erros nos mesmos, considerando que não há a retransmissão, por causa da utilização dos protocolos UDP e RTP, até porque sendo a voz um tipo de dado em tempo real, a retransmissão de pacotes não pode ser aplicada. O valor máximo de perdas de pacotes aceitável é de 1%. Ocorrendo uma perda de pacotes acima de 5% do total, uma conversa telefônica usando VoIP já fica comprometida (ROSS, 2007).

 A largura de banda disponível para o tráfego de voz numa rede IP é de extrema importância, como trafegam também dados, informações de tempo real necessitam de prioridade. Como exemplo, uma ligação VoIP consome em média 8kbit/s de codificação, utilizando o codec G.729, há mais 16kbit/s dos cabeçalhos IP, RTP e UDP, resultando em 24kbit/s em média por ligação. Se não houver prioridade dos pacotes de voz pela rede, outros dados consumirão a largura de banda.

 Outro fator é a supressão de silêncio ou Voice Activity Detection (VAD), como a comunicação entre origem e destino é halfduplex, ocorrem pausas quando um termina e o outro começa. Essas pausas podem ser suprimidas e recriadas na outra extremidade, para manter o tom natural da conversa, evitando a transmissão de pacotes de silêncio pela rede. Numa ligação telefônica, constatou-se que 22% é a comunicação propriamente dita, enquanto que 56% são pausas e outros 22% são padrões repetitivos (JÚNIOR et al, 2010). A supressão de silêncio é feita pelos algoritmos de compressão de voz, utilizados pelos codecs.

 Um último fator a ser considerado, porém não sendo o menos importante, é o jitterJitter é o termo que define as variações de tempo da chegada do pacote de voz ao destino, ou seja, a variação do atraso fim a fim. Numa comunicação telefônica, os fluxos de pacotes de voz devem chegar ao destino numa harmonia constante, e de preferência no mesmo ritmo com que foram gerados pela origem. Se o jitter for muito grande, mesmo o atraso se mantendo dentro dos limites aceitáveis, a qualidade da comunicação vai decrescer até se tornar impossível. O jitter não pode ultrapassar 20 ms.

 Métodos de avaliação de desempenho

 Existem alguns métodos de avaliação de desempenho da qualidade de voz trafegada por uma rede IP: MOS, PSQM, PAMS e PESQ.

 O Mean Opinion Score (MOS) é definido pela recomendação ITU-T P.800. Esse método avalia a qualidade da voz comparando resultados com uma referência bem específica. O MOS é um método subjetivo, baseado na opinião de um grupo de avaliadores sobre a qualidade de uma conversa. Estes avaliadores participam da conversa ou ouvem uma amostra de voz que atribuem uma pontuação.

 A tabela 1 exibe uma escala de valores do MOS utilizada pela ITU, e a tabela 2 a comparação entre os codecs de voz utilizados em VoIP e seus respectivos MOS:

 Tabela 1: Escala de valores MOS

PONTUAÇÃO (MOS)

COMPREENSÃO DA VOZ

DISTORÇÃO

5

Excelente

Imperceptível

4

Boa

Apenas imperceptível, sem incomodar.

3

Regular

Perceptível, leve incomodação.

2

Pobre

Perturbando, mas audível.

1

Ruim

Perturbando muito, inaudível

 Tabela 2: MOS, taxas de bits e atrasos de codecs de voz

CODEC E ALGORITMO

TAXA DE BITS (KBIT/S)

MOS

ATRASO (MS)

G.711 PCM

64,0

4,3

0,125

G.726 ADPCM

16 a 40

2,0 a 4,3

0,125

G.723.1 MP-MLQ

5,3 e 6,3

3,7 e 3,8

70

G.728 LD-CELP

16,0

4,1

2

G.729 CS-ACELP

8,0

4,0

20

Uma pontuação 4 ou maior no MOS, indica o som de voz adequado ao serviço de telefonia. Mas uma desvantagem deste método é submeter inúmeros avaliadores ao teste sempre que novos equipamentos e codecs de voz são criados.

Há outros métodos de avaliação da qualidade de serviço VoIP como o Perceptual Speech Quality Measure (PSQM), da recomendação ITU-T P.861. Ele é um algoritmo baseado num modelo matemático para determinar a degradação de qualidade dos sinais de voz, usando uma escala entre 0 (sem degradação) e 6,5 (degradação total). Ele compara uma amostra de voz adequada com outra um pouco distorcida. A pontuação da distorção alcançada é bem próxima a reação de pessoas se as mesmas estivessem sido submetidas ao teste. Este mecanismo não foi originalmente desenvolvido para se ter em conta as perturbações típicas das redes de dados, usadas pelos serviços de VoIP, ele foi desenvolvido para a comutação de circuitos, portanto o algoritmo não leva em consideração o jitter e a perda de pacotes. Para ultrapassar esta limitação, foi desenvolvida a variante PSQM+ e, recentemente, o algoritmo PESQ.

Perceptual Analysis Measurement System (PAMS) é um processo de medição proprietário, que injeta o sinal de voz numa terminação da rede e captura o sinal degradado no outro lado. Assim a predição é computada comparando matematicamente a versão original do sinal com o sinal degradado. Esse algoritmo difere do PSQM na escala de medição de qualidade da voz entre 1 e 5, semelhante a escala MOS.

Já o Perceptual Evaluation of Speech Quality (PESQ), da recomendação ITU-T P.862, é combinação de dois mecanismos anteriores (PSQM+ e PAMS) para medir a qualidade fim a fim de uma comunicação de voz, em condições de rede reais.

Para realizar uma avaliação de desempenho, há o site  www.testyourvoip.com, que simula ligações telefônicas entre uma origem e um destino. Ele avalia e aponta a qualidade da conexão de banda larga. A simulação se baseia em situações de tráfego por rotas semelhantes tanto no envio quanto na recepção de voz.

Este site cria gráficos relacionados aos problemas críticos que a tecnologia VoIP enfrenta para realizar a comunicação: valores de jitter, atraso fim a fim, a rota percorrida pelos pacotes de voz, a perda e descarte de pacotes e o MOS. Ele foi desenvolvido pela empresa Brix Networks.

Outro site para testar se a conexão de Internet está apta para VoIP, é de endereço www.qprocura.com.br/voip/teste-de-velocidade-voip.html. Neste site são gerados alguns gráficos e resultados da conexão de Internet. O teste realizado pelo site, citado como exemplo, foi proveniente de um microcomputador em uma rede local, com sistema operacional Windows XP, com conexão de Internet ADSL de 2 Mbit/s. Após o teste são exibidos alguns resultados como os da figura 2:

Figura 2: Teste de velocidade de Internet para VoIP

Como pode ser observado na figura, foi constatado que a velocidade da Internet para downloads é 1.96 Mbit/s e de upload é de 208 kbit/s.

Na figura 3 é mostrado um gráfico relacionado a velocidades de transferência e atrasos, em atividades de downloads. Como se pode observar, o teste revela que a velocidade de transferência fica a maior parte do tempo entre 2000 e 2500 kbit/s, e o atraso dificilmente ultrapassa 10 ms.

Figura 3: Velocidades e atraso da conexão de Internet para downloads

A figura 4 ilustra um gráfico com dados sobre a velocidade de transferência e atrasos, em atividades de upload, nesse caso, é revelado que a velocidade fica variável, iniciando-se em 600 kbit/s, chegando a um pico de 1800 kbit/s, e caindo novamente para 600 kbit/s no final do teste. O atraso também varia bastante, com o resultado acima de 3000 ms em um determinado período do teste.

Figura 4: Velocidades e atraso da conexão de Internet para uploads

O site também exibe dados estatísticos relacionados a conexão que podem  ser observados na figura 5:

Figura 5: Dados estatísticos de velocidade de conexão com a Internet

Neste resultado, são citadas as informações das velocidades de download e upload, assim como a porcentagem de 99% de QoS. Os tipos de testes aplicados para download e upload são indicados e também a média de atraso de 5 ms e o tempo de ida e volta da informação Round Trip Time (RTT), de 17 ms.

A figura 6 revela o resultado final do teste da conexão de Internet, indicando que a comunicação em VoIP pode ser realizada em três pontos avaliados:

  • A velocidade de download é alta o suficiente para a comunicação em VoIP, por ser de 1,96 Mbit/s.
  • A velocidade de upload também é o suficiente para a comunicação.
  • E a QoS, foi medida em 99%, indicando que a conexão pode produzir um fluxo constante de dados, sendo a QoS a chave para o provimento de uma conexão de alta qualidade de Voz sobre IP.

Figura 6: Resultado final do teste de conexão de Internet para VoIP

Provisão de QoS em VoIP

Para a provisão de QoS na VoIP, podem ser implementados os mesmos mecanismos utilizados numa rede IP que trafegam os dados.

Para fornecer a prioridade dos pacotes em tempo real, como os pacotes de voz, podem ser utilizados os Integrated Services (IntServ), Differentiated Services (DiffServ), o protocolo RSVP, MPLS e VLAN.

A arquitetura IntServ, tem como objetivo otimizar a utilização dos recursos da rede para novas aplicações, como as de multimídia de tempo real, que exigem as garantias de QoS. Os recursos são disponibilizados fim a fim, para os fluxos individuais, com controle de tráfego. O IntServ classifica os pacotes, com mapeamento para uma classe específica, de tal forma que todos os pacotes classificados receberão o mesmo tratamento pelo escalonamento de pacotes, que utiliza mecanismos de filas e algoritmos para este fim, desta forma os pacotes de voz serão encaminhados segunda a sua classificação. (RODRIGUES, 2010).

A arquitetura DiffServ, tem como uma das características a classificação dos pacotes de prioridade, essa prioridade é feita com uma marcação relacionada a classes de tráfego a partir do campo Type of Service (ToS) do cabeçalho do pacote IP. Os roteadores de rede que tem a arquitetura DiffServ implementada, vão encaminhar os pacotes que a marcação de prioridade para as filas adequadas de forma a roteá-los com mais eficiência. Outra característica é o policiamento com a mudança de prioridade dos pacotes, mais a organização do enfileiramento reservado para cada tipo de classe de tráfego.

O protocolo Resource reSerVation Protocol (RSVP), tem como característica pedir uma reserva para recursos da rede, e pode negar a admissão se os recursos forem insuficientes. Ele aloca parte da largura de banda disponível para a transmissão de voz. O RSVP necessita ser implementado em todos os nós da rede IP, entre a origem e o destino para que funcione com eficiência.

Já o Multiprotocol Label Switching (MPLS), encaminha os pacotes de prioridade se baseando em rótulos. A partir daí os pacotes são encaminhados não somente pelos seus endereços IP, mas pela sua rotulação. Esses são inseridos nos pacotes IP e também nos cabeçalhos dos quadros da camada 2, abaixo da camada em que o protocolo IP se situa. (LAMARÃO; ALVÃO, 2010)

Uma Virtual Local Area Network (VLAN) segmenta de forma lógica a rede, dividindo o tráfego para voz e para dados. Dessa forma há maior largura de banda disponível para voz independentemente da quantidade do tráfego dos dados.

A solução para contornar o problema do jitter, é o armazenamento dos pacotes em buffers o tempo suficiente para os pacotes subsequentes chegarem para realizar a compressão natural de voz.

O cancelamento de eco pode ser implementado no gateway VoIP, para eliminar o eco resultante da reflexão do sinal de voz, melhorando assim a qualidade da transmissão.

 Sendo esses mecanismos implementados nos equipamentos em uma rede IP local, que receberá a comunicação em VoIP, a qualidade de serviço do transporte de voz poderá ser alcançada. Porém, (KELLER, 2009) salienta que não é possível garantir que todos os equipamentos em que trafegarem os pacotes de voz terão esses mecanismos implementados, principalmente quando o tráfego passar pela Internet, pois a infraestrutura da Internet é heterogênea, com equipamentos intermediários, dos quais a informação pode trafegar sem nenhum desses mecanismos implementados.

 Assim como o desempenho e a QoS são de extrema importância para que uma comunicação em VoIP seja realizada, a segurança também necessita de atenção, para que haja a provisão da integridade, confidencialidade, disponibilidade e legalidade da informação de voz, que trafega em uma rede IP, principalmente na Internet. A segurança é o próximo tema a ser discutido seção a seguir.

Fonte: 

https://datatracker.ietf.org/doc/html/rfc3393

https://www.itu.int/rec/T-REC-G.114

https://www.teleco.com.br/tutoriais/tutorialvoipconv2/pagina_2.asp

https://pt.wikipedia.org/wiki/Lat%C3%AAncia

https://pt.wikipedia.org/wiki/Qualidade_de_servi%C3%A7o_(telecomunica%C3%A7%C3%B5es)


0303 - O novo número para Televendas