Mean Opinion Score - MOS (POLQA vs PESQ)

  

O MOS é um teste utilizado há anos para medir a qualidade das redes telefônicas. Este teste foi realizado em determinadas condições ambientais onde as pessoas participantes da “experiência” foram solicitadas a expressar a sua opinião sobre a qualidade do áudio recebido ao longo da chamada.

Dito isso, quando trabalhamos com VoIP, temos consciência de que estamos trabalhando com uma tecnologia digital, composta por um fluxo de dados dedicado à sinalização, e outro fluxo de dados dedicado a mídias, ou seja: áudio, vídeo, arquivos, etc. Tudo é digital, então o ruído eletromagnético que normalmente afeta as informações transmitidas por linhas analógicas não nos afeta neste caso, e também é IP, de forma que em cada dispositivo inteligente, roteadores, switches, etc., existem ferramentas de verificação de dados .que verificam que o que entra por uma porta sai por outra exatamente igual e no menor tempo possível. Porém, há motivos pelos quais, durante uma conversa, temos interesse em conhecer a qualidade do áudio para descobrir erros, problemas e resolvê-los.

80% das vezes, os erros de áudio geralmente são devidos a problemas de qualidade de serviço ou largura de banda insuficiente. Geralmente isso é resolvido configurando QoS no roteador, separando as redes VoIP e de dados para que “as atualizações do Windows não consumam a largura de banda de uma chamada”. 5% das vezes geralmente é devido a problemas com fones de ouvido de baixa qualidade (microfones muito próximos da boca, o que causa volume excessivo e ruídos de movimento da boca que são captados pelo microfone).

Imagine que você está trabalhando, faz uma ligação e o som está entrecortado... por que isso acontece? Como pode ser resolvido? Certamente diremos que é por falta de largura de banda, ou algum gargalo, mas e se não for isso?

Precisamos medir a qualidade de uma chamada para garantir que as conversas tenham a qualidade mínima exigida. Esta medição deve ser objetiva e verificável, por isso temos que nos aprofundar em um novo tema. 

Para medir a qualidade de uma chamada temos que conhecer alguns conceitos-chave no mundo das comunicações VoIP:

  • Latência: É o atraso desde o microssegundo em que o som chega ao microfone do nosso telefone, até sair pelo alto-falante do aparelho do receptor. Esta latência costuma ser inferior a 100ms e quando é superior (<200ms.) percebe-se que há uma certa espera entre um turno de fala e outro, mas ainda assim permite uma conversa mais ou menos fluida. Quando esse tempo aumenta (ao usar redes de alta latência, como links de satélite), é muito mais difícil estabelecer uma conversa normal e você tem que falar em turnos declarados para evitar pisar uns nos outros com respostas a frases antigas.
  • jitter: Se a latência for sempre a mesma, você pode manter uma conversa simplesmente esperando um segundo entre o final da frase e o início da próxima. Mas se a latência variar a cada segundo, manter uma conversa será extremamente difícil. Ainda mais quando isso causa perda de pacotes porque há novos pacotes que chegam antes dos mais antigos. É como dizer: - “Vou comprar pão” e esse “pão” chega antes de “comprar”, para que o sistema receptor elimine “comprar” e você ouviria “Vou… pão”.
  • Pacotes perdidos: Por vários motivos, um pacote pode desaparecer: muito tempo para ser transmitido (cada pacote tem um TTL -time to live - que se for excedido o pacote é eliminado porque é obsoleto e inútil), ruído no sinal digital que provoca alterações e incentiva o descarte da referida embalagem por ter sofrido alterações durante a viagem, etc. Isto causa problemas de áudio semelhantes ao que foi mencionado anteriormente: micro-cortes de áudio de cerca de 20~30 milissegundos, tempo suficiente para que um corte de áudio seja perceptível se estivermos ouvindo música, mas quase imperceptível se estivermos em uma conversa com paradas, pausas entre palavra e palavra, ou se tivermos consciência de que o nosso interlocutor não tem uma boa ligação. Existem codecs que permitem “completar automaticamente” o áudio que falta, dando aquela sensação de áudio “metálico” ou “robótico” que todos nós certamente já experimentamos. 
  • Largura de banda: Se a largura de banda for insuficiente, os pacotes demorarão para chegar ao destinatário, o que implica que há latência, ou que os pacotes são perdidos, então teremos uma conversa com atraso e micro-cortes. Dependendo do codec utilizado, precisaremos de mais ou menos largura de banda, portanto para conexões limitadas é recomendado o uso de codecs especiais como GSM, G729, iLBC, Speex, etc. em vez do G711, G722, G726, etc. 

Valores de medição

Os conceitos básicos de qualidade de áudio já foram explicados, mas claro, não é interessante tratar valores específicos para analisar todo o áudio de uma conversa, pois podem ocorrer problemas em 1 segundo da conversa, porem ser perfeito no restante da mesma chamada. Assim, analisando os valores específicos ao longo da conversa, podemos obter medidas mais práticas e interessantes:

  • Classe de Serviço (CoS): Mede a porcentagem de pacotes que chegam nas duas extremidades durante toda a conversa. O ideal é que cheguem 100% dos pacotes (CoS = 100%) mas se tivermos valores semelhantes não é drama (>95%). 
  • Mean Opinion Score (MOS): É uma das medidas mais utilizadas para saber a qualidade de uma conversa. Ele mede os valores de pacotes perdidos, jitter e latência e gera um valor médio que varia entre 1 e 5. Um valor abaixo de 3,5 é considerado problemático enquanto um valor acima de 4,5 é considerado uma chamada normal e de boa qualidade. 
  • Fator R: É uma medida semelhante ao MOS, utilizada como recomendação da UIT e baseada nos mesmos fatores que pontuam a qualidade entre 0 e 100 como pode ser visto na tabela a seguir: 

  

POLQA (Perceptual Objective Listening Quality Analysis) e PESQ (Perceptual Evaluation of Speech Quality) são dois algoritmos de avaliação da qualidade de voz em telecomunicações, que permitem a geração de um escore MOS objetivo, uma métrica típica em chamadas telefônicas.
 
PESQ é um algoritmo que mede a qualidade do sinal de voz após compressão, roteamento e processamento do sinal. Fornece uma pontuação de qualidade de voz em uma escala de 0 a 5, sendo que 5 representa a melhor qualidade possível.
 
Por outro lado, o POLQA é uma evolução do PESQ que utiliza um modelo auditivo mais avançado para avaliar a qualidade da voz. O POLQA é capaz de avaliar a qualidade de voz em uma ampla variedade de codecs e condições de rede e fornece uma pontuação de qualidade de voz em uma escala de 0 a 4,5.
 
Ambos os algoritmos simulam o processo perceptivo humano usando técnicas de processamento de sinal. O POLQA usa uma técnica de processamento de sinal chamada “Análise de Pulso Cepstral de Longo Prazo” (LTPC). Esta técnica utiliza um modelo matemático para simular o processo perceptivo humano, dividindo o sinal de fala em segmentos curtos e analisando cada segmento em busca de distorções e outros artefatos.  
 
Por outro lado, o PESQ utiliza uma técnica de processamento de sinais chamada “Phase and Amplitude Difference Analysis” (Perceptual Evaluation of Speech Quality, em inglês), que também utiliza um modelo matemático para simular o processo perceptivo humano. Esta técnica mede a diferença entre o sinal de voz original e o sinal de voz recebido e utiliza um algoritmo de processamento de sinal para estimar a percepção subjetiva da qualidade de voz pelos ouvintes de teste.  
 
Notavelmente, o PESQ-LQ é uma variante do PESQ que leva em consideração as características específicas dos sistemas VoIP de baixa qualidade, como a presença de ruído de fundo, distorção e perda de pacotes, e fornece medições de qualidade de voz mais precisas nesses sistemas.  
 
Em resumo, POLQA e PESQ são algoritmos de processamento de sinais que simulam o processo perceptual humano para avaliar a qualidade de voz em telecomunicações, e utilizam diferentes técnicas de processamento de sinais para fazê-lo. POLQA é uma evolução do PESQ que utiliza uma técnica mais avançada para avaliar a qualidade de voz sob uma ampla variedade de codecs e condições de rede.  
 
Atualmente apenas as soluções comerciais incluem POLQA (PEXQ, VQuad e OPTICOM), uma vez que o algoritmo POLQA é propriedade da União Internacional de Telecomunicações (UIT) e está protegido por direitos de autor.  
As ferramentas comerciais de medição de qualidade de voz que utilizam POLQA obtiveram licenças para usar o algoritmo e estão sujeitas a restrições de uso e distribuição.  
 
No entanto, existem algumas ferramentas de medição de qualidade de voz de código aberto que utilizam outros algoritmos para medir a qualidade de voz em sistemas de comunicação VoIP, como PESQ e PESQ-LQ (Perceptual Evaluation of Speech Quality). Ferramentas como OpenMOS, VQmon/EP ou implantação de um sistema STOQ (Speech Transmission Quality Overhead), podem ser uma alternativa viável para medição de qualidade de voz em sistemas VoIP se você não tiver acesso a uma ferramenta comercial que utilize POLQA.

Outras ferramentas de análise e medição

Existem ferramentas que analisam o tráfego e mostram, não só o “traço SIP” da conversa, mas também os valores de medição da sua qualidade, dados detalhados da chamada (pacotes perdidos, tempos de resposta, latência, jitter, etc… ) Havia um muito bom, embora comercial, chamado VQManager. Infelizmente, tal como acontece com o software comercial, o software é descontinuado, abandonado e desaparece em vez de ser lançado. Felizmente, existem mais ferramentas que analisam esta informação e oferecem resultados muito interessantes:

Em resumo: PESQ e POLQA são modelos objetivos de avaliação MOS usados ​​principalmente para avaliar a qualidade de voz em redes de telefonia e voz sobre IP, respectivamente, comparando fisicamente ondas de áudio com versões degradadas do mesmo áudio. É importante ressaltar que PESQ e POLQA também são considerados medidas subjetivas de qualidade de voz, pois dependem das avaliações subjetivas dos usuários, enquanto o Modelo E (Recomendação ITU-T G.107) é um modelo de avaliação objetivo. O MOS usado para prever a qualidade de voz em redes telefônicas é uma medida objetiva baseada em métricas de rede como latência, perda de pacotes e jitter, entre outras.

Fonte: https://www.sinologic.net/blog/2016-06/como-medir-la-calidad-de-una-llamada.html

Nenhum comentário

Toda vez que um homem supera os reveses, torna-se mentalmente e espiritualmente mais forte!

Tecnologia do Blogger.