- Работа с Wireshark/sngrep в контексте VoIP подробнее описана в отдельной статье
VOIP сервер
- OpenSouce: Kamailio, FreeSwitch, Kazoo
ASTERISK
Cisco Unified Communications Manager Express (CUCM/CME), всю инфраструктуру поднять можно в GNS3 на базе роутера Cisco 3725 как сервера с софтфонами как клиентами, взаимодействие по skinny protocol (SCCP).
CALLER ID
Обычно SIP оператор проверяет (и зачастую жестко подменяет) то, что подключающийся передает в caller id (исходящий номер), иначе через SIP сервер будут звонить в МЧС, фродить от лица сбербанка и проч подставляя в src что угодно.
Односторонняя слышимость
Разговор в VoIP состоит из двух unicast RTP (Real-Time Transport Protocol) потоков – один от src до dst, второй от dst до src. Это видно и в Wireshark (там можно посмотреть в том числе дампы).
Причина односторонней слышимости – один из потоков (туда/обратно) не проходит до получателя, связь unidirectional. Траблшутим прохождение (firewall, nat, routing).
Траблы при односторонней слышимости обычно связаны с включенными костылями для NAT типо SIP ALG которые работают не так, как надо. SIP зачастую прекрасно работает через NAT без сторонних костылей.
ALG
Хорошая презентация о SIP ALG от MikroTik. Особенно последний слайд – не используйте ALG, используйте VPN 🙂
Кодеки
Преобразуют (кодируют) аналоговый (звуковой) сигнал в цифровой формат для передачи и декодируют при приеме.
- G.711 – no compression, с двумя схемами (алгоритмами) кодирования (оба примера payload есть в статье Wireshark):
- a-law – используется в Европе и компаниями оттуда
- u-law – используется в USA и компаниями из USA (Cisco)
- G.721/723/729/gsm – compression по уровню
VOICE MOS
-
- разница между Good (4) и Excellent (5) может сильно по факту не различаться в сравнении с Good (4) и Fair (3)
- сравнивать MOS полученный в разных условиях некорректно – и это неявно прослеживается ниже в описаниях категорий разных тестирований
- при автоматизированой оценке MOS есть свои особенности напр. 75% пользователей способны заметить разницу только начиная с фактической разницы в 0.5 баллов и более, при том что автоматизированная оценка может быть 3.6 в первом тестировании и 3.8 во втором (неуловимо для большинства)
Absolute Category Rating Rating Label
5 Excellent
4 Good
3 Fair
2 Poor
1 Bad
«О качестве голосовой сотовой связи», «О качестве мобильного доступа в сеть интернет».
https://www.mos.ru/upload/documents/oiv/random_120628033432_phpapp01.docx
https://www.2test.ru/solutions/seti-peredachi-dannykh/resheniya-dlya-drayv-testov-i-benchmarkinga/apparatno-programmnyy-kompleks-dlya-kontrolya-raboty-radiointerfeysa-ascom-tems-investigation.html
- Оценка 3,2 и ниже может характеризовать появление дискомфорта и ухудшения качества речи во время разговора.
- Оценка 2,6 и ниже характеризует низкое качество связи с искажениями в голосе, пропадание речи, постоянные «переспросы» абонентов и т.д.
Измерения проводились с помощью специализированного программно-аппаратного комплекса Ascom TEMS Investigation, включающего в себя:
- 3 мобильных абонентских терминала поддерживающих стандарты 2G и 3G (по одному для каждого оператора сотовой связи);
- 3 внешние антенны GSM установленные на крыше автомобиля с разнесением 40 см друг от друга;
- модуль GPS для регистрации спутниковых координат и времени измерения;
- ноутбук с установленным программным обеспечением TEMS Investigation.
Spirent umetrix voice lm
By default, a call is classified as bad quality if it has a MOS of less than 2.20.![]()
ГОСТ Р 51061-97
ГОСУДАРСТВЕННЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
СИСТЕМЫ НИЗКОСКОРОСТНОЙ ПЕРЕДАЧИ РЕЧИ ПО ЦИФРОВЫМ КАНАЛАМ
Баллы Характеристика качества речи
4,6-5,0 Естественность звучания речи. Высокая узнаваемость. Полное отсутствие помех и искажений
4,0-4,5 Естественность звучания речи. Высокая узнаваемость. Отдельные малозаметные искажения или помехи
3,5-3,9 Естественность звучания речи. Высокая узнаваемость. Слабое постоянное присутствие отдельных видов искажений или помех
3,0-3,4 Незначительное нарушение естественности и узнаваемости. Заметное присутствие отдельных искажений или помех
2,5-2,9 Заметное нарушение естественности и ухудшение узнаваемости, присутствие нескольких видов искажений (картавость, гнусавость и др.) или помех
1,7-2,4 Существенное искажение естественности и ухудшение узнаваемости. Постоянное присутствие искажений типа картавость, гнусавость и др. или помех
<1,7 Сильные искажения типа картавость, гнусавость и др. Механический голос. Наблюдается потеря естественности и узнаваемости
MOS historically originates from subjective measurements where listeners would sit in a "quiet room" and score a telephone call quality as they perceived it. This kind of test methodology had been in use in the telephony industry for decades and was standardized in ITU-T recommendation P.800.
MOS is a commonly used measure for video, audio, and audiovisual quality evaluation, but not restricted to those modalities. ITU-T has defined several ways of referring to a MOS in Recommendation P.800.1, depending on whether the score was obtained from audiovisual, conversational, listening, talking, or video quality tests. The MOS is expressed as a single rational number, typically in the range 1–5, where 1 is lowest perceived quality, and 5 is the highest perceived quality.
https://en.wikipedia.org/wiki/Mean_opinion_score
https://en.wikipedia.org/wiki/Absolute_Category_Rating
The Absolute Category Rating scale is very commonly used, which maps ratings between Bad and Excellent to numbers between 1 and 5, as seen in below table.
it is not meaningful to directly compare MOS values produced from separate experiments, unless those experiments were explicitly designed to be compared, and even then the data should be statistically analysed to ensure that such a comparison is valid.