24 февраля 2017

How efficient is Morse code?


Насколько эффективна азбука Морзе?


Posted on 8 February 2017 by John


Азбука Морзе была разработана таким образом, что наиболее часто используемые буквы имеют самые короткие коды. В целом соблюдается условие - при увеличении длины кода уменьшается частота использования знака.
Насколько эффективна азбука Морзе? Мы сравним частоту использования знаков (на основе исследований компании Google) с длиной соответствующего кода, при этом предположим то, что тире в три раза длиннее точки.



Буква
Код
Длина
Частота
применения, %
E
.
1
12,49
T
-
3
9,28
A
.-
4
8,04
O
---
9
7,64
I
..
2
7,57
N
-.
4
7,23
S
3
6,51
R
.-.
5
6,28
H
….
4
5,05
L
.-..
6
4,07
D
-..
5
3,82
C
-.-.
8
3,34
U
..-
5
2,73
M
--
6
2,51
F
..-.
6
2,40
P
.--.
8
2,14
G
--.
7
1,87
W
.--
7
1,68
Y
-.--
10
1,66
B
-…
6
1,48
V
…-
6
1,05
K
-.-
7
0,54
X
-..-
8
0,23
J
.---
10
0,16
Q
-.--
10
0,12
Z
--..
8
0,09


Тут есть чего улучшить. Например, применение трёх тире для буквы O - явно не самое
оптимальное решение.

Но какова возможная максимальная эффективность? Если бы мы изменили коды таким образом, чтобы их длина соответствовала частоте использования, то насколько короче будет типичная передача текста?

Перемножив длины кода на частоты использования мы находим, что в среднем буква,
взвешенная по частоте, имеет длину кода 4.5268 точки.

Что будет, если мы изменим коды? Тогда мы получим длину кода 4.1257 точки, что
соответствует повышению эффективности примерно на 9%. Иными словами, эффективность азбуки Морзе составляет 91% от той, что могла бы быть при использовании тех же кодов. Всё сказанное относится, конечно же, к английскому языку. При использовании данных по другим языкам результаты будут немного отличаться.

В приведённой выше таблице, в нижней её части, частоты применения букв иногда плохо
соответствуют длинам кодов, хотя это и не имеет особого значения для эффективности. Но некоторые из вариантов в верхней части таблицы озадачивают. Относительная частота
использования первых нескольких букв остается стабильной в течение долгого времени и
была хорошо известна задолго до исследований Google. (Смотри в Википедии: ETAOIN
SHRDLU
). Возможно были и другие факторы, кроме эффективности, которые повлияли на то, как были закодированы наиболее часто используемые символы.

Обновление: В некоторых источниках, которыми я пользовался, говорится, что тире в три
раза дольше, чем точка, в том числе и пространство между точками или тире. Другие же
источники утверждают, что пауза между элементами равна по длине точке. Если использовать последнее утверждение, то среднее время для передачи буквы английского алфавита составит 6.0054 точек, и это значение может быть улучшено до 5.6616 в случае изменения кодов. При таких критериях эффективность азбуки Морзе составляет около 93,5%. (Здесь я просто добавил в расчёты время пробелов внутри кодов букв).

Комментариев нет:

Отправить комментарий

Извините, в связи с огромным количеством спама, все ваши комментарии могут появляться с небольшой задержкой.
Буду рад, если вы не забудете подписаться под своим комментарием :)