無線電信の巧みと技

William G.Pierpont N0HFF

-改訂2版-

第28章  文字頻度

-国際モールスの場合

 

第27章     目次     第29章
 

文字頻度は暗号文解読術に関する一般的な書籍から引用し、通常の英語テキスト1000文字中の出現回数を基準とします。各文字は構成単位に分解して、1ユニットを1短点の長さ、111は3ユニットで長点とし、それと等しい沈黙を0で表します。文字間隔に必要な3単位の沈黙として下記のように(000)を付加します。

出現回数   文字     構成    単位         
130    E      1000     4       520
 92        T               111000        6             552
 79        N             11101000        8             632
 76        R           1011101000       10             760
 75        O       11101110111000       14            1050
 74        A             10111000        8             592
 74        I               101000        6             444
 61        S             10101000        8             488
 42        D           1110101000       10             420
 36        L         101110101000       12             432
 34        H           1010101000       10             340
 31        C       11101011101000       14             434
 28        F         101011101000       12             336
 27        P       10111011101000       14             378
 26        U           1010111000       10             260
 25        M           1110111000       10             250
 19        Y     1110101110111000       16             304
 16        G         111011101000       12             192
 16        W         101110111000       12             192
 15        V         101010111000       12             180
 10        B         111010101000       12             120
  5        X       11101010111000       14              70
  3        Q     1110111010111000       16              48
  3        K         111010111000       12              36
  2        J     1011101110111000       16              32
  1        Z       11101110101000       14              14

1000     平均構成長 11.23  平均単位 9.07   9076

上記より、もし上記の平均文字長の5倍と語間隔に必要なスペース(合計で7単位=0000000)を加えると、通常の英単語の長さ5 x 9.076 + 4 = 49.38になります。これは標準単語の50ユニットにわずか1%たりないだけです。(対照的に、ランダムな5文字グループの平均は60.15単位です。これは通常の英単語より20.3% 長いです。)

同様の分析で数字の平均長は17単位(最小12、最大22)となり、5つの数字のグループを送信するのにかかる時間は文字を送るときに比較して1.78倍長くなります。

これらの計算を比較するとなぜ受信速度が送信されるマテリアルによって変わるのかがわかります。

興味のひとつとして、以下に構成単位の短いものから純に並べてみます。(文字スペースは単位に含みません)――すべて奇数であることにご注目: 1 - E;   3 - I, T;   5 - A, N, S;   7 - D, H, M, R, U;   9 - B, F, G, K, L, V, W;  11 - C, O, P, X, Z; 13 - J, Q, Y.
 

インターナショナルコードの外国への適用:
もし同様の計算を他のいくつもの言語でしてみると、次のような結果が平均文字長としてでます。(出現頻度データは
Secret and Urgent, Fletcher Pratt l942 Tables II to IV, p. 253 ff.による)
ドイツ語  8.640,  フランス語 8.694,  スペイン語 8.286 これらは英語と比較して5~9%短い。
これは英語でも何らかの再設計や調整を行なえば5%程度の短縮が可能ではないかということを示唆しているようです。

オリジナルのアメリカンモールスコードの場合:
Ivan Coggeshall氏は同様に普通の長点長と1ユニット少ない語間隔を使ってアメリカンコードの分析を行ない、文字平均長7.978 (国際コードは 9.076)、数字平均長 l4を得ました。ただし、16章で述べたように、アメリカンモールスのタイミングは非常に変化に富んでいることを念頭に入れる必要があります。

先頭     第27章     目次     第29章