SSブログ

アルファベットの頻度 (etaoin shrdlu) [英語のトリビア]

1年前の内容を見返したら「わら人形」について書いていたが、ここから頭に浮かんだのが、コナン・ドイルのホームズもの短編「踊る人形」である(単純な連想で、直接の関係はまったくない)。ネタばれになるので詳しくは書かないが、この中に暗号解読にからんで「アルファベット各文字が使われる頻度」についての話が出てくる。面白いテーマなので、ちょっと調べてみた。

まず、この "The Adventure of the Dancing Men" に出てくるシャーロック・ホームズの言葉を借りると、

- As you are aware, E is the most common letter in the English alphabet (中略) The order of the English letters after E is by no means well marked (中略) Speaking roughly, T, A, O, I, N, S, H, R, D, and L are the numerical order in which letters occur

アルファベット全文字を網羅したものではないが、ここにある文字を列挙するとこうなる。

etaoinshrdl

この短編を収めた "The Return of Sherlock Holmes" の Oxford University Press 版を私は持っているが、そこにはこんな注がある。

- The Encyclopaedia Britannica ("Cryptography") gives the frequency as E, T, A, O, I, N, R, S, H, D, L.

つまり、

etaoinrshdl

また「詳注版ホームズ全集」(ちくま文庫)では、この作品について原注者が他の3つの調査結果を引用している。最後のものは電報文なので、ちょっと特殊かもしれない。

etoanirshdlcwumfygpbvkxqjz
etaoinsrhldcumfwgypbvkxjqz
eoanirstdlhucmpyfgwbvkxjqz

ドイル以前にこのテーマを題材にしたのが、エドガー・アラン・ポーの「黄金虫」 The Gold-Bug である。今度はこの作品から引用してみよう。

- Now, in English, the letter which most frequently occurs is e. Afterwards, the succession runs thus: a o i d h n r s t u y c f g l m w b k p q x z. E predominates so remarkably, that an individual sentence of any length is rarely seen, in which it is not the prevailing character.

これも全文字ではないが、整理すると、

eaoidhnrstuycfglmwbkpqxz

さらにネットでは、いろいろな調査結果が見つかって面白い。文学作品等についてあげているサイトから引用する。

etaoinhsrdlmuwycfgpbvkxjqz (David Copperfield)
etaoinhsrdlumcywfgbpvkzjxq (Pride and Prejudice)
etaonihsrdlumcyfwgpbvkxjqz (Wuthering Heights)
etaonhsirdlumcwfgypbvkjqxz (Vanity Fair)
etoainshrdlmucfwygpbvkxjqz (Gulliver's Travels)
etaoihnsrdluwgcymfpbkvqxjz (Alice in Wonderland)

etaoinsrhldcumfpgwybvkxjqz (British National Corpus)
etaoinsrhldcumfpgwybvkxjqz (Brown corpus)

( http://www.bckelk.ukfsn.org/words/etaoin.html )

コーパスを使った最後の2つは奇しくも一致している。

さらに、今回初めて知ったのは、etaoin shrdlu という単語があることだ。私の持っている電子辞書の英和辞典にちゃんと載っている。「混乱」「誤り」などの意味があり、辞書の説明には書かれていなかったが、この「アルファベットの頻度」と関係あることは明白だ。次のサイトには詳しいことが書かれているが、この単語に触発された小説もかなりあることがわかり、なんとも面白い。
http://en.wikipedia.org/wiki/ETAOIN_SHRDLU

今回のテーマについて、手っ取り早く参考になりそうなサイトをあげておこう。

http://en.wikipedia.org/wiki/Letter_frequencies
http://www.askoxford.com/asktheexperts/faq/aboutwords/frequency?view=uk
http://deafandblind.com/word_frequency.htm#word-frequency

「詳注版ホームズ全集」は残念ながら絶版になってしまったようだ。前述のように、短編「踊る人形」は、「ホームズの生還」(出版社によっては「ホームズの帰還」)に収められている。原題の The Dancing Men を「人間」ではなく「人形」と訳したのはうまいと思うが、「にんぎょう」ではなく、以前取り上げた effigy の訳語にもあった「ひとがた」と読むのが正しいのだろうか。

参考記事:
キーボードの配列(qwerty)
http://eigo-kobako.blog.so-net.ne.jp/2008-05-26


にほんブログ村 英語ブログへ
にほんブログ村←参加中です


シャーロック・ホームズの生還 新訳シャーロック・ホームズ全集 (光文社文庫)

シャーロック・ホームズの生還 新訳シャーロック・ホームズ全集 (光文社文庫)

  • 作者: アーサー・コナン・ドイル
  • 出版社/メーカー: 光文社
  • 発売日: 2006/10/12
  • メディア: 文庫


The Return of Sherlock Holmes (The Oxford Sherlock Holmes)

The Return of Sherlock Holmes (The Oxford Sherlock Holmes)

  • 作者: Arthur Conan, Sir Doyle
  • 出版社/メーカー: Oxford Univ Pr (T)
  • 発売日: 1995/02/02
  • メディア: ペーパーバック


nice!(0)  コメント(2)  トラックバック(0) 
共通テーマ:資格・学び

nice! 0

コメント 2

松永

Fredric Brown の作品に「ETAOINSHRDLU」という物がありますね。
日本語訳では「諸行無常の物語」だったかな。
by 松永 (2012-09-22 22:26) 

tempus fugit

フレドリック・ブラウンは昔SFのほとんどを翻訳で読み、10年ほど前にThe NESFA Pressから出た原書のSF全集(2分冊)をamazon.comで購入しました。全部は読んでいないのですが、短編の全集"From These Ashes"を本棚から引っ張りだしてみました。作品別でなく、年代順に作品を収めていて、"Etaoin Shrdlu"は1942年の項にありました。内容は覚えていないので、今度読んでみようと思います。どうもありがとうございました。

by tempus fugit (2012-09-29 22:29) 

コメントを書く

お名前:
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

※ブログオーナーが承認したコメントのみ表示されます。

トラックバック 0

にほんブログ村 英語ブログへ
にほんブログ村← 参加中です
Related Posts Plugin for WordPress, Blogger...