アルゴリズム元号予想④

(前回:アルゴリズム元号予想③へ)

元号の音の偏向性を探る

今週から音の分析に入ります。前回の記事でも書いたように比較対象の集団は、

①「常用漢字の音韻分布」(4,200,450通り)
②「勘申案の音韻分布」(2,313)
③「採用された元号の音韻分布」(248)

になります。①は、音読みを持たない和声漢字(「畑」や「峠」など)を除外した2,050字で組み合わせ得る全ての二字のパターンから構成します。 すなわち、同じ文字を二回使用する組み合わせのみ除いた全2050*(2050-1)=4,200,450通り。

②の勘申案の中には一度だけでなく何度も提案された元号案があります。例えば「明治」は11回目の勘申で採用されたものですし、「嘉徳」は40回勘申されながら未だ採用に至っていません。①「常用漢字」に対する②「勘申案」の偏向性や、②に対する③「元号」の偏向性を計測するため、②「勘申案」の分布を求めるときには、各勘申案について勘申回数を加重することにします。

これら①②③について、第一字・第二字それぞれの

  • 子音
  • 母音
  • 長母音(oo,uu)/短母音
  • 二重母音(ai,ei,ui)
  • 語尾子音(「安」:anや「徳」:tokuなど、一つの文字に二つ目の子音が入っている場合)

を要素とした分布を行っていきます。

元号の音の取り扱い

漢音で読むか、呉音で読むか

年号の漢字を呉音で読むか、漢音で読むかの問題があります。従来年号の漢字は呉音で発音する習慣がありましたが(例えば「正」はseiではなくsho)、「平成」の読みが呉音のbyo-joではく漢音のhei-seiであるように、 近年では漢音で読むものも多いようです。便法として漢字の読みは以下のように取り扱うことにします。

①「常用漢字」:全て漢音で読む
②「勘申案」:原則として漢音で読む。しかし③の実年号で全て呉音読みしている漢字については、呉音で読む。(例:正 syo、貞 jo)
③「元号」:山田孝雄『年号読方考証稿』(宝文館  1950)を参照

ローマ字表記の方法

ひらがな五十音表に則した簡便な音素分析にするため、ローマ字表記する際には敢えて慣例に従わず、「し」=si(≠shi)、「じ」=zi(≠ji)、「ち」=ti(≠chi)、「つ」=tu(≠tsu)と表記します。同様に、拗音(ようおん)もsya, syu, syo, zya, zyu, zyo, tya, tyu, tyoとすべてyで表記することにします。

字の音素分解法

モーラ(拍)区切りで考えると、漢字には 短母音のみの“1モーラ漢字” と、長母音(昭:syoなど)や二重母音(平:heiなど)を伴ったり、安(an)や徳(toku)など一字に二子音を持つ“2モーラ漢字”があります。しかし、要素を減らして分析を極力単純化するため、モーラ単位の分解は行わず、あくまで全ての漢字の音の構成要素を

「子音」+「母音(長母音、二重母音含む)」+「語尾子音」

という一音節と見做すことにします。つまり、一字に二つ子音を持つ漢字の第二の母音(徳:tokuの”u”)は無視するわけです。「徳治」(toku-zi)、「嘉吉」(ka-kitu)などの元号を実際に音にすると分かりますが、元号各字の第二子音に対応する母音は前後の音のイントネーションに負けて無声化することが多いので、この要素を捨象しても大きな影響はないと考えたからです。

(次回:アルゴリズム元号予想⑤へ)

参考文献

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください