アルゴリズム元号予想⑤

(前回:アルゴリズム元号予想④へ)

まずは子音から

まず手始めに、第一字と第二字それぞれの最初の子音の分布比較を行ってみます。こちらをご覧ください。

上の表が、①「常用漢字」の第一字の最初の子音×第二字の最初の子音の組み合わせ数になります。行が第一字、列が第二字を示しており、一番最初の(blank)は、母音始まりを意味しています。全4,200,450通り中、例えば母音始まり×母音始まりは表中一番左上の13,572通りとなるわけです。

下の表がそれぞれのパターンの占める密度を‰(パーミル = 0.1パーセント)で表示したもので、母音始まり×母音始まり の組み合わせなら3.2‰(13,572/4,200,450)となります。

この分布密度一覧表を②「勘申案」と③「元号」についても作成し、①②③の密度差から、②「勘申案」で採用されやすい/にくい子音の組み合わせ、③「元号」で採用されやすい/にくい組み合わせを探ってみます。

次はこちらをご覧ください。上から順に、

  • ②「勘申案の分布密度」と①「常用漢字の分布密度」の差(②から①を引いたもの、単位:‰)
  • ③「元号の分布密度」と②「勘申案の分布密度」の差
  • ③「元号の分布密度」と①「常用漢字の分布密度」の差(上記二つの和に等しい)

を並べています。青く染まって値が正になっているものは、各元号選定プロセスで採用されやすいパターンだということです。赤く染まって負になっているものはその逆です。

母音始まりの音は好まれやすい

まず目につくのは、勘申案では第一字、第二字ともに子音無し(母音から始まる)の漢字の採用が多いことです。

最大の理由は、この中に歴代の勘申者が長らく選好してきた「安」と「永」が含まれているからです。②「勘申案」の中でこの二字のいずれかを含むものは実に355例(153.5‰)もあります。6つ勘申の中に1つは「安」もしくは「永」が入っている見当です。

しかし、②「勘申案」と③「元号」の密度差においても母音始まりの字の選好は補正されるどころか、さらにポジティブになっています。勘申者のみならず為政者も、元号の二字のうち片方もしくは両方に母音を取り入れる傾向にあったということです。

子音を多く持たない日本語では、母音が音声認識において重要な役割を果たします。万人にとって明瞭で聞き取りやすい母音始まりの漢字を、歴代の為政者も選好したのかもしれません。

その他の傾向

kは第一字でポジティブ、第二字でネガティブ

kは①「常用漢字」における数がそもそも多い(kを含むパターンは全体の176.7‰)にも拘わらず、②「勘申案」の第一字における採用確率はこれを大きく上回ります(+74.0‰)。実は③「元号」で第一字における子音kの採用確率は237.9%。元号の1/4近くはkから始まっているのです(「嘉」11例、「寛」11例、「康」10例、「建」9例、他)。破裂音として聞き取りやすく、硬性と力強さを持つkも、元号の音の始まりに相応しいのでしょう。

sは全てにおいてネガティブ

そもそも③常用漢字における字数が多い (158.0‰) ためでしょうが、kとは対照的です。 風をはらむように清爽で軽快な印象のsは、元号には不向きなのでしょうか。

第二字のnは②「勘申案」vs ①「常用漢字」においてポジティブ。③vs②でも特段補正無し。

「仁」の寄与が大きいのでしょう。 (②勘申における第一字採用46例、第二字採用60例)

第二字 のwも②vs①におけるへの偏向性がそのまま③へ引き継がれている

これは専ら「和」の寄与によるもの。第二字への採用が多のは、口を大きく広げて短母音で収束する”wa”の音の座りが良いからではないでしょうか。

第二字のry, zは③vs②においてポジティブ

これも「暦」12例、「治」18例と特定の字が選好されたためでしょう。特筆すべきは、 ③「元号」における 「暦」と「治」の第一字への採用が比較的少ないことです。(「暦」2例、「治」3例)

syの第一字、第二字における偏向性が②vs①と③vs②で逆

gは③vs②において第一字・第二字いずれも好まれている

これも「元」(第一字15例、第二字12例)一字による貢献。

hは②vs①において回避、③vs②においてやや回復

こんなところでしょうか。次回は子音の後に続く母音や語尾子音について分析していきます。

(次回:アルゴリズム元号予想⑥へ)

参考文献

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください