アルゴリズム元号予想⑤

(前回:アルゴリズム元号予想④へ)

まずは子音から

まず手始めに、第一字と第二字それぞれの最初の子音の分布比較を行ってみます。こちらをご覧ください。

上の表が、①「常用漢字」の第一字の最初の子音×第二字の最初の子音の組み合わせ数になります。行が第一字、列が第二字を示しており、一番最初の(blank)は、母音始まりを意味しています。全4,200,450通り中、例えば母音始まり×母音始まりは表中一番左上の13,572通りとなるわけです。

下の表がそれぞれのパターンの占める密度を‰(パーミル = 0.1パーセント)で表示したもので、母音始まり×母音始まり の組み合わせなら3.2‰(13,572/4,200,450)となります。

この分布密度一覧表を②「勘申案」と③「元号」についても作成し、①②③の密度差から、②「勘申案」で採用されやすい/にくい子音の組み合わせ、③「元号」で採用されやすい/にくい組み合わせを探ってみます。

次はこちらをご覧ください。上から順に、

  • ②「勘申案の分布密度」と①「常用漢字の分布密度」の差(②から①を引いたもの、単位:‰)
  • ③「元号の分布密度」と②「勘申案の分布密度」の差
  • ③「元号の分布密度」と①「常用漢字の分布密度」の差(上記二つの和に等しい)

を並べています。青く染まって値が正になっているものは、各元号選定プロセスで採用されやすいパターンだということです。赤く染まって負になっているものはその逆です。

母音始まりの音は好まれやすい

まず目につくのは、勘申案では第一字、第二字ともに子音無し(母音から始まる)の漢字の採用が多いことです。

最大の理由は、この中に歴代の勘申者が長らく選好してきた「安」と「永」が含まれているからです。②「勘申案」の中でこの二字のいずれかを含むものは実に355例(153.5‰)もあります。6つ勘申の中に1つは「安」もしくは「永」が入っている見当です。

しかし、②「勘申案」と③「元号」の密度差においても母音始まりの字の選好は補正されるどころか、さらにポジティブになっています。勘申者のみならず為政者も、元号の二字のうち片方もしくは両方に母音を取り入れる傾向にあったということです。

子音を多く持たない日本語では、母音が音声認識において重要な役割を果たします。万人にとって明瞭で聞き取りやすい母音始まりの漢字を、歴代の為政者も選好したのかもしれません。

その他の傾向

kは第一字でポジティブ、第二字でネガティブ

kは①「常用漢字」における数がそもそも多い(kを含むパターンは全体の176.7‰)にも拘わらず、②「勘申案」の第一字における採用確率はこれを大きく上回ります(+74.0‰)。実は③「元号」で第一字における子音kの採用確率は237.9%。元号の1/4近くはkから始まっているのです(「嘉」11例、「寛」11例、「康」10例、「建」9例、他)。破裂音として聞き取りやすく、硬性と力強さを持つkも、元号の音の始まりに相応しいのでしょう。

sは全てにおいてネガティブ

そもそも③常用漢字における字数が多い (158.0‰) ためでしょうが、kとは対照的です。 風をはらむように清爽で軽快な印象のsは、元号には不向きなのでしょうか。

第二字のnは②「勘申案」vs ①「常用漢字」においてポジティブ。③vs②でも特段補正無し。

「仁」の寄与が大きいのでしょう。 (②勘申における第一字採用46例、第二字採用60例)

第二字 のwも②vs①におけるへの偏向性がそのまま③へ引き継がれている

これは専ら「和」の寄与によるもの。第二字への採用が多のは、口を大きく広げて短母音で収束する”wa”の音の座りが良いからではないでしょうか。

第二字のry, zは③vs②においてポジティブ

これも「暦」12例、「治」18例と特定の字が選好されたためでしょう。特筆すべきは、 ③「元号」における 「暦」と「治」の第一字への採用が比較的少ないことです。(「暦」2例、「治」3例)

syの第一字、第二字における偏向性が②vs①と③vs②で逆

gは③vs②において第一字・第二字いずれも好まれている

これも「元」(第一字15例、第二字12例)一字による貢献。

hは②vs①において回避、③vs②においてやや回復

こんなところでしょうか。次回は子音の後に続く母音や語尾子音について分析していきます。

(次回:アルゴリズム元号予想⑥へ)

参考文献

アルゴリズム元号予想④

(前回:アルゴリズム元号予想③へ)

元号の音の偏向性を探る

今週から音の分析に入ります。前回の記事でも書いたように比較対象の集団は、

①「常用漢字の音韻分布」(4,200,450通り)
②「勘申案の音韻分布」(2,313)
③「採用された元号の音韻分布」(248)

になります。①は、音読みを持たない和声漢字(「畑」や「峠」など)を除外した2,050字で組み合わせ得る全ての二字のパターンから構成します。 すなわち、同じ文字を二回使用する組み合わせのみ除いた全2050*(2050-1)=4,200,450通り。

②の勘申案の中には一度だけでなく何度も提案された元号案があります。例えば「明治」は11回目の勘申で採用されたものですし、「嘉徳」は40回勘申されながら未だ採用に至っていません。①「常用漢字」に対する②「勘申案」の偏向性や、②に対する③「元号」の偏向性を計測するため、②「勘申案」の分布を求めるときには、各勘申案について勘申回数を加重することにします。

これら①②③について、第一字・第二字それぞれの

  • 子音
  • 母音
  • 長母音(oo,uu)/短母音
  • 二重母音(ai,ei,ui)
  • 語尾子音(「安」:anや「徳」:tokuなど、一つの文字に二つ目の子音が入っている場合)

を要素とした分布を行っていきます。

元号の音の取り扱い

漢音で読むか、呉音で読むか

年号の漢字を呉音で読むか、漢音で読むかの問題があります。従来年号の漢字は呉音で発音する習慣がありましたが(例えば「正」はseiではなくsho)、「平成」の読みが呉音のbyo-joではく漢音のhei-seiであるように、 近年では漢音で読むものも多いようです。便法として漢字の読みは以下のように取り扱うことにします。

①「常用漢字」:全て漢音で読む
②「勘申案」:原則として漢音で読む。しかし③の実年号で全て呉音読みしている漢字については、呉音で読む。(例:正 syo、貞 jo)
③「元号」:山田孝雄『年号読方考証稿』(宝文館  1950)を参照

ローマ字表記の方法

ひらがな五十音表に則した簡便な音素分析にするため、ローマ字表記する際には敢えて慣例に従わず、「し」=si(≠shi)、「じ」=zi(≠ji)、「ち」=ti(≠chi)、「つ」=tu(≠tsu)と表記します。同様に、拗音(ようおん)もsya, syu, syo, zya, zyu, zyo, tya, tyu, tyoとすべてyで表記することにします。

字の音素分解法

モーラ(拍)区切りで考えると、漢字には 短母音のみの“1モーラ漢字” と、長母音(昭:syoなど)や二重母音(平:heiなど)を伴ったり、安(an)や徳(toku)など一字に二子音を持つ“2モーラ漢字”があります。しかし、要素を減らして分析を極力単純化するため、モーラ単位の分解は行わず、あくまで全ての漢字の音の構成要素を

「子音」+「母音(長母音、二重母音含む)」+「語尾子音」

という一音節と見做すことにします。つまり、一字に二つ子音を持つ漢字の第二の母音(徳:tokuの”u”)は無視するわけです。「徳治」(toku-zi)、「嘉吉」(ka-kitu)などの元号を実際に音にすると分かりますが、元号各字の第二子音に対応する母音は前後の音のイントネーションに負けて無声化することが多いので、この要素を捨象しても大きな影響はないと考えたからです。

(次回:アルゴリズム元号予想⑤へ)

参考文献

アルゴリズム元号予想③

(前回:アルゴリズム元号予想②へ)

音も大事な要素

元号は広く国民全員が使用するものなわけで、「理想としてふさわしいようなよい意味をもつ」べきであることは当然ながら、その音韻についても相当の注意が払われるはずです。

大正天皇重篤の際に、宮内大臣・一木喜徳郎(いつき・きとくろう)が吉田増蔵(よしだ・ますぞう)に元号の勘申を内命した際は、元号選定の五つの要領のうちの一つとして「呼称上、音調諧和を要すべきこと」が示されていました。(勘申:天皇に命じられて、学者が年号案の調査内容の上申を行う事)また、近代以前の朝廷における元号案の絞り込み過程では、「反切」(はんせつ、 後漢末の中国で開発された漢字発音表記法)も検討の対象とされたようです。和音だけでなく大陸音でも、同音異義語に不吉なものがないかなど、調査されたのでしょう。 

歴史的に、元号選定の過程では音についても慎重な検討がなされていたのです。

他の言語に類を見ないほどオノマトペの豊富な日本語において、ことばの音、「語感」は重要です。

ネット上では、「安」が新元号に採用される可能性が高いのではないかという予測が多いようですね。ひらがな五十音の最初にして、上古においては「吾」(わたし)を意味するすべての始まりの言葉、そして解放感に満ちた母音である「あ」と五十音の最後から安定感を以て支える「ん」。「安」の採用の見込みが高いという巷間の見立ては、意味のみならず語感も踏まえた卓見だと私は思います。 (現政権首相の名前は元号に組み込まないと思うけど。)

漢字二字の音の組み合わせから派生するイメージ、語感、ここに元号候補を絞り込める大きな可能性を感じます。

元号候補音韻選別の方法

私は音を通じて思い切った選別を行うことにします。なにしろここで48万から数百にまで絞り込まなければならないので、大胆にヤマを張る必要がありますから。

考案した元号候補音韻選別の手順は以下の通りです。

1. 過去の勘申、元号最終決定それぞれのプロセスで採用された音韻の偏向性を分析する。

2. 1.の分析結果に、音から派生するイメージを元に考察を加え、次元号にふさわしい音韻パターンを抽出する。

改元に際して、漢籍に通暁する有識者に元号案を複数勘申させ、天皇・公卿などの為政者がそのうち一つに決定、というプロセスは平安時代から現在に至るまで変わりません。つまり、実際に採用された元号の背後には、識者らが勘申したけれども没になった元号候補群が存在するわけです。

有難いことに、所功・久禮旦雄・吉野健一共著『元号 年号から読み解く日本史』(文春新書 2018年)の巻末に、過去の全未採用元号案が所収されています。

先ずはこれを参照しながら、

  • 「母集団としての常用漢字の音韻分布」と「勘申案の音韻分布」の比較
  • 「勘申案の音韻分布」と「採用された元号の音韻分布」の比較

をそれぞれ行って、選定の両プロセスにおける音韻選好の偏向性を探っていきます。

(次回:アルゴリズム元号予想④へ)

参考文献

アルゴリズム元号予想②

(前回:アルゴリズム元号予想①へ)

ふるい落としの方法論

前回の内容を踏まえて、元号候補を絞り込む具体的な条件は以下になるでしょう。

1. 使用される漢字の選別

  • 文部科学省が公布している現行の「小学校学習指導要領学年別漢字配当表」全1008字から採字 。常用漢字まで対象を拡げてもよいが「書きやすい、読みやすい」という留意点を踏まえて、小学校で習う漢字に限定する。
  • 明治天皇以降の幼名、諱に使用されている文字を除く。
  • 「悪」や「毒」などネガティブな意味を持つ漢字や、また年号表記の上で混乱を招くであろう漢数字を除く。

2. 近代以降の元号のイニシャル(H,S,T,M)とそれらと外見が似るアルファベット(I,W,N)から始まる配列を除く

3. 過去に使用された年号(日本だけでなく中国やベトナムも含め)、追号、諡号を除く

4. 俗用されているものを除く

  • 商号
  • 屋号
  • 商標
  • 人名(一般的な姓と、有名人の名)
  • 地名

5. 漢籍に出典のある言葉

和書からの採用の可能性もあるようですが、対象となる文献の範囲も、調べ方についても、筆者不案内のため無視(笑) 。

1.と2.は単純な算術的絞り込みなので、簡単に行えます。 3.についても、ネット上にいくらでも情報が転がっているので、やや手間は掛かっても振るい落としができるでしょう。

4.と5.も、商号であれば国税庁の法人番号公表サイト、漢籍については台湾の中央研究院の漢籍電子文献を活用できます。地名、屋号、商標については、google 検索に頼るしかないでしょうね。(特許庁の商標検索は、正直上手く使いこなせませんでした、、、)

もう一つ新機軸が必要

問題は、ある程度候補を絞ってからでないと、4.5.のふるい落としができないことです。

試みに1.2.から導出される元号候補の数を計算してみると約48万通り。これを一つずつ4.5.の検索にかけるのは、余程の人海戦術が必要です。現実的ではありません。

本来の元号制定の手順では、有識者が漢籍から一定量の元号候補をピックアップするわけで、漢籍不案内なために元号候補を機械的に求めようとした 私のような素人予想家は皆、同じような問題に行き当たったはずです。

1.2.3.の後、4.5の選別プロセスに入る前に、対象候補を数百個程度に絞りこむような新機軸を見い出せるかどうか、ここにアマチュアの元号予想者の力量が問われます。

そこで、私は元号の音に注目してみることにしました。

(次回:アルゴリズム元号予想③へ)

アルゴリズム元号予想①

平成が終わる?実感はないけど、、、

今年4月30日を以って、今上天皇陛下は退位され、翌日徳仁(なるひと)親王が即位されます。これに伴って、元号法の定めるところにより、現在の元号「平成」も改定されます。


元号は、皇位の継承があった場合に限り改める。


(元号法第二項 )

新元号の公表まであと一ヶ月、選定については委嘱を受けた有識者らが既に20程度の案に絞り込んでいるとの報道も出てきています。

「たかが元号」という方もいるかもしれませんが、昨年来の巷間での元号予想ブームも冷めるどころか、ここへきて一層熱を帯びてきているのを見ると、やはり日本国民の元号への関心は全体として薄くはないのでしょう。

明治の男は泣かない、明治は遠くなりにけり、大正ロマン、大正デモクラシー、昭和ノスタルジー、、、

アナログに移ろいゆく時代を元号によって区切ってきた我々が、数年後もしくは数十年後に「平成」を振り返ったとき、この時代にどのようなキャッチフレーズをつけるのでしょうね。既に「失われた30年」というのはあるけれど。

30年間私たちの周りに空気のように存在していた「平成」が終わるという実感は正直未だにありません。が、気持ちの整理の意味合いも込めて、私も次の元号予想を行って「平成」への餞としたいと思います。

あくまで機械的な操作で元号予想

漢籍(国書から採用される可能性もあり)から採用されるものである以上、全うな元号予想には、選定にかかわる学者と同程度の素養やセンスが要求されるわけですが、一方で「頭文字M,T,S,Hは避けられる」など素人でもスクリーニングできるような制約があるのも事実です。

そこで私は、あくまで機械的なふるい落としで次の元号予想にチャレンジしてみることにしました。

改めて、元号に関する条件をまとめてみましょう。まず、明示的なレギュレーションは、 昭和五十四年大平内閣の閣議報告で公表された「元号制定手続」に関する要領。元号候補名の検討・整理の留意点として以下の六点が明記されています。

  • 国民の理想としてふさわしいようなよい意味をもつものであること。
  • 漢字2字であること。
  • 書きやすいこと。
  • 読みやすいこと。
  • これまでに元号又はおくり名(諡号、追号)として用いられたものでないこと。
  • 俗用されているものでないこと。

この他に暗黙の制約もあります。

まず、先にも触れたイニシャル文字。 平成・昭和・大正・明治とおなじ頭文字H、S、T、Mから始まる元号は避けられるとみられています。元号を頭文字で書きあらわすことがあるため、これらと被る元号を採用してしまうと実用上の支障が出てくるからです。その趣旨からすると、Tと字形が似ているIやMと字形が似ているWやNも採用しづらいのではないかと思います。

また、「要領」に明記されているおくり名以外に、近代以降の天皇陛下の諱(実名)や幼名も避けられるのではないかと思います。「諱む(忌む)」の文字通り、古来より貴人の実名は口に出すのを憚る習慣がありましたから、国民全員が使用する元号に採用するなど、以ての外でしょう。今上天皇陛下の御幼名・諱に使用されている「継」や「明」はまず使用されないのではないでしょうか。

(次回:アルゴリズム元号予想②へ)