アルゴリズム元号予想②

(前回:アルゴリズム元号予想①へ)

ふるい落としの方法論

前回の内容を踏まえて、元号候補を絞り込む具体的な条件は以下になるでしょう。

1. 使用される漢字の選別

  • 文部科学省が公布している現行の「小学校学習指導要領学年別漢字配当表」全1008字から採字 。常用漢字まで対象を拡げてもよいが「書きやすい、読みやすい」という留意点を踏まえて、小学校で習う漢字に限定する。
  • 明治天皇以降の幼名、諱に使用されている文字を除く。
  • 「悪」や「毒」などネガティブな意味を持つ漢字や、また年号表記の上で混乱を招くであろう漢数字を除く。

2. 近代以降の元号のイニシャル(H,S,T,M)とそれらと外見が似るアルファベット(I,W,N)から始まる配列を除く

3. 過去に使用された年号(日本だけでなく中国やベトナムも含め)、追号、諡号を除く

4. 俗用されているものを除く

  • 商号
  • 屋号
  • 商標
  • 人名(一般的な姓と、有名人の名)
  • 地名

5. 漢籍に出典のある言葉

和書からの採用の可能性もあるようですが、対象となる文献の範囲も、調べ方についても、筆者不案内のため無視(笑) 。

1.と2.は単純な算術的絞り込みなので、簡単に行えます。 3.についても、ネット上にいくらでも情報が転がっているので、やや手間は掛かっても振るい落としができるでしょう。

4.と5.も、商号であれば国税庁の法人番号公表サイト、漢籍については台湾の中央研究院の漢籍電子文献を活用できます。地名、屋号、商標については、google 検索に頼るしかないでしょうね。(特許庁の商標検索は、正直上手く使いこなせませんでした、、、)

もう一つ新機軸が必要

問題は、ある程度候補を絞ってからでないと、4.5.のふるい落としができないことです。

試みに1.2.から導出される元号候補の数を計算してみると約48万通り。これを一つずつ4.5.の検索にかけるのは、余程の人海戦術が必要です。現実的ではありません。

本来の元号制定の手順では、有識者が漢籍から一定量の元号候補をピックアップするわけで、漢籍不案内なために元号候補を機械的に求めようとした 私のような素人予想家は皆、同じような問題に行き当たったはずです。

1.2.3.の後、4.5の選別プロセスに入る前に、対象候補を数百個程度に絞りこむような新機軸を見い出せるかどうか、ここにアマチュアの元号予想者の力量が問われます。

そこで、私は元号の音に注目してみることにしました。

(次回:アルゴリズム元号予想③へ)

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください