AIで新元号を予測する

2017年5月10日 開始

2019年3月27日 最終更新

平成の次の元号を予測しまています。天皇については、勉強がてらまとめています。元号についてもまとめていますこの本とか、この本を参考にしてます。ディープラーニングについては、これとかこれとか。これも。機械学習はこれ。 ブログで日記も書いています。

美音咲月 #咲月と近距離恋愛 [Blu-ray] 元号 全247総覧 大原優乃/You Know - 私は私の旅に出る - [DVD] 元号 年号から読み解く日本史 (文春新書) 葉月あや    「僕とあや。」  チェキ(現場撮影サイン入り)付き (数量限定)   [Blu-ray]  元号って何だ?: 今日から話せる247回の改元舞台裏 (小学館新書) 岸明日香 やっぱり岸が好き [Blu-ray] 元号大全 「大化」から「平成」まで 全247詳細解説 ([テキスト]) 久松かおり/チョコチップLOVE [DVD] 元号通覧 (講談社学術文庫) 大澤玲美 奥様はれいぴょん!  [Blu-ray]

始めに

平成の次の元号を予測(予想)しました。根拠のある決めごとを採用しつつ、今現在の日本を生活する日本国民として、元号にふさわしい単語を客観的な根拠を示しつつ候補を選びました。

インターネットによる検索結果をさっと眺めると、「早稲田」(慶応大学の「慶応」や明治大学の「明治」が過去にあるのに早稲田大学だけがない)、「新平成」(平成の次という意味)などといったジョークの類いを見かけますが、ここではジョークではなく、主観的な基準を採用しつつも可能な限り論理的に予測しました。

インターネット上では、平成の次の元号は「安久」(←アクセスアップのために意図的に書きました(笑))ではないかといった書き込みが散見されます(2017年5月現在)。これが広く流布されている理由の一つが語感が良くもっともらしいからだと勝手に考えていますが、ここでは抽象的な判断基準も使用しますが、そのような場合はその基準をなるべく明確にしたいと思います。

美音咲月 #咲月と近距離恋愛 [Blu-ray] 元号 全247総覧 大原優乃/You Know - 私は私の旅に出る - [DVD] 元号 年号から読み解く日本史 (文春新書) 葉月あや    「僕とあや。」  チェキ(現場撮影サイン入り)付き (数量限定)   [Blu-ray]  元号って何だ?: 今日から話せる247回の改元舞台裏 (小学館新書) 岸明日香 やっぱり岸が好き [Blu-ray] 元号大全 「大化」から「平成」まで 全247詳細解説 ([テキスト]) 久松かおり/チョコチップLOVE [DVD] 元号通覧 (講談社学術文庫) 大澤玲美 奥様はれいぴょん!  [Blu-ray]

手順の概要と基本方針

手順の概要

まず初めに、考え得る候補を作成します。そしてそれぞれに評価値をつけて、この評価値がもっとも高い候補を新元号と予測します。

なお、評価の方法は、基本的に減点方式とします(詳細は後述)。

基本的な方針

まず、参照する情報は公式なもの、あるいは著名な書籍等のみとします。個人ブログや任意団体のウェブサイトの発信情報は参考にしません。無記名で自由に記述できるインターネット上の掲示板なども参考にしません。

元号をこう決めるといった法律等は、調べてみたところあるようです。

元号法(昭和54年6月12日法律第43号)

以下、上記ページからコピペしました。

  1. 元号は、政令で定める。
  2. 元号は、皇位の継承があつた場合に限り改める。

まったく参考になりません(笑)。

国立公文書館のウェブサイトで検索すると、「元号選定手続について」(昭和54年10月23日 閣議報告)という文書が見つかります。昭和54年10月22日に内閣総理大臣から内閣総理大臣に提出された書類のようです。そこには、元号の選定基準について以下のように書かれています。
  1. 国民の理想としてふさわしいようなよい意味を持つものであること。
  2. 漢字2字であること。
  3. 書きやすいこと。
  4. 読みやすいこと。
  5. これまでに元号又はおくり名として用いられたものでないこと。
  6. 俗用されているものでないこと。

この文書に記載の内容がどの程度の拘束力があり、また、今も有効なのかはわかりませんが。参考にはなるると思います。個別に考えてみました。

(1)国民の理想としてふさわしいようなよい意味を持つものであること。

抽象的過ぎてわかりませんが、おそらく明治神宮のQ&Aのページで主張されているような、出典元から良いと思われるような意味があるものであると理解しました。

(2)漢字2字であること。

そのとおりと理解しました。

(3)書きやすいこと。

手で書きやすい漢字であると理解しました。使い慣れた、国民が広く慣れ親しんでいる漢字を使用すること。つまり常用漢字で、もう少し絞ると、小学校で習う漢字であると解釈しました。

(4)読みやすいこと。

常用漢字の一般的な読みが適用されると理解しました。

(5)これまでに元号又はおくり名として用いられたものでないこと。

初代元号「大化」から最新「平成」までのこれまでの元号は使えないと解釈しました。さらに、神武天皇から始まる歴代の天皇名(初代「神武」、最新「昭和」)も使えないと理解しました。

(6)俗用されているものでないこと。

国語辞典に掲載されているような一般的に使われる名詞はダメと理解しました。「開花」、「平和」、「晴天」のような良いイメージを持っていたとしても、普通名詞はダメということでしょう。さらには、「青森」、「浦和」、「銀座」のような著名な地名、地域名もダメであると理解しました。さらには、著名な固有名詞もダメということでしょう。

繰り返しになりますが、この文書が今も有効か否かは不明です。さらに、お役人様お得意の、基準を都合のいいように変えるという最終手段があるでしょう。ですが、疑いだしたら切りがないので、この文書は元号作成の参考となる文章と考え、今後の議論を進めることにします。

美音咲月 #咲月と近距離恋愛 [Blu-ray] 元号 全247総覧 大原優乃/You Know - 私は私の旅に出る - [DVD] 元号 年号から読み解く日本史 (文春新書) 葉月あや    「僕とあや。」  チェキ(現場撮影サイン入り)付き (数量限定)   [Blu-ray]  元号って何だ?: 今日から話せる247回の改元舞台裏 (小学館新書) 岸明日香 やっぱり岸が好き [Blu-ray] 元号大全 「大化」から「平成」まで 全247詳細解説 ([テキスト]) 久松かおり/チョコチップLOVE [DVD] 元号通覧 (講談社学術文庫) 大澤玲美 奥様はれいぴょん!  [Blu-ray]

実際の作業

考え得る候補(漢字の組み合わせ)の作成

まず、新元号は上記選定基準(2)より、漢字2文字としました。漢字2文字以外は一切考えないことにします。

さらに、この2文字を構成する漢字は、上記選定基準(3)から類推して、小学校で習う漢字(平成29年5月時点で1,006個)としました。小学校で習う漢字以外は一切考えないことにします。

この条件を基に、可能性のある新元号は1,006×1,006=1,012,036個です。新元号は、この中のどれかだと考えられます。なお、処理システムの都合上、ファイル3つに分けてアップロードしてあります。

  1. 漢字組み合わせ候補リスト(1~300,000個目)(テキスト形式)
  2. 漢字組み合わせ候補リスト(300,001~600,000個目)(テキスト形式)
  3. 漢字組み合わせ候補リスト(600,001~1,012,036個目)(テキスト形式)

候補(漢字の組み合わせ)に読みをつけてさらに候補を拡張する

単語の読みについて考えます。年号は漢字による組み合わせ以外に、その形成した単語の読みも考えなければなりません。例えば「大正」について考えると、「大」の一般的な読みは「たい」と「だい」です。一方、「正」は「せい」とも「しょう」とも読みます。「たいしょう」が正しい読みですが、この例でいえば、読みは2×2=4通りあることになります。「だいしょう」、「たいせい」、「だいせい」もあり得たわけです。

そこで、読みも含めた可能性のある組合せを作ります。ここで直近4個(明治、大正、昭和、平成)の年号の読みについて考えてみます。いずれもすべてが音読み。そこで、新元号の読みはすべて音読みとして、上記の1,006個の漢字に音読みを当てはめて、候補を作成します。

なお、小学校で習う漢字のうち、以下の5つには音読みがありません。そのため、これらの漢字は自動的に候補から外れることになります。

貝,皿,箱,畑,株,届

計算すると、候補は1,522,756個となりました。この1,522,756個をホームページ上で読みと共に候補を掲載したいところですが、全部を掲載するのは現実的ではないので(処理システムの出力結果のファイルサイズ(テキスト形式)は10MB以上)、以下に先頭10個の候補を示すにとどめておきます

通し番号 漢字組み合わせ 読み
1 愛愛 アイアイ
2 愛悪 アイアク
3 愛悪 アイオ
4 愛圧 アイアツ
5 愛安 アイアン
6 愛暗 アイアン
7 愛案 アイアン
8 愛以 アイイ
9 愛位 アイイ
10 愛囲 アイイ

この例のように、漢字が同じでありながら読みが違うもの(「愛悪」の「あいあく」と「あいお」)、逆に読みが同じでありながら漢字が異なるもの(「あいあん」の「愛暗」と「愛案」)が多数あります。

総合評価値をつける

新元号の候補1,522,756個について、それぞれに総合評価値を考え、その総合評価値が高いものが新元号となる可能性が高いと考えます。各候補の総合評価値の考え方は以下のとおりです。

(候補の総合評価値)=(1文字目の漢字の評価値)×(2文字目の漢字の評価値)×漢字の組み合わせの評価値)×(単語の読みの評価値)

×記号は表記のとおりのかけ算で、4つの評価値の総乗により、その候補の最終的な評価値を算出します。 それぞれ4つ(1文字目の漢字、2文字目の漢字、漢字の組み合わせ、単語の読み)の評価値の最大値は1、最小値は0とし、各評価項目の総乗により求めることから、候補の評価値は最大1、最小は0となります。

1文字目と2文字目の漢字の評価

それぞれ1文字目と2文字目の漢字(「平成」の場合は「平」と「成」)について、以下の判断基準でそれぞれ評価値を算出します。

過去の元号に使われている漢字か否か

平成を含む過去の元号は247個。リストはこのとおりなのですが、使われている漢字は72個しかありません。以下のとおりです。

大,化,白,雉,朱,鳥,宝,慶,雲,和,銅,霊,亀,養,老,神,天,平,感,勝,字,護,景,応,延,暦,同,弘,仁,長,承,嘉,祥,寿,斉,衝,安,貞,観,元,寛,昌,泰,喜,徳,康,保,禄,永,祚,正,治,万,久,文,建,福,禎,乾,亨,中,武,興,国,授,至,明,享,吉,政,昭,成

これらはまた使われる可能性が極めて高いです。これらの漢字は評価値を0.99とし、それ以外の漢字は0.5とします。ただし、直近の「平成」の「平」と「成」は0.01とします。

漢字 評価値
永天元 0.99
治応和文長 0.98
安暦延保徳寛承仁嘉宝康建慶久貞弘享禄明 0.97
大亀万寿喜養中政神観化護雲 0.96
雉祚老霊福武白銅同禎鳥泰斉成衝祥昭昌勝授朱字至国景興亨吉感乾 0.90
平成 0.01
上記以外の漢字 0.50

小学校の何年生で習うか

以下のように評価します。

判断基準評価値
1年生で習う 0.96
2年生で習う 0.97
3年生で習う 0.99
4年生で習う 0.99
5年生で習う 0.99
6年生で習う 0.98

漢字の画数

画数が少なすぎたり多すぎたりする漢字は評価値を下げます。

判断基準評価値
1~3画 0.80
4~10画 0.99
10画以上 0.30

ネガティブなイメージも持つ漢字か否か

独断と偏見ですが、ネガティブなイメージも持つ以下の漢字は評価値を0.1とします。それ以外の漢字は0.99とします。

悪犯罪亡暴閉否悲避不非切落欠苦死害失去病毒敗殺争停終負暗辞老飢饉

機能的なイメージも持つ漢字か否か

独断と偏見ですが、機能的なイメージも持つ以下の漢字は、評価値を0.3とします。それ以外の漢字は0.99とします。

一二三四五六七八九十百千万億兆東西南北春夏秋冬血皮鼻胃歯夫妻父母子孫神国元号青緑黄赤白黒茶

生き物もイメージする漢字か否か

生き物もイメージする以下の漢字は、評価値を0.3とします。それ以外の漢字は0.99とします。

犬鳥虫羊象

漢字の組み合わせの評価

1文字目と2文字目の漢字を組み合わせてできあがった単語(「平成」の場合は「平成」)について、以下の判断基準で評価をします。

過去にその単語が元号として使われているか否か

使われていれば0.0、そうでなければ1.0とします。

2文字が同じ漢字か否か

2文字の漢字が同じであれば0.02、異なる漢字であれば1.0とします。

単語の読みの評価

その単語の読みについて、以下の判断基準で評価をします。

ローマ字で記載したときにM、T、S、Hで始まるか否か

読みがマ行、タ行、サ行、ハ行で始まるものは0.01、それ以外は1.0とします。

同じ行の文字が続くか否か

最近の元号「平成」(へいせい)、「昭和」(しょうわ)、「大正」(たいしょう)、「明治」(めいじ)、「慶応」(けいおう)の読みは、すべて同じ行の文字が続きません。同じ行の文字が続くというのは、例えば、「ああ」とか「あい」です。ですので、読みに同じ行のひらがなが続く読みは0.1とし、それ以外は1.0とします。なお、ア行とワ行は除きます。

読みの最初が母音か子音か

読みが母音で始まるものは0.1、それ以外は1.0とします。

最初の文字が濁音か否か

直近の過去10個の元号のうち、最初の文字が清音であるのは8個、濁音で始まるものは2個。

よって、濁音で始まるものは0.2、それ以外は1.0とします。

読みの長さ

直近の過去10個の元号の読みの長さは3.9±0.7。そのため、以下のように評価しました。

2文字 0.5
3文字 1.0
4文字 1.0
5文字 1.0
6文字 0.5

読み

読み自体を以下のように評価しました。

読み 評価値 理由
〇い〇い 0.3 平成(へいせい)と似ているため
~せい 0.3 (同上)
しょう~ 0.3 昭和(しょうわ)と似ているため
~わ 0.3 (同上)
~しょう 0.3 大正(たいしょう)と似ているため
~じ 0.3 明治(めいじ)と似ているため

※〇は任意の1字。~任意の複数文字。

美音咲月 #咲月と近距離恋愛 [Blu-ray] 元号 全247総覧 大原優乃/You Know - 私は私の旅に出る - [DVD] 元号 年号から読み解く日本史 (文春新書) 葉月あや    「僕とあや。」  チェキ(現場撮影サイン入り)付き (数量限定)   [Blu-ray]  元号って何だ?: 今日から話せる247回の改元舞台裏 (小学館新書) 岸明日香 やっぱり岸が好き [Blu-ray] 元号大全 「大化」から「平成」まで 全247詳細解説 ([テキスト]) 久松かおり/チョコチップLOVE [DVD] 元号通覧 (講談社学術文庫) 大澤玲美 奥様はれいぴょん!  [Blu-ray]

結果

上記の条件により各候補の総合評価値を計算したところ、評価値の最高は0.87743で、その漢字の組み合わせは「和永」でした。読みは「わえい」です。平成の次の元号については、考えられる候補(ただし、漢字による表記)は1,522,756個であり、その中で平成の次の元号となる可能性が一番高いものは「和永」となりましたが、以下に総合評価値の100番以内について、表にして示します。「和永」ではないにしても、これらが平成の次の元号となる可能性が高いと考えられます。

1和永ワエイ0.87743
2和応ワオウ0.86857
3建応ケンオウ0.85971
3建応コンオウ0.85971
3建和ケンオ0.85971
3建和コンオ0.85971
3仁永ニエイ0.85971
3和安ワアン0.85971
3和建ワケン0.85971
3和建ワコン0.85971
11化永カエイ0.85952
11化永ケエイ0.85952
13仁応ニオウ0.85102
13和延ワエン0.85102
13和仁ワジン0.85102
13和長ワチョウ0.85102
13和宝ワホウ0.85102
18建安ケンアン0.85093
18建安コンアン0.85093
20化応カオウ0.85084
20化応ケオウ0.85084
20和天ワテン0.85084
23建延ケンエン0.84234
23建延コンエン0.84234
23建宝ケンホウ0.84234
23建宝コンホウ0.84234
23仁建ニケン0.84234
23仁建ニコン0.84234
23和明ワメイ0.84234
23和明ワミョウ0.84234
31和文ワブン0.84225
31和文ワモン0.84225
33化安カアン0.84216
33化安ケアン0.84216
33建化ケンカ0.84216
33建化コンカ0.84216
33建化ケンケ0.84216
33建化コンケ0.84216
33建天ケンテン0.84216
33建天コンテン0.84216
41仁延ニエン0.83383
41仁長ニチョウ0.83383
41仁宝ニホウ0.83383
44建明ケンメイ0.83374
44建明コンメイ0.83374
44建明ケンミョウ0.83374
44建明コンミョウ0.83374
48化延カエン0.83365
48化延ケエン0.83365
48化仁カジン0.83365
48化仁ケジン0.83365
48化長カチョウ0.83365
48化長ケチョウ0.83365
48化宝カホウ0.83365
48化宝ケホウ0.83365
48建文ケンブン0.83365
48建文コンブン0.83365
48建文ケンモン0.83365
48建文コンモン0.83365
48仁天ニテン0.83365
61化天カテン0.83348
61化天ケテン0.83348
63仁明ニメイ0.82532
63仁明ニミョウ0.82532
65仁文ニブン0.82523
65仁文ニモン0.82523
67化明カメイ0.82515
67化明ケメイ0.82515
67化明カミョウ0.82515
67化明ケミョウ0.82515
71化文カブン0.82506
71化文ケブン0.82506
71化文カモン0.82506
71化文ケモン0.82506
71和中ワチュウ0.82506
71和中ワジュウ0.82506
77建中ケンチュウ0.81664
77建中コンチュウ0.81664
77建中ケンジュウ0.81664
77建中コンジュウ0.81664
81仁中ニチュウ0.80839
81仁中ニジュウ0.80839
83化中カチュウ0.80822
83化中ケチュウ0.80822
83化中カジュウ0.80822
83化中ケジュウ0.80822
87建至ケンシ0.78155
87建至コンシ0.78155
87和同ワドウ0.78155
90建同ケンドウ0.77358
90建同コンドウ0.77358
92仁同ニドウ0.76576
93化同カドウ0.76560
93化同ケドウ0.76560
95久永キュウエイ0.70180
95久永クエイ0.70180
97久応キュウオウ0.69471
97久応クオウ0.69471
97久治キュウチ0.69471
97久和キュウオ0.69471
97和久ワキュウ0.69471