< log

「日本人名の厖大なる表」について

簡単にアクセスできるデータベース、Japanese Multilingual Named Entity Dictionary (JMnedict)を利用して纏めましたのでその詳細を記しておこうと思いました。

サイトによると登録の類別は下記のようです。

s - surname (138,500)
p - place-name (99,500)
u - person name, either given or surname, as-yet unclassified (139,000) 
g - given name, as-yet not classified by sex (64,600)
f - female given name (106,300)
m - male given name (14,500)

まずは人名認定のものでは充分なので地名も姓名不明のも除きました。 なぜか男性と認定されているものに対して女性のほうが圧倒的に多く、そして「性別不明」の中で 明らかに男性と思われるのも多くありましたので、語尾と読みで区別してみました。すると男性のほうが多くなりました。ですが、現代の感覚で性別がはっきりとしていると思っても時代とともに変化するものであって或る程度の曖昧さがあっても良いのではないか(「悪魔」だって女性の名前として載っています!)と考え、 自分なりに最低限にしてみました。これは主に性別不明のものを別けるためでした。

また、同じ読みのを32個以内にし、それから外国の名も数多く含まれていて、片仮名の読みのを排除。 作業中にパッと目立った変なのも排除。無作為に表に収まる数に絞って整理終了。

この上でちょっとした統計をまとめてみました。

名では、男性的なのは女性的なのを少し上回ったが、女性の方が漢字も読み方も豊富で、男女を通して平均的に一意の読み方に対して漢字が四つ程あるが、中で漢字組合せが多いのでは「こうじ」が957と「ゆりな」が650と、読みでは「尚史」が37と「愛」が48、ということです。 姓では、一意の読み方が全体の半分程あり、一意の漢字が四分の三程、読み方が最も多いのが28個で「大豆生田」でした。

  合計 読み 漢字の
組合せ
漢字
男性 146825 16322 66622 2977
女性 123004 21698 96729 3344
性別不明 21147 10207 19648 2613
119543 67450 88484 3515
© 2025 Kotendo