【画数の謎に挑む】 
 (13)どんだけ名前を集めれば信用してもらえるの?

 数十人の都合のよい姓名判断の結果を示して、だからこの画数は良いとか悪いとか言うのは簡単なことです。しかし、統計によって結果を示そうとする場合には、それ相応の、信頼に足りる数のデーターを用意しなければなりません。
 信頼性の高い結果を得るにはどれだけのデーター(姓名)を揃えればよいのか。300なのか、500なのか、1000なのか、3000なのか5000なのか、はたまた数万なのか。
 集計はコンピューターで行いますから、100だろうが10000だろうが費やす労力や時間に大した違いはないのですが、名前の収集では、集める名前の数が100倍になれば要する時間も100倍になってしまいますし、第一、資産家1万人とか犯罪者1万人とかを男女別に集めるとなると、これはもう、ほとんど不可能に近い数字でしょう。姓名の収集を行なうのに先だって、どれくらいのデーター数を用意すれば信頼性の高い結果を得られるのかを調べておく必要があります。

 グループ別姓名の収集に比べれば、一般の姓名を1万人集めるのはさほど難しいことではありません。そこで、一般姓名を大量に収集して、これを信頼性の判定に用いることにします。例えば、「平成生れの一般女性の名前」を大量に収集して、300人の集計結果、400人の集計結果、500人、600人、700人と、データーの数を増やしながら画数分布のグラフを描いていきます。すると、最初は分散していたグラフがある数を超えたところから重なり始め、それ以上データーを増やしてもほとんど変化しなくなります。この、グラフが重なり始めたときのデーター数が、信頼性の高い結果が得られる数の下限と考えることができるわけです。

グラフ2-4は、「平成生れの女性の地格」について、200人から10000人まで、データーを徐々に増やしながら画数別出現率のグラフを重ねていったもので、データーが多くなるにつれてグラフが収束し、黒く濃い線となって表れています。

グラフ2-4
信頼できるデーター数

 平成生れの女性の外格、昭和生れの男性の人格、平成生れの男性の総格など、色々なパターンでグラフの重ね合わせを行ってみると、どれも600名あたりから安定し始めて、800名を超えると、どのパターンでもそれぞれのグラフが重なって描かれるようになります。このことから、1グループ当たりのデーターは最低でも800名分が必要であり、データー数の下限を1000以上に設定すれば信頼性の高い結果が得られるであろうと判断できます。
 今回、実際に使用したデーターでは、1グループ当たり2000名を下限に設定し、各グループとも男女比1対1、合計3000名を目安に収集を行いました。
 なお、収集が比較的容易な一般姓名については、昭和生れ男性10000人、昭和生れ女性10000人、平成生れ男性10000人、平成生れ女性10000人の計4万人分のデーターを用意して、集計・分析に用いました。

 当然ながら、姓名を収集した結果2000名に満たないグループは、集計から除外することになります。「宝くじの高額当選者」や「豪華懸賞の当選者」、「殺人事件の被害者」や「自殺者」などに絞って名前を集めることができれば、興味深い結果が得られるのではないかと期待したのですが、個人情報保護の壁に阻まれて目標のデーター数には到底及びませんでしたので、残念ながらこれらのグループの集計は断念せざるを得ませんでした。



「コラム・ISOP物語」 http://isop.bunsekishi.com/column.htm

Copyright © 2009 ISOP Inc. All rights reserved.