クラスター分析
統計学 へ戻る
大学生のための数学 へ戻る
2020.04.19____

 20個の物質について、2つの性質を点数化し、縦は上から下に点数が多く、横は左から右に点数が多くなるよう、プロットしていくと、次のようになりました。

    

 これを大きく2つのグループに分類したいと思います。どのようにすればいいでしょうか?
 まず四角の範囲内に無作為に2つの点を作ります。そして、その2つの点のどちらに近いかで物質を2つのグループに分けます。そうしたら、グループごとに位置の平均値を取ります。そして次に、その平均値を新たな2つの点として、その2つの点のどちらに近いかで物質を2つのグループに分けます。こうしたことを繰り返していって、2つのグループが前回と変化しなくなったところで終了とします。
 最初の無作為に2つの点によって、2つのグループ分類が異なることがありますが、何回も繰り返すことによって最も多かった結果を採用すればいいと思います。
 では、プログラムによるシミュレーションをしてみましょう。

 



 次に、およそ左下と右上に分類されそうなグループを無作為に作ってから、実際に分類するプログラムを実行してみましょう。

 


プログラムの内容 :