最終更新日 2012年9月29日
判別ツリーとロジット回帰モデルの比較
はプログラム記述でアイコンを押下するとC言語仕様のプログラムが表示されます
ロジット回帰は 0〜1 までの確率で回帰するので目的変数を 0 または 1 にします
説明
判別ツリーモデルとロジットモデルの精度比較を行うデータフロー図です 対象データは住宅の案内メールを出した人のデータとメールへの返事の有無です。 このデータを分析して、メールへの返事がある率を計算します。 まずAICで説明力の強い順に変数を表示します、上位の変数を判別ツリーモデルに投入します ロジット回帰モデルでは、カテゴリ変数はそのままでは使用できないので数値変数のみ投入します 最後に判別効率図を重ね合わせ精度を比較します |
AIC表の結果 説明力が強い順に変数が並んでいます
判別ツリーモデルのレポート表示
判別ツリー図の表示
返事の来やすい人は home(その他,アパート,借家) area(北部) の人で70.8%が返事しています。
判別ツリーの判別効率図の表示
返事の来る確率が高い順に並べると全員の 20% で実際に返事をした人が 80% いることが分かります 全員の 20% で 80%を予測することができる高い精度のモデルになっています。 |
ロジット回帰モデルの判別効率図の表示
返事の来る確率が高い順に並べると全員の 20% で実際に返事をした人が 40% いることが分かります
判別ツリーとロジット回帰モデルの判別効率図の比較
判別ツリーモデルはカテゴリ変数と数値変数を投入しましたが、ロジット回帰モデルは数値変数だけなので精度に差が出ています |