最終更新日 2015年6月30日
説明
ベイジアンネットの構造学習にはスコアベースと制約ベースがある
スコアーベース | ノードのリンク状態毎に対数尤度MDL等を計算し最適なリンクを求める方法 |
制約ベース | 条件独立を検定して、条件独立なら非連結とする方法 |
統合ベース | 制約ベースで構造決定し、スコアベースで連結方向を決定する方法 |
統合ベースとして、Lassoで疎な構造を設定し、独立成分分析による因果分析で連結方向を決定した方法を提案する
事例
米国の銀行員の給与で少数民族に対して差別があるかベイジアンネットで構造推定する @米国の銀行員の給与データを読んで、ノード間の相互情報量を求める A相互情報量の行列が疎になる様にLassoで解く BLassoの疎な関係をノード間に設定する Cノード間のデータの一方がカテゴリの場合はMDL基準で最適な方向付けをする Dノード間のデータが実数値の場合、独立成分分析で因果方向を求め方向付けする |
米国の銀行員の給与の相互情報量
Lasso計算結果
初任給と現在給与の独立成分分析による因果方向
初任給と現在給与の散布図 初任給が現在の給与の原因である確率(95%)
米国銀行員の給与のベイジアンネット構造推定結果
少数民族(mainority)ノードは孤立しており、給与に少数民族による差別が無いことがわかる。
jobcat | 職種 | |
mainority | 少数民族 | |
salnow | 現在給与 | |
salbeg | 初任給 | |
sex | 性別 | |
age | 年齢 | |
work | 勤続年数 | |
edlevel | 教育レベル |