最終更新日 2015年6月30日

独立成分分析を用いたベイジアンネット構造推定

説明

ベイジアンネットの構造学習にはスコアベースと制約ベースがある

スコアーベースノードのリンク状態毎に対数尤度MDL等を計算し最適なリンクを求める方法
制約ベース条件独立を検定して、条件独立なら非連結とする方法
統合ベース制約ベースで構造決定し、スコアベースで連結方向を決定する方法


統合ベースとして、Lassoで疎な構造を設定し、独立成分分析による因果分析で連結方向を決定した方法を提案する


事例

米国の銀行員の給与で少数民族に対して差別があるかベイジアンネットで構造推定する

@米国の銀行員の給与データを読んで、ノード間の相互情報量を求める
A相互情報量の行列が疎になる様にLassoで解く
BLassoの疎な関係をノード間に設定する
Cノード間のデータの一方がカテゴリの場合はMDL基準で最適な方向付けをする
Dノード間のデータが実数値の場合、独立成分分析で因果方向を求め方向付けする


米国の銀行員の給与の相互情報量


Lasso計算結果


初任給と現在給与の独立成分分析による因果方向

        初任給と現在給与の散布図                    初任給が現在の給与の原因である確率(95%)


米国銀行員の給与のベイジアンネット構造推定結果

少数民族(mainority)ノードは孤立しており、給与に少数民族による差別が無いことがわかる。

jobcat 職種
mainority 少数民族
salnow 現在給与
salbeg 初任給
sex 性別
age 年齢
work 勤続年数
edlevel 教育レベル


戻る