DPCデータの分析とかやるブログ

DPCデータの分析なんかをテキトーにやってます。

ヒートマップで相関係数を可視化する

以前、相関係数について、ざっくりした記事を書きました。

stagira.hatenablog.com

おさらいですが、相関係数は-1から+1の間を取る指標で、±0.7以上なら強い相関があると認められます。
マイナスなら負の相関、プラスなら正の相関ですね。
さて。以前の記事では「df.corr()メソッド一発で計算終了!楽ちん!」で終わってますが、実際のデータというのは15〜20項目あったりして、相関係数の表を見ているだけで目が痛くなります。
(重複はありますが、15✕15マスの表が出来上がります…)

ヒートマップを使えば、色の濃いところが相関が強い!くらいに一望出来るので、目に優しいですね。
実際どんなグラフになるのか、早速描画してみましょう。
今回は適当な例題データを思いつかなかったので、機械学習でよく使うボストン住宅データを流用します。

HeatMap_example

いかがでしょうか。
ボストン住宅データは、わりと実務で目にするデータに近い形です。
手元のデータで実際にヒートマップを描いてみると、案外面白い発見があるかも知れません。