DPCデータの分析とかやるブログ

DPCデータの分析なんかをテキトーにやってます。

2016-06-01から1ヶ月間の記事一覧

副傷病分岐の無いDPCを探すSQL

DPC分類番号はご存知の通り14桁の英数字で構成されています。 それぞれの番号にはルールが設定されていますので、それに従うことで特定の条件に当てはまる患者データを抽出することが可能です。 例えば、手術をしている、処置1で分岐している等ですね。 …

PythonからSQLサーバーに接続してグラフを描いてみる

今日はPythonからPostgreのDBに接続し、データを引っこ抜いてくるところまでやってみましょう。 最後にオマケで、グラフを描画してデータの可視化まで行います。 使うライブラリは以下の通り。 Pandas(Pythonでデータを扱うなら必須のライブラリ) Numpy(Pa…

EFファイル統合スクリプト(平成28年度版)

EFファイル統合をPython+Pandasで行う さて6月になりましたが、未だにEF統合ツールが公開されません。 いい加減待つのも飽きましたので、平成28年度様式に対応したEF統合スクリプトを書きました。 使い方は単純です。 下記のコードをコピペし、テキスト…

【雑談】DPCデータを扱う手法② 成功例編

前回に引き続き雑談です。 DPCデータを扱う上で、今のところ上手く行っているものを上げます。 PostgreSQL(現在も運用中) まあ、基本と言えば基本です。DPCデータのように、データ量が膨大で、かつ蓄積される性質のものであれば、SQLサーバーが最初の選択…