DPCデータの分析とかやるブログ

DPCデータの分析なんかをテキトーにやってます。

EFファイル統合を自力でやってみる(1)

さて新年度となりDPC制度も変わりました。 具体的には厄介なことに様式1とEF/Dファイルの仕様が変わっています。 EFファイルとDファイル使って仕事をしてた私にはいい迷惑です。

さて、何はともあれ関連情報を見に行くと・・・あれ?

平成28年度対応版_EFファイル統合ソフト:6月下旬リリース予定

・・・ちょっと待って。私、EFファイル使って仕事してるんですけど・・・

というわけで、今回はEFファイル統合を自力でやってみようと思います。 まずは旧様式で試してみて、その後新様式に対応する予定。

事始め:そもそもEFファイルってどんなんでしたっけ?

まずはEファイル/Fファイルの項目を確認しましょう。

Eファイル

施設コード データ識別番号 退院年月日 入院年月日 データ区分 順序番号 病院点数マスタコード レセプト電算コード 解釈番号 診療行為名称 行為点数 行為薬剤料 行為材料料 円・点区分 行為回数 保険者番号 レセプト種別コード 実施年月日 レセプト科区分 診療科区分 医師コード 病棟コード 病棟区分 入外区分 施設タイプ

Fファイル

施設コード データ識別番号 退院年月日 入院年月日 データ区分 順序番号 行為明細番号 病院点数マスタコード レセプト電算コード 解釈番号 診療明細名称 使用量 基準単位 行為明細点数 行為明細薬剤料 行為明細材料料 円・点区分 出来高実績点数

さてこの二つをくっつけるとEFファイルになるわけですが、ぱっと見問題があります。 まず、実施年月日はEファイルにしかありません。おいおい。じゃあいつ何をやったかどうやって判断すんの? ということになりますが、えーと、お国の資料を読みますに・・・

どうやら、データ識別番号 入院年月日 データ区分 順序番号の4項目が、ふたつのファイルに共通していて、これをキーに合体させるようです。 具体的には、Eファイルの順序番号をキーにして、Fファイルが紐付き、順序番号の中で更に行為明細番号が割り振られます。 図にするとこんな感じ。

Eファイル         Fファイル
データ識別番号  入院年月日  データ区分 順序番号 行為明細番号
000001    2015-04-01 60 1    0
1

なーるほど。つまり二つの表を横方向にくっつけているんだな!

・・・そう思ったのが間違いで、実際そのようにコードを書いたらトンチキなファイルが出来上がります。

実際には、色々見てみますと、何てことはない。

Eファイルの行数+Fファイルの行数 = EFファイルの行数

ですので、縦方向に連結して、足りない部分は穴埋めしているわけですね。 例えば、「実施年月日」はEファイルにしかありませんので、単純に縦連結すると穴だらけになります。 そこは上手いこと穴埋めして、EFファイルが出来上がっているわけです。 (ちなみに穴埋めされていないレコードもある) では次回から、実際に結合処理をやってみましょう。

2017-04追記

この記事にアクセスされる方が多いようですので、2017年版の統合スクリプトを用意しました。

stagira.hatenablog.com