DPCデータの分析とかやるブログ

DPCデータの分析なんかをテキトーにやってます。

様式1ファイルの項目マスタをアップしました

このブログでは2回ほど様式1について扱ってきました。
が、まあ、触りだけやって特に深掘りはしていません。

stagira.hatenablog.com

今回は深掘りをするための準備作業をしてみます。
何はともあれ、あの忌々しいペイロードの詳細を見ないといけませんね。
ここに資料がありますので見てみると・・・あれ、これってPDF?
うーん、おかしいですね。
厚生労働省のサイトを頑張って探しましたが、どこにもcsvやエクセルファイルが見当たりません・・・

ここでおさらさいをすると、様式1はこんな形をしています。

様式1全体像

大項目 必須 小項目
1.ヘッダ部 (1) 施設コード
1.ヘッダ部 (2) データ識別番号
1.ヘッダ部 (3) 入院年月日
1.ヘッダ部 (4) 回数管理番号
1.ヘッダ部 (5) 統括診療情報番号
2.ペイロード (1) コード
2.ペイロード (2) バージョン
2.ペイロード (3) 連番
2.ペイロード (4) ペイロード 1(日付等)
2.ペイロード (5) ペイロード 2(コード等)
2.ペイロード (6) ペイロード 3
2.ペイロード (7) ペイロード 4
2.ペイロード (8) ペイロード 5
2.ペイロード (9) ペイロード 6
2.ペイロード (10) ペイロード 7
2.ペイロード (11) ペイロード 8
2.ペイロード (12) ペイロード 9(可変長文字列)

ペイロード部のコードペイロード1〜9の組み合わせで、何のデータが入るか決まる、という寸法です。ではどんなデータが入るのでしょうか。

ペイロード部分項目詳細

コード ペイロー ド種別 レコード必須 条件等 有 連番 ペイ ロード番号 項目 必須 条件 有 項目名
A000010 患者属性 - 1 生年月日
A000010 患者属性 - 2 性別
A000010 患者属性 - 3 患者住所地域の郵便番号
A000020 入院情報 - 1 入院年月日
A000020 入院情報 - 2 入院経路
A000020 入院情報 - 3 ※A 他院よりの紹介の有無
A000020 入院情報 - 4 ※A 自院の外来からの入院
A000020 入院情報 - 5 ※A 予定・救急医療入院
A000020 入院情報 - 6 ※A 救急車による搬送の有無
A000020 入院情報 - 7 ※A 入院前の在宅医療の有無
A000020 入院情報 - 8 ※A 自傷行為・自殺企図の有無

こんな感じのが、だいたい150個くらいあります。で、これを手作業でPDFから書き起こせと?
またまたご冗談を。
困ったので、PDF→Excelへの変換サービスを使い、その後手作業で整形してマスタを作りました。 こちらからダウンロード出来ます。 様式1全体像は様式1マスタ.csvに、ペイロード詳細はペイロードマスタ.csvに入っています。
なお、GitHubでは文字コードがUTF8でないと怒られるので、UTF8にしてあります。Excelで開くとたぶん文字化けしますので、様式1マスタ.xlsxも用意しておきました。
あとはDBに取り込むなり、Pandasで利用するなり、好きなように使えます。
次回は実際にこのファイルを使って、様式1データとマスタを組み合わせて好きなデータを抽出してみましょう。


なお、今回の記事作成にあたってはこちらのサービスに大いに助けられました。

www.tablesgenerator.com

こんなでかいテーブルをMarkdownで手打ちするのは苦行ですので・・・ とても素晴らしいサービスです。Markdownでブログを書いている方は是非どうぞ。