様式1ファイルの項目マスタをアップしました
このブログでは2回ほど様式1について扱ってきました。
が、まあ、触りだけやって特に深掘りはしていません。
今回は深掘りをするための準備作業をしてみます。
何はともあれ、あの忌々しいペイロードの詳細を見ないといけませんね。
ここに資料がありますので見てみると・・・あれ、これってPDF?
うーん、おかしいですね。
厚生労働省のサイトを頑張って探しましたが、どこにもcsvやエクセルファイルが見当たりません・・・
ここでおさらさいをすると、様式1はこんな形をしています。
様式1全体像
大項目 | 必須 | 小項目 |
---|---|---|
1.ヘッダ部 | ○ | (1) 施設コード |
1.ヘッダ部 | ○ | (2) データ識別番号 |
1.ヘッダ部 | ○ | (3) 入院年月日 |
1.ヘッダ部 | ○ | (4) 回数管理番号 |
1.ヘッダ部 | ○ | (5) 統括診療情報番号 |
2.ペイロード部 | ○ | (1) コード |
2.ペイロード部 | ○ | (2) バージョン |
2.ペイロード部 | ○ | (3) 連番 |
2.ペイロード部 | ※ | (4) ペイロード 1(日付等) |
2.ペイロード部 | ※ | (5) ペイロード 2(コード等) |
2.ペイロード部 | ※ | (6) ペイロード 3 |
2.ペイロード部 | ※ | (7) ペイロード 4 |
2.ペイロード部 | ※ | (8) ペイロード 5 |
2.ペイロード部 | ※ | (9) ペイロード 6 |
2.ペイロード部 | ※ | (10) ペイロード 7 |
2.ペイロード部 | ※ | (11) ペイロード 8 |
2.ペイロード部 | ※ | (12) ペイロード 9(可変長文字列) |
ペイロード部のコード
とペイロード1〜9の組み合わせで、何のデータが入るか決まる、という寸法です。ではどんなデータが入るのでしょうか。
ペイロード部分項目詳細
コード | ペイロー ド種別 | レコード必須 条件等 有 | 連番 | ペイ ロード番号 | 項目 必須 条件 有 | 項目名 |
---|---|---|---|---|---|---|
A000010 | 患者属性 | ○ | - | 1 | ○ | 生年月日 |
A000010 | 患者属性 | ○ | - | 2 | ○ | 性別 |
A000010 | 患者属性 | ○ | - | 3 | ○ | 患者住所地域の郵便番号 |
A000020 | 入院情報 | ○ | - | 1 | ○ | 入院年月日 |
A000020 | 入院情報 | ○ | - | 2 | ○ | 入院経路 |
A000020 | 入院情報 | ○ | - | 3 | ※A | 他院よりの紹介の有無 |
A000020 | 入院情報 | ○ | - | 4 | ※A | 自院の外来からの入院 |
A000020 | 入院情報 | ○ | - | 5 | ※A | 予定・救急医療入院 |
A000020 | 入院情報 | ○ | - | 6 | ※A | 救急車による搬送の有無 |
A000020 | 入院情報 | ○ | - | 7 | ※A | 入院前の在宅医療の有無 |
A000020 | 入院情報 | ○ | - | 8 | ※A | 自傷行為・自殺企図の有無 |
こんな感じのが、だいたい150個くらいあります。で、これを手作業でPDFから書き起こせと?
またまたご冗談を。
困ったので、PDF→Excelへの変換サービスを使い、その後手作業で整形してマスタを作りました。
こちらからダウンロード出来ます。
様式1全体像は様式1マスタ.csv
に、ペイロード詳細はペイロードマスタ.csv
に入っています。
なお、GitHubでは文字コードがUTF8でないと怒られるので、UTF8にしてあります。Excelで開くとたぶん文字化けしますので、様式1マスタ.xlsx
も用意しておきました。
あとはDBに取り込むなり、Pandasで利用するなり、好きなように使えます。
次回は実際にこのファイルを使って、様式1データとマスタを組み合わせて好きなデータを抽出してみましょう。
なお、今回の記事作成にあたってはこちらのサービスに大いに助けられました。
こんなでかいテーブルをMarkdownで手打ちするのは苦行ですので・・・ とても素晴らしいサービスです。Markdownでブログを書いている方は是非どうぞ。