DPCデータの分析とかやるブログ

DPCデータの分析なんかをテキトーにやってます。

EFファイル/Dファイル読み込み時の注意点

文字コード

EFファイル/Dファイルともに文字コードはshift-JISになっている。

はっきり言ってやめて欲しい。SQLに読み込む前に、メモ帳か何かで開いて、エンコーディングUTF-8に変更して保存し直そう。

 

読み込み設定

pgAdminで読み込む際は、

フォーマット csv

エンコーディング UTF-8

ヘッダ あり

デリミター [tab] 

に設定して読み込む。

ちなみに、 EFファイルはEF統合ツールから吐き出すときにヘッダありで出力できるが、Dファイルは各自自分でつけないといけない。げんなり。

 一応ヘッダを用意したので利用される方はどうぞ。貼付けしたあとで、エクセルの「区切り位置」機能を使うと綺麗に分かれます。

 

id 施設番号 データ識別番号 退院年月日 入院年月日 データ区分 順序番号 点数マスタコード レセ電処理コード 解釈番号 診療行為名称 行為点数 行為薬剤料 行為材料料 円・点区分 行為回数 保険者番号 レセプト種別コード 実施年月日 レセプト科区分 診療科区分 医師コード 病棟コード 病棟区分 入外区分 施設タイプ 算定開始日 算定終了日 算定起算日 分類番号 医療機関係数

いや、ヘッダなしにして上手く読み込まれればこんなの要らないんだけど、私の環境だと毎回失敗するんだよな…なぜだ…