DPCデータの分析とかやるブログ

DPCデータの分析なんかをテキトーにやってます。

pandasで移動平均を出してみる

お久しぶりです。 ブログはサボってましたが、仕事はサボれず、色々やっていました。 現在、時系列データに取り組んでいますが、全く経験がないので四苦八苦してます。 単に推移を見るだけならプロットすればオシマイですが、突発的な変動は無視して、傾向を…

scikit-learn 勉強ノート(2)

前回から大分間が空きましたが、scikit-learnの勉強メモです。 おさらいすると、サンプルとしてIrisデータセットを使い、アヤメの品種を分類していたのでした。 データセットは、がく片や花びらの長さが記録されたXと正解ラベルが記載されたyに分かれていま…

[読書] 「達人に学ぶDB設計」「The Hitchhiker's Guide to Python」

特にネタもないので、最近読んだ本の話でも。 達人に学ぶDB設計 達人に学ぶDB設計 徹底指南書作者: ミック出版社/メーカー: 翔泳社発売日: 2013/08/07メディア: Kindle版この商品を含むブログ (4件) を見る SQL解説本でご存じ、ミック先生のDB設計本です。 …

ICD→MDC6の変換表を作成する

色々あって、ICD10→DPCの頭6桁の変換を行う必要に迫られました。 とはいえ、電子点数表がありますから、楽勝でしょう。 そう思ってデータを見ると…ん…あれ…? I20$ → 050050 とかありますね。 困りました。実データは、I209とかなのです。これを050050に変…

EF/Dファイルのテーブル定義について

今更ですが、EFファイル/DファイルをDBに読み込む際のテーブル定義について、少し見直しをしていました。 今まで、「主キーとすべき項目が見当たらない」という理由で、id列を連番で振っていましたが、冷静になってみると複合主キー使えばいいんですね… Pos…

「病床の機能別分類」を境界点に従って区分する

いきなり何のこと? 病床の機能別分類は、国が(かなりいい加減に使っていた)高度急性期・急性期・回復期・慢性期の定義付けです。 ちゃんとした数字で指標を作らないと、統計も取れませんからね。 紹介記事はこちらを参考にしてください。 該当記事によれ…

DPCチェッカーの32bit版を公開…してみるが…

例によってこちらからどうぞ。 が、残念ながら既知の問題があります。 ある大きさ以上のファイルを読み込もうとすると、メモリ不足で落ちるようです。 (実際、検証したらエラーを吐きました) 32bit版WIndowsで、メモリ4GB(うちOSが3GB使用)で落ちたので…

scikit-learn 勉強ノート(1)

まえがきと目標 scikit-learnは最も有名なPythonの機械学習ライブラリです。 私も去年、「そろそろ機械学習をやるぞ!」と思い立って公式サイトを覗き、早々に諦めた覚えがあります。 だって恐ろしい数式が乱舞してますし、そもそも何を説明しているのかも分…

エクセルは事務職の生産性を本当に上げたのか?

事務職の生産性を上げるために えー、歴史を鑑みると、近代というのは機械化の時代です。 人間は逆立ちしてもトラクターには勝てませんし、馬ではトラックと競争出来ません。 事務職にとってコンピュータは、運送業におけるトラックと同じくらい大きな意味が…

ヒートマップで相関係数を可視化する

以前、相関係数について、ざっくりした記事を書きました。 stagira.hatenablog.com おさらいですが、相関係数は-1から+1の間を取る指標で、±0.7以上なら強い相関があると認められます。 マイナスなら負の相関、プラスなら正の相関ですね。 さて。以前の記事…

EFファイルを自力で統合する(2017年版)

EFファイルの統合は、EファイルとFファイルを縦方向に連結し、穴埋めをすることで可能です。色々な方法が考えられますが、Pandasでの実装が最も容易です。便利なメソッドにおんぶにだっこで、手っ取り早くEF統合をやってみましょう。

さいきん読んだ本など

あるごりずむ 特にネタがないので(おい)、今日は最近読んだ本の話でも。 私はどんな問題も 楽ができる機能がないか探す 楽ができるライブラリを探す StackOverFlowで答えを探す という方法で解決するゆとりコーダーです。はい、あまりプログラムは出来ませ…

Electronアプリ DPCチェッカー0.2を公開

えー、前回のリリースから一ヶ月以上サボってましたが、0.2が出来ましたので公開します。 例によってこちらからどうぞ。 変更点 Python版にあったダッシュボード機能を移植しました。 今回こんなに時間がかかったのは、方向性を決めあぐねて、色々フレームワ…

Pandasでささっと前年度比較

毎月レセプトが終わると、前年同月比較をやることが多いです。 まあ、手術がガクンと落ちたり上がったり、どうしても波があるからです。 今回は、EFからささっとデータを取ってくる方法を考えてみました。 わかりやすく、今年のデータはdf17、去年のデータは…

EFファイル統合スクリプトをアップしました

DPCデータのEFファイル統合スクリプトを作成しました。EファイルとFファイルの統合ツールとして、PRISMのEF統合ツールが公開されていますが、2017年度版は6月まで公開されません。 つなぎのためのスクリプトです。

Bokehで動的なグラフを描画する

Pythonのグラフ描画ライブラリ、Bokehの基本をおさらいします。 matplotlibと違い、HTMLとJavaScriptを出力するのでWebアプリとの親和性が高いです。 二つのグラフを同期して動かす、といったことも可能です。

DPC入院料を月別/科別に可視化する

DPC入院料を、月別/科別に集計して可視化します。Pandasのプロット機能と、seabornを使っています。

なんでPythonでGUIアプリを書かないの?

さて、前回はElectronを使ってでっち上げたアプリケーションを公開しました。 ElectronはJavaScriptベースのライブラリです。私が普段使っているのはPythonで、JavaScriptはロクに分かっていません。 が、いざデスクトップアプリを書く段になって、選択した…

DPCチェッカーElectron版を公開

今回はこちらです。 ZIPをダウンロードして解凍して、dpc.exeを叩いて下さい。ブラウザではなく、ちゃんとアプリケーションが走る筈です。 何だか一ヶ月ほど前に、「Windows版を作りました!」と自慢げにエントリ書いてますが、ええと、忘れて下さい。 前回…

「Electronではじめるアプリ開発 ~JavaScript/HTML/CSSでデスクトップアプリを作ろう」読んでます

年明けに「Webが全てにやってくるぞ!」と書いておきながら、何もしてなかったので本を買いました… というのは冗談で、ずっとNode.jsいじってました。で、Electronでアプリ化するにあたり、適当にブログやStackOverflowの記事なんか読みつつ書いてたんですが…

様式1データを扱いやすい形に変形する

DPCの様式1データは、そのままでは大変扱いづらいです。今回は、様式1データをスクリプトで扱いやすい形に整形してみます。

様式1のペイロード項目詳細を扱いやすい形に変換する

DPC様式1データを扱うためには、まずペイロード項目情報が必要です。 残念ながら、そのままでは扱いづらい形のデータなので、Python向けに加工します。

様式1ファイルの項目マスタをアップしました

DPCデータ提出で使われる、様式1ファイルのペイロード項目マスタをGitHubで公開しています。完全な情報は厚生労働省のサイトに公開されていますが、残念ながらPDFでした。データ分析に利用できるよう、csvとxlsxで公開しています。

Postgres用SQLクエリまとめに追加をしました

このブログでは今まで色々なSQLクエリを紹介してきましたが、殆どがPostgreSQL用でした。 SQLite向けのクエリはDPCチェッカーに突っ込んでいますが、Postgres用のクエリはどこにもまとまっていません。 流石に不味い、ということでこちらに随時アップロード…

DPCチェッカー 0.13 Windowsアプリケーション版を配布開始

DPCデータの簡易分析ツール、DPCチェッカーのWindows版を公開しました。算定チェックや簡単な可視化をやっています。

Scalaでcsvをいじってみました

Scalaを使ってCSVデータをいじってみます。使用する外部ライブラリはopencsvのみ。

EFファイル/DファイルをPowershellで扱う

PowerShellでEFファイルやDファイルを扱ってみます。Import-Ccvコマンドを使えば、単純な置換作業はとても簡単になります。

PostgreSQL用のクエリをまとめてます(進行形)

このブログではずっとPostgreSQL用にクエリを書き連ねて来ましたが、そろそろいい数になりましたのでGitHubに上げることにしました。 こちらです。 まだ数は多くありませんが、これから順次増やしていく予定です。 また、よくよく考えるとPostgresの環境構築…

SQLiteと日付型データについて

SQL

SQLiteは素晴らしいツールです。 単体exeで走り、かつデータベースは一つのファイルに纏まるので、DBをUSBに入れて、実行環境ごと持ち運ぶことが出来ます。 パブリックドメインなので、好きなように使って大丈夫です。Accessと違って、DBのサイズ制限も無い…

DPCチェッカー 0.12 ダッシュボード機能を書き直し

DPCチェッカーは、SQLとPandasを用いたDPCデータの簡易分析ツールです。ver 0.12にアップデートしました。