医療BI奮戦記 Part3

こんにちは。Keepdata BI担当のピーです。

前回、医療BI奮戦記Part2では、医療データ可視化プロジェクトで時系列のグラフ表現で実際の時間軸に沿ったスケールをどう表現するかを一般のBIツールとKeeoData Hubで実現する方法をご紹介しました。

 

それぞれで実現でき、ほっと一安心したのも束の間、個人的に敬拝する医師から新たな課題が提示されました。

 

医師:ところで、検査結果や問診結果を沢山表示すると軸表示や単位がたくさん表示されてしまって、見ずらいのですが何とかならないでしょうか。

 

検査結果や問診結果のデータには、沢山の項目が存在します。血液検査でいうと、よく知られている赤血球や白血球の数から、腎機能を検査する際に有用なクレアチニン、細胞組織破壊の際に測定されるC-反応性蛋白(CRP)や赤血球沈殿速度のESRまで、様々な内容、様々な単位が存在します。加えて、リウマチの問診データには、全身28か所の関節のなかから腫れのある関節数や痛みのある関節数、医師の全般評価(VAS)とそれらを掛け合わせた指標(SDAI/CDAI)などがあります。

 

血液検査データは小数値が多く、リウマチ問診のデータは、10~20台の整数値が多いようです。ただしESRなどはmmで表すため、大きめの整数値になる場合があります。

 

軸が多数出てしまう場合の例を見てみましょう。

f:id:tkoyamax:20180621132640p:plain

       <軸が複数表示される例:画面はKeepData Hubで再現>

画面サイズが大きい場合はまだ良いのですが、表示するサイズが小さく、軸がもっと

多い場合は、軸だけの画面になってしまう場合もあります。

 

      f:id:tkoyamax:20180621133240p:plain

      <軸が複数表示される例、サイズが小さい場合>

 

もう一つ問題があります。軸がバラバラなので、ぐしゃっと重なってしまい、傾向がうまく読み取れません。例えば近いスケールの数値で、どちらが大きいかが重要である数値の場合でも、軸が揃っていないことにより、逆転してしまう場合もあります。

分かりやすい例を挙げるとすると、例えば午前の体温と、午後の体温を取ったとして、一見午後に熱が下がったように見えたとしても、そもそもスケールの違いにより逆転しているだけだった場合、判断を誤ってしまいます。

 

BIツールやExcelでは、この問題に対し、軸を一つに集約するという解決方法を持っています。

 

f:id:tkoyamax:20180621152329p:plain

         <軸を一つに集約した場合:Excelで再現>

さくっと設定し、早速医師へのお披露目です。

私:スケールは統一されたので、値の位置が逆転するなどという問題はなくなりましたね。

医師:そうですね。でも、ちょっと待ってください、CRP量や、DAS28CRPなど小さい値の折れ線が下の方に張り付いてしまって、傾向が全く読み取れません。これはどうしたものでしょう。

 

そうです。確かにこれまで、スケールを一緒にした場合、販売数量と販売金額が上下に張り付いてしまって、数量など全く読めないなどという経験がありました。

 

困りました。困ったあげく取った方法は、国産のBIツールにある重ね合わせの機能を使う事でした。数値を大きいスケールと小さいスケールのグループに分け、 それぞれ軸の集約をかけたグラフを二つ作り、グラフ重ね合わせの機能で統合してみました。

    f:id:tkoyamax:20180621154353p:plain

  <グラフを二つ作成し重ね合わせた図:当画面はExcel透過機能で再現>

 やってみてわかったのですが、 数値スケールを大きいグループと小さいグループに分ける事が難しく、煩雑な作業でした。上下に行ったり来たりの値もありますし、中間の値が出てくる数値はどちらにすべきか正直迷います。

結局のところ、軸を振り分けてもグラフの値は混ざるため、やっぱり分かりにくいという印象です。当初の課題に戻ったような既視感を感じます。

 

当時はここまでであきらめるしかありませんでした。

翻って現在ですが、Keepdata開発者jkimuraさんに相談したところ、早速以下の図のような解決案を提示いただきました。

f:id:tkoyamax:20180621180301p:plain   <傾向を綺麗に表現した画面:KeepData Hub 医療ソリューション画面>

グラフが重なることなく、傾向を読み取れることが分かります。 なぜでしょう?

 

              f:id:tkoyamax:20180621181644p:plain

 秘密は軸にありました。傾向を出すために最も効果的な軸の幅を計算し、幅を小さくしたり、大きくしたりしています。上の図を見ると、10と4の間が広く、20と40の間が狭い事がわかります。

  これには長年BIを見てきた私も感動を隠しきれませんでした。素直に素晴らしいと思います。

 

 ここまで、来たらもう課題はないと思われるかもしれませんが、最難関があります。

積み上げ棒グラフと折れ線のコンボです。当時の状況では、集計結果の結合機能を使いながらだったので、余計に難しい課題でした。

 

長くなりましたので、続きは次回とさせていただきます。

 

<まとめ>

複数軸のある折れ線チャートで傾向を読み取れる効果的な手段は?

 

・ BIツールの軸を集約する機能を使う。→上下に折れ線が張り付く場合があり、見ずらいです。

・ 複数軸そのまま、もしくは軸をグルーピングする。→数値の逆転が発生する場合があり、誤解を招く場合があります。

・軸の幅を自動調節して傾向を強調する機能を使う。→そのような機能を持つBIは稀と思われます。KeepData Hub医療ソリューションを使いましょう。(宣伝が入り、申し訳ありません。)