新型コロナウイルス感染症特設サイトはこちら
ニュース

医療データの性質を考える-整理されていないビッグデータは莫大な情報のゴミとなりかねない

医療データの性質を考える-整理されていないビッグデータは莫大な情報のゴミとなりかねない
濱村 進 さん

衆議院議員 公明党ICT社会推進本部事務局次長、新産業委員会委員長

濱村 進 さん

超高齢社会の到来を目前に控え、現在日本では医療ビッグデータの利活用のための基盤づくりが進められています。医療ビッグデータとは、レセプトデータや特定健診データなど、医療や介護、あるいは健康に関する情報を集積した大規模データのことを指します。しかし、医療ビッグデータが内包するものについては知っていても、これらのデータを性質ごとに整理するという視点をお持ちの方は多くはないでしょう。公明党ICT(情報通信技術)社会推進本部新産業委員会の委員長を務める濱村進先生は、性質ごとに整理されていない漠然としたビッグデータは「莫大な情報のゴミ」になりかねないとおっしゃいます。医療や介護に関するデータの性質を明確化する意義について、濱村先生にお話しいただきました。

現在、わが国では厚生労働省が中心となり、レセプトデータや電子カルテデータなどに蓄積された医療・介護分野に関するデータ(以下、医療データ)を収集・蓄積し、利活用するための法整備が進められています。

しかし、「医療データには一体どのような性質のものがあるのか」という問いに対し、具体的に回答できる方はそう多くはないように思われます。

医療データを利活用する方法や、それにより得られる効果についても、同様のことがいえます。

どれだけ膨大な量の情報を集めたとしても、その種類や性質が明確に整理されていなければ、データは有効に利活用できない莫大な情報のゴミとなってしまいます。

貴重なデータをゴミではなく有用なものとするために、医療データを性質ごとに整理し、全体構想を提示することは、我々立法府の使命といえます。

以下に掲げる表は、平成29年2月に内閣官房の健康・医療戦略室により提示された「ICT・AI等を活用した医療・介護のパラダイムシフト(工程表)」です。

ICT・AI等を活用した医療・介護のパラダイムシフト 出典:「医療分野の研究開発に資するための匿名加工医療情報に関する法律案について」 内閣官房健康・医療戦略室 資料提供:濱村進先生

この工程表は、平成28年11月の第2回未来投資会議において厚生労働省が提示した工程表に、新たに「認定匿名加工医療情報作成事業者の実現」という項目を追加したものです。(※緑色で囲われたエリアの中段)

「認定匿名加工医療情報作成事業者の実現」については、もともと厚生労働省が示した工程表にはなかったことから、内閣官房の健康・医療戦略室が所轄する次世代医療ICT基盤法により行うものであると認識しています。

では、次世代医療ICT基盤法に基づき収集し、利活用する医療データとは、どのような性質のものを指すのでしょうか。私は、医療データとは4つの性質に分けられると考えています。

次項以降では、本工程表を参照しつつ、それぞれのデータの性質について解説していきます。

赤色で囲われた「AIを用いた診療支援」は、今後議論が進められていく分野であると考えます。表中にも、2018年を目処に最新のエビデンスや診療データをAI(人工知能)で分析し、最適な診療を受けられるような仕組み開発し実装化すると記されているように、現在は検討整理の段階にあります。そのため、AIを用いた診療支援を行う目的で収集する医療データとは、将来の利活用のために先を見据えて収集するデータと定義づけられます。

では、AIなどのテクノロジーを診療現場で実際に活用するためには、どのような議論が必要なのでしょうか。

胸部X線検査の画像

AIを用いた診療支援を実現するために蓄積すべきデータの中でも、私が最も重視しているものは放射線画像などの画像データです。

厚生労働省では、平成28年度から日本医療研究開発機構を通じて、放射線画像などの医療画像を集める事業を実施しています。

AIを用いた精度の高い画像診断(X線、CT、MRIなどの画像による病気の発見や早期診断)は、ディープラーニングと呼ばれる技術の革新により、早期に実用化できるものと期待されています。

現在は、画像診断を実現するために有用な画像データとは一体どのようなものか、また、その画像データをどのような方法で収集・蓄積していくかを議論することが重要です。

したがって、AIを用いた診療支援に関しては、今年度は論点整理にとどまるものと思われます。

一方で、既に議論が重ねられてきた分野もあります。それが、工程表中では青色で囲まれている「医療等ID」と「医療連携ネットワーク」です。

医療等IDとは、医療や介護などの分野で使用される番号のことであり、現時点では(1)マイナンバーを使用するのか、それとも(2)マイナンバーとは異なる番号(Key-ID)を新たに生成するのか、専門家間でも意見がわかれています。

いずれにしても、患者一人ひとりを識別するための全国共通のIDができることで、国民の健康管理や医療事故の防止といったメリットが得られるものと期待しています。

医療等IDと医療連携ネットワークの整備が実現すれば、患者が医療圏を超えて転居をした際、新たに受診する医療機関に、カルテ情報などの医療データが正確に共有されます。

既にこういった医療情報連携ネットワークを県単位で運営している自治体もありますが、今回の構想は、連携を全国規模で行おうというものです。

医療連携ネットワークにより共有されることが想定される患者の医療データとは、疾患名、処方されている薬剤名、検査データなどです。

医療機関を受診している患者さんのなかには、ご自身の処方されている薬剤名を曖昧にしか覚えておらず、新規に受診する医療機関に自己の情報を正確に伝えられないという方もおられます。また、持病を隠したいという思いから、意図的に診断されている疾患名や薬剤名を伏せてしまう患者さんもおられます。これが、結果として医療事故に繋がってしまうことがあります。

医師と患者の会話

医療連携ネットワークと医療等IDの導入が実現することにより、上述のような医療事故の防止や、診療現場においてより的確なアドバイスがなされるようになることが見込まれます。したがって、青色で囲まれたエリアは、本格稼働後すぐに国民の健康に還元できる性質を持ったデータについて述べている部分といえます。

続いて表中の緑のエリア、「公的データベースの整備・連結」という部分について整理しましょう。

レセプト情報・特定健診等情報ナショナルデータベース(以下、NDB)とは、「高齢者の医療の確保に関する法律」に基づき、レセプト情報や特定健診・特定保健指導情報を収集し、格納しているデータベースです。

青色で囲われた医療等IDと医療連携ネットワークは、診療現場で役立ち、即時的に国民に利益をもたらすものと述べましたが、緑色のエリアは巡り巡って最終的に国民の健康に寄与することが見込まれる、医療分野の研究開発に資する性質を持ったデータです。

たとえば、学術研究や創薬、医療機器の開発のためにNDBを活用することで、医療の周辺産業を育てることができます。

ただし、保険診療で行われる診療行為の大部分をカバーするNDBにも、不足しているデータがあります。たとえば、検査など診療行為の内容はわかったとしても、予後の経過まではわかりません。

また、診療行為を受けた後、患者さんの予後が改善したのか悪化したのかといった情報も、現時点ではどこにも蓄積されていません。

今後は、患者さんが医療機関から離れた後の詳細な状態をデータ化し、収集することも必要になるでしょう。

次の記事『医療ビッグデータは4つの性質に分けられる-医療従事者に賢くデータを利用してほしい』では、医療分野の研究開発に資する性質のデータとして区分されるエリアに新たに設けられた「認定匿名加工医療情報作製事業者の実現」について、詳しくお話しします。