歯科情報の2次利用における問題点とこれからの課題について
丸山 陽市1) 藤原 卓1) 本多 正幸2)
長崎大学病院医療情報部歯科分室1)
長崎大学病院医療情報部2)
Problems and prospects in the secondary use of electronic dental records
Maruyama Youichi1) Fujiwara Taku1) Honda Masayuki2)
Division of Dental Information, Center of Medical Information, Nagasaki University Hospital1)
Center of Medical Information, Nagasaki University Hospital2)
In general dental practice, because the dental caries and periodontal treatment are the main component of outpatient dental service, the data generated from ordering system is not sufficient for the secondary use of electronic dental records, and the dental information density is low in DWH. In this study, the evaluation of the information retrieval to the electronic dental records by the free sentence form and the evaluation of the template being used in Nagasaki university hospital dental secession were achieved, and the outline of the information retrieval keys requested as the second use for the electronic dental records were extracted from the those template by the text mining approach. The results were as follows.1. When the secondary use of the electronic dental records was done by DWH, according to the decrease of the information retrieval effectiveness in the full-text search to the electronic dental records by the free sentence form, it was difficult to obtain an accurate number of dental clinical cases matched to the information retrieval purpose.2. The template form of the electronic dental records was able to simplify of the input procedure for diagnosis and treatment records, to standardize, to be necessary for the improvement of the information retrieval effectiveness, and seven groups of the information retrieval keys were extracted from 206 templates, 71,320 words. 3. In the secondary use of the electronic dental records, using of the template method and the free text method together is a realistic solution for an effort decrease in the template making, for the information retrieval effectiveness and the degree of freedom securing of the expression and the term.
Keywords: electronic dental record system, 歯科電子カルテ, data warehouse, データウェアハウス, full-text search, 全文検索, template, テンプレート

1. 緒言
 長崎大学病院では2008年より総合病院情報システム(HIS)を稼動させている1)。本HISでは歯科システムで発生した情報を電子カルテに集約し、患者情報、オーダ情報、診療情報、部門情報、画像情報等を医科歯科間で共有している。これらの医療情報の電子化により診療支援、研究支援、経営支援としての2次利用が可能になる。しかし電子カルテの検索機能は不十分であり、2次利用による電子カルテのシステム負荷が生じるため、2次利用のためにデータウェアハウス(DWH)への保存も同時に実施している。医科におけるDWHの2次利用では、検体検査、注射、処方、病理検査、生理検査等の患者状態を示す検索キーと成り得る項目が多く存在する。一方、歯科において、一般的な歯科治療では、う蝕や歯周病治療等の外来診療が主体であるためにオーダ種類が少なく、DWHでは口腔内状態を示す情報密度が低い。歯科には口腔内状態を示す歯周組織検査、プラークスコア等があり、これらをDWHで2次利用できればいいのだが、現状ではまだ実現できていない。実現できても情報密度は不十分であるため、歯科情報の2次利用として口腔内状態を検索するにはどうしても診療記録として自由文形式やテンプレート形式で口腔内状態や処置の詳細記録を保存する必要が生じる。本院歯科では、DWHで検索キーとして使用する可能性のある重要イベントでの記録はテンプレート形式で行うように、全診療科でテンプレート作成を行った。現行HISが稼動して3年経過し、次期システムで2次利用を考慮したシステムを構築する場合、ユーザは日常臨床や研究のためにどのような診療記録のデータを2次利用したいと思っているのかを評価する必要性が生じている。
 本研究では、自由文形式で入力した診察記録に対する検索の評価と、現在使用しているテンプレートの評価を行い、診療記録の2次利用として求められている検索キー抽出について、その概略を報告する。
2. 方法

2.1 総合病院情報システムの概要
 本HISは医科系ベンダーと歯科系ベンダーのマルチベンダーで構築し、クライアント・サーバ型電子カルテ(MegaOak HR, NEC)を基幹システムとしている。サーバベースコンピューティング型歯科システム(MEDIA Inc.)は病名・歯科処置オーダのフロントエンドとして使用し、歯科システムで発生した歯科情報は電子カルテへ送信する事で、電子カルテ上で他の情報との集約を行う2) 3)。診療記録入力のテンプレートは電子カルテの動的テンプレートで作成した。

2.2 自由文形式の診療記録に対する情報検索
 自由文形式入力による診療記録に対する表記揺れを確認するために、一例として矯正用インプラントに関する診療記録の検索をDWHで行った。検索キーは以下の第1キーワードと第2キーワードの複合語である“第1キーワード+第2キーワード”または“第2キーワード+第1キーワード”と定義し、2008年6月から2010年5月までの診療記録について、定義した検索キーによる全文検索を行った。
1) 第1キーワード
矯正用、アンカー、スクリュー、インプラント、プレート、screw、plate、SMAP、SAS、TAD
2) 第2キーワード
アンカー、スクリュー、インプラント、プレート

2.3 テンプレートデータの評価方法
 歯科で作成したテンプレート数は歯科全診療科で重複したものも含めて206存在する。全テンプレートは電子カルテから抽出してテキストデータに変換し、HTMLマーキングによる階層化を行った(図1)。<h1>...</h1>は診療科名称、<h2>...</h2>はテンプレート名称、<h3>...</h3>から<h5>...</h5>はテンプレート内容とした。テキストデータ解析はテキストマイニング手法で行い、全データを品詞別に分離した。解析対象はh2からh5までの名詞とし、語句の出現頻度や意味的な結びつきによる共起ネットワークを作成した。
3. 結果

3.1 自由文形式の診療記録に対する検索結果
 矯正用インプラントに関する検索キーが第1キーワードと第2キーワードの複合語で19種類確認でき、症例間だけでなく1症例内にも表記揺れが存在した(表1)。

3.2 テンプレートデータの評価について
 テンプレートデータからの総抽出語数は71,320であった。テンプレートから抽出した名詞は、共起ネットワークにより以下の7つのグループが認められた(図2)。
1) 初診時の全身疾患に対する問診項目
  疾患名、高血圧、心疾患、糖尿病、アレルギー、喘息、脳、妊娠
2) 初診時の歯の状態
  健全歯、萌出歯、レジン充填、インレー、歯冠修復、ポンティック
3) 顎関節症
  顎関節、関節、雑音、開口量、疼痛、咀嚼
4) 顎変形症
  下顎、前方、顎、両側、頭
5) 口腔ケア
  歯、舌、歯肉、ブラシ、歯ブラシ、ブラッシング、ケア、方法、義歯、指導
6) 摂食・嚥下リハビリテーション
  嚥下、唾液、自立、栄養、機能、摂取、飲水、中等、ギャッチアップ、座、酸素、めまい、体動、嘔
7) 唇顎口蓋裂
  口唇、口蓋、裂、鼻
4. 考察
 診療記録の入力には非構造化データの自由文形式と構造化データのテンプレート形式がある。自由文形式入力では診療内容・語句の表記に個人差が影響した結果、矯正用インプラントという1つの項目を抽出するのに19種類の検索キーが存在していた。19種類の検索キー以外にも他の語句が存在している可能性がある。可能性のあるすべての検索キーを決定するのは困難であり、不十分な検索キーや症例内での表記揺れでDWHでの検索精度低下が生じることになる。非構造化のテキストデータについて、事前にテキストマイニングツールで関連する検索キーをすべて抽出してDWHと連係させるのは日常臨床や研究においての2次利用としては煩雑になると思われ、DWHでシソーラス検索や、あいまい検索機能が必要になると思われる。一方、テンプレート方式は入力項目を予め定めて、各項目の選択肢もラジオボタンやプルダウンメニューで表示する機能であるため、入力作業の簡素化が実現でき、入力項目に漏れがなく標準化された診療記録の作成が可能となる。しかし、ほとんどの入力をテンプレートで行う場合、表記の自由度が低いために数多くのテンプレートを事前に作成しておかなければならず、歯科領域に対する標準的なテンプレートは存在しないため独自に作成することになり、多くの労力が必要となる。これらの問題点を解決するには、すべての診療記録を非構造化データの自由文形式で入力するのではなく、2次利用を行うと判断した問診、診断や治療方針の決定等の重要イベントに対してテンプレート方式で入力を行う、自由文方式とテンプレート方式の選択的併用が本HISにおける現実的な解決法であると思われる。
 現在のテンプレート数は206であるが、複数の診療科で同一のものを使用しているような必要度の高いテンプレートやほとんど使用しないものもある。最適なテンプレート数は不明であるが、多くの診療科で類似したものが多数存在すれば、類義語の増加により自由文形式と同様な表記揺れが出現して、検索精度の低下が生じる可能性がある。出現頻度の高い類似したテンプレートは歯科全体として2次利用の対象として重要性が高いと考えると、検索精度を確保するために、ある程度のテンプレートの集約は必要になると思われる。
 今回のテンプレート解析では7つのグループに対して2次利用を行いたいと望んでいることが判明した。歯の状態、全身と歯科疾患の関係、顎口腔機能異常である顎関節症、チームアプローチが求められる顎変形症や唇顎口蓋裂、病棟との連携で行う摂食嚥下リハビリテーション、舌や歯、歯周組織の管理を含んだ口腔ケアである。これらに対するデータ入力機能について、どれを歯科システムに実装し、どれをテンプレートで対応するのかはこれからの課題である。今回の2次利用対象は診療記録に限定したが、歯科で重要な検索キーとなる項目は他にも多く存在する。歯周組織の状態、歯列不正や咬合状態などの基本情報の2次利用についても、これから検討していかなければならない。
5. 結論
1.DWHによる電子カルテの2次利用を行う場合、自由文形式の入力が行われた診療記録に対して全文検索を行うと、表記や用語の揺れにより検索精度は低くなり、正確な症例数を得るのは困難であった。
2.テンプレート形式は診療記録入力の簡素化と標準化、情報検索の精度向上に必要であり、206のテンプレートから7つのグループを抽出できた。
3.テンプレート作成の作業量減少、表記や語句の精度確保と自由度確保のためには、テンプレート方式とフリーテキスト方式の併用が現実的な解決法である。
参考文献
[1]丸山陽市、藤原 卓.:シンポジウム「歯科において病院情報システムはどのように貢献できるか」医科歯科統合システムにおけるマルチベンダーによる歯科電子カルテの構築. 医療情報学 28(Suppl.):171-172, 2008.
[2]丸山陽市、松本武浩、海老原隆善、藤原 卓、本多正幸.:クライアント・サーバ型電子カルテとサーバベースコンピューティング型歯科システムの連携についての評価. 医療情報学 30(Suppl.):1116-1119, 2010.
[3]丸山陽市,本多正幸.:医科・歯科統合電子カルテシステム構築で解決すべき歯科の基本要件. 新医療 38:122-126, 2011.

図1 HTMLマーキングによるテキストデータの階層化:
表1 矯正用インプラントの記載がある症例の検索数:検索キーとなる複合語は”第1キーワード+第2キーワード”または”第2キーワード+第1キーワード”と定義した。
図2 テンプレートから抽出した名詞に対する共起ネットワーク: