【医療DX最前線 第2弾】医療現場の「言った言わない」を防げるか?AI音声認識が小児外科にもたらす変革【佐伯医師 × mocoVoice】
〜広島大学病院 小児外科 佐伯 勇 医師 × mocoVoice 医療モデル 対談レポート〜

mocomoco株式会社(本社:東京都港区六本木、代表取締役:田中 康紀)は、広島大学病院 小児外科 講師/臨床准教授の佐伯 勇(さえき・いさむ)医師と、当社が提供する音声認識AI「mocoVoice(モコボイス)医療モデル」の研究開発担当である、取締役CRO 大西 一誉(おおにし・かずよ)による対談インタビュー記事を公開しました。
本インタビュー記事は、mocoVoiceによる自動文字起こし結果をもとに編集されたもので、AI音声認識が医療現場にもたらす変化や、インフォームド・コンセントにおける「言った/言わない」のリスク低減の可能性について掘り下げています。
▼インタビュー記事全文はこちらからご覧いただけます!
医療現場の「言った言わない」を防げるか? AI音声認識が小児外科の最前線にもたらす変革
<診療は進化しても、「記録」と「言った言わない」の課題は残る>
医療現場では、日々の診療だけでなく、カンファレンスや外来診察、インフォームド・コンセント(IC)など、後から正確に振り返ることが求められる場面が数多く存在します。
一方で、医療スタッフの時間は限られており、電子カルテに説明内容を入力する作業は、「診療と同じくらい負担が大きい」という声も少なくありません。中でも、インフォームド・コンセント(IC)の場面では、患者や家族への説明が「本当に伝わっていたのか」が後から問題になるいわゆる「言った・言わない」問題が、大きな懸念となっています。
こうした背景から、「診療の様子や説明内容を、そのままの形で残したい」というニーズが高まり、AI音声認識への期待が急速に高まっています。
<本インタビュー登壇者紹介>
今回のインタビューでは、「小児外科医としての現場視点」と「AI研究者としての視点」が交差しながら、医療モデルAIの共同開発の裏側が語られました。

佐伯 勇 医師は、2020年より広島大学病院 小児外科 講師/臨床准教授を務める小児外科医。
日本外科学会および日本小児外科学会の指導医資格を持つほか、臨床・教育・研究の各分野で活躍しています。
また、医学生の教育にも力を入れており、「問診」や「診察」の技術を体系的にトレーニングする教育プログラムの研究を進めています。

mocomoco株式会社 取締役CROの大西 一誉は、舞鶴工業高等専門学校・同専攻科を修了後、奈良先端科学技術大学院大学(NAIST)で工学修士号を取得。
現在は理化学研究所にて対話型AIの研究に従事しながら、ユーザー視点に立ったプロダクトの研究開発をリードしています。
<修正時間は「5時間 → 1時間未満」に>
佐伯医師は当初、市販の一般向けAI文字起こしサービスを利用していましたが、医療用語の誤認識が多く、1ページあたり10箇所以上の修正が必要な状況でした。mocoVoice 医療モデルと共同で、2時間以上の診療音声を用いた学習とチューニングを約20回繰り返した結果、文字起こしの精度は大きく改善しました。
・1ページあたりの修正箇所:10箇所以上 → 1〜2箇所、場合によってはゼロ
・2時間の録音の修正にかかる時間:約5時間 → 1時間未満
佐伯医師は、「このままでは身が持たないと思っていた修正作業が、
ようやく現実的に続けられるレベルになった」と語っています。
<「大泉門」も「うんち」も、医療現場では欠かせない言葉>
今回の共同開発では、小児外科ならではの語彙にも着目しました。赤ちゃんの頭にある柔らかい部分を指す「大泉門(だいせんもん)」や、新生児の状態を評価する「アプガースコア」といった専門用語に加え、「うんち」「おしっこ」など、一般的なAIサービスでは伏字にされがちな言葉も診察では重要な情報です。
mocoVoice 医療モデルでは、医療用途に限って、こうした語彙も含めて正確に認識・表示できるようチューニングを行っています。
<インフォームド・コンセントとAIの“解釈しない設計”>
診療の中でも、治療内容を説明し同意を得るインフォームド・コンセント(IC)は、「言った・言わない」が絶対にあってはならない重要なプロセスです。
本対談では、患者が実際に発した言葉をAIがどう扱うべきか、「吐いた」を「嘔吐」と書き換えてよいのか、といった具体的な論点も議論しました。インフォームド・コンセント(IC)におけるAIの役割や、「医療AIには、あえて解釈しない設計が必要ではないか」という問題提起を含む詳細な内容は、インタビュー全文にてご覧いただけます。
<mocoVoiceについて>
「mocoVoice」は、企業から寄せられた現場の声に応える形で誕生した、オールインワンAI音声認識サービスです。議事録作成も話者分離もこれひとつで対応可能です。
-
高い正確性と処理速度:
大規模言語モデル(LLM)との組み合わせと独自アルゴリズムにより、精度90%以上(※当社調べ)と1時間の音声を最速3分で書き起こす高速処理を両立。
-
文脈を加味した校正機能:
書き起こした文章の誤字脱字を文脈を踏まえて修正し、正確なテキストに仕上げます。
-
用語の辞書登録機能:
医療、法律、金融など業界ごとの専門用語や固有名詞を事前に登録し、正しく書き起こし。読み仮名の登録は不要です。
-
話者分離機能:
最大12人の発話を個別に識別し、「誰が何を話したか」を明確にします。
-
カスタマイズ可能な議事録・要約:
長時間の会話や講義内容を簡潔な要点にまとめます。
-
実務運用しやすいチーム管理機能:
書き起こし結果や作成した議事録をチーム内で共有・管理することができます。
-
オンプレミス対応:
セキュリティや機密情報を扱う業界向けに、クラウドを使わず安全にデータを処理できるオンプレミス環境も提供可能です。
(※上記機能の一部は特定のプランやオプションでの提供となる場合があります。)
<今後の展望>
mocomocoは、今回の広島大学病院 佐伯医師との連携を通じて得られた知見を活かし、医療分野における音声認識技術のさらなる精度向上と機能拡充を進めてまいります。引き続き、医療従事者の皆様の業務効率化と医療DXの推進に貢献できるようなサービス開発に努めてまいります。
<サービス利用のお申込み>
mocoVoiceの利用を開始するには、以下の利用申請フォームからお申し込みください。医療モデルのご利用や詳細については、お問い合わせフォームよりご相談ください。
関連ページ
-
mocoVoice 無料トライアル https://cloud.mocomoco.ai/sign-up
-
mocomoco株式会社 HP https://www.mocomoco.ai/
-
mocoVoice医療モデル・記事に関するお問い合わせ https://tayori.com/f/mocomoco-inc/

代表者:代表取締役CEO 田中康紀
本社:〒106-0032 東京都港区六本木7丁目20-19 イナダビル302
広報担当 メール: contact@mocomoco.ai
すべての画像
