AIによる自動校閲システムを活用し、「医療広告ガイドライン」を遵守した信頼性の高いメディアへと進化
~最大25%の校閲時間短縮により、精度の高い記事作成につなげた「ギミック」と「リクルート テクノロジーズ」の共同実証実験について~
株式会社ギミック(本社:東京都渋谷区、代表取締役社長:横嶋大輔、以下ギミック)は、株式会社リクルートテクノロジーズ*1 (本社:東京都千代田区、代表取締役社長:清水 淳、以下リクルートテクノロジーズ)と共同し、総合医療情報サイト「ドクターズ・ファイル」の記事において、リクルートテクノロジーズが提供する機械学習API群「A3RT(アート)」内の校閲API「Proofreading」を用いた自動校閲の実証実験を実施。1年3ヵ月にわたって行われた本実験では、誤字脱字や表記ルールの見逃しを防止するとともに、校閲にかかる時間を1ヵ月あたり最大25%削減(従来と比較して平均18%削減)するという結果を得ることができました。*2
*1 リクルートテクノロジーズは2021年4月に株式会社リクルートに統合されます。
*2 2020年7月30日に、リクルートテクノロジーズより同実証実験のプレスリリース(https://recruit-tech.co.jp/news/200730_002535.html)が配信されています。
医療広告は人の健康や生命に関わる重要な情報を扱うため、その在り方が厚生労働省の制定する「医療広告ガイドライン」によって定められています。医療広告ガイドラインとは、医療広告を見た人に誤解やトラブルが起こらないよう、広告の内容を適正化し、情報の受け手を守ることを目的とした指針です。ギミックでは医療広告ガイドラインを遵守したメディア運営を行うために、下記のような取り組みを実施し徹底した品質管理を行ってきました。
・編集部内に記事をチェックする専門機関を設け、医療広告ガイドラインを遵守した内容になっているかを確認
・掲載情報の定期的なチェックやメンテナンスを実施
・2018年6月、医療広告ガイドラインの改定を受け、クチコミや体験談の含まれるコンテンツの見直しを実施
参考:医療広告ガイドライン
https://www.mhlw.go.jp/file/06-Seisakujouhou-10800000-Iseikyoku/0000209841.pdf
◆具体的な課題
取り組みを通じて正確性・信頼性を重視した質の高い記事づくりをめざす一方で、細かな規定に基づいた複雑な内容を取り扱う校閲業務においては、下記のような課題がありました。
(1)誤字脱字の見逃し、医療広告ガイドラインの認識違いによるチェック漏れ
(2)校閲者の経験やスキル差による精度のバラつき
(3)医療情報の増加に伴う校閲時間の肥大化
そこで2018年に、自動校閲機能を公開していたリクルートテクノロジーズのデータテクノロジーラボ部(以下DTL)が提供する機械学習API 群「A3RT」の校閲API「Proofreading」の活用を検討。DTLでも、技術の汎用性を実証すべく、社外における活用の機会を求めていたことから、共同実証実験の実施に至りました。
▶A3RT 公式サイト https://a3rt.recruit-tech.co.jp/
現在公開されているAPIは11種(8月24日時点)で、本実験はそのうちの「Proofreading」を使用しました。これは、大量の日本語文章データから、正しい文章の構成や文法、単語の流れを学習し、そのデータから誤字脱字や不適切な文章を発見する機能を有しています。加えて今回は、ルールを作成して独自の校閲ロジックを構築する仕組みも取り入れました。
A3RTによる機械学習機能と、ギミックが設定したルールの2つのロジックについては下記のとおりです。
【機械学習ベース】
・大量の日本語原稿を用いて言語モデルを構築
・対象箇所にあてはまる文字の確率をその前後の文から求め、元の文字の確率が低ければ誤字と判定
・できること:誤字脱字・表記ゆれ・差別表現のチェック
【ルールベース】 ※今回の実証実験向けに実装
・あらかじめピックアップしたいキーワードを選定し、ルールを作成して独自の校閲ロジックを構築
・エンジニアではなく、一般ユーザーが設定可能(本実験ではギミックにて設定)
(1)クオリティー向上
誤字脱字の見逃しや、医療広告ガイドラインの認識違いによるチェック漏れの減少
(2)品質の均一化
校閲担当者の経験やスキル差による、精度のバラつきを解消
(3)校閲時間の短縮
実験開始前と比較して最大25%(平均18%)削減
このような成果を上げられた要因の一つには、表記ゆれや専門用語のチェックなどをAIが行うことで、校閲者の負担を軽減できたことが挙げられます。その結果、校閲者は従来費やしていた時間・労力を、医療広告ガイドラインの適切な運用にあてられ、ガイドラインに沿った言葉のニュアンスを確認するほか、ユーザーにとってよりわかりやすい内容にするための文章構成に注力することが可能となりました。つまり、AIと校閲者それぞれが得意分野を担うことで、医療広告ガイドラインを遵守した、質の高い記事をスピーディーに作成することにつながったのです。
▶総合医療情報サイト「ドクターズ・ファイル」 https://doctorsfile.jp/
社 名:株式会社ギミック
設 立:2003年12月9日
所在地:東京都渋谷区南平台町2-17 日交渋谷南平台ビル7F
代表取締役社長:横嶋大輔
事業内容:医療情報メディア事業、転職支援サービス、医療連携システム事業等
コーポレートサイト:https://gimic.co.jp/
■リクルートテクノロジーズ 会社概要
社 名:株式会社リクルートテクノロジーズ
設 立:2012年10月1日
所在地:東京都千代田区丸の内1-9-2 グラントウキョウサウスタワー
代表取締役社長:清水 淳
事業内容:リクルートグループのビジネスにおけるIT・ネットマーケティングテクノロジーの開発・提供
コーポレートサイト:https://recruit-tech.co.jp/
ーーリクルートテクノロジーズ データテクノロジーラボ部についてーー
A3RTをはじめとする機械学習やAI技術をコアとし、リクルートテクノロジーズ社内でのR&Dやプロダクト開発を推進。最近では、機械学習周辺の技術のみならず、IoTやARなどの技術検証や実証実験も実施、中長期での技術戦略検討をミッションとしている。
《当記事に関するお問い合わせ》
メディア掲載、取材に関するお問い合わせは下記までお願いいたします。
株式会社ギミック 制作管理開発部:江田
Email:info_all@doctorsfile.jp
*2 2020年7月30日に、リクルートテクノロジーズより同実証実験のプレスリリース(https://recruit-tech.co.jp/news/200730_002535.html)が配信されています。
- 実証実験の背景
医療広告は人の健康や生命に関わる重要な情報を扱うため、その在り方が厚生労働省の制定する「医療広告ガイドライン」によって定められています。医療広告ガイドラインとは、医療広告を見た人に誤解やトラブルが起こらないよう、広告の内容を適正化し、情報の受け手を守ることを目的とした指針です。ギミックでは医療広告ガイドラインを遵守したメディア運営を行うために、下記のような取り組みを実施し徹底した品質管理を行ってきました。
・編集部内に記事をチェックする専門機関を設け、医療広告ガイドラインを遵守した内容になっているかを確認
・掲載情報の定期的なチェックやメンテナンスを実施
・2018年6月、医療広告ガイドラインの改定を受け、クチコミや体験談の含まれるコンテンツの見直しを実施
参考:医療広告ガイドライン
https://www.mhlw.go.jp/file/06-Seisakujouhou-10800000-Iseikyoku/0000209841.pdf
◆具体的な課題
取り組みを通じて正確性・信頼性を重視した質の高い記事づくりをめざす一方で、細かな規定に基づいた複雑な内容を取り扱う校閲業務においては、下記のような課題がありました。
(1)誤字脱字の見逃し、医療広告ガイドラインの認識違いによるチェック漏れ
(2)校閲者の経験やスキル差による精度のバラつき
(3)医療情報の増加に伴う校閲時間の肥大化
そこで2018年に、自動校閲機能を公開していたリクルートテクノロジーズのデータテクノロジーラボ部(以下DTL)が提供する機械学習API 群「A3RT」の校閲API「Proofreading」の活用を検討。DTLでも、技術の汎用性を実証すべく、社外における活用の機会を求めていたことから、共同実証実験の実施に至りました。
- A3RTによる自動校閲機能
▶A3RT 公式サイト https://a3rt.recruit-tech.co.jp/
現在公開されているAPIは11種(8月24日時点)で、本実験はそのうちの「Proofreading」を使用しました。これは、大量の日本語文章データから、正しい文章の構成や文法、単語の流れを学習し、そのデータから誤字脱字や不適切な文章を発見する機能を有しています。加えて今回は、ルールを作成して独自の校閲ロジックを構築する仕組みも取り入れました。
A3RTによる機械学習機能と、ギミックが設定したルールの2つのロジックについては下記のとおりです。
【機械学習ベース】
・大量の日本語原稿を用いて言語モデルを構築
・対象箇所にあてはまる文字の確率をその前後の文から求め、元の文字の確率が低ければ誤字と判定
・できること:誤字脱字・表記ゆれ・差別表現のチェック
【ルールベース】 ※今回の実証実験向けに実装
・あらかじめピックアップしたいキーワードを選定し、ルールを作成して独自の校閲ロジックを構築
・エンジニアではなく、一般ユーザーが設定可能(本実験ではギミックにて設定)
- 自動校閲機能の実験結果
(1)クオリティー向上
誤字脱字の見逃しや、医療広告ガイドラインの認識違いによるチェック漏れの減少
(2)品質の均一化
校閲担当者の経験やスキル差による、精度のバラつきを解消
(3)校閲時間の短縮
実験開始前と比較して最大25%(平均18%)削減
このような成果を上げられた要因の一つには、表記ゆれや専門用語のチェックなどをAIが行うことで、校閲者の負担を軽減できたことが挙げられます。その結果、校閲者は従来費やしていた時間・労力を、医療広告ガイドラインの適切な運用にあてられ、ガイドラインに沿った言葉のニュアンスを確認するほか、ユーザーにとってよりわかりやすい内容にするための文章構成に注力することが可能となりました。つまり、AIと校閲者それぞれが得意分野を担うことで、医療広告ガイドラインを遵守した、質の高い記事をスピーディーに作成することにつながったのです。
また、新型コロナウイルス拡大の影響を受け在宅勤務を実施する中でも、「自動校閲」の活用と、「人の目による校閲」を組み合わせることで、スムーズな業務の進行を実現することができました。
- 今後の自動校閲活用に向けて
- 「ドクターズ・ファイル」について
▶総合医療情報サイト「ドクターズ・ファイル」 https://doctorsfile.jp/
- 会社概要
社 名:株式会社ギミック
設 立:2003年12月9日
所在地:東京都渋谷区南平台町2-17 日交渋谷南平台ビル7F
代表取締役社長:横嶋大輔
事業内容:医療情報メディア事業、転職支援サービス、医療連携システム事業等
コーポレートサイト:https://gimic.co.jp/
■リクルートテクノロジーズ 会社概要
社 名:株式会社リクルートテクノロジーズ
設 立:2012年10月1日
所在地:東京都千代田区丸の内1-9-2 グラントウキョウサウスタワー
代表取締役社長:清水 淳
事業内容:リクルートグループのビジネスにおけるIT・ネットマーケティングテクノロジーの開発・提供
コーポレートサイト:https://recruit-tech.co.jp/
ーーリクルートテクノロジーズ データテクノロジーラボ部についてーー
A3RTをはじめとする機械学習やAI技術をコアとし、リクルートテクノロジーズ社内でのR&Dやプロダクト開発を推進。最近では、機械学習周辺の技術のみならず、IoTやARなどの技術検証や実証実験も実施、中長期での技術戦略検討をミッションとしている。
《当記事に関するお問い合わせ》
メディア掲載、取材に関するお問い合わせは下記までお願いいたします。
株式会社ギミック 制作管理開発部:江田
Email:info_all@doctorsfile.jp
このプレスリリースには、メディア関係者向けの情報があります
メディアユーザーログイン既に登録済みの方はこちら
メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。
すべての画像