株式会社Elithが医療ドメインの日本語音声認識学習用データセット「Mecon Audio」の提供開始
先進医療会議の議事録を使用した音声データセットで医療現場でのAI技術研究の支援を目指す
【データセットについて】
Mecon Audio (Medical Conference Audio) は、厚生労働省主催の「先進医療会議」の議事録を日本語で読み上げたデータセットで、株式会社Elith (https://elith.co.jp) が作成・公開しております。今回のリリースでの本データセットには、2012年から2013年(一部)にかけての議事録である2,954文が含まれており、24歳の女性話者1人によって読み上げられました。総読み上げ時間は4時間7分48秒です。データには音声データと読み上げ用の漢字カナとひらがなのテキストファイルが含まれています。
Mecon Audioのデータセットは、GitHubリポジトリ(https://github.com/elith-co-jp/meconaudio) からアクセスできます。GitHubリポジトリを通じて、データセットの利用方法やアップデート情報などが提供される予定です。
【販売の背景】
医療現場でのAI技術の需要が高まる中、高精度な音声認識技術の研究開発を支援することを目指しております。株式会社Elithは、Mecon Audioの提供を通じて、研究者や開発者が医療ドメインの音声認識技術を磨くためのリソースを提供することで、医療現場でのAI技術の活用がさらに広がることを期待しております。これにより、患者のケアや診断の効率化、病院運営の最適化など、医療現場におけるさまざまな課題の解決が期待されます。
【今後の展望】
Mecon Audioの提供により、医療ドメインの音声認識技術の研究開発がさらに加速されることを期待しております。今後も続けて医療ドメインでの音声データセットの提供を計画しております。
【ご利用方法】
このデータセットは、非営利の研究目的での利用が許可されています。
Elithでは商用利用も歓迎しております。商用利用を希望する場合は、こちらのGitHubリポジトリ(https://github.com/elith-co-jp/meconaudio) に従ってお問い合わせください。
【株式会社Elithについて】
社名:株式会社Elith
代表者:代表取締役 若林怜帆人、取締役CEO兼CTO 井上顧基
本社所在地:東京都渋谷区恵比寿西2-3-13-601
会社概要 URL:https://elith.co.jp
【本プレスリリースに関するお問い合わせ先】
株式会社Elith Eメール:contact@elith.co.jp
【出典】
「先進医療会議」(厚生労働省)https://www.mhlw.go.jp/stf/shingi/other-hoken_129195.html (2023年4月13日に利用)を加工して作成
すべての画像