<お知らせ>EQUES、自然言語処理分野の難関国際会議「IJCNLP-AACL 2025」本会議に論文採択
製薬ドメイン特化LLMの学習と評価 | モデルの公開は世界初
弊社は、経済産業省・NEDOによる日本の生成AI開発力強化を目的としたプロジェクト「GENIAC」において開発した製薬業務に特化した大規模言語モデル (LLM) である「JPharmatron」に関する論文が、2025年12月にインド・ムンバイで開催される「IJCNLP-AACL 2025」の本会議(Main)に採択されたことをお知らせいたします。
「International Joint Conference on Natural Language Processing & Asia-Pacific Chapter of the Association for Computational Linguistics(IJCNLP-AACL)」は自然言語処理分野における難関国際会議の一つです。

JPharmatronについて
JPharmatron(ジェー・ファーマトロン)は弊社EQUESが経済産業省・NEDOの「GENIAC」において、採択事業「薬学分野・製薬業務に特化したLLMの開発」の一環で開発した、製薬ドメイン特化LLMです。詳しくは以下のサイトもご覧下さい。
論文の概要
本研究では、20億トークンの日本語製薬・薬学関連文書と80億トークンの英語生物医学関連文書を用いた継続事前学習によって構築した、製薬・薬学分野に特化した日本語LLMである「JPharmatron」を提案する。さらに、製薬・薬学分野における日本語LLM向けのベンチマークの不足を鑑み、以下の3つの新規ベンチマークタスクを開発した。内容は(1) 薬剤師国家試験に基づく「YakugakuQA」、(2) 多言語にわたる同義語認識などの名寄せ能力を評価する「NayoseQA」、(3) 複数文書間の齟齬検出のための推論能力を測定する「SogoCheck」である。
開発したLLM「JPharmatron」を、オープンソースの医療分野LLMおよびGPT-4oを含む商用モデルと比較評価した。その結果、JPharmatronは同程度のパラメータ数の既存オープンモデルを上回る性能を示した。JPharmatronの開発および3種のベンチマークによる評価の結果からは、GPT-4oでさえも「SogoCheck」タスクでは顕著な性能低下を示しており、文間の一貫性推論が依然として未解決の課題であるという示唆が得られた。
本プロジェクトの成果は、実用的で安全性が高く、かつコスト効率に優れた日本語ドメイン特化LLMの構築可能性を示すとともに、製薬・薬学分野の自然言語処理研究における今後の研究活動に活用できる評価リソースを提供したことである。開発成果はHuggingfaceから公開している。
今後の展望
今後は、開発モデル「JPharmatron」の製薬業界向けの弊社AIソリューション「QAI」への導入や、共同研究への使用を目指します。
論文情報
A Japanese Language Model and Three New Evaluation Benchmarks for Pharmaceutical NLP
著者:Shinnosuke Ono, Issey Sukeda, Takuro Fujii, Kosei Buma, Shunsuke Sasaki
発表予定学会:IJCNLP-AACL2025 Main Conference
学会URL:https://2025.aaclnet.org/
プレプリントURL:https://arxiv.org/abs/2505.16661v2
謝辞
本成果は、経済産業省と国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)が実施する、国内の生成AIの開発力強化を目的としたプロジェクト「GENIAC(Generative AI Accelerator Challenge)」の成果をもとに作成されました。
EQUESについて
株式会社EQUESは、『最先端の機械学習技術をあやつり社会の発展を加速する』という理念の下、GenerativeAIや数理最適化に焦点を当て研究開発を行なっている東大松尾研発スタートアップです。現役東京大学院生の創業者らを中心としてメンバーそれぞれの専門性を結集し、企業の課題に向き合いながらAI・機械学習分野を中心とした最先端技術を社会に実装してまいります。
社名:株式会社EQUES(エクエス)
代表取締役:岸尚希
設立:2022年2月
本社所在地:東京都文京区本郷3丁目30番10号本郷K&Kビル2F
事業内容:AIソリューション開発
会社ホームページURL:https://www.eques.co.jp
すべての画像
